V letih 2015-2018 je potekal projekt nadgradnje korpusa Šolar (Šolar 2.0), zbirke besedil osnovnošolcev in srednješolcev, ki vsebuje skoraj milijon besed. Zbrali smo 2782 novih besedil, ki so morala izpolnjevati spodnje kriterije. Pri zbiranju so bili upoštevani naslednji kriteriji:

  • zbirala so se besedila učencev 6.-9. razreda OŠ in dijakov vseh letnikov srednjih šol;
  • besedilo je moralo imeti vsaj 40 besed, da je bilo vključeno v korpus;
  • prednost so imela besedil iz regije in šol, ki so bile v prvi verziji korpusa slabše zastopane.

V spodnjem diagramu je prikazana razporeditev besedil po regijah v osnovnih in srednjih šolah v Šolarju 2.0, spodaj pa za primerjavo razporeditev besedil v Šolarju 1.0. Kot je razvidno, je projekt uspel pokriti veliko mankov prejšnje verzije korpusa, še vedno pa ostaja nekaj dela za naprej.

ŠOLAR 2.0

Osnovne šole

Celje
Koper
Kranj
Krško
Ljubljana
Maribor
Murska Sobota
Nova Gorica
Novo mesto
Postojna
Slovenj Gradec

Srednje šole

Celje
Koper
Kranj
Krško
Ljubljana
Maribor
Murska Sobota
Nova Gorica
Novo mesto
Postojna
Slovenj Gradec

ŠOLAR 1.0

Osnovne šole

Celje
Koper
Kranj
Krško
Ljubljana
Maribor
Murska Sobota
Nova Gorica
Novo mesto
Postojna
Slovenj Gradec

Srednje šole

Celje
Koper
Kranj
Krško
Ljubljana
Maribor
Murska Sobota
Nova Gorica
Novo mesto
Postojna
Slovenj Gradec