O korpusu Šolar

Korpus šolskih pisnih izdelkov Šolar je korpus besedil, ki so jih učenci slovenskih osnovnih in srednjih šol samostojno tvorili pri pouku. Korpus je nastal v okviru projekta Sporazumevanje v slovenskem jeziku v letih 2009-2010, vsebuje pa skoraj milijon besed oz. natančno 967.477 besed. Gre za prvi tovrstni korpus besedil v Sloveniji, ki je narejen po vzoru korpusov usvajanja jezikov, vendar pa se od večine teh korpusov razlikuje v tem, da (a) besedila niso nastala na pobudo projekta, ampak predstavljajo dejansko šolsko produkcijo učencev in dijakov, (b) so jezikovni popravki, ki so označeni v korpusu, realni, naredili pa so jih učitelji in ne raziskovalci. Zaradi izrabe učiteljskih popravkov za namene označevanja jezikovnih napak učencev je korpus edinstven ne samo v slovenskem, ampak tudi v evropskem oziroma svetovnem merilu.

Šolar vsebuje 2.703 pisnih besedil srednješolcev in učencev zadnjega triletja osnovnih šol, nekaj pa je tudi besedil učencev 6. razreda osnovne šole. Največji delež besedil predstavljajo eseji oziroma spisi (64,2 %), v korpusu pa najdemo še pisne izdelke, nastale pri učni uri, kot so obnove, opisi, prošnje ipd. (18 %), in teste, ki smo jih razdelili v dve skupini: odgovori na vprašanja (16,1 %) predstavljajo klasične teste z vprašanji in (esejskimi) odgovori, ki so nastali pri različnih predmetih, v skupino daljše besedilo (1,7 %) pa sodijo različna praktična besedila (prošnje, zahvale …), ki so jih učenci morali napisati v okviru daljšega testa iz slovenščine.

Korpus Šolar je velika pridobitev za slovensko korpusno jezikoslovje, saj ponuja vpogled v pisanje šolajoče se mladine, torej populacije, katere jezikovna produkcija je bila doslej s korpusnim pristopom še neraziskana. To je deloma botrovalo pomanjkanju problemsko naravnanih jezikovnih priročnikov in učnih gradiv za osnovne in srednje šole, osnovanih na analizah dejanske jezikovne rabe.

Cilji projekta

Projekt ima tri glavne cilje:

  1. Z načrtnim dodajanjem novo zbranih (in deloma že zbranih besedil) izboljšati regijsko uravnoteženost korpusa Šolar in uravnoteženost po stopnji šolanja.
  2. Izdelati podkorpus besedil šolarjev dislektikov kot primer korpusa besedil učencev s posebnimi potrebami. Podkorpus naj bi kasneje služil kot model za izdelavo vseh nadaljnjih podobnih podkorpusov.
  3. Vnesti informacijo o podkategoriji napake učenca v obstoječih besedilih in na podlagi teh informacij izdelati učni korpus za jezikovnotehnološke namene.