Page 55 - Studia Universitatis Hereditati, vol 8(2) (2020)
P. 55
ia universitatisTabela 9: Statistika list besed KK
kor pusni pr istop kot metoda r aziskovanja in učenja tujega strokov nega jezik a 55
lista besed Pojavnice % različnice % družine
1 766281 72,62 4190 11,15 999
2 103891 8,87 3809 9,25 983
3 40327 3,46 2437 6,65 938
4 30875 2,75 2161 5,73 887
5 17807 1,66 1742 4,72 826
6 12638 1,23 1351 3,77 749
7 9615 0,89 1102 3,16 701
8 6912 0,66 940 2,77 642
9 5988 0,59 730 2,50 619
10 3832 0,40 722 2,24 598
11 3956 0,41 670 2,12 584
12 2116 0,26 606 1,71 496
13 2983 0,33 608 1,72 514
14 1329 0,20 406 1,23 391
15 15050 1,63 2065 5,01 2065
16 123 0,01 21 0,05 4
ni na listi 45150 4,04 14636 36,22 ????

skupaj 1000070 38187 9927

zajema velik del splošnega besedišča, oziroma be- splošno besedišče, le manj običajno besede. Nato
sedišča, za katerega pričakujemo, da ga študentje pa ujemanje besedišča v KK s tistim v posame-
na nadaljevalni stopnji tujega jezika že poznajo. znih listah postopno upada do šestnajste liste, ki
Hkrati tudi opazimo, da je med visokopogostim vključuje osebna lastna imena. Veliko različnic,
besediščem le malo specialističnega strokovnega kar 36,22 %, pa se uvrsti še med besede, ki jih liste
besedišča. nimajo, torej v pretežno specialistično termino-
logijo kulturologije. Tabela 9 prikazuje statistič-
S programom Range porazdelimo besediš- no porazdelitev KK v vseh šestnajst besednih list
če celega korpusa avtomatsko po stopnjah od in pa delež besedišča, ki ga nima nobena od list.
najpogostejšega, torej najsplošnejšega ali najbolj
vsakdanjega, do različnih stopenj zahtevnosti ali V KP ni tako popolnega ujemanja z be-
strokovnosti. Vsaka od Rangevih list obsega po sednimi družinami s prve liste, pač pa je delež
tisoč besednih družin, ki jih lahko opišemo kot ujemanja različnic še višji, kar 14 % vseh različ-
termin z vsemi tvorjenkami. KK zajema kar 999 nic v korpusu je s prve liste in kar 73,87 % vsega
družin iz prve liste, kar pomeni, da vsebuje vsaj besednega gradiva. Višje kot v KK je tudi ujema-
po eno obliko besede iz vsake od teh družin. To nje z drugo, tretjo in četrto listo, potem pa so de-
pomeni, da je delež splošnega ali najobičajnejšega leži ujemanja nižji. Sklepamo lahko, da je bese-
besedišča v tem korpusu zelo obsežen, ker zaje- dišče KP zgoščeno v bolj natančno definiranem
ma 72,62 % vseh pojavnic, vendar le 11,15 % vseh segmentu izrazja, medtem ko je besedišče v KK
različnic. Podobno velik delež različnic, 9,25 %, razpršeno po celem spektru zahtevnosti izrazja.
se uvršča v drugo listo besed, ki še vedno vsebuje To dokazuje tudi visoko število besednih dru-
   50   51   52   53   54   55   56   57   58   59   60