Page 52 - Studia Universitatis Hereditati, vol 8(2) (2020)
P. 52
ilnih značilnosti, kar privede do zelo kom- Primerjava izpostavi precejšnje razlike med
pleksnih statističnih primerjav. O primerjavi korpusoma, zato lahko sklepamo, da je izrazje v
korpusov različnih strokovnih jezikov z name- KK bistveno bolj raznoliko od tistega v KP. Po-
nom, da izluščijo ključno izrazje in strukture po- datek je sicer le okviren, saj na število različnic
ročajo številni raziskovalci (npr. Crosthwaite in močno vpliva sestava korpusa pa tudi njegova ve-
Cheung 2019, Granger in Paquot 2015, Nelson likost. Hkrati nas velika razlika v razmerjih opo-
2006). Ugotovijo, da tvorijo »ključno besedišče zori, da se besede oziroma različnice v KP veliko
tiste besede, ki so nenavadno pogoste v določe- pogosteje ponavljajo kot v KK. To bi lahko na-
nem besedilu« (Scott in Tribble 2006: 36) v pri- kazovalo na večjo ustaljenost rabe terminologi-
merjavi z rabo v drugih besedilih ali referenčnih je in skladenjskih vzorcev. Nadalje nam razmer-
korpusih. Za namen te raziskave smo uporabili je kaže na višjo leksikalno gostoto v KK, kar bi
nekatere vpoglede iz gornjih analiz, saj prispevek pomenilo, da je pojavnost polnopomenskih be-
poroča o vpogledih, ki jih da primerjava več di- sed v KK večja v primerjavi s slovničnopomen-
menzij jezikovne rabe v KK in KP, kakor tudi v skimi besedami (Scott in Tribble 2006: 65). Rav-
njunih podkorpusih. Strokovne korpuse primer- no obraten pojav pa lahko predvidevamo v KP.
jamo tudi z angleškimi referenčnimi korpusi na Leksikalna gostota je pomembna, ko ocenjujemo
spletni platformi Sketch Engine. berljivost besedil, saj z njo poskušamo ugotoviti
Razmerje med pojavnicami in različnicami delež polnopomenskega besedišča v besedilu ali
v obeh strokovnih korpusih korpusu. Lažje berljiva so namreč besedila z niž-
jo leksikalno gostoto, ker imajo manj polnopo-
menskih različnic. Ker sta KK in KP razvršče-
na v oddelke po besedilnih zvrsteh in bi žanrske
razlike kaj lahko vplivale tudi na razmerje med
različnicami in pojavnicami, si v tabelah 4 in 5
oglejmo še to primerjavo.

Tabela 4: Razmerje med različnicami in pojavnicami
v oddelkih KK
studia universitatis hereditati, letnik 8 (2020), številka 2 52

hereditati
Tabela 3: Razmerje med različnicami in pojavnicami

Korpus Število Število Razmerje
KK pojavnic različnic 1: 26,19
KP 1.000.000 1: 39,20
1.000.000 38.187
25.511

Osnovno orodje, ki ga uporabljajo korpusne raz- KK Število Število Razmerje
iskave, so liste besed, saj nam te izpostavijo te- pojavnic različnic 1: 19,18
meljne statistične podatke o besednem gradivu strokovna 250.000
vsakega korpusa posebej, torej nabor vseh po- besedila 250.000 13.035
javnic (angl. token) v korpusu podeljenih v raz- poljudnoznanstve- 250.000
ličnice (angl. type). V naši raziskavi analiziramo na besedila 250.000 13.550 1: 18,45
lematizirane korpuse, ki so označeni besednovr- poljudna
stno, torej so vse oblike pojavnic združene in šte- besedila 26.882 1: 9,30
te kot osnovna oblika različnice. Seštevek pojav- govorjena
nic v korpusu nam pove, kako obsežno besedišče besedila 18.939 1: 13,20
sestavlja posamezni korpus. Razmerje med raz-
ličnicami in pojavnicami nam dovoljuje, da med Čeprav se razmerja med različnicami in po-
seboj primerjamo različne korpuse in kaže leksi- javnicami v oddelkih korpusov precej znižajo,
kalno variabilnost besedišča oziroma leksikalno kar lahko pripišemo predvsem manjšemu obsegu
gostoto. Za večjo jasnost primerjave smo podat- besedil, je očitno, da se besede najbolj ponavlja-
ke v tabeli 3 normalizirali na povprečje v korpu- jo v izrazito strokovnih besedilih, leksikalna go-
su z 1.000.000 pojavnicami. stota le-teh je torej najnižja. Če zadevo nekoliko
poenostavimo, si lahko predstavljamo, da se vsa-
   47   48   49   50   51   52   53   54   55   56   57