Page 53 - Studia Universitatis Hereditati, vol 8(2) (2020)
P. 53
ia Tabela 5: Razmerje med različnicami in pojavnicamiuniversitatis nega izrazja posameznega korpusa uporabimo
kor pusni pr istop kot metoda r aziskovanja in učenja tujega strokov nega jezik a 53v oddelkih KP torej različna računalniška orodja.
KP Število Število Razmerje Računalniški program AntConc nam po-
pojavnic različnic 1: 24,85 nuja orodje KeyWords, ki izloči najpogostejše
strokovna besedila 250.000 10.060 1: 29,37 besede nekega korpusa tako, da primerja listi be-
pravna besedila 250.000 1: 18,57 sed dveh korpusov. Podobno orodje ponuja tudi
poljudnoznanstve- 8.512 1: 12,65 platforma Sketch Engine, ki ponudi tudi samo-
na besedila 250.000 dejno luščenje ključnih besed s primerjavo list
poljudna besedila 13.463 besed pridobljenih iz korpusov BNC ali English
250.000 Web 2015. Računalniški program Range lahko
19.763 izdela »profil leksikalne gostote«, saj razporedi
ves korpus v najmanj tri in največ osemnajst se-
ka različnica v uradovalnih besedilih o prome- gmentov besedišča glede na pogostost pojavnosti
tu ponovi kar 30-krat, v znanstvenih člankih in v referenčnih korpusih. Primerjava z listo besed
strokovnih knjigah o prometu 25-krat, medtem AWL izloči najpogostejše različnice, ki jih lah-
ko je izrazje v strokovnih besedilih o kulturolo- ko opredelimo kot splošno besedišče, da se pos-
ških temah bolj raznoliko, vsaka različnica naj bi vetimo izrazju, specifičnemu za določeno stroko.
se ponovila le 19-krat v celem podkorpusu. Polju-
dnoznanstvena besedila v obeh korpusih tvorijo Tudi z gornjimi orodji pridobljene liste
v veliki meri besedila povzeta iz enciklopedij in ključnih besed so obsežne, zato je tu prikazan le
očitno je, da sledijo žanrsko in stilistično podob- vzorec najpogostejših 100 različnic liste ključnih
nim vzorcem zapisa, saj je razmerje ponavljanja v besed KK in KP. V obeh korpusih so v tem se-
obeh primerih 1: 18,5. Najbolj odprt nabor bese- gmentu najpogostejše samostalniške različnice,
dnega gradiva opazimo v obeh korpusih pri pu- kar gre pripisati visoki stopnji nominalizacije v
blicističnih besedilih, torej v člankih iz revij in strokovnih besedilih (Biber 1995). Kar nekaj je
biltenov v elektronski obliki. Tako v KK kot v tudi pridevnikov, sorazmerno redki pa so glago-
KP so vrednosti razmerja polovico nižje v publi- li, kot prikazuje tabela 6.
cističnih kot v strokovnih besedilih. Tudi govor-
jena besedila, torej zapisi dokumentarnih oddaj Tabela 6: Primerjava najpogostejših različnic nekaterih
o kulturoloških temah, se približujejo vrednos- besednih vrst v obeh korpusih
tim razmerij v publicističnih besedilih. Primer-
java s temi podatki nakazuje, da naša strokovna korpus samostal- pridevniške glagol- število ra-
korpusa nikakor nista ozko usmerjena v stro- KK niške r. r. ske r. zličnic
kovni jezik, ampak zajemata širok nabor izraz- 100
ja okvirno usmerjenega v vsako stroko posebej. 69 23 8 100
Zato se zdita ustrezna osrednjemu namenu razi- 9
skave, torej predvsem analizi rabe polstrokovne- KP 80 11
ga besedišča navedenih strokovnih področjih.
Čeprav liste ključnih besed obeh korpu-
Določanje ključnih besed s primerjavo sov tvorijo večinoma samostalniki, gre opozori-
korpusnih list besed ti tudi na pogosto dvoumnost teh različnic, saj
Izbor različnic, ki naj bi jih opredelili kot ključne najdemo v KK med njimi veliko besed, ki jih
besede posameznega strokovnega korpusa, se iz- lahko rabimo kot samostalnik ali pridevnik ali
kaže za zahtevno nalogo predvsem zato, ker nam kot glagol, na primer besede »evil«, »human«,
vsa orodja za samodejno raziskavo korpusov da- »male«, »Roman«, »Christian«, »desire« ali
jejo zelo dolge spiske, nize tisoče besed, kar pa »reign«. Pri razvrščanju v spodnje tabele smo
težko smiselno pregledujemo. Za luščenje ključ- upoštevali, kateri besedni vrsti različnica naj-
pogosteje pripada v naših korpusih. Ključne sa-
mostalniške različnice v KK opisujejo življenje v
kor pusni pr istop kot metoda r aziskovanja in učenja tujega strokov nega jezik a 53v oddelkih KP torej različna računalniška orodja.
KP Število Število Razmerje Računalniški program AntConc nam po-
pojavnic različnic 1: 24,85 nuja orodje KeyWords, ki izloči najpogostejše
strokovna besedila 250.000 10.060 1: 29,37 besede nekega korpusa tako, da primerja listi be-
pravna besedila 250.000 1: 18,57 sed dveh korpusov. Podobno orodje ponuja tudi
poljudnoznanstve- 8.512 1: 12,65 platforma Sketch Engine, ki ponudi tudi samo-
na besedila 250.000 dejno luščenje ključnih besed s primerjavo list
poljudna besedila 13.463 besed pridobljenih iz korpusov BNC ali English
250.000 Web 2015. Računalniški program Range lahko
19.763 izdela »profil leksikalne gostote«, saj razporedi
ves korpus v najmanj tri in največ osemnajst se-
ka različnica v uradovalnih besedilih o prome- gmentov besedišča glede na pogostost pojavnosti
tu ponovi kar 30-krat, v znanstvenih člankih in v referenčnih korpusih. Primerjava z listo besed
strokovnih knjigah o prometu 25-krat, medtem AWL izloči najpogostejše različnice, ki jih lah-
ko je izrazje v strokovnih besedilih o kulturolo- ko opredelimo kot splošno besedišče, da se pos-
ških temah bolj raznoliko, vsaka različnica naj bi vetimo izrazju, specifičnemu za določeno stroko.
se ponovila le 19-krat v celem podkorpusu. Polju-
dnoznanstvena besedila v obeh korpusih tvorijo Tudi z gornjimi orodji pridobljene liste
v veliki meri besedila povzeta iz enciklopedij in ključnih besed so obsežne, zato je tu prikazan le
očitno je, da sledijo žanrsko in stilistično podob- vzorec najpogostejših 100 različnic liste ključnih
nim vzorcem zapisa, saj je razmerje ponavljanja v besed KK in KP. V obeh korpusih so v tem se-
obeh primerih 1: 18,5. Najbolj odprt nabor bese- gmentu najpogostejše samostalniške različnice,
dnega gradiva opazimo v obeh korpusih pri pu- kar gre pripisati visoki stopnji nominalizacije v
blicističnih besedilih, torej v člankih iz revij in strokovnih besedilih (Biber 1995). Kar nekaj je
biltenov v elektronski obliki. Tako v KK kot v tudi pridevnikov, sorazmerno redki pa so glago-
KP so vrednosti razmerja polovico nižje v publi- li, kot prikazuje tabela 6.
cističnih kot v strokovnih besedilih. Tudi govor-
jena besedila, torej zapisi dokumentarnih oddaj Tabela 6: Primerjava najpogostejših različnic nekaterih
o kulturoloških temah, se približujejo vrednos- besednih vrst v obeh korpusih
tim razmerij v publicističnih besedilih. Primer-
java s temi podatki nakazuje, da naša strokovna korpus samostal- pridevniške glagol- število ra-
korpusa nikakor nista ozko usmerjena v stro- KK niške r. r. ske r. zličnic
kovni jezik, ampak zajemata širok nabor izraz- 100
ja okvirno usmerjenega v vsako stroko posebej. 69 23 8 100
Zato se zdita ustrezna osrednjemu namenu razi- 9
skave, torej predvsem analizi rabe polstrokovne- KP 80 11
ga besedišča navedenih strokovnih področjih.
Čeprav liste ključnih besed obeh korpu-
Določanje ključnih besed s primerjavo sov tvorijo večinoma samostalniki, gre opozori-
korpusnih list besed ti tudi na pogosto dvoumnost teh različnic, saj
Izbor različnic, ki naj bi jih opredelili kot ključne najdemo v KK med njimi veliko besed, ki jih
besede posameznega strokovnega korpusa, se iz- lahko rabimo kot samostalnik ali pridevnik ali
kaže za zahtevno nalogo predvsem zato, ker nam kot glagol, na primer besede »evil«, »human«,
vsa orodja za samodejno raziskavo korpusov da- »male«, »Roman«, »Christian«, »desire« ali
jejo zelo dolge spiske, nize tisoče besed, kar pa »reign«. Pri razvrščanju v spodnje tabele smo
težko smiselno pregledujemo. Za luščenje ključ- upoštevali, kateri besedni vrsti različnica naj-
pogosteje pripada v naših korpusih. Ključne sa-
mostalniške različnice v KK opisujejo življenje v