Page 90 - Studia Universitatis Hereditati, vol. 4(1) (2016)
P. 90
dia universitatis her editati, letnik 4 (2016), številk a 1 90comparire (comparii/comparsi/comparvi);CoLFIS servirà inoltre per ordinare i verbi
in questo caso le tre forme flesse sono nella nella sezione 4.9
hereditatimaggior parte dei titoli indicate come equi-I numeri di occorrenze sono disposti in due ta-
valenti. belle: la tabella 3 prende in considerazione i verbi
che nelle tavole di coniugazione hanno registra-
Passato Remoto (ir)regolare nei corpora to due forme alternative del PR, la tabella 4 con-
d’italiano scritto tiene i verbi con tre forme flesse. I verbi, a loro
volta, sono disposti in ordine crescente a secon-
L’analisi del numero di occorrenze del PR è sta- da del numero complessivo delle loro occorren-
ta effettuata sui più noti corpora di italiano scrit- ze del PR nei cinque corpora analizzati. Siccome
to:7 alcune voci del PR coincidono con le forme del
Participio Passato (p. es. annesse, connesse ecc.),
1) CORIS, che contiene 130 milioni di parole sono state analizzate le forme della terza persona
ed è “costituito da una raccolta di testi, au- plurale, prive di tale ambiguità sintattica.
tentici e ricorrenti nell’uso, in formato elet- I verbi che hanno le doppie forme flesse
tronico, selezionati come rappresentativi sono stati divisi in due gruppi, in cui a) prevalgo-
dell’italiano attuale”;8 no le forme flesse regolari, e b) prevalgono le for-
me flesse irregolari. In tal modo, nel primo grup-
2 Italian Web 2016 (itTenTen16; nel seguito po entrano tutti i verbi uscenti in –ire, insieme
abbreviato come ItWeb), componente del a tre verbi in –ere: flettere, deflettere, riannet-
sistema SketchEngine che raccoglie testi tere (il cui numero complessivo nei cinque cor-
tratti da Internet; oggi la più grande risor- pora è molto limitato, perciò non sarebbe lecito
sa lessicale per la lingua italiana con quasi 5 dedurne una regola grammaticale; si paragoni-
miliardi di parole; no nel seguito i numeri relativi a questi verbi che
risultano dal questionario). Per gli altri verbi in
3) “la Repubblica”, quindi un corpus compo- –ere si registrano invece più numerose le forme
sto dagli articoli del giornale pubblicati tra irregolari.
il 1985 e il 2000, con pressoché 380 milioni Nel corpus ItWeb, dove le forme del PR
di parole; sono più diffuse rispetto ad altri corpora, le for-
me prevalenti costituiscono una percentuale re-
4) PAISÀ, di 250 milioni di parole, contiene lativamente molto alta di tutte le occorrenze del
testi raccolti dal web nel settembre/ottobre PR (mi limito a elencare i verbi le cui forme del
del 2010; “la raccolta di testi contemporanei PR superano la soglia di 100 occorrenze): per
è stata creata […] allo scopo di fornire mate- le forme regolari: aprirono 96,7%, costruirono
riale autentico e disponibile gratuitamente 99,4%, scoprirono 97,4%, offrirono 93,7%, spari-
per l’apprendimento dell’italiano”; rono 96,1%, coprirono 96,3%, soffrirono 90,7%;
per le forme irregolari, rispettivamente: resero
5) CoLFIS (Corpus e Lessico di Frequen- 99,1%, caddero 99,9%, tennero 99,9%, risolsero
za dell’Italiano Scritto), quindi “un corpus 87,9%, tacquero 99,9%, discussero 99,8%, redas-
bilanciato di oltre 3 milioni di parole, che sero 100%.
rispecchia le tendenze di lettura degli italia- Per quanto riguarda i verbi con tre varianti fles-
ni desunte da dati ISTAT”. Il lemmario del se, per i verbi della seconda coniugazione preval-
7 Per una panoramica delle risorse lessicali in italiano si veda p. es. 9 I motori di ricerca di ItWeb, CoLFIS e PAISÀ permettono di sele-
Emanuela Cresti, Alessandro Panunzi, Introduzione ai corpora zionare le parole annotate come verbi. Nel Coris ho posto la seguen-
dell’italiano (Bologna: il Mulino, 2013), 141-154. te domanda CQL: [word="X" & pos="V_GVRB"], quindi general
verb forms; nel corpus Repubblica: [word="X" & pos="VER:fin"],
8 Tutte le citazioni relative ai corpora sono tratte dai rispettivi siti quindi verb finite form.
web dei singoli progetti: CORIS: http://corpora.dslo.unibo.it/
coris_ita.html; PAISÀ: http://www.corpusitaliano.it; CoLFIS:
http://linguistica.sns.it/CoLFIS/Home.htm.
in questo caso le tre forme flesse sono nella nella sezione 4.9
hereditatimaggior parte dei titoli indicate come equi-I numeri di occorrenze sono disposti in due ta-
valenti. belle: la tabella 3 prende in considerazione i verbi
che nelle tavole di coniugazione hanno registra-
Passato Remoto (ir)regolare nei corpora to due forme alternative del PR, la tabella 4 con-
d’italiano scritto tiene i verbi con tre forme flesse. I verbi, a loro
volta, sono disposti in ordine crescente a secon-
L’analisi del numero di occorrenze del PR è sta- da del numero complessivo delle loro occorren-
ta effettuata sui più noti corpora di italiano scrit- ze del PR nei cinque corpora analizzati. Siccome
to:7 alcune voci del PR coincidono con le forme del
Participio Passato (p. es. annesse, connesse ecc.),
1) CORIS, che contiene 130 milioni di parole sono state analizzate le forme della terza persona
ed è “costituito da una raccolta di testi, au- plurale, prive di tale ambiguità sintattica.
tentici e ricorrenti nell’uso, in formato elet- I verbi che hanno le doppie forme flesse
tronico, selezionati come rappresentativi sono stati divisi in due gruppi, in cui a) prevalgo-
dell’italiano attuale”;8 no le forme flesse regolari, e b) prevalgono le for-
me flesse irregolari. In tal modo, nel primo grup-
2 Italian Web 2016 (itTenTen16; nel seguito po entrano tutti i verbi uscenti in –ire, insieme
abbreviato come ItWeb), componente del a tre verbi in –ere: flettere, deflettere, riannet-
sistema SketchEngine che raccoglie testi tere (il cui numero complessivo nei cinque cor-
tratti da Internet; oggi la più grande risor- pora è molto limitato, perciò non sarebbe lecito
sa lessicale per la lingua italiana con quasi 5 dedurne una regola grammaticale; si paragoni-
miliardi di parole; no nel seguito i numeri relativi a questi verbi che
risultano dal questionario). Per gli altri verbi in
3) “la Repubblica”, quindi un corpus compo- –ere si registrano invece più numerose le forme
sto dagli articoli del giornale pubblicati tra irregolari.
il 1985 e il 2000, con pressoché 380 milioni Nel corpus ItWeb, dove le forme del PR
di parole; sono più diffuse rispetto ad altri corpora, le for-
me prevalenti costituiscono una percentuale re-
4) PAISÀ, di 250 milioni di parole, contiene lativamente molto alta di tutte le occorrenze del
testi raccolti dal web nel settembre/ottobre PR (mi limito a elencare i verbi le cui forme del
del 2010; “la raccolta di testi contemporanei PR superano la soglia di 100 occorrenze): per
è stata creata […] allo scopo di fornire mate- le forme regolari: aprirono 96,7%, costruirono
riale autentico e disponibile gratuitamente 99,4%, scoprirono 97,4%, offrirono 93,7%, spari-
per l’apprendimento dell’italiano”; rono 96,1%, coprirono 96,3%, soffrirono 90,7%;
per le forme irregolari, rispettivamente: resero
5) CoLFIS (Corpus e Lessico di Frequen- 99,1%, caddero 99,9%, tennero 99,9%, risolsero
za dell’Italiano Scritto), quindi “un corpus 87,9%, tacquero 99,9%, discussero 99,8%, redas-
bilanciato di oltre 3 milioni di parole, che sero 100%.
rispecchia le tendenze di lettura degli italia- Per quanto riguarda i verbi con tre varianti fles-
ni desunte da dati ISTAT”. Il lemmario del se, per i verbi della seconda coniugazione preval-
7 Per una panoramica delle risorse lessicali in italiano si veda p. es. 9 I motori di ricerca di ItWeb, CoLFIS e PAISÀ permettono di sele-
Emanuela Cresti, Alessandro Panunzi, Introduzione ai corpora zionare le parole annotate come verbi. Nel Coris ho posto la seguen-
dell’italiano (Bologna: il Mulino, 2013), 141-154. te domanda CQL: [word="X" & pos="V_GVRB"], quindi general
verb forms; nel corpus Repubblica: [word="X" & pos="VER:fin"],
8 Tutte le citazioni relative ai corpora sono tratte dai rispettivi siti quindi verb finite form.
web dei singoli progetti: CORIS: http://corpora.dslo.unibo.it/
coris_ita.html; PAISÀ: http://www.corpusitaliano.it; CoLFIS:
http://linguistica.sns.it/CoLFIS/Home.htm.