Page 110 - Lazar, Irena, Aleksander Panjek in Jonatan Vinkler. Ur. 2020. Mikro in makro. Pristopi in prispevki k humanističnim vedam ob dvajsetletnici UP Fakultete za humanistične študije, 2. knjiga. Koper: Založba Univerze na Primorskem.
P. 110
1), построенном на основе предварительного корпуса СРЯ. В нем
приведены следующие данные:
– 1000 наиболее частотных лемм покрывает 64.07% текста,
– 2000 наиболее частотных лемм покрывают 71.95% текста,
– 3000 наиболее частотных лемм покрывают 76.51% текста,
– 5000 наиболее частотных лемм покрывают 82.06% текста.
Приведенные данные впрочем сложно напрямую сопоставить
с действующими лексическими минимумами, предложенными для
иностранных учащихся на различных уровнях языковой компетен-
ции. В связи с этим в рамках настоящего исследования было решено
соотнести ЛМ базового уровня (1300 лексических единиц) с данными
Нового частотного словаря РЯ (Ляшевская, Шаров 2009), составлен-
ного на базе Национального корпуса русского языка. Сопоставление
было произведено с помощью программы корпусного анализа
AntConc, которая позволяет статистически вычислить процент со-
впадения соотносимых списков. Как оказалось, в числе первых 1300
наиболее частотных лемм можно обнаружить только 45% слов, вклю-
ченных в ЛМ базового уровня (см. рис.1).
Рис. 1. Совпадение первых 1300 самых частотных лемм с ЛМ базового уровня
Данный показатель свидельствует о том, что частотность слов
действительно не является приоритетным критерием включения
лексических единиц в действующие лексические минимумы.
Поскольку они были разработаны для ограниченного тематического
набора, прописанного для каждого уровня, мы решили проверить
процент лексического совпадения с текстами из интернет-источника
«Корпуса звучащей речи», тематика которых совпадает с заявленным
тематическим диапазоном ЛМ. Для сравнения были использованы 20
неспециализированных (устных) текстов небольшого объема (до 250
слов) из сферы повседневного общения (о семье). Как показал анализ,
486
приведены следующие данные:
– 1000 наиболее частотных лемм покрывает 64.07% текста,
– 2000 наиболее частотных лемм покрывают 71.95% текста,
– 3000 наиболее частотных лемм покрывают 76.51% текста,
– 5000 наиболее частотных лемм покрывают 82.06% текста.
Приведенные данные впрочем сложно напрямую сопоставить
с действующими лексическими минимумами, предложенными для
иностранных учащихся на различных уровнях языковой компетен-
ции. В связи с этим в рамках настоящего исследования было решено
соотнести ЛМ базового уровня (1300 лексических единиц) с данными
Нового частотного словаря РЯ (Ляшевская, Шаров 2009), составлен-
ного на базе Национального корпуса русского языка. Сопоставление
было произведено с помощью программы корпусного анализа
AntConc, которая позволяет статистически вычислить процент со-
впадения соотносимых списков. Как оказалось, в числе первых 1300
наиболее частотных лемм можно обнаружить только 45% слов, вклю-
ченных в ЛМ базового уровня (см. рис.1).
Рис. 1. Совпадение первых 1300 самых частотных лемм с ЛМ базового уровня
Данный показатель свидельствует о том, что частотность слов
действительно не является приоритетным критерием включения
лексических единиц в действующие лексические минимумы.
Поскольку они были разработаны для ограниченного тематического
набора, прописанного для каждого уровня, мы решили проверить
процент лексического совпадения с текстами из интернет-источника
«Корпуса звучащей речи», тематика которых совпадает с заявленным
тематическим диапазоном ЛМ. Для сравнения были использованы 20
неспециализированных (устных) текстов небольшого объема (до 250
слов) из сферы повседневного общения (о семье). Как показал анализ,
486