Частотность слова (word frequency)

Частотность слова (word frequency)

В психологии Ч. с. играет важную роль не только в пед. приложениях, но тж при контроле и анализе свойств стимула и реакции в экспериментах по восприятию, научению, памяти и речи и при характеристике вербальных репертуаров различных популяций индивидуумов — как нормальных, так и отклоняющихся от нормы и находящихся на различных уровнях хронологического и психол. возраста.

Частотность слова-типа (word type) обычно определяется путем подсчета числа случаев воспроизведения данной лексемы (tokens) на большой выборке таких случаев, извлекаемой либо из разговорной речи, либо из письменных или печатных текстов. Машинные программы подсчета слов обычно определяют тип как специфическую последовательность печатных символов, ограниченную пробелами. В отличие от них тематический подсчет слов (lemmatized word count) рассматривает слово-тип как определенный класс слов, включающий его различные родственные формы (формы множественного числа, временные формы, написание с заглавных букв и т. д.), а нек-рые тематические подсчеты тж учитывают различия между омографами (совпадающими по написанию, но различающимися по значению словами).

В двух наиболее широко используемых частотных словарях английского языка — «Учительском словаре на 30 000 слов» (Teacher's word book of 30 000 words) Э. Л. Торндайка и И. Лоджа и «Численном анализе совр. американского варианта английского языка» (Computational analysis of present-day American English) Г. Кучера и У. Н. Франсиса — частотность слов-типов указана в виде частоты встречаемости на млн слов. Ч. с., приводящиеся в этих источниках, не вполне сопоставимы не только вследствие несопоставимости самих выборок, но тж по причине использования в первом, в отличие от последнего, тематического подсчета.

Все эти подсчеты осн. на печатных материалах. Доступны лишь немногие хорошие подсчеты устной речи. Ч. с. из устной и письменной речи практически совпадают; наиболее существенное различие, вероятно, выражается в более высокой частоте употребления личных местоимений в устной речи.

Значительный интерес вызывала мат. форма распределений Ч. с. Такие распределения могут использоваться с целью оценки величины словарного запаса, из к-рого была извлечена определенная выборка, однако различные трактовки распределений приводят к довольно различным оценкам.

Частотность яв-ся лишь одной из ряда характеристик слова, к-рая требует контроля в психол. экспериментах по процессам вербального научения и памяти. Частотность положительно связана с числом значений слова, но отрицательно — с его длиной. Существуют тж связи частотности с известностью слова, скоростью узнавания, разборчивостью (intelligibility), числом вызываемых ассоц. (associative value), эмоциональной коннотацией (affective connotation), конкретностью значения, возрастом, в к-ром предположительно усваивается слово, и др. важными переменными. В определенных типах афазии и др. патологических состояниях Ч. с., наряду с показателем употребления типов слов (type-token ratio), яв-ся решающей переменной при характеристике словарных репертуаров.

Э. Л. Торндайк — пионер в изучении прикл. аспектов Ч. с. в области образования, в частности отбора слов для составления материалов по чтению для школьников и учеб. словарей, а тж оценки читаемости и понятности текстов. Информ. по Ч. с. тж сыграла важную роль в обучении иностранным языкам.

Дж. Б. Кэрролл