Влияние психолингвистических факторов на эффективность автоматической рубрикации текста
Введение
Определение эффективности автоматической рубрикации документов выполняется путем сравнения результатов автоматической рубрикации с "правильной" эталонной рубрикацией, составленной независимыми аудиторами. Однако эталонная рубрикация может быть неточной, поскольку выбор релевантных рубрик является сложной задачей не только для автоматизированных систем, но и для людей.
Психолингвистические факторы
Точность экспериментальной оценки эффективности автоматической рубрикации ограничивают следующие психолингвистические факторы:
- Сложность ориентации в больших классификаторах
 - Некомпетентность аудиторов в отдельных предметных областях
 - Отсутствие формальных критериев для определения важности рубрики
 - Затруднения при отнесении документа к конкретной рубрике
 - Субъективное восприятие релевантности рубрики документу
 
Недостаточность традиционных методов
Традиционно для определения эффективности используется сравнение автоматической рубрикации с эталонной, составленной одним аудитором. Однако такой подход некорректен, поскольку:
- Исследование показало, что процент совпадения рубрик, поставленных разными экспертами на одни и те же документы, может быть низким (до 60%).
 - Эталонная рубрикация должна обеспечивать оценку релевантности рубрики документу, но этого обычно не происходит.
 
Усовершенствования
Для преодоления психолингвистических факторов предлагаются следующие усовершенствования экспериментальной методики:
- Шкалирование релевантности: Релевантность рубрики должна оцениваться по шкале для каждого отнесения документа к рубрике. Это позволит выявить степень близости рубрики к ядру поля текста.
 - Многократная эталонная рубрикация: Одни и те же тексты должны рубрицироваться разными аудиторами, специалистами в различных предметных областях и возрастных группах. Это позволит учесть индивидуальные особенности аудиторов.
 - Статистический анализ: Сравнение результатов шкалирования рубрик различными аудиторами с величиной, полученной в результате автоматической рубрикации, должно производиться в соответствии с T-критерием Стьюдента, чтобы выявить статистически значимые различия.
 
Заключение
Точность традиционной экспериментальной оценки эффективности автоматической рубрикации текста ограничивается рядом психолингвистических факторов. Предложенные усовершенствования методики, учитывающие эти факторы, могут повысить точность оценки и обеспечить более надежные результаты.
Дальнейшие исследования
Для дальнейших исследований планируется:
- Применить предлагаемую методику для оценки эффективности разрабатываемой автором системы автоматической рубрикации новостных сообщений.
 - Определить необходимое количество испытуемых, предметных областей, социокультурного статуса и возрастных групп аудиторов.
 - Проанализировать возможные зависимости между этими параметрами и мерами точности и полноты рубрикации.
 
Ключевые особенности усовершенствованной методики оценки эффективности автоматической рубрикации текста
Шкалирование релевантности
- Релевантность рубрики документу оценивается по шкале для каждого отнесения документа к рубрике.
 - Эталонная рубрикация обеспечивает оценку релевантности рубрики документу, чего обычно не происходит в традиционных методах.
 - Шкалирование позволяет учесть индивидуальные особенности аудиторов и выделить ядро и периферию поля текста рубрик.
 
Многократная эталонная рубрикация
- Одни и те же тексты рубрицируются разными аудиторами, специалистами в различных предметных областях и возрастных группах.
 - Учитываются индивидуальные особенности аудиторов, их компетентность в определенных областях и субъективное восприятие релевантности рубрики.
 - Многократная эталонная рубрикация повышает надежность и точность оценки эффективности автоматической рубрикации.
 
Статистический анализ
- Сравнение результатов шкалирования рубрик различными аудиторами с величиной, полученной в результате автоматической рубрикации, производится в соответствии с T-критерием Стьюдента.
 - T-критерий позволяет выявить статистически значимые различия между результатами автоматической рубрикации и эталонной рубрикацией.
 - Статистический анализ обеспечивает более объективную и достоверную оценку эффективности.
 
Улучшение точности
- Учет психолингвистических факторов, таких как субъективное восприятие релевантности рубрики, сложность ориентации в больших классификаторах и отсутствие формальных критериев для определения важности рубрики.
 - Шкалирование релевантности, многократная эталонная рубрикация и статистический анализ позволяют преодолеть эти факторы и повысить точность оценки эффективности автоматической рубрикации текста.