3.5. Оценка надежности тестов

Несмотря на кажущуюся простоту, данная проблема постоянно находится в фокусе внимания психометристов, порождая нескончаемый поток публикаций [72; 73; 138; 147]. Публикации, посвященные различным аспектам надежности, начали появляться и в советской литературе |75; 79; 87; 184; 274; 277].

68___________ Часть I. Психодиагностика — Теоретико-Методологические Аспекты

В современной психометрии стало уже привычным в качестве фундаментальных характеристик приіодности теста как измерительного инструмента выделять его надежность и валидность.

Однако, несмотря на все возрастающее внимание к проблеме надежности, многие ее аспекты остаются недостаточно разработанными, дискуссионными. Как отмечается в одной из последних работ по психологическому тестированию, изданных за рубежом [325J, в течение многих десятилетий усилия исследователей концентрировались главным образом на совершенствовании методов, посредством которых оценивается согласованность измерения, и лишь сравнительно недавно взоры стали обращаться к вопросам, связанным с установлением причин, обусловливающих недостаточную надежность тех или иных тестов.

Поэтому и в подходах к трактовке различных аспектов этого понятия, в интерпретации конкретных коэффициентов надежности, наконец, в понимании взаимосвязи надежности и валидности все еще сохраняется немало спорных, а то и просто неосвещенных моментов. В частности, недостаточно четко специфицированы отдельные аспекты надежности, сохраняются «белые пятна» и в вопросе о факторах, создающих погрешность измерения, недостаточно проанализированы и пути повышения надежности тестовых методик. Все это делает проблему надежности одной из наиболее актуальных в современной тестологии.

Надежность [Reliability — англ.) Теста — Это Характеристика Точности Его как Измерительного Инструмента, Устойчивости Его К Действиям Помех (Состояния Испытуемых, Их Отношение К Процессу Тестирования И Др.).

При разработке теста на базе репрезентативной выработки исследователь отбирает задачи, вопросы (или модифицирует их) таким образом, чтобы распределение реальных тестовых оценок было по возможности близко к нормальному. Величина дисперсии в этом случае считается истинной и обозначается через D или s2.

Каждый член тестированной выборки занимает свое определенное место на шкале «сырых» оценок и шкале стандартных отклонений. Теоретически это место для каждого члена выборки должно быть постоянно. Повторное выполнение теста теми же испытуемыми должно давать такое же распределение мест на указанных шкалах, как и в первый раз. В этом идеальном случае тест считается абсолютно надежным. На практике оценка и места испытуемых в результате повторного тестирования часто меняются. Распределение в этом случае в большей степени отличается от нормального, чем исходное, принятое за эталонное, истинное.

Для такого распределения величина дисперсии выше, чем S2 На величину дисперсии ошибки измерения: S2 =S2 + S2R

Раздел 3. Теоретические Проблемы Диагностических Методов

Надежность теста определяется, как правило, по окончании процедуры анализа задач и составления окончательной формы теста. Метод повторного тестирования (ретестирования) является основным при определении надежности теста. Метод повторного тестирования чаще всего находит применение при контроле надежности скоростных тестов и опросников. Наиболее простой способ нахождения коэффициента надежности заключается в расчете коэффициента полной корреляции (по Пирсону) между результатами первого и второго тестирования у группы испытуемых.

Тест считается надежным, когда коэффициент надежности находится в пределах 0,6 + 0,1. Случаи, когда Г < 0,6, должны рассматриваться особо.