Систематическая ошибка измерений, вызванная влиянием пола (sex bias in measurement)

Систематическая ошибка измерений, вызванная влиянием пола (sex bias in measurement)

С. о. и. имеет место в тех случаях, когда группы реагируют по-разному на задания в тестах достижений, интеллекта или способностей, либо в др. измерительных инструментах, таких как опросники интересов. С. о. и., вызванная влиянием пола, имеет место в тех случаях, когда лица мужского и женского пола по-разному реагируют на такие задания и пункты тестов. Эта проблема имеет столь же важные последствия для образовательных и профессиональных выборов женщин, как и систематическая ошибка при тестировании представителей меньшинств.

Хотя термины «систематическая ошибка», или «необъективность» и «несправедливость», часто использовались как взаимозаменяемые, среди специалистов, по-видимому, достигнуто согласие употреблять термин «необъективность», или «систематическая ошибка», применительно к внутренним свойствам теста — его содержанию, конструкту или конструктам, к-рые он предназначен измерять, и контексту, в к-рый помещается его содержание. Термин «несправедливость» имеет отношение к этическим вопросам, связанным с использованием рез-тов теста. В дополнение к этому, Шепард определяет систематическую ошибку инструмента как то, что имеет место в ситуации, когда два индивидуума с равными способностями, но из различных групп не имеют равных шансов на успешное выполнение тестового задания.

Вопросы вызванной полом необъективности и нечестности в измерениях изучались гл. обр. в связи с тестами интересов, достижений и способностей, и в меньшей степени — в связи с инструментами измерения личности. Мн. из различий между мужчинами и женщинами в рез-тах тестирования приписывались различиям в процессе социализации — различиям в ожиданиях относительно поведения, интересов и достижений в раннем детстве; различиям в ожиданиях, касающихся учеб. предметов, к-рыми мальчиков и девочек поощряют заниматься в школе; и стереотипизации профессий как мужских и женских, с отнесением к числу последних преим. низкооплачиваемых, бесперспективных профессий, на к-рых в настоящее время занято большинство женщин.

Систематическая ошибка в измерении интересов. До сравнительно недавнего времени опросники интересов — в особенности те, в состав к-рых входят шкалы профессий, — акцентировались преим. на оценке предпочтений к традиционно мужским формам деятельности. Лишь недавно стали предприниматься попытки построить сбалансированные в половом отношении шкалы интересов с числом пунктов в шкале, благоприятствующих одному полу, уравновешенному с числом пунктов, благоприятствующих др. полу. Национальный ин-т образования (National Institute of Education) занимается изучением вопросов половой необъективности в измерении интересов, включая разраб. рекомендаций для создания справедливых в половом отношении опросников, предполагающих, напр., сообщение тестируемым мужчинам и женщинам оценок по всем шкалам, независимо от пола критериальной группы, и более справедливую в половом отношении интерпретацию рез-тов тестирования.

Систематическая ошибка в тестировании достижений и способностей. Начиная с девятого класса, контекст, а тж содержание и половая сбалансированность пунктов в тестировании, становятся важными переменными половых различий в его рез-тах, особенно в области математики и естественных наук. К. Двайер приводит данные о том, что в тестах вербальной способности, при прочих равных условиях, мужчины получали более высокие оценки, когда материал подавался в контексте бизнеса, науки, повседневных практ. дел, механических принципов или математики. Женщины получали более высокие оценки, когда привлекался материал из области иск-ва, гуманит. предметов или касался понимания челов. отношений. В этом исслед. не было получено убедительных доказательств в отношении того, возникали ли эти различия в рез-те знакомства с контекстом, мотивирующего значения этого контекста, или определенного сочетания того и другого. Титтл тж описал исслед., в к-ром было установлено, что даже если осн. мат. процессы, необходимые для выполнения заданий теста, оставались неизменными, эксперим. манипулирование контекстом отдельных заданий с целью описать материал или ситуацию более знакомым для мужчин или женщин образом вызывало половые различия в рез-тах тестирования. В тестировании способностей вопросы половой необъективности и несправедливости, пожалуй, лучше всего иллюстрируют комментарии Ли Кронбаха к Батарее профессиональной пригодности вооруженных сил США (Armed Services Vocational Aptitude Battery). Кронбах указал, что, наряду с др. недостатками, эта батарея была плохо приспособлена для применения к женщинами. Недостаточная профессиональная и техническая информированность (напр., неспособность опознать карбюратор) была бы оценена как низкая профпригодность, низкий уровень технических способностей или способности к обучению.

Степень различий между мужчинами и женщинами. Важным фактором в решении вопросов необъективности и несправедливости в измерениях, вызванных влиянием пола, яв-ся действительная величина измеряемых различий в интеллектуальной способности. Д. Хайд приводит рез-ты мета-анализа, к-рый она провела в отношении исслед. по половым различиям в вербальных, числовых, визуально-пространственных и визуально-аналитических пространственных способностях. Несмотря на то что упомянутые различия описывались как «надежно установленные», Хайд обнаружила, что в действительности они оказались не столь велики. Половыми различиями можно было объяснить только 1% дисперсии в вербальной и числовой способности, 4% дисперсии в визуально-пространственной способности и приблизительно 2,5% дисперсии в визуально-аналитической пространственной способности. Эти величины, заключила она, оказываются слишком незначительными, чтобы ими можно было объяснить различия в профессиональном распределении мужчин и женщин, напр. в области технических профессий.

Вопрос социальной справедливости. Мессик выделяет два критических вопроса: а) хорош ли тест в качестве средства измерения характеристик, к-рые он предназначен оценивать; б) должен ли тест использоваться для предполагаемой цели предлагаемым образом? Первый вопрос относится к психометрическим свойствам теста, особенно к конструктной валидности. Второй яв-ся этическим вопросом, и чтобы ответить на него, предлагаемое использование теста должно оказываться справедливым с т, зр. соц. ценностей. Эти вопросы относятся не только к проблемам отбора или оценки личности, но и ко всей области психол. и пед. измерений, включая осн. на конструктах тесты способностей и осн. на выборочной проверке содержания тесты достижений.

См. также Культурно-свободные тесты, Смещение результатов тестирования, связанное с расовыми (этническими) различиями, Сексизм

Э. Даймонд