ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ
Л. С. КУРАВСКИЙ, С. Б. МАЛЫХ, Т. Е. КРАВЧУК, К. А. БОЛЫЧЕВА
Работа выполнена при поддержке РФФИ, проект № 04-06-80162.
Предложен способ оценки баланса влияний генетических и средовых факторов на психологические характеристики, опирающийся на методы теории информации. Его особенности и преимущества демонстрируются на примере анализа результатов лонгитюдных исследований показателей интеллекта близнецов и сопоставляются с аналогичными данными традиционного факторного анализа. Расчеты показали согласованность выводов, полученных рассмотренными методами.
Ключевые слова: оценка баланса влияний, теория информации, факторный анализ, интеллект близнецов.
Для оценки генетических и средовых причин изменчивости психологических характеристик используются различные процедуры: от классического корреляционного анализа до конфирматорного факторного анализа [5], [9], [10], [13]. Наибольшую эффективность показали методы линейного структурного моделирования, которые являются аналитическими аналогами применяемого в генетике поведения метода, сводящегося к построению и анализу путевых диаграмм. Этот подход позволяет работать с достаточно сложными структурами и, в частности, дает возможность изучать динамику изменения психологических характеристик с помощью симплекс-моделей, опираясь на лонгитюдные данные [6], [8].
Однако данный способ исследования имеет ряд существенных ограничений. Одно из главных — возможность анализа структуры только дисперсий и ковариаций исследуемых параметров. Моменты других порядков, а также динамика распределений результатов наблюдений при этом анализу не поддаются. Особенностью данного типа анализа является наличие необоснованных (и, вообще говоря, не всегда верных) априорных предположений о структуре дисперсий и ковариаций наблюдаемых параметров, включая предположения о равенстве вкладов различных типов сред в психологические характеристики моно- и дизиготных близнецовых пар, о равенстве эффектов влияния генетических факторов, и т. д. Без указанных предположений оценка искомых значений свободных параметров модели стала бы невозможной. Кроме того, определенная искусственность формальных определений общей и индивидуальной сред, воздействующих на испытуемых, приводит к посылкам, явно расходящимся с результатами наблюдений (например, к посылке о том, что одно и то же воздействие среды одинаково влияет на испытуемых с различным генотипом).
145
Рассматривая такие интегрированные характеристики, как дисперсии и ковариации, исследователь теряет достаточно много информации об объекте анализа. Как правило, он
05.10.2012
144
2
Сталкивается с трудностями при экстраполяции (интерполяции) полученных результатов на моменты времени, не совпадающие с теми, в которые проводились наблюдения, а также при выявлении зависимостей эффектов различных воздействий от уровней значений индивидуальных характеристик.
Все это делает актуальным поиск принципиально новых методов анализа, позволяющих, во-первых, проводить независимую проверку выводов и результатов, которые дают традиционные подходы, и, во-вторых, получать и учитывать новую информацию о психологических характеристиках, которая теряется при вычислении моментов второго порядка и не сводится к сведениям о структуре этих моментов и причинной обусловленности наблюдаемых характеристик.
Учитывая это, авторами были предприняты попытки построения альтернативных моделей и методов анализа. Для решения этой задачи было предложено использовать модели, описывающиеся марковскими процессами с дискретными состояниями и непрерывным временем [11], [12]. Полученные результаты позволяют исследовать динамику средовых влияний (общей и индивидуальной сред) на испытуемых, а также генетические факторы, опираясь на скорректированные определения эффектов воздействий различных видов сред. Мы разработали метод исследования комбинированного влияния наследственности и среды, опирающийся на анализ изменений в распределениях фенотипа в популяции. Полученные модели позволили оценивать динамику не только дисперсий, но и средних значений рассматриваемых величин как непрерывных функций от времени. Последнее особенно важно для психологии, поскольку открывает путь для исследования важной проблемы детерминант психического развития. В качестве базовых анализируемых характеристик используются гистограммы (а не ковариационные и корреляционные матрицы, как в факторном анализе). Возможности предложенного подхода ясно видны на примере анализа результатов наблюдений коэффициента интеллектуального развития, проведенных в рамках близнецового лонгитюда. Предложенный метод также дал возможность провести исследование эволюции распределений коэффициента интеллектуального развития с возрастом, позволив сделать ряд заключений о развитии российских детей до школы и в школьный период, а также о зависимости комбинированного влияния наследственности и среды от уровня интеллектуального развития [11].
В дополнение к рассмотренным подходам для оценки роли генетических факторов в развитии психологических характеристик представляется перспективным проведение анализа близнецовых данных методами Теории информации С опорой на понятие Энтропии. Ранее такие исследования не проводились. Их результаты позволят учесть информацию о психологических характеристиках, которая теряется при вычислении моментов второго порядка, избежать ряда недостаточно мотивированных априорных предположений, неизбежных при проведении традиционного факторного анализа, а также получить дополнительное средство для оценки корректности выводов и результатов, получаемых с помощью других методов.
В данной работе рассматривается математический аппарат, необходимый для подобного рода исследований. Особенности его применения демонстрируются на примере анализа показателей интеллекта (IQ), полученных в результате близнецовых и лонгитюдных наблюдений. Представленные методы позволяют выявлять балансы влияний наследственности и среды в процессе изменения психологических характеристик с возрастом, что является одной из основных задач психогенетики. Полученные данные дают возможность выявлять
05.10.2012
144
3
146
Скрытые закономерности развития личности и формируют основания для обоснованного выбора оптимальных методик обучения и воспитания, что вызывает большой интерес у специалистов в области психологии и педагогики. Актуальность решения этой проблемы обусловлена тем, что к настоящему времени накоплено большое число методик подобного рода, многие их которых содержат противоречивые рекомендации.
ОСОБЕННОСТИ АНАЛИЗА ИНФОРМАЦИОННЫХ СВЯЗЕЙ В БЛИЗНЕЦОВЫХ
ПАРАХ
Числовые значения исследуемой психологической характеристики при анализе информационных связей рассматриваются как состояния некоторой стохастической системы X, в которых она может находиться с той или иной вероятностью. В зависимости от типа характеристики множество этих состояний полагается непрерывным или дискретным. Отдельное состояние соответствует либо каждой точке диапазона
Допустимых значений, либо каждому допустимому уровню значений заданной величины.
1 При анализе показателя интеллекта ограничимся непрерывным множеством состояний.
Анализ информационных связей опирается на понятие энтропии H(X), которая
Служит мерой неопределенности состояния системы. В непрерывном случае эта величина
Определяется как Сумм а двух компонентов: средневзвешенного логарифма вероятности
Пребывания в состоянии системы и логарифма от степени точности определения
Состояния системы, взятых с обратным знаком. Соответствующее выражение имеет
Вид:
Где x — состояние системы X, F(X) — плотность распределения вероятностей нахождения в состояниях системы X, Dx — точность определения состояния системы, M[...] — математическое ожидание случайной величины. Выбор основания логарифма определяет выбор единицы измерения энтропии. На практике, как правило, пользуются логарифмами с основанием 2, измеряя энтропию в двоичных единицах.
Пояснения, связанные с мотивами выбора именно такой меры неопределенности, можно найти, например, в книге [1] или любом другом подходящем учебнике. Следует отметить, что данная мера обладает свойством аддитивности: энтропия сложной системы, получаемой при объединении нескольких независимых компонентов, равна сумме их энтропий.
В результате получения сведений о системе ее неопределенность может быть уменьшена. Поэтому количество информации измеряют уменьшением энтропии той системы, для уточнения состояния которой эта информация предназначена. В частности, количество информации, получаемое при полном выяснении состояния системы X, равно энтропии этой системы:
Ix=H(X).
При исследовании двух связанных систем X и Y сведения, полученные в результате наблюдения за одной из этих систем, позволяют в общем случае уточнить состояние
05.10.2012
144
4
Другой. Количество информации о системе X, содержащееся в наблюдениях за системой Y, определяется соответствующим уменьшением энтропии системы X, обозначается как IY→X и называется полной информацией о системе X, содержащейся в системе Y. Можно показать, что
Величина IX→Y называется Полной взаимной информацией, содержащейся в системах X и Y, и выражается через энтропии систем X и Y и энтропию объединенной системы H(X, Y):
IX→Y=H(X)+H(Y)–H(X, Y).
147
Входящая в данное выражение энтропия объединенной системы с непрерывным множеством состояний может быть вычислена следующим образом:
Где f(x, y) — двумерная взаимная плотность распределения вероятностей объединенной системы (X, Y).
В дальнейшем в качестве систем X и Y будем рассматривать множества допустимых значений исследуемой психологической характеристики двух индивидуумов,
Составляющих близнецовую пару. Введенные Г. Менделем фундаментальные понятия
2 Генотипа и фенотипа позволяют формально выделить в полной взаимной информации,
Содержащейся в моно - и дизиготных близнецовых парах, две аддитивных составляющих:
Величину IG, обусловленную генетическими факторами, и величину IC, обусловленную
Влиянием общей для близнецов среды:
Определим коэффициент, представляющий Отношение генетических составляющих моно - и дизиготных близнецовых пар:
K=IGDZ/IGMZ.
Полагая составляющую общей среды одинаковой для разнотипных близнецовых пар, можно составить следующую систему уравнений:
Где IG=IGMZ. Решение этой системы позволяет оценить баланс влияний генетических
05.10.2012
144
5
Факторов и воздействия общей среды.
Индивидуальные особенности Близнецов E(X), обусловленные различиями действующих на них средовых влияний, естественно оценивать как разность между энтропией психологической характеристики индивидуума и полной взаимной информацией, содержащейся в соответствующих характеристиках близнецовой пары:
E(X)=H(X)-Ix→y=H(X, Y)-H(Y).
Рассмотренные выше понятия удобны для описания эволюции психологических характеристик личности в лонгитюдных исследованиях. Если U и V — множества допустимых значений исследуемой психологической характеристики одного и того же индивидуума в два последовательных контрольных момента времени, то новое значение энтропии данной характеристики H(V) можно представить как сумму двух составляющих:
Предыстории, Которая оценивается через полную взаимную информацию И^У Содержащуюся в исследуемых величинах в первый и второй моменты времени, и так называемой Инновации N, обусловленной только новыми влияниями за прошедший период времени и не сводящейся к их предыстории:
Опираясь на приведенные соотношения, можно оценить процентное содержание
Предысторий и инноваций, а также влияний наследственности и среды в энтропии
Наблюдаемой психологической характеристики. Для этого следует определить полные
JMZ JDZ J Взаимные информации J&R^Y1 X^Y* U<^Y И энтропии H(X) и H(V), использу
Результаты наблюдений за популяцией, а затем найти величины IG, IC, E(X) и N из
Указанных выше системы и двух уравнений, полагая известным коэффициент k.
При вычислении полных взаимных информаций и энтропий целесообразно сделать
Предположения о нормальном распределении наблюдаемых психологических
Характеристик X, Y, U и V, а также их пар X-Y и U-V, а именно:
05.10.2012
144 6
Где fT(x, y) и fL(u, v) — соответственно, двумерные взаимные плотности распределения вероятностей пар случайных величин X–Y и U–V, rxy и ruv — их коэффициенты корреляции, mu и mv — математические ожидания величин U и V, mxy — математическое ожидание исследуемой характеристики в близнецовой паре, σu и σv — среднеквадратические отклонения величин U и V, σxy — среднеквадратическое отклонение исследуемой характеристики в близнецовой паре. Сделанные предположения о нормальности опираются на центральную предельную теорему теории вероятностей и подтверждаемый психологической практикой факт воздействия большого числа сопоставимых по влиянию факторов на исследуемые характеристики типа показателя интеллекта.
Сделав несложные преобразования, можно найти следующие выражения для
3 Искомых и вспомогательных величин :
05.10.2012
144
7
Поскольку значения этих величин определяются по результатам наблюдений, вместо входящих в приведенные выше выражения среднеквадратических отклонений и коэффициентов корреляций можно подставить их выборочные оценки.
Биометрические исследования на растениях и животных показали, что принципы менделевского наследования дискретных признаков применимы для полигенных признаков, к которым относятся и психологические характеристики [14]. Поэтому, опираясь на сложившуюся практику, оценим возможные значения коэффициента k, представляющего отношение генетических составляющих моно - и дизиготных близнецовых пар, для простейшего случая гена, находящегося в двухаллельном состоянии, а затем обобщим полученный результат на исследуемый полигенный признак.
Как известно, особи диплоидных организмов разделяются по любому гену с двумя аллелями (А и а) на три генетических класса (АА, аа и Аа). Обозначив вероятности нахождения аллелей А и а в заданном локусе, соответственно, как p и q=1–p, методами биометрической генетики [14] можно вывести представленные в табл. 1 и 2 вероятности появления различных типов пар моно - и дизиготных близнецов.
Полная взаимная информация, содержащаяся в паре близнецов T1–T2, вычисляется
4 По формуле :
149
Таблица 1
Вероятности появления различных типов пар дизиготных близнецов
Таблица 2
Вероятности появления различных типов пар монозиготных близнецов
05.10.2012
144 8
Где i — номер генотипа 1-го близнеца (i=1 для АА, i=2 для аа, i=3 для Аа), j — номер генотипа 2-го близнеца, Rij — вероятность появления генотипа 1-го близнеца, Sij — вероятность появления генотипа 2-го близнеца, Pij — вероятность появления близнецовой пары типа i–j.
Зависимость коэффициента k от вероятности p представлена на рис. 1. Она показывает, что значения этого коэффициента изменяются в достаточно узких пределах. В частности, для реализуемого на практике интервала 0,2≤p≤0,8 коэффициент k не выходит за границы диапазона 0,253±0,011. Таким образом, Генетическая составляющая полной взаимной информации в дизиготной паре близнецов примерно в четыре раза меньше аналогичной составляющей в монозиготной паре. Обобщая этот результат на полигенный случай, можно принять значение k=0,25 в качестве допустимой расчетной оценки данного показателя.
Последовательность вычислений, рекомендуемая для выявления балансов влияний наследственности и среды и включающая взаимные связи между рассмотренными выше показателями, предположениями и зависимостями, представлена в виде схемы на рис. 2. Аналогичная последовательность вычислений, рекомендуемая для выявления предысторий и инноваций в процессе изменения психологической характеристики с возрастом, показана на рис. 3.
АНАЛИЗ ИНФОРМАЦИОННЫХ СВЯЗЕЙ И СИМПЛЕКС-МОДЕЛИ:
РЕЗУЛЬТАТЫ РАСЧЕТОВ
Для оценки возможностей рассмотренного выше подхода, результаты его применения далее сопоставляются с аналогичными данными, полученными с помощью традиционного конфирматорного факторного анализа. Исследованная выборка состояла из 34 пар монозиготных (МЗ) и 28 пар дизиготных (ДЗ) близнецов, которые проходили тестирование в возрасте 6 и 14 лет. Выборка состояла из добровольцев, числящихся в городской популяционной базе близнецов, собранной лабораторией возрастной психогенетики
150
Психологического института Российской академии образования. Все дети были воспитаны в русскоязычных семьях, принадлежащих преимущественно к среднему классу. Все наблюдавшиеся пары близнецов — однополые. Анализировались только те из них, чья зиготность была точно установлена по диагностическому опроснику [7].
05.10.2012
144
9
Дети проходили тестирование по адаптированной в России детской шкале интеллекта Векслера (WISC) [16], используемой для диагностики когнитивных способностей детей в возрасте 5–16 лет и состоящей из 12 субтестов. Одна половина субтестов служит для оценки вербального интеллекта, другая — невербального. Подсчитывались общие показатели вербального, невербального и общего интеллекта.
Описательные статистики для показателя общего интеллекта представлены в табл. 3. Значимых различий между моно - и дизиготными близнецами по среднему значению и дисперсии не обнаружено. Однако было выявлено, что имеются значимые различия по среднему значению между близнецами 6 и 14 лет (t=0,005756).
Описательные статистики для показателя общего интеллекта
Таблица 3
Определяющих
Конфирматорный факторный анализ обеспечил выявление факторов,
5 Структуру общего интеллекта, и исследование динамики ее изменения со временем. В
Качестве наблюдаемых переменных использовались показатели интеллекта, а в качестве
Латентных факторов — величины, обусловленные аддитивными генетическими
Эффектами (различия между гомозиготами), а также влиянием общей и индивидуальной
Сред. Гетерозиготные эффекты, обусловленные доминированием, не учитывались,
Поскольку при имевшихся небольших объемах наблюдаемых данных не представлялось
Возможным отделить при анализе гетерозиготные влияния от аддитивных генетических.
6 Эффекты воздействия факторов оценивались на базе симплекс-модели, представленной
В
05.10.2012
144
10
Рис. 2. Последовательность вычислений, рекомендуемая для выявления баланса влияний
Наследственности и среды
Виде путевой диаграммы на рис. 4, где использованы следующие обозначения:
• G1 и G2 — генетические влияния на показатель интеллекта в 6 и 14 лет;
• C1 и C2 — влияния общей среды в 6 и 14 лет;
• E1 и E2 — влияния индивидуальной среды в 6 и 14 лет;
152
05.10.2012
144
11
Рис. 4. Путевая диаграмма, представляющая симплекс-модель для лонгитюдного исследования
Показателя общего интеллекта (измерения в 6 и 14 лет):
Прямоугольниками обозначены наблюдаемые переменные; кругами обозначены латентные
Переменные; однонаправленные стрелки (или пути) использованы для представления
Предполагаемых причинных связей между переменными; двунаправленные стрелки
Использованы для представления ковариационных связей между переменными (в частности,
Они же использованы и для представления дисперсий)
• путевые коэффициенты g1, c1, e1 и g2, c2, e2 (описывают влияния латентных
переменных для указанных возрастов);
• путевые коэффициенты g12, c12 и e12 (описывают влияния переменных G1, C1 и E1 на
показатели интеллекта в 14 лет).
Путевые коэффициенты рассматривались как свободные параметры модели. Их оценки определялись методом максимального правдоподобия [2], [14]. Для проверки
Того, насколько хорошо модель согласуется с результатами измерений, использовались
7 Критерии χ2 и Акаике (AIC — Akaike’s Information Criterion) [8], [14].
После анализа полной модели из нее последовательно исключались компоненты G и С. Исключение G дает модель, в которой все сходство между близнецами можно отнести за счет общей среды. Исключение C предполагает, что все внутрипарное сходство обусловлено наследственностью.
На следующем этапе анализа последовательно оценивалось, можно ли исключить из модели новые генетические и средовые влияния в 14 лет и можно ли приравнять нулю генетические и средовые ковариации (т. е. можно ли предполагать полную независимость генетических и средовых переменных в разном возрасте).
Критерий χ2 позволил сравнивать между собой указанные альтернативные модели, а именно: оценка согласованности для полной модели сравнивалась с той же
153
05.10.2012
144
12
Характеристикой для упрощенных моделей, в которых некоторые из искомых параметров полагались равными нулю. Поскольку разность в значениях критерия χ2 для полной и упрощенных моделей сама асимптотически описывается распределением χ2 ([4], [14]), она используется для выявления статистической значимости удаленных из модели компонентов.
Процедура поиска оптимальной симплекс-модели представлена в табл. 4.
Таблица 4
Согласование симплекс-моделей, представляющих структуру общего интеллекта, с
Результатами наблюдений
Полная модель не показывает убедительного соответствия результатам наблюдений (χ211=17,08; p=0,11). Модель 2, учитывающая влияние генетических факторов и случайной среды, дает примерно такое же соответствие (Dχ23=3,71; p=0,29), в то время как модель 3, учитывающая только общую и случайную среды, демонстрирует значительно худшие показатели: Dχ23=14,99; p=0,00. Это свидетельствует о том, что значимыми в структуре общего интеллекта в данном случае являются лишь компоненты, обусловленные влиянием генетических факторов и случайной среды.
В модели 4, где отсутствовали новые генетические влияния (инновации), имело место значимое увеличение показателя χ2, указывающее на отсутствие генетических инноваций в 14-летнем возрасте.
Для проверки гипотезы об отсутствии статистически значимых связей между генетическими влияниями в возрасте 6 и 14 лет использовалась модель 5, а для проверки аналогичной гипотезы относительно случайной среды — модель 6. Значимое увеличение показателя χ2 у модели 5 свидетельствует о том, что генетические влияния, определявшие общий интеллект в 6 лет, играли существенную роль и в 14 лет. В то же время отсутствие значимых изменений в показателе χ2 для модели 6 (по сравнению с полной моделью) дает основания полагать, что влияние индивидуальной среды определяется только возрастом.
Относительные значения информационных составляющих, обусловленных влиянием наследственности и различных видов сред, при точности определения показателя Dx, равной единице, сопоставлены с аналогичными характеристиками оптимальной симплекс-модели в табл. 5.
Факторный анализ показал, что бóльшая часть дисперсии исследуемого показателя в 14-летнем возрасте обусловлена новыми влияниями: инновации составляют
05.10.2012
144
13
154
Таблица 5
Конфирматорный факторный анализ и анализ информационных связей: оценки относительных эффектов влияния генетических факторов, общей и
Индивидуальной сред, %
61 %, а влияния, определявшие общий интеллект в 6 лет, — 39 % (при этом генетическая составляющая этой дисперсии является новой на 35 %, а составляющая общей среды — на 100 %). Анализ информационных связей дает похожие результаты: при точности определения показателя Dx, равной единице, полная взаимная информация, содержащаяся в показателях общего интеллекта в 6- и 14-летнем возрасте, составляет 8 % от энтропии данной характеристики в 14 лет. Следовательно, 92 % указанной энтропии обусловлено новыми влияниями, имевшими место за период времени от 6 до 14 лет.
АНАЛИЗ ИНФОРМАЦИОННЫХ СВЯЗЕЙ И СИМПЛЕКС-МОДЕЛИ:
СРАВНЕНИЕ
Сопоставимост ь результатов. Несмотря на то, что анализ информационных связей и факторный анализ оперируют величинами совершенно разной природы, основные выводы, вытекающие из полученных с их помощью результатов, совпадают: относительный вклад генетических факторов с возрастом снижается, а вклад индивидуальной среды возрастает. Как показали расчеты, в обоих случаях относительное
Ослабление влияния генотипа обусловлено в первую очередь не столько его абсолютным
8 Уменьшением, сколько увеличением вклада индивидуальной среды. Анализ
Информационных связей свидетельствует о наличии некоторого влияния общей среды,
Хотя и существенно менее значимого, чем влияние двух типов факторов, учтенных в
Оптимальной симплекс-модели.
Чувствительность результатов к изменчивости выборочных оценок. Несмотря на
Малый объем исследуемой выборки испытуемых, относительные соотношения между
Компонентами факторной модели показали малую чувствительность к ошибкам,
Возникающим при вычислении выборочных оценок наблюдаемых дисперсий и
Ковариаций: при изменении значений свободных параметров в границах 95 %-х
10 Средовых составляющих в общей дисперсии не превысило 5 % . Это позволяет говорить
Об устойчивости качественной структуры факторной модели. Данный вывод
Подтверждается оценками, построенными для подмножеств, представляющих половину
Исходной выборки: изменение
05.10.2012
144
14
Процентного содержания компонентов общей дисперсии также не превышало 5 % от первоначального значения.
Проведенные расчеты показали, что результаты, полученные путем анализа информационных связей, в случае малых выборок оказались более чувствительными к ошибкам в выборочных оценках коэффициентов корреляции и среднеквадратических отклонений: изменение этих оценок в границах 95 %-х доверительных интервалов может приводить к качественному изменению соотношений между компонентами энтропии, обусловленными влиянием генетических и средовых факторов. Эта неопределенность сравнительно быстро уменьшается с увеличением объема выборки. Для иллюстрации на рис. 5 представлен график, показывающий границы 95 %-х доверительных интервалов для выборочных оценок коэффициента корреляции при различных объемах выборки.
Адекватность терминов и предположений. Учитывая природу исследуемых величин, использование понятий энтропии и информации для оценки соотношений между генетическими и средовыми влияниями, с нашей точки зрения, является более естественным, чем построение аналогичных оценок на базе представлений о выражаемой дисперсией степени разброса характеристик фенотипа относительно среднего значения. Преимуществом анализа информационных связей также является отсутствие ряда необоснованных априорных предположений о структуре дисперсий и ковариаций наблюдаемых параметров, неявно используемых в классических факторных моделях, а именно: предположений о равенстве вкладов различных типов сред в психологические характеристики моно - и дизиготных близнецовых пар, о равенстве эффектов влияния генетических факторов, о равенстве средовых влияний на испытуемых с различным генотипом и т. д.
Адекватность оптимальной модели. Преимуществом используемой в факторном анализе схемы выявления наиболее адекватной модели на основе проверки гипотез о статистической значимости тех или иных ее компонентов является возможность обоснованно оценивать значимость различных компонентов модели и судить о ее адекватности наблюдениям в целом. С другой стороны, удаление незначимых компонентов факторной модели при невысокой степени ее адекватности наблюдениям приводит к грубой модели, противоречащей накопленному опыту и здравому смыслу.
05.10.2012
144
15
Это, в частности, имело место в рассмотренном выше примере, где, опираясь на статистические оценки,
156
Был сделан вывод о полном отсутствии влияния общей среды. Анализ информационных связей не создает подобных проблем.
Зависимость от точности измерения. Существенным недостатком анализа информационных связей, в свою очередь, является зависимость оценок от точности Dx измерения исследуемого показателя, что предъявляет повышенные требования к обоснованию его выбора.
Простота применения и сложность программной реализации. Оценки, получаемые в результате анализа информационных связей, вычисляются по несложным формулам на базе простейших описательных статистик: коэффициентов корреляции и среднеквадратических отклонений. Проведение соответствующих вычислений доступно неподготовленным пользователям. Оно не требует ни специально разработанного программного обеспечения, ни дополнительного обучения.
Факторный анализ, напротив, может проводиться только при наличии специализированных программ, в которых, в частности, реализованы сложные алгоритмы многомерной численной оптимизации. Эти программы могут эффективно использоваться только подготовленными специалистами, которые достаточно хорошо ориентируются в решении таких проблем, как выбор начальных приближений при численной оптимизации, поиск глобальных экстремумов, интерпретация результатов расчетов и т. д. Таким образом, анализ информационных связей имеет очевидные преимущества по такому важному показателю, как простота применения.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Выведены простые соотношения, позволяющие, опираясь на методы и понятия
теории информации, оценивать степень влияния генетических и средовых факторов на
психологические характеристики по стандартным описательным статистикам,
получаемым в результате близнецовых и лонгитюдных исследований.
2. Исследована зависимость отношения генетических составляющих полной
взаимной информации о психологических характеристиках в моно - и дизиготных парах
близнецов от частотного распределения аллелей в популяции.
3. Проведенные расчеты показали сопоставимость результатов, полученных с
помощью анализа информационных связей и традиционного факторного анализа,
включая согласованность качественных выводов, сделанных на их основе.
4. Сравнение результатов расчетов показало, что анализ информационных связей имеет преимущества по таким показателям, как доступность применения и простота программной реализации, отсутствие ряда недостаточно мотивированных априорных предположений о соотношениях генетических и средовых влияний, адекватность методов и терминов исследуемой проблеме. В то же время преимуществами факторного анализа являются малая чувствительность к ошибкам, которые возникают при вычислении выборочных статистических оценок, используемых при выборе оптимальной модели, и независимость от точности измерения исследуемой характеристики.
5. Анализ информационных связей может служить дополнительным средством для оценки корректности выводов, получаемых традиционным конфирматорным факторным
05.10.2012
144
16
Анализом, поскольку позволяет учесть информацию о психологических характеристиках, которая теряется при вычислении выборочных оценок моментов второго порядка.
1. Вентцель Е. С. Теория вероятностей. М.: Высшая школа, 2003.
2. Лоули Д., Максвелл А. Факторный анализ как статистический метод. М.: Мир, 1967.
3. Akaike H. New look at the statistical model identification // IEEE Transactions on automatic control.
1974. AC-19. N 6. P. 716.
4. Bishop Y. M.M., Fienberg S. E., Holland P. W. Discrete multivariate analysis: Theory and practice.
Cambridge, MA: M. I. T. Press, 1975.
5. Bollen K. A. Structural equations with latent variables. N. Y.: John Wiley, 1989.
157
6. Boomsma D. I., Martin N. G., Molenaar P. C.M. Factor and simplex models for repeated measures:
Application to two psychomotor measures of alcohol sensitivity in twins // Behav. Genetics. 1989. V. 19. P. 79–96.
7. Cohen D. J. et al. Separating identical from fraternal twins // Arch. General Psychiatry. 1973. V. 29.
P. 465–469.
8. Dolan C. V., Molenaar P. C.M., B oomsma D. I. Longitudinal genetic analysis of longitudinal means
And covariance structure in the simplex model using LISREL // Behav. Genetics. 1991. V. 21. P. 49–61.
9. Eaves L. J., Eysenck H. J., Martin N. G. Genes, culture and personality: An empirical approach. L.:
Oxford Univ. Press, 1989.
10. JЦeskog K. G. Estimation and testing of simplex models // Brit. J. Mathemat. and Statistic. Psychol.
1970. V. 23. P. 121–145.
11. Kuravsky L. S., Malykh S. B. Application of Markov models for analysis of development of psychological characteristics // Austral. J. Educ. and Devel. Psychol. 2004. V. 2. P. 29–40.
12. Kuravsky L. S., Malykh S. B. On the application of queuing theory for analysis of twin data // Twin
Research. 2000. V. 3. P. 92–98.
13. Loehlin J. C. Latent variable models: An introduction to factor, path and structural analysis. Hills-
Dale, NJ: Erlbaum, 1987.
14. Neale M. C., Cardon L. R. Methodology for genetic studies of twins and families. Dordrecht, the Netherlands: Kluwer Acad. Publ., 1992.
15. Neale M. C., Miller M. B. The use of likelihood-based confidence intervals in genetic models // Behav. Genetics. 1997. V. 27. P. 113–120.
16. Wechsler D. Wechsler intelligence scale for children. N. Y., 1949.
Поступила в редакцию 23.VI 2005 г.
1 Это ограничение не является принципиальным.
2 В терминах Г. Менделя — фактор и эффект.
3 Далее полагаем, что в близнецовой паре D X=D Y, а *-У .
4 Эта формула выводится из приведенного выше выражения для полной взаимной информации:
1Т^т=ЩТ1)+ЩТ2)-ЩГ1>Т2)=м[-\оёЦТ1)]+м[-1о&Р{Т2)]-
■-■■м\-1<щ?(ТиТ2}]=.М
І J
5 Данный вид анализа сводится к оценке степени близости по заданным статистическим
Критериям наблюдаемых ковариационных матриц, составленных из выборочных оценок
Ковариаций психометрических показателей, и прогнозируемых ковариационных матриц,
05.10.2012
144
17
Элементы которых обусловлены используемой моделью и описываются аналитическими
Выражениями относительно ее свободных параметров.
6
Чтобы получить достаточное число наблюдаемых статистик, искомые характеристики
Использованной симплекс-модели оценивались одновременно для моно - и дизиготных пар
Близнецов (каждому типу близнецов соответствовали свои прогнозируемые и наблюдаемые
Матрицы с размерностью 4×4).
7 Критерий Акаике отдает предпочтение тем моделям, которые согласуются с результатами
Измерений при меньшем количестве параметров (модель с наименьшим значением этого
Критерия рассматривается как наилучшая).
8 Анализ оптимальной симплекс-модели показал некоторое увеличение этого показателя, а
Анализ информационных связей — его уменьшение.
9 Для оценки доверительных интервалов применялся метод, представленный в работе [15],
Который сводится к постепенному удалению значения заданного свободного параметра от его
Оптимальной оценки до достижения заданного приращения меры соответствия прогноза и
Наблюдений, распределенной как χ2.
10
Абсолютное изменение вычисленных значений свободных параметров при этом могло
Быть достаточно велико, достигая 50 % от исходного значения.
05.10.2012
146
1
146 ИСТОРИЯ ПСИХОЛОГИИ