ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

Л. С. КУРАВСКИЙ, С. Б. МАЛЫХ, Т. Е. КРАВЧУК, К. А. БОЛЫЧЕВА

Работа выполнена при поддержке РФФИ, проект № 04-06-80162.

Предложен способ оценки баланса влияний генетических и средовых факторов на психологические характеристики, опирающийся на методы теории информации. Его особенности и преимущества демонстрируются на примере анализа результатов лонгитюдных исследований показателей интеллекта близнецов и сопоставляются с аналогичными данными традиционного факторного анализа. Расчеты показали согласованность выводов, полученных рассмотренными методами.

Ключевые слова: оценка баланса влияний, теория информации, факторный анализ, интеллект близнецов.

Для оценки генетических и средовых причин изменчивости психологических характеристик используются различные процедуры: от классического корреляционного анализа до конфирматорного факторного анализа [5], [9], [10], [13]. Наибольшую эффективность показали методы линейного структурного моделирования, которые являются аналитическими аналогами применяемого в генетике поведения метода, сводящегося к построению и анализу путевых диаграмм. Этот подход позволяет работать с достаточно сложными структурами и, в частности, дает возможность изучать динамику изменения психологических характеристик с помощью симплекс-моделей, опираясь на лонгитюдные данные [6], [8].

Однако данный способ исследования имеет ряд существенных ограничений. Одно из главных — возможность анализа структуры только дисперсий и ковариаций исследуемых параметров. Моменты других порядков, а также динамика распределений результатов наблюдений при этом анализу не поддаются. Особенностью данного типа анализа является наличие необоснованных (и, вообще говоря, не всегда верных) априорных предположений о структуре дисперсий и ковариаций наблюдаемых параметров, включая предположения о равенстве вкладов различных типов сред в психологические характеристики моно- и дизиготных близнецовых пар, о равенстве эффектов влияния генетических факторов, и т. д. Без указанных предположений оценка искомых значений свободных параметров модели стала бы невозможной. Кроме того, определенная искусственность формальных определений общей и индивидуальной сред, воздействующих на испытуемых, приводит к посылкам, явно расходящимся с результатами наблюдений (например, к посылке о том, что одно и то же воздействие среды одинаково влияет на испытуемых с различным генотипом).

145

Рассматривая такие интегрированные характеристики, как дисперсии и ковариации, исследователь теряет достаточно много информации об объекте анализа. Как правило, он

05.10.2012


144

2


Сталкивается с трудностями при экстраполяции (интерполяции) полученных результатов на моменты времени, не совпадающие с теми, в которые проводились наблюдения, а также при выявлении зависимостей эффектов различных воздействий от уровней значений индивидуальных характеристик.

Все это делает актуальным поиск принципиально новых методов анализа, позволяющих, во-первых, проводить независимую проверку выводов и результатов, которые дают традиционные подходы, и, во-вторых, получать и учитывать новую информацию о психологических характеристиках, которая теряется при вычислении моментов второго порядка и не сводится к сведениям о структуре этих моментов и причинной обусловленности наблюдаемых характеристик.

Учитывая это, авторами были предприняты попытки построения альтернативных моделей и методов анализа. Для решения этой задачи было предложено использовать модели, описывающиеся марковскими процессами с дискретными состояниями и непрерывным временем [11], [12]. Полученные результаты позволяют исследовать динамику средовых влияний (общей и индивидуальной сред) на испытуемых, а также генетические факторы, опираясь на скорректированные определения эффектов воздействий различных видов сред. Мы разработали метод исследования комбинированного влияния наследственности и среды, опирающийся на анализ изменений в распределениях фенотипа в популяции. Полученные модели позволили оценивать динамику не только дисперсий, но и средних значений рассматриваемых величин как непрерывных функций от времени. Последнее особенно важно для психологии, поскольку открывает путь для исследования важной проблемы детерминант психического развития. В качестве базовых анализируемых характеристик используются гистограммы (а не ковариационные и корреляционные матрицы, как в факторном анализе). Возможности предложенного подхода ясно видны на примере анализа результатов наблюдений коэффициента интеллектуального развития, проведенных в рамках близнецового лонгитюда. Предложенный метод также дал возможность провести исследование эволюции распределений коэффициента интеллектуального развития с возрастом, позволив сделать ряд заключений о развитии российских детей до школы и в школьный период, а также о зависимости комбинированного влияния наследственности и среды от уровня интеллектуального развития [11].

В дополнение к рассмотренным подходам для оценки роли генетических факторов в развитии психологических характеристик представляется перспективным проведение анализа близнецовых данных методами Теории информации С опорой на понятие Энтропии. Ранее такие исследования не проводились. Их результаты позволят учесть информацию о психологических характеристиках, которая теряется при вычислении моментов второго порядка, избежать ряда недостаточно мотивированных априорных предположений, неизбежных при проведении традиционного факторного анализа, а также получить дополнительное средство для оценки корректности выводов и результатов, получаемых с помощью других методов.

В данной работе рассматривается математический аппарат, необходимый для подобного рода исследований. Особенности его применения демонстрируются на примере анализа показателей интеллекта (IQ), полученных в результате близнецовых и лонгитюдных наблюдений. Представленные методы позволяют выявлять балансы влияний наследственности и среды в процессе изменения психологических характеристик с возрастом, что является одной из основных задач психогенетики. Полученные данные дают возможность выявлять

05.10.2012


144

3


146

Скрытые закономерности развития личности и формируют основания для обоснованного выбора оптимальных методик обучения и воспитания, что вызывает большой интерес у специалистов в области психологии и педагогики. Актуальность решения этой проблемы обусловлена тем, что к настоящему времени накоплено большое число методик подобного рода, многие их которых содержат противоречивые рекомендации.

ОСОБЕННОСТИ АНАЛИЗА ИНФОРМАЦИОННЫХ СВЯЗЕЙ В БЛИЗНЕЦОВЫХ

ПАРАХ

Числовые значения исследуемой психологической характеристики при анализе информационных связей рассматриваются как состояния некоторой стохастической системы X, в которых она может находиться с той или иной вероятностью. В зависимости от типа характеристики множество этих состояний полагается непрерывным или дискретным. Отдельное состояние соответствует либо каждой точке диапазона

Допустимых значений, либо каждому допустимому уровню значений заданной величины.

1 При анализе показателя интеллекта ограничимся непрерывным множеством состояний.

Анализ информационных связей опирается на понятие энтропии H(X), которая

Служит мерой неопределенности состояния системы. В непрерывном случае эта величина

Определяется как Сумм а двух компонентов: средневзвешенного логарифма вероятности

Пребывания в состоянии системы и логарифма от степени точности определения

Состояния системы, взятых с обратным знаком. Соответствующее выражение имеет

Вид:

ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

Где x — состояние системы X, F(X) — плотность распределения вероятностей нахождения в состояниях системы X, Dx — точность определения состояния системы, M[...] — математическое ожидание случайной величины. Выбор основания логарифма определяет выбор единицы измерения энтропии. На практике, как правило, пользуются логарифмами с основанием 2, измеряя энтропию в двоичных единицах.

Пояснения, связанные с мотивами выбора именно такой меры неопределенности, можно найти, например, в книге [1] или любом другом подходящем учебнике. Следует отметить, что данная мера обладает свойством аддитивности: энтропия сложной системы, получаемой при объединении нескольких независимых компонентов, равна сумме их энтропий.

В результате получения сведений о системе ее неопределенность может быть уменьшена. Поэтому количество информации измеряют уменьшением энтропии той системы, для уточнения состояния которой эта информация предназначена. В частности, количество информации, получаемое при полном выяснении состояния системы X, равно энтропии этой системы:

Ix=H(X).

При исследовании двух связанных систем X и Y сведения, полученные в результате наблюдения за одной из этих систем, позволяют в общем случае уточнить состояние

05.10.2012


144

4


Другой. Количество информации о системе X, содержащееся в наблюдениях за системой Y, определяется соответствующим уменьшением энтропии системы X, обозначается как IY→X и называется полной информацией о системе X, содержащейся в системе Y. Можно показать, что




Величина IX→Y называется Полной взаимной информацией, содержащейся в системах X и Y, и выражается через энтропии систем X и Y и энтропию объединенной системы H(X, Y):

IX→Y=H(X)+H(Y)–H(X, Y).

147

Входящая в данное выражение энтропия объединенной системы с непрерывным множеством состояний может быть вычислена следующим образом:




Где f(x, y) — двумерная взаимная плотность распределения вероятностей объединенной системы (X, Y).

В дальнейшем в качестве систем X и Y будем рассматривать множества допустимых значений исследуемой психологической характеристики двух индивидуумов,

Составляющих близнецовую пару. Введенные Г. Менделем фундаментальные понятия

2 Генотипа и фенотипа позволяют формально выделить в полной взаимной информации,

Содержащейся в моно - и дизиготных близнецовых парах, две аддитивных составляющих:

Величину IG, обусловленную генетическими факторами, и величину IC, обусловленную

Влиянием общей для близнецов среды:

ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

Определим коэффициент, представляющий Отношение генетических составляющих моно - и дизиготных близнецовых пар:

K=IGDZ/IGMZ.

Полагая составляющую общей среды одинаковой для разнотипных близнецовых пар, можно составить следующую систему уравнений:

ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

Где IG=IGMZ. Решение этой системы позволяет оценить баланс влияний генетических

05.10.2012


144

5


Факторов и воздействия общей среды.

Индивидуальные особенности Близнецов E(X), обусловленные различиями действующих на них средовых влияний, естественно оценивать как разность между энтропией психологической характеристики индивидуума и полной взаимной информацией, содержащейся в соответствующих характеристиках близнецовой пары:

E(X)=H(X)-Ix→y=H(X, Y)-H(Y).

Рассмотренные выше понятия удобны для описания эволюции психологических характеристик личности в лонгитюдных исследованиях. Если U и V — множества допустимых значений исследуемой психологической характеристики одного и того же индивидуума в два последовательных контрольных момента времени, то новое значение энтропии данной характеристики H(V) можно представить как сумму двух составляющих:

Предыстории, Которая оценивается через полную взаимную информацию И^У Содержащуюся в исследуемых величинах в первый и второй моменты времени, и так называемой Инновации N, обусловленной только новыми влияниями за прошедший период времени и не сводящейся к их предыстории:

ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

Опираясь на приведенные соотношения, можно оценить процентное содержание

Предысторий и инноваций, а также влияний наследственности и среды в энтропии

Наблюдаемой психологической характеристики. Для этого следует определить полные

JMZ JDZ J Взаимные информации J&R^Y1 X^Y* U<^Y И энтропии H(X) и H(V), использу

Результаты наблюдений за популяцией, а затем найти величины IG, IC, E(X) и N из

Указанных выше системы и двух уравнений, полагая известным коэффициент k.

При вычислении полных взаимных информаций и энтропий целесообразно сделать

Предположения о нормальном распределении наблюдаемых психологических


Характеристик X, Y, U и V, а также их пар X-Y и U-V, а именно:

ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

05.10.2012


144 6




Где fT(x, y) и fL(u, v) — соответственно, двумерные взаимные плотности распределения вероятностей пар случайных величин X–Y и U–V, rxy и ruv — их коэффициенты корреляции, mu и mv — математические ожидания величин U и V, mxy — математическое ожидание исследуемой характеристики в близнецовой паре, σu и σv — среднеквадратические отклонения величин U и V, σxy — среднеквадратическое отклонение исследуемой характеристики в близнецовой паре. Сделанные предположения о нормальности опираются на центральную предельную теорему теории вероятностей и подтверждаемый психологической практикой факт воздействия большого числа сопоставимых по влиянию факторов на исследуемые характеристики типа показателя интеллекта.

Сделав несложные преобразования, можно найти следующие выражения для

3 Искомых и вспомогательных величин :

ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

05.10.2012


144

7


Поскольку значения этих величин определяются по результатам наблюдений, вместо входящих в приведенные выше выражения среднеквадратических отклонений и коэффициентов корреляций можно подставить их выборочные оценки.

Биометрические исследования на растениях и животных показали, что принципы менделевского наследования дискретных признаков применимы для полигенных признаков, к которым относятся и психологические характеристики [14]. Поэтому, опираясь на сложившуюся практику, оценим возможные значения коэффициента k, представляющего отношение генетических составляющих моно - и дизиготных близнецовых пар, для простейшего случая гена, находящегося в двухаллельном состоянии, а затем обобщим полученный результат на исследуемый полигенный признак.

Как известно, особи диплоидных организмов разделяются по любому гену с двумя аллелями (А и а) на три генетических класса (АА, аа и Аа). Обозначив вероятности нахождения аллелей А и а в заданном локусе, соответственно, как p и q=1–p, методами биометрической генетики [14] можно вывести представленные в табл. 1 и 2 вероятности появления различных типов пар моно - и дизиготных близнецов.

Полная взаимная информация, содержащаяся в паре близнецов T1–T2, вычисляется

4 По формуле :

149

Таблица 1

Вероятности появления различных типов пар дизиготных близнецов

ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

Таблица 2

Вероятности появления различных типов пар монозиготных близнецов

ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

05.10.2012


144 8

ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

Где i — номер генотипа 1-го близнеца (i=1 для АА, i=2 для аа, i=3 для Аа), j — номер генотипа 2-го близнеца, Rij — вероятность появления генотипа 1-го близнеца, Sij — вероятность появления генотипа 2-го близнеца, Pij — вероятность появления близнецовой пары типа i–j.

Зависимость коэффициента k от вероятности p представлена на рис. 1. Она показывает, что значения этого коэффициента изменяются в достаточно узких пределах. В частности, для реализуемого на практике интервала 0,2≤p≤0,8 коэффициент k не выходит за границы диапазона 0,253±0,011. Таким образом, Генетическая составляющая полной взаимной информации в дизиготной паре близнецов примерно в четыре раза меньше аналогичной составляющей в монозиготной паре. Обобщая этот результат на полигенный случай, можно принять значение k=0,25 в качестве допустимой расчетной оценки данного показателя.

Последовательность вычислений, рекомендуемая для выявления балансов влияний наследственности и среды и включающая взаимные связи между рассмотренными выше показателями, предположениями и зависимостями, представлена в виде схемы на рис. 2. Аналогичная последовательность вычислений, рекомендуемая для выявления предысторий и инноваций в процессе изменения психологической характеристики с возрастом, показана на рис. 3.

АНАЛИЗ ИНФОРМАЦИОННЫХ СВЯЗЕЙ И СИМПЛЕКС-МОДЕЛИ:

РЕЗУЛЬТАТЫ РАСЧЕТОВ

Для оценки возможностей рассмотренного выше подхода, результаты его применения далее сопоставляются с аналогичными данными, полученными с помощью традиционного конфирматорного факторного анализа. Исследованная выборка состояла из 34 пар монозиготных (МЗ) и 28 пар дизиготных (ДЗ) близнецов, которые проходили тестирование в возрасте 6 и 14 лет. Выборка состояла из добровольцев, числящихся в городской популяционной базе близнецов, собранной лабораторией возрастной психогенетики

150

Психологического института Российской академии образования. Все дети были воспитаны в русскоязычных семьях, принадлежащих преимущественно к среднему классу. Все наблюдавшиеся пары близнецов — однополые. Анализировались только те из них, чья зиготность была точно установлена по диагностическому опроснику [7].

05.10.2012


144

9





Дети проходили тестирование по адаптированной в России детской шкале интеллекта Векслера (WISC) [16], используемой для диагностики когнитивных способностей детей в возрасте 5–16 лет и состоящей из 12 субтестов. Одна половина субтестов служит для оценки вербального интеллекта, другая — невербального. Подсчитывались общие показатели вербального, невербального и общего интеллекта.

Описательные статистики для показателя общего интеллекта представлены в табл. 3. Значимых различий между моно - и дизиготными близнецами по среднему значению и дисперсии не обнаружено. Однако было выявлено, что имеются значимые различия по среднему значению между близнецами 6 и 14 лет (t=0,005756).


Описательные статистики для показателя общего интеллекта


Таблица 3


Определяющих

Конфирматорный факторный анализ обеспечил выявление факторов,

5 Структуру общего интеллекта, и исследование динамики ее изменения со временем. В

Качестве наблюдаемых переменных использовались показатели интеллекта, а в качестве

Латентных факторов — величины, обусловленные аддитивными генетическими

Эффектами (различия между гомозиготами), а также влиянием общей и индивидуальной

Сред. Гетерозиготные эффекты, обусловленные доминированием, не учитывались,

Поскольку при имевшихся небольших объемах наблюдаемых данных не представлялось

Возможным отделить при анализе гетерозиготные влияния от аддитивных генетических.

6 Эффекты воздействия факторов оценивались на базе симплекс-модели, представленной

В


05.10.2012


144

10


ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

Рис. 2. Последовательность вычислений, рекомендуемая для выявления баланса влияний

Наследственности и среды

ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

Виде путевой диаграммы на рис. 4, где использованы следующие обозначения:

• G1 и G2 — генетические влияния на показатель интеллекта в 6 и 14 лет;

• C1 и C2 — влияния общей среды в 6 и 14 лет;

• E1 и E2 — влияния индивидуальной среды в 6 и 14 лет;

152

05.10.2012


144

11





Рис. 4. Путевая диаграмма, представляющая симплекс-модель для лонгитюдного исследования

Показателя общего интеллекта (измерения в 6 и 14 лет):

Прямоугольниками обозначены наблюдаемые переменные; кругами обозначены латентные

Переменные; однонаправленные стрелки (или пути) использованы для представления

Предполагаемых причинных связей между переменными; двунаправленные стрелки

Использованы для представления ковариационных связей между переменными (в частности,

Они же использованы и для представления дисперсий)

• путевые коэффициенты g1, c1, e1 и g2, c2, e2 (описывают влияния латентных
переменных для указанных возрастов);

• путевые коэффициенты g12, c12 и e12 (описывают влияния переменных G1, C1 и E1 на
показатели интеллекта в 14 лет).

Путевые коэффициенты рассматривались как свободные параметры модели. Их оценки определялись методом максимального правдоподобия [2], [14]. Для проверки

Того, насколько хорошо модель согласуется с результатами измерений, использовались

7 Критерии χ2 и Акаике (AIC — Akaike’s Information Criterion) [8], [14].

После анализа полной модели из нее последовательно исключались компоненты G и С. Исключение G дает модель, в которой все сходство между близнецами можно отнести за счет общей среды. Исключение C предполагает, что все внутрипарное сходство обусловлено наследственностью.

На следующем этапе анализа последовательно оценивалось, можно ли исключить из модели новые генетические и средовые влияния в 14 лет и можно ли приравнять нулю генетические и средовые ковариации (т. е. можно ли предполагать полную независимость генетических и средовых переменных в разном возрасте).

Критерий χ2 позволил сравнивать между собой указанные альтернативные модели, а именно: оценка согласованности для полной модели сравнивалась с той же

153


05.10.2012


144

12


Характеристикой для упрощенных моделей, в которых некоторые из искомых параметров полагались равными нулю. Поскольку разность в значениях критерия χ2 для полной и упрощенных моделей сама асимптотически описывается распределением χ2 ([4], [14]), она используется для выявления статистической значимости удаленных из модели компонентов.

Процедура поиска оптимальной симплекс-модели представлена в табл. 4.

Таблица 4

Согласование симплекс-моделей, представляющих структуру общего интеллекта, с

Результатами наблюдений

Полная модель не показывает убедительного соответствия результатам наблюдений (χ211=17,08; p=0,11). Модель 2, учитывающая влияние генетических факторов и случайной среды, дает примерно такое же соответствие (Dχ23=3,71; p=0,29), в то время как модель 3, учитывающая только общую и случайную среды, демонстрирует значительно худшие показатели: Dχ23=14,99; p=0,00. Это свидетельствует о том, что значимыми в структуре общего интеллекта в данном случае являются лишь компоненты, обусловленные влиянием генетических факторов и случайной среды.

В модели 4, где отсутствовали новые генетические влияния (инновации), имело место значимое увеличение показателя χ2, указывающее на отсутствие генетических инноваций в 14-летнем возрасте.

Для проверки гипотезы об отсутствии статистически значимых связей между генетическими влияниями в возрасте 6 и 14 лет использовалась модель 5, а для проверки аналогичной гипотезы относительно случайной среды — модель 6. Значимое увеличение показателя χ2 у модели 5 свидетельствует о том, что генетические влияния, определявшие общий интеллект в 6 лет, играли существенную роль и в 14 лет. В то же время отсутствие значимых изменений в показателе χ2 для модели 6 (по сравнению с полной моделью) дает основания полагать, что влияние индивидуальной среды определяется только возрастом.

Относительные значения информационных составляющих, обусловленных влиянием наследственности и различных видов сред, при точности определения показателя Dx, равной единице, сопоставлены с аналогичными характеристиками оптимальной симплекс-модели в табл. 5.

Факторный анализ показал, что бóльшая часть дисперсии исследуемого показателя в 14-летнем возрасте обусловлена новыми влияниями: инновации составляют

05.10.2012


144

13


154

Таблица 5

Конфирматорный факторный анализ и анализ информационных связей: оценки относительных эффектов влияния генетических факторов, общей и

Индивидуальной сред, %


61 %, а влияния, определявшие общий интеллект в 6 лет, — 39 % (при этом генетическая составляющая этой дисперсии является новой на 35 %, а составляющая общей среды — на 100 %). Анализ информационных связей дает похожие результаты: при точности определения показателя Dx, равной единице, полная взаимная информация, содержащаяся в показателях общего интеллекта в 6- и 14-летнем возрасте, составляет 8 % от энтропии данной характеристики в 14 лет. Следовательно, 92 % указанной энтропии обусловлено новыми влияниями, имевшими место за период времени от 6 до 14 лет.

АНАЛИЗ ИНФОРМАЦИОННЫХ СВЯЗЕЙ И СИМПЛЕКС-МОДЕЛИ:

СРАВНЕНИЕ

Сопоставимост ь результатов. Несмотря на то, что анализ информационных связей и факторный анализ оперируют величинами совершенно разной природы, основные выводы, вытекающие из полученных с их помощью результатов, совпадают: относительный вклад генетических факторов с возрастом снижается, а вклад индивидуальной среды возрастает. Как показали расчеты, в обоих случаях относительное

Ослабление влияния генотипа обусловлено в первую очередь не столько его абсолютным

8 Уменьшением, сколько увеличением вклада индивидуальной среды. Анализ

Информационных связей свидетельствует о наличии некоторого влияния общей среды,

Хотя и существенно менее значимого, чем влияние двух типов факторов, учтенных в

Оптимальной симплекс-модели.

Чувствительность результатов к изменчивости выборочных оценок. Несмотря на

Малый объем исследуемой выборки испытуемых, относительные соотношения между

Компонентами факторной модели показали малую чувствительность к ошибкам,

Возникающим при вычислении выборочных оценок наблюдаемых дисперсий и

Ковариаций: при изменении значений свободных параметров в границах 95 %-х

10 Средовых составляющих в общей дисперсии не превысило 5 % . Это позволяет говорить

Об устойчивости качественной структуры факторной модели. Данный вывод

Подтверждается оценками, построенными для подмножеств, представляющих половину

Исходной выборки: изменение


05.10.2012


144

14



ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ ИНФОРМАЦИИ ДЛЯ ОЦЕНКИ ГЕНЕТИЧЕСКИХ И СРЕДОВЫХ ВЛИЯНИЙ В БЛИЗНЕЦОВЫХ ИССЛЕДОВАНИЯХ

Процентного содержания компонентов общей дисперсии также не превышало 5 % от первоначального значения.

Проведенные расчеты показали, что результаты, полученные путем анализа информационных связей, в случае малых выборок оказались более чувствительными к ошибкам в выборочных оценках коэффициентов корреляции и среднеквадратических отклонений: изменение этих оценок в границах 95 %-х доверительных интервалов может приводить к качественному изменению соотношений между компонентами энтропии, обусловленными влиянием генетических и средовых факторов. Эта неопределенность сравнительно быстро уменьшается с увеличением объема выборки. Для иллюстрации на рис. 5 представлен график, показывающий границы 95 %-х доверительных интервалов для выборочных оценок коэффициента корреляции при различных объемах выборки.

Адекватность терминов и предположений. Учитывая природу исследуемых величин, использование понятий энтропии и информации для оценки соотношений между генетическими и средовыми влияниями, с нашей точки зрения, является более естественным, чем построение аналогичных оценок на базе представлений о выражаемой дисперсией степени разброса характеристик фенотипа относительно среднего значения. Преимуществом анализа информационных связей также является отсутствие ряда необоснованных априорных предположений о структуре дисперсий и ковариаций наблюдаемых параметров, неявно используемых в классических факторных моделях, а именно: предположений о равенстве вкладов различных типов сред в психологические характеристики моно - и дизиготных близнецовых пар, о равенстве эффектов влияния генетических факторов, о равенстве средовых влияний на испытуемых с различным генотипом и т. д.

Адекватность оптимальной модели. Преимуществом используемой в факторном анализе схемы выявления наиболее адекватной модели на основе проверки гипотез о статистической значимости тех или иных ее компонентов является возможность обоснованно оценивать значимость различных компонентов модели и судить о ее адекватности наблюдениям в целом. С другой стороны, удаление незначимых компонентов факторной модели при невысокой степени ее адекватности наблюдениям приводит к грубой модели, противоречащей накопленному опыту и здравому смыслу.

05.10.2012


144

15


Это, в частности, имело место в рассмотренном выше примере, где, опираясь на статистические оценки,

156

Был сделан вывод о полном отсутствии влияния общей среды. Анализ информационных связей не создает подобных проблем.

Зависимость от точности измерения. Существенным недостатком анализа информационных связей, в свою очередь, является зависимость оценок от точности Dx измерения исследуемого показателя, что предъявляет повышенные требования к обоснованию его выбора.

Простота применения и сложность программной реализации. Оценки, получаемые в результате анализа информационных связей, вычисляются по несложным формулам на базе простейших описательных статистик: коэффициентов корреляции и среднеквадратических отклонений. Проведение соответствующих вычислений доступно неподготовленным пользователям. Оно не требует ни специально разработанного программного обеспечения, ни дополнительного обучения.

Факторный анализ, напротив, может проводиться только при наличии специализированных программ, в которых, в частности, реализованы сложные алгоритмы многомерной численной оптимизации. Эти программы могут эффективно использоваться только подготовленными специалистами, которые достаточно хорошо ориентируются в решении таких проблем, как выбор начальных приближений при численной оптимизации, поиск глобальных экстремумов, интерпретация результатов расчетов и т. д. Таким образом, анализ информационных связей имеет очевидные преимущества по такому важному показателю, как простота применения.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1. Выведены простые соотношения, позволяющие, опираясь на методы и понятия
теории информации, оценивать степень влияния генетических и средовых факторов на
психологические характеристики по стандартным описательным статистикам,
получаемым в результате близнецовых и лонгитюдных исследований.

2. Исследована зависимость отношения генетических составляющих полной
взаимной информации о психологических характеристиках в моно - и дизиготных парах
близнецов от частотного распределения аллелей в популяции.

3. Проведенные расчеты показали сопоставимость результатов, полученных с
помощью анализа информационных связей и традиционного факторного анализа,
включая согласованность качественных выводов, сделанных на их основе.

4. Сравнение результатов расчетов показало, что анализ информационных связей имеет преимущества по таким показателям, как доступность применения и простота программной реализации, отсутствие ряда недостаточно мотивированных априорных предположений о соотношениях генетических и средовых влияний, адекватность методов и терминов исследуемой проблеме. В то же время преимуществами факторного анализа являются малая чувствительность к ошибкам, которые возникают при вычислении выборочных статистических оценок, используемых при выборе оптимальной модели, и независимость от точности измерения исследуемой характеристики.

5. Анализ информационных связей может служить дополнительным средством для оценки корректности выводов, получаемых традиционным конфирматорным факторным

05.10.2012


144

16


Анализом, поскольку позволяет учесть информацию о психологических характеристиках, которая теряется при вычислении выборочных оценок моментов второго порядка.

1. Вентцель Е. С. Теория вероятностей. М.: Высшая школа, 2003.

2. Лоули Д., Максвелл А. Факторный анализ как статистический метод. М.: Мир, 1967.

3. Akaike H. New look at the statistical model identification // IEEE Transactions on automatic control.

1974. AC-19. N 6. P. 716.

4. Bishop Y. M.M., Fienberg S. E., Holland P. W. Discrete multivariate analysis: Theory and practice.

Cambridge, MA: M. I. T. Press, 1975.

5. Bollen K. A. Structural equations with latent variables. N. Y.: John Wiley, 1989.

157

6. Boomsma D. I., Martin N. G., Molenaar P. C.M. Factor and simplex models for repeated measures:

Application to two psychomotor measures of alcohol sensitivity in twins // Behav. Genetics. 1989. V. 19. P. 79–96.

7. Cohen D. J. et al. Separating identical from fraternal twins // Arch. General Psychiatry. 1973. V. 29.

P. 465–469.

8. Dolan C. V., Molenaar P. C.M., B oomsma D. I. Longitudinal genetic analysis of longitudinal means

And covariance structure in the simplex model using LISREL // Behav. Genetics. 1991. V. 21. P. 49–61.

9. Eaves L. J., Eysenck H. J., Martin N. G. Genes, culture and personality: An empirical approach. L.:

Oxford Univ. Press, 1989.

10. JЦeskog K. G. Estimation and testing of simplex models // Brit. J. Mathemat. and Statistic. Psychol.

1970. V. 23. P. 121–145.

11. Kuravsky L. S., Malykh S. B. Application of Markov models for analysis of development of psychological characteristics // Austral. J. Educ. and Devel. Psychol. 2004. V. 2. P. 29–40.

12. Kuravsky L. S., Malykh S. B. On the application of queuing theory for analysis of twin data // Twin

Research. 2000. V. 3. P. 92–98.

13. Loehlin J. C. Latent variable models: An introduction to factor, path and structural analysis. Hills-

Dale, NJ: Erlbaum, 1987.

14. Neale M. C., Cardon L. R. Methodology for genetic studies of twins and families. Dordrecht, the Netherlands: Kluwer Acad. Publ., 1992.

15. Neale M. C., Miller M. B. The use of likelihood-based confidence intervals in genetic models // Behav. Genetics. 1997. V. 27. P. 113–120.

16. Wechsler D. Wechsler intelligence scale for children. N. Y., 1949.

Поступила в редакцию 23.VI 2005 г.

1 Это ограничение не является принципиальным.

2 В терминах Г. Менделя — фактор и эффект.

3 Далее полагаем, что в близнецовой паре D X=D Y, а *-У .

4 Эта формула выводится из приведенного выше выражения для полной взаимной информации:

1Т^т=ЩТ1)+ЩТ2)-ЩГ1>Т2)=м[-\оёЦТ1)]+м[-1о&Р{Т2)]-


■-■■м\-1<щ?(ТиТ2}]=.М

І J

5 Данный вид анализа сводится к оценке степени близости по заданным статистическим

Критериям наблюдаемых ковариационных матриц, составленных из выборочных оценок

Ковариаций психометрических показателей, и прогнозируемых ковариационных матриц,


05.10.2012


144

17


Элементы которых обусловлены используемой моделью и описываются аналитическими

Выражениями относительно ее свободных параметров.

6

Чтобы получить достаточное число наблюдаемых статистик, искомые характеристики

Использованной симплекс-модели оценивались одновременно для моно - и дизиготных пар

Близнецов (каждому типу близнецов соответствовали свои прогнозируемые и наблюдаемые

Матрицы с размерностью 4×4).

7 Критерий Акаике отдает предпочтение тем моделям, которые согласуются с результатами

Измерений при меньшем количестве параметров (модель с наименьшим значением этого

Критерия рассматривается как наилучшая).

8 Анализ оптимальной симплекс-модели показал некоторое увеличение этого показателя, а

Анализ информационных связей — его уменьшение.

9 Для оценки доверительных интервалов применялся метод, представленный в работе [15],

Который сводится к постепенному удалению значения заданного свободного параметра от его

Оптимальной оценки до достижения заданного приращения меры соответствия прогноза и

Наблюдений, распределенной как χ2.

10

Абсолютное изменение вычисленных значений свободных параметров при этом могло

Быть достаточно велико, достигая 50 % от исходного значения.

05.10.2012


146

1


146 ИСТОРИЯ ПСИХОЛОГИИ