I I i
матрицы оыло очень популярным и рассматривалось как метод конструктной валидизации. Магнуссон (1961, 1967) описал этот метод в своей книге по теории тестов и назвал его процедурой «полной конструктной валидизации».
В истории дифференциации и интеграции концепции валидности присутствует некоторая волнообразность. Это очень старая проблема, и она была предметом размышлений у греческих философов. Концепция допускает существование обоих подходов— и холистического, и атомистического.
В последнее десятилетие было добавлено еще одно новое значение понятия валидности. Так что можно говорить о дальнейшей дифференциации этого понятия. Представляется интересным, что само это понятие как бы привносит некое единство (или объяснение) в разнообразие коэффициентов прогностической валидности одного и того же теста. Это понятие представляет собой обобщение валидности. Исследование прогностической валидности одного и того же теста для различных, но связанных между собой критериев обнаруживает его разную ценность. Таким образом, по-видимому предпочтительнее подсчитывать новые коэффициенты валидности для каждого критерия. Шмидт и Хантер (1977) полагают, что существует один «истинный» коэффициент прогностической валидности и что расхождения коэффициентов валидности теста по различным, но сходным критериям представляют собой дисперсию ошибки. Они указали на 7 источников дисперсии ошибки:
-
ненадежность в оценивании критерия;
-
ненадежность теста;
-
ограничение интервала;
-
ошибки при составлении выборки;
-
тип критерия и значимость;
-
ошибки при подсчете и письме;
-
небольшие различия в структуре факторов между задачами определенного типа.
Авторы попытались оценить источники этих систематических ошибок. Были проведены исследования, в которых подсчитывались коэффициенты валидности для сходных тестов и для сходных критериев. Подсчитывалась диспер-
сия в распределении коэффициентов валидности. Из этой дисперсии вычитались все показатели дисперсии, связанные с перечисленными источниками ошибок. Таким образом может быть подсчитан истинный коэффициент валидности прогностического критерия. Подобные расчеты действительно проводились авторами. Например, авторы оценивали некоторые из возможных источников ошибок в предсказании успешности работы механиков службы сервиса с помощью тестов на понимание принципов механики, а также при определении возможной эффективности труда работников службы быта с помощью интеллектуальных тестов. Этот тип исследования Может быть рассмотрен как мета-исследование. В психодиагностике разработаны также статистические методы для оценки источников ошибок (Schmidt, Law, Hunter, Rothstein, Pearlman & McDaniel, 1993). Но остается вопрос о том, как могут быть использованы знания о способах оценки истинного коэффициента корреляции и представления о возможных источниках ошибок. Используется ли реально эта информация практическими психологами или же они до сих пор обречены на то, чтобы подсчитывать коэффициенты валидности для каждой группы и для каждого критерия?
Подведем итоги. Итак, в истории развития представлений о валидности первым предметом рассмотрения была прогностическая валидность. Постепенно представления о валидности становились все более дифференцированными, и в качестве объединяющей их силы выступила концепция конструктной валидности. Сравнительно недавно была разработана обобщенная концепция валидности для объяснения различий между коэффициентами прогностической валидности сходных тестов по сходным критериям.
3.2.6. Статистическая оценка валидности Валидность представляет собой весьма широкое и сложное понятие. Этим и объясняется отсутствие специфических математических моделей или статистических методик для оценки валидности. Современная теория тестов вносит свой довольно скромный вклад в развитие понятия валидности (см. гл. 1) Для объяснения того, как даются ответы на отдельные задания теста или группу заданий, были разработаны одномерные модели изучаемых (латентных) харак-
112
пз
теристик. По мнению Гольдштейна и Уда (1987, р. 163— 164) в теории ответов на задания теста центральной проблемой является вероятностная природа ответов, а не то, почему люди дают правильные или неправильные ответы. По мнению авторов, часто недостатком нелинейных логистических моделей является их относительная математиче-ская сложность, поскольку она может заслонять исследуемое реальное содержание. Эта критика не умаляет вклада современной теории тестов в объяснение тестируемого поведения.
Поскольку существует множество различных значений валидности, при изучении валидности в психологии используется целая гамма способов анализа данных психологии. В связи с этим при обсуждении проблемы валидности в учебниках авторы делают это несколько по-разному. Дрене и Сийтсма (1990) ограничиваются такими методами анализа данных, как регрессионные анализ и прогноз, факторный анализ (без их дальнейшей разработки). Крокер и Альджина пошли на шаг дальше. Они описывают процедуры шкалирования, модели линейного прогноза (при рассмотрении прогностической валидности) и факторный анализ (для конструктной валидности). Наннелли и Берн-штейн (1994) пошли еще дальше в использовании статистических процедур. Кроме перечисленных методик они применяют дискриминантный анализ, многомерное шкалирование и др.
По мере разработки новых методов анализа данных они будут использоваться при исследовании валидности. Трудно найти специфические связи между исследованиями валидности и ограниченным набором специфических техник. Однако некоторое устойчивые связи все же сложились. Исследования прогностической валидности связаны главным образом с моделями линейного прогноза (корреляции и регрессия). В исследовании конструктной валидности общей линейной модели используются многометодная матрица свойств и факторный анализ. Кронбах и Миль еще в 1955 году составили перечень множества процедур конструктной валидизации.
• Изучение различий между группами.
Если существует теоретическое предположение о том, что между двумя группами имеются различия в отношении
определенной поведенческой характеристики, то можно попытаться оценить различия между средними показателями.
• Изучение матриц корреляции и факторного анализа.
Первоначально эти методы оптимистически рассматривались как средства выявления основных параметров мышления и характеристик личности (см. Cronbach & Meehl, 1955,стр.285).
• Изучение внутренней структуры тестовых заданий.
Это имеет отношение к многочисленным способам анализа заданий.
• Изучение изменений во времени.
Интерес сконцентрирован преимущественно на том, насколько характеристики остаются стабильными с течением времени.
• Изучение процесса.
По мнению авторов, внимание должно быть уделено анализу поведения во время работы с тестом, необходимо точное ведение протоколов и фиксация допущенных ошибок.
С 1955 г. репертуар статистических методов существенно расширился, помимо исследовательских методик стали использоваться и методы проверки гипотез.
Как показано в этом разделе, при оценке валидности используются все виды линейных и нелинейных методов анализа данных. Изучение валидизации сопровождается аналитическим «насилием» над полученными данными. Мессик говорит также о необходимости качественного анализа поведения (материалов протоколов).
3.2.7. Соотношения трех уровней
Житейские представления о валидности в какой-то мере согласуются с психодиагностическими концепциями. Психодиагностические концепции могут наполнять новым содержанием «житейскую психологию». Эмпирические исследования прогностической и конструктной валидности также показывают, что житейские представления не так уж «скромны». Высокие ожидания, основанные на житейских представлениях, редко получают эмпирическое подтверждение, поскольку корреляции предиктора и критерия невы-
I 14
1 15
соки. Феномен внешней валидности является примером слишком большой веры в возможность непосредственно «увидеть» валидность предиктора. В итоге житейские объяснения являются объяснениями «post hoc»*, то есть объяснениями уже совершившихся фактов.,
Математический уровень с помощью нелинейной модели и современной теории тестов ведет к объяснению того, как человек отвечает на задание или группу заданий. Эти модели элегантны, но ограничены. Леви (1973), Гольдш-тейн и Вуд (1989) высказывали критические замечания в адрес теории тестов, потому что связь с содержанием поведения, по мнению этих авторов, отсутствует почти полностью. Число моделей быстро возрастает, причем связи с реальным поведением рассматриваются как менее интересные по сравнению с вероятностными моделями самими по себе (Goldstain & Wood, 1989). Следует добавить по поводу моделей, что они требуют тщательной проверки.
Анализ валидности может использовать все типы исследований (экспериментальные и корреляционные) и все типы методов анализа данных (линейные и нелинейные, количественные и качественные). Мессик указывает на то, что используемые методы анализа данных должны соответствовать предполагаемой структуре психологических концепций, поскольку эти методы не являются нейтральными. Велик соблазн использовать новые способы анализа данных, и они действительно будут использоваться. Отчасти это необходимо, чтобы определить области их приложения и ограничения в их использовании. Главное значение все же имеют психологические теории и концепции, а не модели. Аспектный анализ (the facet analysis) представляет собой попытку сочетания понятийного и статистического анализа. Цитируя «анархиста от методологии» Фейерабен-да (1975), можно сказать, что для исследования валидности «подходит» чуть ли не все. Важно, что в процессе опробования любых возможностей устанавливаются разумные пределы,
post hos (лат.) — после-этого (прим. перев.).
3.2.8. Некоторые эпистемологические «строительные»
блоки понятия валидности в психодиагностике Концепция валидности в психодиагностике находится в центре теоретических, методологических изысканий и вопросов методического обеспечения, что обусловливает комплексный характер этой концепции. В данной главе обсуждаются некоторые основные проблемы концепции валидности. За основу взята статья Мсссика (1989), в которой автор предпринимает попытку связать концепцию валидности с общими эпистемологическими принципами (личное сообщение, 26 августа, 1993), что является достаточно трудной задачей. Сам Мессик оценивает результаты своей работы скептически, считая, что это в большей степени изыскания в области философии наук"и, чем строгие научные факты, поскольку ни одно из его утверждений не подкреплено эмпирическими данными. Это замечание показывает, насколько осторожным в суждениях и требовательными к себе должен быть исследователь, обращающийся к основам проблемы валидности в психологии. С другой стороны, разработчики некоторых моделей не считают нужным рассматривать недостатки собственной модели, как, например, психометрики при представлении нелинейных моделей для ответов на задания теста. Этот пример показывает ограниченность эмпирической ориентации, которая в определенные моменты времени являлась преобладающей в психологии.
В определении прогностической, содержательной и кон-структной валидности в психологии пятидесятых годов доминировал логический позитивизм. В рамках этой эпистемологии, с одной стороны, существовала ориентация на логику, синтаксис и структуру, а с другой — на значение, требующее эмпирической верификации. Первая (логическая) относится к логической структуре теорий. Эти теории должны быть сформулированы аксиоматическим, математическим или формально-логическим способом. Абстрактные теоретические термины должны быть связаны с категориями, доступными наблюдению, с помощью правил соответствия, то есть правил взаимодействия, определений или правил интерпретации, описывающих как теоретические понятия, так и соответствующие им экспериментальные процедуры. Хорошо известным примером правил
I 16
117
соответствия служат операциональные определения психологических конструктов. Строгие требования подробной спецификации психологических понятий не получили полной поддержки в психологии. Наиболее приемлемыми оказались правила соответствия, которые в той или иной степени определяются теоретическими понятиями. Теоретические понятия содержат некоторое «избыточное» значение. Вторая составляющая относится к области значений. Согласно правилам проверяемости теории истины, утверждение является истинным тогда и только тогда, когда оно соответствует законам логики. Это можно интерпретировать как подчинение предписанным конструктам и правилам формулирования выводов или как эмпирическую верификацию значения. Соотношение логического и эмпирического — это старая проблема, восходящая к предложенному еще Кантом различению аналитических и синтетических суждений. Принципу верифицируемости всегда уделялось должное внимание, поскольку он призван «отделять имеющее смысл от бессмысленного» и способствовать исключению всякой метафизики.
Логический позитивизм в своей исходной форме очень быстро показал себя как слишком требовательная и жесткая концепция, чтобы его положения могли оказаться плодотворными для развитии психологического знания. История науки знает примеры того, как концепции, не будучи чисто аналитическими или чисто эмпирическими, оказывались важными и значимыми. Много лет назад категории пространства и времени были названы Кантом априорными синтетическими суждениями. Эти категории, существование которых невозможно в рамках логического позитивизма, имеют форму общих законов и гипотетических конструктов, и допускают возможность проверки эмпирических заключений.
Логический позитивизм предполагает возможность двух интерпретаций значения. С одной стороны, значение всецело зависит от данных эмпирического опыта (эмпиризм, позитивистская составляющая), с другой стороны, значение определяется также связью утверждения с другими утверждениями (логическая составляющая, структурализм).
Структурный принцип, то есть определение абстрактных, бессодержательных конструктов с помощью набора правил, до сих пор оказывает влияние на развитие психо-
диагностики. Примером может служить современная теория тестов с абстрактной нелинейной вероятностной моделью. Позитивистские принципы проявляются и в подчеркивании эмпирического и операционального определений. Эмпирическая интерпретация абстрактных бессодержательных конструктов — это не простой процесс. Гипотетические конструкты должны быть дополнены системой опытного знания, то есть система с бессодержательными элементами и абстрактными отношениями должна быть соединена с элементами, которые могут быть почерпнуты из наблюдений. Роскам (1991) формулирует это положение (цит. по Hem pel, 1970, стр. 688) следующим образом: теоретическая проблема «плавает» в океане данных и пытается установить с ними контакт, но как это сделать? Роскам считает, что связи не могут быть образованы на основе семантического содержания конструктов, для этого необходимо наличие сходства по форме и структуре. Конструкт — это не семантическая единица, но его необходимо описать как набор определенных элементов и связей. Теоретическая система называется номологической сетью. В рамках этой сети происходит формулировка выводов, прогнозов, утверждений об отношениях. Возможна эмпирическая проверка этих утверждений. Связи между абстрактной и эмпирической системами носят вероятностный характер, используемые процедуры лишь частично «покрывают» конструкты. Считается, что конструкты имеют дополнительное (избыточное) значение. Результат взаимодействия элементов и отношений номологической сети с эмпирическими данными важен для обеих сторон этого процесса, поскольку становится ясно, получают ли поддержку эмпирические конструкты, возможно ли дальнейшее существование номологической сети, являются ли данные адекватными, надежными и валидными.
Следующая характеристика, влияющая на психологические и диагностические исследования и имеющая своим истоком позитивизм,— это предпочтение дедукции. Дедуктивная номологическая модель содержит логические, теоретические (гипотетические) отношения, интерпретация которых носит вероятностный характер. Объяснить какой-либо феномен — значит представить его как проявление общего закона. Если какой-либо феномен яв-
I 18
119
ляется частным случаем общего закона, то он может быть объяснен и предсказан. Подчеркивается, что гипотезы выводятся или, по крайней мере, формулируются без какого бы то ни было обращения к данным. Ван дер Хейден (1995) приводит примеры исследований, в которых многие сторонники клинического подхода честно признавали, что иногда они переформулируют гипотезы по мере получения данных. Это часто называется «предложением, делаемым задним числом» («Harking»), т.е. это выдвижение гипотез уже после того, как стали известны результаты (см. также Кегг & Harris, в печати). Эти авторы указывают на то, что такая практика является достаточно распространенной в некоторых школах.
Логический позитивизм влияет на развитие концепции конструктной валидности. Конструктная валидизация касается отношений, специфицированных номологической сетью. По крайней мере, некоторые элементы и отношения нуждаются в эмпирической интерпретации, тоестьонидол-жны быть операционализированы и соотнесены между собой тем или иным способом.
Мессик (1989) пришел к выводу, что исходные строгие требования логического позитивизма не были использованы в «чистом виде», они были адаптированы к возможностям конкретных эмпирических исследований. Значение логического позитивизма для психологии он определяет как (стр.23) «освещение того, как должна быть представлена роль конструктов в психологической теории и измерении». В психологии не слишком сильны «принудительные» элементы логического позитивизма, но дидактические правила анализа конструктов, взаимодействие между конструктами, их отношения представляются достаточно важными и ценными. Мессик согласен с Кронбахом, утверждающим, что было бы слишком претенциозным использовать позитивистскую эпистемологию в «нашей незрелой науке». Это замечание еще раз показывает, с каким уважением психологи относятся к эпистемологии. В философии логический позитивизм был популярен в течение короткого времени, и тем более удивительно, что он до сих пор остается идеалом познания в психологии.
Идеология логического позитивизма оказала значительное влияние на развитие концепции валидности в психоло-
120
гии. Попиер (1939/1959) подверг критике верификацию логического позитивизма. Он указывал на возможность фальсификации утверждений с помощью других правдоподобных утверждений. Не бывает единственно возможного объяснения. Существует множество п равдоподобных и конкурирующих между собой объяснений. Впрочем, это положение не получило распространения в исследованиях конструктной валидности, возможно, из-за относительного характера объяснений. Кук и Кэмпбелл (1976), обсуждая вопросы внутренней валидности в квазиэксперименте, выдвинули альтернативное объяснение.
Проверяемость и фальсифицируемость предполагают строгое разграничение теоретических и эмпирических терминов. Считается, что иногда такое разграничение невозможно. Концепция исследовательских парадигм предполагает, что каждая теория в какой-то степени сама создаст свои собственные данные и факты (Kuhn, 1962, 1970). Хотя эти представления достаточно хорошо известны в психодиагностике, тем не менее они редко становятся предметом дискуссий.
Существование различных парадигм с их собственными исследованиями и собственными «истинами» обусловливает наличие релятивизма. Конструктивизм и контекстуа-лизм относятся к радикальному релятивизму в определенной степени из-за своей приверженности позиции, что научное знание образует всего лишь одну из многих эквивалентных парадигм или один из подходов. Применительно к психодиагностике, можно утверждать, что невозможно установить истинные показатели испытуемого, поскольку полученные показатели во многом зависят от контекста, с помощью же методик оценивается «сконструированный» человек. В ситуации тестирования и в эксперименте испытуемый является «сконструированным» субъектом. При том, что исследователи все-таки принимают во внимание относительный характер полученных результатов, главным предметом интересов психодиагноста остаются стабильные характеристики поведения, мышления, эмоций. Отмечается, однако, что исследования зависимы от контекста. Конструктивисты обычно не признают «ремесленную» работу психодиагностов, ими разработан метод естественного наблюдения и качественного анализа.
121
Релятивизм предполагает эквивалентность любого ответа на вопрос или любого решения проблемы. Считается, однако, что по определенным причинам некоторые ответы и решения «лучше» других. Теории и конструкты в той или иной степени противоречат реальности. Лакатос (1978) утверждает, что исследовательские программы имеют определенную продолжительность сушествования. Их «ядерные» конструкты какое-то время сохраняются, будучи предметом эмпирической проверки и обсуждения. Программа может быть приостановлена или изменена, если ее концептуальные решения становятся неудовлетворительными, а эвристическая сила падает. При отсутствии подтверждения со стороны эмпирических данных теории и основные понятия исследовательской программы становятся изолированными. В этой ситуации программа может быть заменена новыми теориями и концепциями. Таким образом, никакого релятивистского объяснения тому, что программы возникают и исчезают, нет. Функционирование программ — их «жизнь» и «смерть» — подчиняется рациональным законам. «Рационалистическая» ориентация не предполагает, что теории должны быть немедленно заменены, когда появляются альтернативные теории или если эм-пирические исследования не дают ожидаемого подтверждения. Эта ориентация способствует проведению исследований конструктной валидности.
В данном разделе мы попытались показать, что несколько различных эпистемологических концепций оказали влияние на развитие понятия валидности в психологии. Это дало основание для упрека в том, что данное понятие с философской точки зрения противоречиво (Norris, 1983). Понятие валидности в психологии должно охватить столь сложную и многостороннюю реальность, что сосуществование различных критериев и точек зрения вполне возможно.
3.2.9. Конструктная валидность и системы исследования
Мессик (1989) попытался прояснить понятие валидности, используя концепцию «системы исследований», представленную эпистемологом Чечменом (1971). Последний предпринял попытку представить и проанализировать эпистемологические теории в виде системы исследовательских
122
вопросов (inquiry). Каждая такая система имеет свои специфические «строительные» блоки или информационные единицы, с помощью которых представляется существо проблемы. Имеются также гарантии того, что само представление проблемы будет отвечать требованиям валидности.
В системе Лейбница основным является формальный или символический способ представления проблемы, точнее эпистемологической проблемы познания. Набор простейших аналитических истин и системы правил и операций образуют основу дедукции теоретических суждений. Критериями валидности являются согласованность, полнота и
др.
Учение Локка применяет эмпирический и индуктивный подход к постановке проблемы. Система знаний развивается путем обобщения данных наблюдения. Критериями валидности являются согласие экспертов, объективность, беспристрастность к данным и методам их сбора и анализа.
Мессик замечает, что обе эти системы пригодны для анализа хорошо структурированных проблем. В том случае, когда проблема плохо структурирована, стоит вечный вопрос о том, как сформулировать се суть. По-видимому, во многих случаях ученые еще не могут найти адекватный способ представления проблем. Это те проблемы, о которых в одной из своих ранних работ (1916) Витгенштейн сказал: «О чем нельзя говорить, о том должно молчать».
Система исследовательских вопросов у Канта содержит способ представления проблемы, интегрирующий подходы Лейбница и Локка. В рамках этой системы существует, по крайней мере, два подхода к представлению проблемы и к систематизации данных или совокупности фактов. Эти подходы могут в одних случаях дополнять друг друга, в других случаях — находиться в антагонистических отношениях. В течение долгого времени наилучшей считалась та теория представления проблемы, которая более успешно оперировала эмпирическими данными.
Диалектическая система Гегеля содержит противоположные способы представления проблемы. Для анализа одних и тех же данных используются две конкурирующие теории. Противоположность позиций со всей наглядностью обнаруживается в публичном споре. Конфликт позиций пе-
123
реносится на более высокий уровень — уровень интеграции, гдеи«ст тмается». Возможно противостояние интегрированной теории новым конкурирующим теориям, так что диалектический процесс может продолжаться. Конечно, этот процесс развертывается между идеями, а не между людьми.
Чечмен рассматривает еще одну, не столь хорошо известную систему, систему Синджера. Эта система содержит описание перечисленных систем и рассматривает связь каждой из них с остальными. Данный метод способствует лучшему пониманию преимуществ каждой системы. Критерием валидности является прогресс путем последовательного приближения.
В психологических исследованиях валидности основное значение имеют системы Лейбница и Локка. Система Канта, рассматривающая альтернативные модели, используется не столь часто. Диалектическая система также используется редко, возможно, из-за трудностей формулирования противоположных теорий. Другой весьма вероятной причиной не столь широкой распространенности диалектической модели является опасение скатиться к релятивизму, если к каждой теории добавлять противоположную. Мессик считает, что «метарефлексия» в системе Синджера могла бы способствовать проведению достаточно «сбалансированных» исследований конструктной валидности.
Таким образом, в психологических исследованиях валидности доминируют формально структурная (Лейбниц) и эмпирическая (Локк) системы постановки проблем. Мессик считает необходимыми и полезными для исследований валидности увеличение числа соперничающих теорий и анализ всех систем. Его рассуждения напоминают в той или иной степени аргументацию из концепции фальсификации Поппера.
3.3. Исследование валидизации и понятия, несущие высокую смысловую нагрузку
В завершение данной главы приведем пример того, что диагностические категории и психологические конструкты характеризуются смысловой нагрузкой. Мессик указывал
на то, что наши категории и конструкты не являются нейтральными. Рассматриваемый нами пример заимствован из работ клинического психолога Ричарда Бенталла (1992). Предметом его анализа является феномен счастья, который, как он считает, следует отнести к числу психиатрических расстройств.
С сожалением Бенталл говорит о том, что клинические психологи слишком мало внимания уделяют рассмотрению феномена счастья. По мнению автора, этот феномен является достаточно важным и заслуживает того, чтобы быть представленным в учебниках по патопсихологии и в классификации психиатрических расстройств (DSM IV-R).
Счастье считается одной из важнейших специфически человеческих категорий. Представление некоторых философов и исследователей обыденного языка о том, что «Счастье существует для свиней: философия в противоположность терапии» (Теннесен, 1969), отвергается.
Хотя феномен счастья с трудом поддается точному определению, тем не менее существует некоторое согласие относительно того, что счастье содержит поведенческий, когнитивный и аффективный компоненты. Когнитивный и аффективный компоненты выражаются в ощущении собственной компетентности и удовлетворенности. Поведенческий компонент счастья может проявляться, например, в том, что человек постоянно весел и смеется. Такое поведение исследовалось во многих культурах, причем допускается наличие биологических основ этого поведения. Существуют данные наблюдений о том, что счастливые люди нередко действуют неосторожно, непредсказуемо и импульсивно. Но это поведение, как правило, не мешает другим людям и не причиняет им вреда. Счастливые люди говорят об ощущениях удовольствия и расслабленности, они удовлетворены своим социальным окружением, но в то же время отмечают состояние «неуспокоенности».
К сожалению, существует немного исследований эпидемиологического типа. Оценка того, какова распространенность счастливых людей, варьирует от 5% (мнение психологов, психиатров и других пессимистов) до 80% (по данным самоотчетов). Эта широта разброса мнений определяется тем, что отсутствуют общепринятые операциональ-
124
на
ные критерии. Имеются данные и том, что распределение людей, считающих себя счастливыми, не подчиняется закону случайного распределения, оно различно для разных социально-экономических слоев общества. Представители высших классов имеют больше шансов чувствовать себя счастливыми по сравнению с представителями среднего класса. Показатели счастья и величина доходов значимо коррелируют. Проведено совсем мало исследований, направленных на выявление источников ощущения счастья. Обнаружено несколько значимых (но не имеющих содержательного наполнения) корреляций с такими характеристиками, как уровень интеллекта, самооценка, экстраверсия и сумма денег на банковском счете. К сожалению, очень мало исследований близнецов. Однако существенный генетический компонент не должен сбрасываться со счетов. Ощущение счастья может быть вызвано путем кортикальной стимуляции. Представляется необходимым дальнейшее проведение работ по исследованию «центров счастья».
Состояние счастья предполагает набор симптомов, которые вместе образуют синдром. Синдром может быть определен экспертами. Он включает много особенностей, характерных для заболеваний. Признаком, указывающим на заболевание в патопсихологии, признается интенсивность аффекта, которая, возможно, является индикатором состояния неврологической расторможенности. Необходим дифференциальный диагноз по отношению к маниакальному синдрому. Состоя ние счастья образует явное отклонение от нормы. В статистическом смысле это явный эксцесс.
В состоянии счастья у человека могут наблюдаться некоторые признаки дезорганизации (расстройства) познавательной сферы. Поведение может выглядеть иррациональным и даже странным, обычно снижены быстрота реакций и чувствительность. Очень трудно дать рациональное объяснение поведения счастливого человека. Распространено мнение о том, что счастье — это привилегия не слишком умных людей.
Из приведенного описания следует, что клиническим психологам и, особенно, психиатрам следует уделять больше внимания анализу состояния счастья как потенциальному источнику патологии. Многие психиатрические
расстройства характеризуются бессмысленным, ненаправленным и даже противоречивым поведением. Счастливые люди часто даже не могут объяснить своего странного поведения, эмоций, и при этом их ничуть не беспокоит такое поведение. Следовательно, вполне оправдан вывод о том, что у них отсутствует понимание болезненного характера своего состояния. Часто можно видеть игру необузданной фантазии счастливых людей. Конечно, заключение о том, что состояние счастья является признаком патологии, возможно, является преждевременным. Для этого должен быть собран более значительный эмпирический материал. Но можно уверенно утверждать, что счастье вызывает безответственные, нелогичные и ненаправленные действия, отвлекает от выполнения общепринятых жизненных обязанностей.
Наконец, существует несколько исследований, связанных с предположением о том, что счастье вызывает расстройство, дезорганизацию когнитивной сферы. Счастливые люди забывают о негативных событиях или недооценивают их значение и при этом переоценивают позитивные события. Их подводит интуиция. Для подтверждения данного вывода необходимо проведение большого числа исследований, особенно таких, которые бы определяли уровень контроля за окружением у счастливых людей. Обычно они переоценивают свои успехи в учебе и на работе, впрочем также как и общении с другими людьми и в любовных делах.
В качестве предварительного заключения можно предложить отнести счастье к одному из видов психиатрических расстройств. Бенталл (1992) определяет счастье как «общее аффективное расстройство приятного типа» (Major Affective Disorder, pleasant type). По его мнению, необходим поиск эффективной терапии, направленной на снижение ощущения счастья.
Приведенный выше пример показывает, что наши понятия характеризуются смысловой наполненностью. Для классификации форм поведения, мышления и эмоций недостаточно одних только формальных и объективных критериев. В человеческом поведении всегда присутствует смысл, значение, которое не может быть передано только средствами языка формальных элементов и отношений.
126
127
ТРИНАДЦА ТЬ ИТОГОВЫХ ТЕЗИСОВ
-
Наиболее полная система психодиагностики предполагает «кооперацию» (пока отсутствующую) между тремя ее уровнями: а) житейскими представлениями о характеристиках людей, б) конструктами психологических теорий, в) математическими или статистическими моделями.
-
Ошибки измерения являются случайными, интуитивно не улавливаемыми и неизбежными. Эти ошибки дают информацию о согласованности-несогласованности поведенческих и когнитивных характеристик. Существуют способы оценки ошибок измерения.
-
Под индексом надежности понимается стандартная ошибка измерения, получаемая путем повторного оценивания одного и того же субъекта. Поскольку это практически невыполнимо, можно говорить о коэффициенте корреляции как об альтернативном варианте.
-
Каждый тест должен быть снабжен не менее чем одним коэффициентом надежности и не менее чем одним коэффициентом валидности (см. также пункт 10).
5. По мнению Леви (1974), Гольдштейна и Вуда (1989).
взаимодействие между «содержательными» психологиче
скими теориями и теорией тестов, классической и современ
ной, можно назвать успешным только в определенной
степени. Аспектный анализ (и теория обобщаемости) —
это, возможно, те подходы, которые могут выполнить фун
кцию моста между теорией тестов и психологическими те
ориями.
-
Критерии валидности могут происходить из различных эпистемологических источников. Это такие, например, критерии, как корреспонденция, когеренция, консенсус, практическая полезность. Их многообразие не означает, что понятие валидности разнородно и даже противоречиво. Такое множество стало возможным потому, что предмет психологии сложен и многообразен.
-
Возможна определенная унификация понятия валидности, но существует также несколько весьма важных разграничений, главное из которых — это разграничение между прогностической, конструктной и содержательной валидностью.
-
Концепция валидности используется и в экспериментальных исследованиях (в собственно экспериментальном
и квазиэкспериментальном вариантах). Различаются внутренняя, внешняя, конструктная типы валидности и валидность статистического вывода. Эти типы валидности в определенной степени аналогичны типам, используемым в психодиагностике.
9. Понятие валидности предполагает, что тестовые ре
зультаты должны соответствовать изучаемым феноменам,
что возможна их интерпретация, и что они практически
полезны (для конкретных целей). Информация о тестовых
результатах и данные наблюдения должны использоваться
в соответствии с нормами и ценностями общества.
-
Генерализация валидности является результатом дифференциации понятия прогностической валидности. Процедура состоит в оценке источников ошибок в выборке коэффициентов валидности и в нахождении истинного коэффициента валидности. Обсуждение практической полезности будет представлено далее.
-
Конструктная валидность претендует на то, чтобы объединить концепции валидности. Можно рассматривать, например, прогностическую и содержательную валидность как конкретные варианты разработки этого более широкого
понятия.
12. Представители психометрии больше интересовались
изучением надежности, чем валидности. Разработка моде
лей исследования валидности достаточно сложна. В иссле
довании валидности всегда «что-то ускользает».
13. Главные заботы представителей психодиагностики
связаны с проблемами поиска соответствия эмпирических
данных и моделей их описания, понятий и способов их опе-
рационализации, структуры и ее содержания.
128
5 Я. тер Лаак
Глава 4
Психодиагностика интеллекта, способностей и уровня достижений
Психодиагностика — это всегда диагностика какого-либо конкретного содержания. Важнейшим содержательным разделом диагностики является оценка индивидуальных различий в области интеллекта, способностей и уровня достижений. Тесты, предназначенные для получения показателей этих различий, называют тестами на определение «максимальных возможностей», поскольку тестируемый человек должен показать все, на что он способен. При этом его ответы в соответствии с определенным правилом оцениваются как правильные или неверные.
Интеллект относится к числу наиболее часто используемых и интенсивно исследуемых в психологии конструктов. Поэтому практически в каждом учебнике рассматривается содержание, история этого конструкта, а также связанные с ним спорные вопросы. В психологии интеллект описывают как достаточно общую способность, включающую в себя, наряду с другими, способность к логическому рассуждению, планированию, решению задач, абстрактному мышлению, способность понимать сложные идеи, скорость обучения и способность извлекать пользу из полученного опыта. Так, например, способность выучить наизусть книгу еще не является показателем интеллекта, так же как успеваемость по какой-либо учебной дисциплине или сообразительность в процессе тестирования — это еще не интеллект. Интеллект представляет собой одновременно широкую и глубокую способность понимать окружающую обстановку, улавливать смысл происходящих событий, знать, что делать в повседневной жизни. Интеллект обычно отличают от креативности, характера, личности и других существенных параметров межиндивидуальных различий.
К способностям (aptitudes) относят условия, обеспечивающие получение какого-либо знания посредством специ-ального обучения (тренировки). Это понятие в определенной степени сходно с понятием интеллекта, особенно оно близко концепции мультифакторного интеллек-
та Терстоуна, где выделяются так называемые «первичные умственные способности». Но на практике существует различие. Интеллект преимущественно мыслится как некая общая способность, которая в целом выражается одним суммарным числовым показателем IQ (коэффициентом интеллекта) , тогда как специальных способностей всегда насчитывается несколько, например: словесная беглость, способность к оперированию пространственным материалом, числовые способности и др.
К сфере достижений относится то, что человек усвоил в какой-либо конкретной области: сюда входят и развиваемые способности, и полученные знания. В словосочетании «школьные достижения» значение понятия становится вполне ясным. Это то, что приобретается в результате усвоения учебной программы в школе. Разработаны специальные тесты уровня достижений, которые, в частности, оценивают степень овладения такими базовыми навыками, как чтение, письмо и арифметические операции.
Названные выше составляющие тестов на выявление максимальных возможностей — интеллект, способности и достижения — молено анализировать на трех уровнях. Во-первых, практически у любого рядового человека, т.е. неспециалиста в психологии, существуют определенные представления о том, что же такое интеллект, способности и достижения. Содержание и структура этих житейских представлений отчасти являются предметом эмпирического анализа. Во-вторых, существуют специальные теории индивидуальных различий в области интеллекта, способностей и уровня достижений. Наконец, имеются модели или, может быть, лучше сказать, статистические методы анализа (или исследования) предполагаемой структуры конкретных составляющих интеллекта, способностей и достижений. В частности, для исследования структуры межиндивидуальных различий по интеллекту используются модели факторного анализа. Сравнительно недавно для моделирования (описания и объяснения) уровня достижений стала использоваться теория анализа ответов в тестовых заданиях (item response theory — IRT).
Установление связей между этими тремя уровнями важно как для соответствующих разделов психологии, так и для
130
131
науки в целом. Философ Блэк (Black, 1962, с. 237) попытался представить в качестве «сохраняемых и передаваемых системных метафор» не только научные модели, но и притчи, сказки, аллегории, мифы, а также бытующие на уровне здравого смысла представления об интеллектуальных способностях. Тем самым он указал на общий источник, из которого происходят и здравый смысл, и научное знание. При этом Блэк также сознавал существенное различие между ними, поскольку : «...любая наука должна начинаться с метафоры, а заканчиваться алгеброй». Между высказываниями Блэка и выделенными нами уровнями анализа можно найти связь. «Метафора» относится к одному полюсу рассматриваемого нами ряда — к представлениям здравого смысла о максимальных возможностях в сфере интеллекта, способностей, достижений,— а «алгебра» — к другому полюсу, т.е. моделям, основанным на факторном анализе или современных тестовых теориях, включая теорию анализа заданий (IRT). Эти два полюса — «метафору» и «алгебру» — можно рассматривать как крайние позиции континуума, включающего в себя все многообразие теорий (см., например, Snow, 1973). Связь между метафорами и моделями иногда подчеркивается сознательно. Так, например, Лири (Leary, 1990, с.2) называет метафору «размышлением души» и отстаивает ее важную функцию в науке. Но существует также и противоположное отношение к метафоре по причине ее «неточного» и, если так можно выразиться, «ветреного» характера. Однако в психологии метафоры все еще сохраняют свое значение и входят в различные теории в качестве их неявных компонентов: например, метафоры, в которых человек рассматривается как машина или носитель набора черт (качеств) и др. Вопрос о том, прибавляет ли метафора что-то к нашему знанию, зависит в свою очередь от того, признается ли возможность приращения знания путем сравнения одного феномена с другим, уже известным (здравому смыслу) феноменом. В науке такая позиция часто отвергается, поскольку подобного рода сравнение (уподобление) всегда неполно. Познание не может опираться на предрассудки, a idola tribus* — это не более, чем другое название того же самого здравого смыс-* idola tribus (лат.) — мнение кумиров (прим. перев.).
ла. На самом деле необходимо, чтобы структура явления получила полное описание и объяснение, независимое от ссылок на что-либо еще. Проблема соотношения различных уровней познания будет обсуждаться нами применительно к задаче выявления максимальных возможностей в процессе тестирования интеллекта, способностей и уровня достижений.
Диагностика состоит из четырех основных компонентов. Эти компоненты присутствуют и в интеллекте, и в отдельных способностях, и в достижениях. Теория тестирования разрабатывалась главным образом с целью получения средств надежной и валидной оценки индивидуальных различий. Кроме того, для описания и объяснения этих различий созданы специальные теории и таксономические системы. Таким образом, на сегодняшний день существует множество тестов на интеллект, отдельные способности и достижения, при этом определение максимальных возможностей человека в указанных областях является важнейшим элементом диагностического процесса. Сказанное, однако, больше относится к форме (методу интеграции данных и процессу их получения), чем к собственно содержанию тестов.
4.1. Начальный период в измерении индивидуальных различий по интеллекту
Хотя индивидуальные психологические различия между людьми были осознаны очень давно, их не исследовали систематически вплоть до конца XIX века. Философы анализировали природу человеческого познания, но не объясняли основ индивидуальных различий. Уже с давних пор претенденты на государственную службу, а также студенты университета должны были демонстрировать обладание теми или иными качествами, однако применяемые при этом процедуры имели, по сути, лишь некое подобие внешней валидное™ (см. главу 3). До конца XIX века интеллект принадлежал исключительно сфере философии, а точнее, эпистемологии. Например, в средние века вслед за Аристотелем (около 330 г. до нашей эры) Фома Аквинский определял интеллект как способность «читать» в объектах, событиях и явлениях. Интеллект связывали с пониманием
132
133
внутреннего строения веществ и структуры предметов, явлений. В интеллекте видели силу, способную объединять и объяснять, способность улавливать черты различия в сходных объектах и черты сходства в различных объектах и событиях. Пиаже отводит открытию ребенком инвариантности одно из центральных мест в своей теории развития интеллекта. Ранняя стадия постижения ребенком инвариантности связана с уверенностью в существовании объектов даже тогда, когда ребенок их не видит (понятие перманентности объекта).
В главе 3 приводятся системы исследования Чёчмена, построенные на основе взглядов виднейших философов. Эти авторы сформулировали основные требования, которым должно отвечать истинное знание. Однако Лейбница, Локка, Канта, Гегеля и Синджера не интересовали индивидуальные различия по интеллекту. Для них центральная проблема была связана с объяснением природы человеческого познания и познания человеком физического мира.
В XIX веке интеллект стал рассматриваться прежде всего как переменная, т.е. некоторое изменяемое свойство, по которому люди отличаются друг от друга. Для эмпирического исследования интеллекта потребовались задачи, вопросы и проблемные ситуации. Человеку предлагалось ответить на разнообразные вопросы, а полученные ответы оценивались. Таким образом были предприняты первые попытки операционализации интеллекта. Последовавшие возражения философов, утверждавших, что такие задачи никогда не смогут привести к созданию адекватной картины интеллекта, были тщетны.
Как известно, начало измерения различий по интеллекту было связано с практическими проблемами, например, с решением проблемы профотбора, с отбором в армию и т.д. У истоков движения за применение тестов стоял Гальтон. Его интересовала наследственная природа гениальности. Он полагал, что существуют некие общие умственные способности. Опираясь на эмпиризм Локка, он считал, что источником познания и интеллекта является восприятие стимулов, основанное на ощущениях. В результате индивидуальные различия по интеллекту выводились им из различий в скорости и тонкости ощущений.
Этот раздел показывает, что многие философы описывают интеллект как способность познавать мир. В отличие от них психологи открыли путь к изучению интеллекта, определив его как общую способность, в развитии которой имеются существенные индивидуальные различия и которую можно оценить количественно с помощью специально подобранных задач.
4.2. Житейские представления об интеллекте
В обыденной речи имеется целый ряд слов и выражений, передающих наше представление о себе и других людях как в той или иной степени умных, способных к творчеству (креативных), сообразительных, хитрых, проницательных, образованных (эрудированных), одаренных. У каждого из нас есть образ умного человека, т.е. человека, обладающего высоким интеллектом. Найссер (1976) предполагает, что у людей имеется некий прообраз, иначе говоря, прототипическое представление об умном человеке. Хайдер (1958) описал имплицитные, т.е. не выражаемые явно представления о личности. Родители и учителя как лица, сопричастные процессу интеллектуального развития своих детей или учеников, имеют определенное представление об интеллекте ребенка, о том, как интеллект меняется и что способствует его развитию. С целью описания содержания и структуры представлений об интеллекте, присущих обыденному сознанию, ведутся эмпирические исследования.
4.2.1. Житейские представления об интеллекте: содержание и основные параметры Стернберг, Конвей, Кетрони Бернштейн (1981) провели исследование содержания и организации представлений об интеллекте, бытующих среди «обычных» людей, т.е. среди людей, не связанных с его изучением. Стернберг посчитал целесообразным исследовать, что подразумевается под интеллектом, поскольку такое знание могло бы стать концептуальной основой для построения эксплицированных теорий. Имплицитные, т.е. неотрефлексированные, представления находятся в «головах людей», и их исследование позволяет выявить определенные культурно обусловлен-
134
ные взгляды на интеллект. Стернберг и др. (1981) предложили 500 участникам исследования (непсихологам) и 150 экспертам (психологам, специалистам в области познавательного и личностного развития) перечислить характерные свойства человека и те виды человеческой деятельности, в которых проявляется «интеллект», «отсутствие интеллекта», «школьный интеллект» и «интеллект в повседневной жизни». Участники эксперимента приводили несколько различных характеристик или видов занятий, таких как «много читает», «логично рассуждает», «обладает открытостью ума», «обнаруживает здравый смысл». Затем участников исследования просили оценить по семибалльной шкале ту степень, в которой каждая из названных характеристик присуща «идеально умному человеку». После этого проводился факторный анализ полученных количественных оценок (от 1 до 7) и определялись корреляции, причем в каждой из двух групп отдельно. В результате в общей картине суждений, характерных для неспециалистов, были выделены три следующих фактора:
-
Способность к «решению проблем практического характера» (человек логично рассуждает, улавливает связь идей, учитывает разные точки зрения).
-
«Вербальные способности» (человек ясно и четко формулирует свои мысли, обладает беглой речью, является хорошим специалистом, знатоком в какой-либо конкретной области).
-
«Социальная компетентность» (человек принимает людей такими, какие они есть, умеет признавать собственные ошибки или неудачи, испытывает интерес к окружающему миру).
В корреляционной матрице шкалированных значений, полученных в группе экспертов, также были выделены три фактора:
-
«Вербальный интеллект» (человек имеет большой словарный запас, хорошо понимает смысл прочитанного, проявляет любознательность).
-
«Способность к решению задач» (человек умеет применять знания и использовать необходимые сведения в решении проблемных ситуаций, хорошо формулирует суть проблемы).
3) «Практический интеллект» (человек хорошо ориентируется в ситуации, умеет находить способы достижения цели, чутко улавливает происходящее вокруг него). В 1985 году Стернберг провел сходное исследование в отношении трех близких понятий: интеллекта, креативности и мудрости. Он посчитал, что эти понятия относятся к числу «прототипических», базовых, другими словами, данные понятия служат в качестве эталона при определении того, насколько данный конкретный человек обладает умом, мудростью и креативностью. Чтобы получить список слов и выражений, соответствующих описанию данного конструкта, он разослал письма профессорам в области истории искусства, философии, физики и экономики. Ему ответили 17% его коллег, и на основе полученных ответов был составлен список из 100 характеристик. Этот список был послан 200 профессорам и представлен на рассмотрение студентам его курса. Всем этим участникам исследования было предложено на основе 9-балльной шкалы оценить степень соответствия полученных характеристик имеющемуся у них «образу» (прообразу) «умного», «мудрого» и «креативного» человека. На этот раз, заполнив опросники, ответили 35% профессоров. Данные были подвергнуты обработке с помощью метода неметрического многомерного шкалирования. Данная методика дает в результате биполярные параметры, которые можно сравнивать с факторами, получаемыми в результате факторного анализа. Три биполярных параметра «дали объяснение» 82% вариаций шкалированных оценок. Стернберг предложил следующую интерпретацию биполярных параметров интеллекта:
I) «Способность к решению практических задач» (облада
ющий ею человек учитывает, можно ли разумными сред
ствами достичь цели, проявляет гибкость, легко находит
применение имеющимся знаниям) —
— «Вербальная способность» (эрудированно высказывает
ся по ряду проблем, обладает вербальной беглостью, легко
владеет речевыми средствами).
II) «Интеллектуальная интеграция и равновесие» (учиты
вает различные точки зрения на проблему, видит черты
сходства и различия, понимает абстрактные идеи) —
— «Целенаправленность» (ведет поиск и использует ин
формацию, необходимую для достижения конкретных це-
136
137
леи, упорно стремится к достижению поставленных целей).
III) «Контекстуальный интеллект» (учится на своем опыте, извлекает урок из ошибок и успехов, понимает свое окружение, знает, что происходит в мире) — — «Текучее мышление» (способность понимать математические отношения, весьма сообразителен, обладает быстротой мышления).
Стернберг обнаружил четыре биполярных параметра для креативности и три — для мудрости. Между интеллектом и мудростью выявилась значимая корреляция. Креативность оказалась в полученных суждениях несколько в стороне. Стернберг пришел к выводу, что суждения непрофессионалов и экспертов мало различаются между собой. Однако отсутствие выраженных различий не означает, что житейские представления и психологические теории сходны во всех отношениях. Фурнам указывает на существующие между ними различия. Так, житейские теории проверяются человеком по критерию их согласованности в «собственной голове», а не с помощью эмпирических данных. Обычно непрофессионалы не прибегают к стандартизованным методам. Имеется различие и в содержании: психологи, как профессионалы, больше подчеркивают индивидуальные характеристики интеллекта, тогда как неспециалисты, напротив, чаще имеют в виду социальные аспекты интеллектуальных способностей, .проявляющиеся в межличностностном контексте.
4.2.2. Житейские представления об интеллекте как пример социальных репрезентаций Представители направления социального конструктивизма исследуют имплицитные, т.е. не выражаемые явно системы взглядов как один из видов социальных репрезентаций. Более того, они предполагают эквивалентность имплицитно подразумеваемых и эксплицированных систем знания. «Метафора» и «модель» равноправны, поскольку обе имеют свои собственные специфические социальные функции. И в науке, и в обыденном сознании сложились определенные представления об интеллекте, хотя они, разумеется, и различны. Некая имплицитная система представлений об интеллекте необходима в целях
приспособления к условиям повседневной жизни. В отличие от нее, эксплицированная теория требует данных, которые подтверждали бы выдвигаемые ею положения, причем эти данные должны быть получены в соответствии с определенными методологическими требованиями. Представители направления, ориентированного на эксплицированные теории, постоянно упрекают представителей «имплицитной ориентации» в отсутствии методологической культуры.
При этом, как замечает Каругати (1990), сторонники эксплицированных теорий упускают из вида то обстоятельство, что социальные репрезентации обладают собственной функцией и организацией. Социальные репрезентации создают для социальной группы особый план символической реальности. Человек может включаться в группу путем приобщения к этой символической реальности, общей для всех членов группы. Согласно теории социального конструктивизма, научные представления —это всего лишь один из многих видов символической реальности. Это расхождение служит основанием для нападок ученых на конструктивизм, в то время как он не подчиняется широко признанным методологическим требованиям, например, требованию объективности.
Каругати (1990) поднял вопрос о том, как воплощаются социальные репрезентации, относящиеся к сфере индивидуальных различий. Такого рода социальные репрезентации имеют место в любой конкретной социальной группе. Члены группы в разной степени знакомы с интеллектуальными различиями. Некоторые из них специально призваны формировать у себя подобные представления — это, например, родители и учителя. Причем у последних должно быть определенное мнение о том, может ли обучение влиять на интеллект детей или нет. В исследовании Муни и Каругати (1989) были описаны социальные репрезентации индивидуальных различий по интеллекту. Авторы просили взрослых испытуемых описать, что, с их точки зрения, представляет собой общий интеллект и специальные его виды; с чем могут быть связаны трудности в арифметике и как можно было бы их предупредить; из каких источников информации можно узнать об интеллектуальных различиях; как ведет себя «образцово» умный ребенок и каким
138
139
образом можно было бы оценить интеллект. Авторы сроб-щают, что представления об интеллектуальных различиях между людьми в этом «думающем сообществе» отличаются богатством и разнообразием. Ниже мы приводим их в суммарной форме (нумерация соответствующих пунктов дана арабскими цифрами, чтобы не смешивать их с параметрами эмпирического анализа исследований Стернберга и др. (1981, 1985).
-
Взрослые испытуемые поднимали вопрос об источнике индивидуальных различий. Они интересовались, имеет ли наука на этот счет определенный ответ.
-
Они задавались вопросом, означает ли интеллект усвоение социальных норм и правил.
-
Интеллект рассматривается как продукт «высших психических функций», при этом могут использоваться и «компьютерная» и «логическая» метафоры.
-
Большая часть других выделенных особенностей касалась адаптации к физическому окружению и процессу обучения, роли социо-экономического статуса семьи и наследственной обусловленности интеллектуальных способностей, влияния учителей на формирование индивидуальных различий, влияния обучения математике, поднимался также вопрос, приобретается интеллект или его нужно скорее рассматривать как некий «дар».
Авторы этого исследования считают, что просто описывать то, что говорят испытуемые, как это делал Стернберг, недостаточно. Они хотят доказать, что два фактора, а следовательно, и два механизма, оказывают влияние на конкретные социальные репрезентации. Это степень знакомства с интеллектуальными достижениями и процессы, связанные с поддержанием социальной идентичности.
Действие отмеченных факторов, или механизмов, было продемонстрировано с помощью примеров, взятых из интервью. Авторы пришли к выводу, что чем менее участники исследования были знакомы с проблемой индивидуальных различий, тем в большей степени они были сторонниками теории «природной одаренности» в объяснении интеллектуальных различий. Часть испытуемых придерживалась мнения, что природа индивидуальных различий таинственна и непредсказуема, а сам интеллект рассматривался как «дар». Кроме того, наблюдалась такая закономерность: ма-
тери, работающие вне дома, были в большей степени склонны думать, что интеллект подчинен преимущественно процессу созревания, по сравнению с матерями, работающими на дому. Каругати (1990, с. 145) использовал данное наблюдение как свидетельство того, что механизмом этого различия служила социальная идентичность образу «хорошей матери».
4.2.3. Культурно-специфический характер житейских представлений об интеллекте
Берри и Беннет (1992) показали, что имплицитно содержащиеся в социальных репрезентациях взгляды на интеллект носят культурно-специфический характер. Изучая племя крии, живущее на севере Канады, они выявили в их языке 20 слов, относящихся к характеристикам сферы интеллекта. Шестидесяти членам племени, умевшим читать, было предложено разделить эти 20 слов на классы, содержащие в себе сходные слова. Метод многомерного шкалирования ответов выявил два параметра. В первый биполярный параметр вошел кластер с такими словами, как «мудрый, много думает, внимателен, умеет чувствовать направление» на одном полюсе. На другом полюсе этого кластера оказались такие характеристики, как «глупый, ненормальный, тугодум». Во второй биполярный параметр вошли такие слова, как «упорный, сильный, смелый», на одном полюсе, и кластер с такими характеристиками, как «понимает новое» и «религиозен», на другом полюсе.
Авторы объясняют использование приведенных терминов особенностями социальной организации данной группы. Эта группа предоставляет своим детям очень большую свободу, и ее члены очень рано начинают отвечать за свои поступки и поведение. Так, например, с 9-летнего возраста детям разрешается носить ружье. Здесь нет западного понимания интеллекта как аналитической способности или быстроты ума, в это слово вкладывается другое значение — способность к самостоятельному и ответственному, с моральной точки зрения, поведению.
Подведем некоторые итоги. Этот раздел показывает, что интеллект можно изучать как некое прототипическое представление, содержащееся в обыденном сознании. Это пред-ставление может стать предметом специального
140
141
исследования. Некоторые его параметры можно измерить на основе суждений, высказываемых как экспертами, так и неспециалистами. Структура этих представлений может быть выявлена с помощью процедур факторного анализа. Хотя по данным исследования Стернберга указанная структура и не обнаруживает значительных различий (при сравнении мнений экспертов и неспециалистов), тем не менее определенные различия как по содержанию, так и контексту между понятиями из психологических теорий и житейскими представлениями все же имеются. Социальные конструктивисты также различают «параметры» житейских представлений об интеллекте. Эти представления рассматриваются как социальные репрезентации некоторой группы. Они соответствуют нормам и ценностям такой группы и выполняют функцию социальной идентичности данной группы и личной идентичности ее членов. Срезовыс исследования показывают, что обыденные представления имеют культурно—специфический характер и соответствуют принятым в обществе ценностям.
4.3. Индивидуальные различия в сфере интеллекта
В психологии термин «интеллект» употребляется в разных значениях. Так называемые «психометрические теории» пытались установить факторы, с помощью которых молено описать и объяснить индивидуальные различия. Кроме того, следует упомянуть о тестах. Хотя тесты создавались главным образом не для контроля за факторами, а с другой целью, они, тем не менее, оказались полезными и в этом качестве, так как могли служить показателями для одного или ряда факторов. Для объяснения природы индивидуальных различий, столь надежно измеряемых с помощью тестов, были предприняты попытки связать тесты с теоретическими представлениями, построенными на основе базисных когнитивных процессов и процессов переработки информации, а также на основе биологических процессов. Была также предпринята попытка объяснить вариации тестовых результатов с помощью более элементарных и базисных процессов.
Следует заметить, что тесты интеллекта чаще всего создавались в ответ на запросы практики, которой обычно
требовались тесты, простые в употреблении. Так что некоторые из тестовых инструментов достаточно далеко отстоят от каких-либо теорий. Мы рассмотрим некоторые примеры тестов. Психометрическое направление в исследовании интеллекта было связано с разработкой метода многомерного анализа данных, главным образом метода факторного анализа. Таким образом имеется связь между характером теоретических представлений и процедурами анализа эмпирических данных. Наконец, мы также затронем некоторые спорные вопросы, связанные с понятием интеллекта.
4.3.1. «Психометрическое» понимание интеллекта
В сфере тестирования интеллекта термин «психометрический» связывают с созданными Гальтоном тестами на умственное развитие (mental tests). Эти тесты называются также психометрическими тестами. Специфика психометрии как одной из отраслей психологии связана с тем, что она имеет дело с моделями, объясняющими ответы тестируемого в каком-либо задании или наборе заданий теста. Вначале эти два значения между собой более или менее переплетались, однако впоследствии их четко разграничили.
Английский ученый Спирмен предположил существование двух факторов интеллекта — общего, или генерального (general), и специфического. В соответствии с этим допущением он разработал факторную теорию интеллекта. Он использовал не столь сложные задания, как Гальтон, и был убежден, что для изучения интеллектуальных способностей человека необходимо исследовать индивидуальные различия. Нужно было установить факторы, приводившие к возникновению индивидуальных различий. И, по крайней мере в исследованиях индивидуальных различий, он был сторонником корреляционного метода и метода наблюдений, а не экспериментальной традиции Фишера. Эксперимент, как известно, предполагает варьирование независимых переменных и оценку (измерение) изменений зависимых переменных (характеристик поведения). Корреляционный метод и метод наблюдения направлены на фиксацию и анализ взаимосвязей между данными, относящимися к «природно» обусловленным индивидуальным различиям. В своих рассуждениях Спирмен исходил из то-
142
143
го, что причины разнообразия характеристик познавательной сферы человека связаны с историей и природой.
Спирмен (1923) полагал, что задания из тестов на умственные способности позволяют измерить общий фактор интеллекта (g-factor), а специальные способности связаны с заданиями более частного типа (s-factors). В большом числе различных заданий имеется общее ядро — g-фактор. (Позднее Лакатос сформулировал аналогичную мысль применительно к научным теориям, см., например, его работу 1970 года). Однако в силу специфичности своей формы задания измеряют не только фактор общего интеллекта, но также и специальные способности. Тем не менее индивидуальные различия, существующие между людьми, связаны главным образом с ядром интеллекта. Согласно теории Спирмена, специфическое содержание заданий не существенно. Спирмен называл это «индифферентностью показателя». По Спирмену, g-фактор отвечает за установление отношений и связей (корреляций). Отношения связаны с индуктивным мышлением, т.е. выводом некоторого общего правила на основе различных эмпирических явлений. Корреляции же относятся к дедуктивному типу рассуждения, т.е. предполагают построение конкретных примеров (явлений, событий и т.д.) как реализации некоего общего правила. В этом заключается главное содержание или «основы» интеллекта.
Прогрессивные матрицы Равена — это тест, о котором принято говорить, что он в достаточно весомой степени измеряет общий фактор интеллекта (Raven, 1938). Его считают относительно свободным от влияния культуры. Этот диагностический инструмент можно использовать начиная с 6-летнего возраста как в групповой, так и в индивидуальной форме. Тест состоит из пяти серий заданий, в каждой из которых содержится 12 постепенно усложняющихся заданий (матриц). Каждая матрица имеет один или несколько прямоугольников с определенным рисунком, причем часть прямоугольника оставлена незаполненной, пустой. Испытуемый должен определить, какой должна быть пустующая часть, и выбрать ее среди 6 или 8 (в зависимости от сложности задания) подобных ей фрагментов, представленных под прямоугольником матрицы. Испытуемый может найти недостающий фрагмент в том случае, если поймет законо-
мерность изменения элементов в матрице. Оценка ответов определяется путем подсчета числа правильно решенных заданий. Считается также, что и в показателях некоторых других тестов, например шкал Стенфорд-Бине и Векслера, отражается фактор общего интеллекта.
Представителем американского направления в психометрии, связанного с многофакторной концепцией интеллекта, является Терстоун. С помощью большой группы сотрудников он провел факторный анализ 56 тестов. Результаты показали, что имеются группы коррелирующих между собой тестов. На этом основании он заявил о существовании групповых факторов. Эти группы образуют «первичные умственные способности». Их насчитывается семь: «словесное понимание», «беглость речи», «легкость оперирования числовым материалом», «пространственная ориентация», «ассоциативная память», «скорость восприятия» и «индуктивное мышление». В процессе факторного анализа использовался метод вращения факторной матрицы таким образом, что группы теста имели высокую нагруженность по одному фактору и низкую — по всем остальным. Это создавало возможность для прямой интерпретации теста как меры того или иного фактора. «Первичные умственные способности» можно измерить при помощи теста. Таким образом, можно получить оценку семи упомянутых способностей субъекта. Благодаря процедуре ортогонального вращения показатели профиля испытуемого можно интепретировать с точки зрения силы или слабости его способностей. В этом и заключается дифференциальный подход к интеллекту с позиций многофактррной теории.
Дальнейшее развитие этого подхода связано с именем Гилфорда. Он выделил 120 «видов интеллекта». Предложенная Гилфордом структурная модель представляет собой прямоугольный параллелепипед, длины сторон которого имеет соотношение 4 : 5 : 6. В этой модели различаются 4 типа содержания, с которым действует субъект: «объектное, символическое, семантическое и поведенческое»; 5 типов операций: «познание, запоминание, конвергенция, дивергенция и оценка», а также 6 типов продуктов: «единицы, классы, отношения, системы, трансформации, рассуждения». Эта модель послужила отправным пунктом для разработки множества тестов. Она дала возможность для очень
144
145
тонкой дифференциации содержания тестов и послужила мощным стимулом для исследования креативности (дивергентного мышления). Модель Гилфорда наводила на мысль, что для каждой из 120 умственных способностей должен быть разработан свой тест. Было применено понятие факторной валидности. Но, как заметили Кронбах и Сноу (1977), главная идея самого Гилфорда состояла не в этом. Его привлекала мысль о создании эвристической модели, содержащей достаточно широкую схему, в которой нашлось бы место для самых разных умственных способностей. Однако число 120 слишком велико. И оно никогда не получит статуса, аналогичного «большой пятерке» из пятифактор-ной модели параметров личности (см. гл. 3). Для этого число факторов должно было бы быть намного скромнее.
До сих пор мы имели дело отдельно с фактором общего интеллекта (g-фактором), семью первичными способностями и 120 умственными способностями (по Гилфорду). Возникла необходимость их упорядочивания. Один из первых исследователей мета-уровня Верной (1969) применил к вышеназванным факторам метод факторного анализа и предложил иерархическую модель, где место генерального фактора занимал спирменовский фактор общего интеллекта, а затем следовали два достаточно мощных групповых фактора (вербальный и пространственный). Групповые же факторы в свою очередь подразделялись на более узкие частные групповые факторы, а затем и специальные факторы.
Дискуссии по вопросу о структуре интеллекта не завершены. В качестве иллюстрации этого достаточно привести несколько выдержек из журнала «Journal of Intelligence» за 1991 год. Там, в частности, обсуждался вопрос, лежит ли в основе фактора общего интеллекта один или большее число базовых информационных процессов. Аналогичная дискуссия (один или более факторов) ведется и по поводу другого уровня: связана ли та или иная способность с одним или большим числом элементарных процессов переработки информации. При этом существование g-фактора интеллекта принимается в качестве рабочей гипотезы.
Кранцлер и Дженсен (1991) поставили вопрос о том, лежит ли в основе g-фактора интеллекта некий первичный процесс или процессов несколько. Эти процессы были опё-
рационализированы с помощью таких элементарных когнитивных задач, как задачи на скорость зрительного поиска и скорость запоминания. Фактор общего интеллекта измерялся с помощью матриц Равена и «многомерной батареи способностей». Результат показал, что индивидуальные различия по фактору общего интеллекта были связаны с четырьмя независимыми компонентами элементарного характера. Авторы пришли к выводу, что связь между различными сложными интеллектуальными тестами определяется одними и теми же элементарными и независимыми друг от друга процессами. Корреляция между показателем многомерной регрессии R, отражающей четыре упомянутых компонента, и фактором общего интеллекта составила 0,54. После введения некоторых поправок (например, сокращения интервала, поскольку в данном исследовании принимали участие только студенты) показатель R составил 0,77. Они отметили, что уточненная корреляция между g-фактором и результатом в элементарных когнитивных задачах была такой же высокой, как и корреляции между другими тестами, направленными на определение IQ, Таким образом, вопреки первоначальной идее Спирмена о дедукции и индукции соответствующих отношений и корреляций, эти авторы объясняют связь различных тестов, измеряющих показатель g-фактора интеллекта, на основе четырех процессов. Оценку фактора общего интеллекта можно предсказать на основе четырех основных компонентов из упомянутых элементарных когнитивных задач.
Кэррол (1991) не согласен с таким утверждением. Он признает лишь то, что авторам удалось показать возможность предсказания оценки g-фактора интеллекта на основе ряда независимых компонентов. Хотя элементарные когнитивные задачи и тесты, измеряющие фактор общего интеллекта, коррелируют между собой, из этого вовсе не обязательно следует, что фактор общего интеллекта характеризуется четырьмя независимыми процессами. Методика данного исследования не дает достаточных основания для такого вывода. Кэррол доказывает, что для полученных результатов может быть предложена более экономная интерпретация, если допустить, что g-фактор представляет собой единое образование. В то же время в работе Кранцле-ра и Дженсена (1991) не исследуются первичные (элемен-
146
147
тарные) процессы независимо от фактора общего интеллекта (в силу особенностей корреляционного метода).
Стернберг считает сомнительной возможность того, что в сложные интеллектуальные задачи вовлечены независимые процессы. Проблема заключается в том, чтобы вычленить, изолировать процессы, играющие важную роль, и измерить их на значимом уровне, а в дальнейшем определить сочетание этих процессов в конкретных популяциях.
Подведем некоторые итоги. В этом разделе главы мы попытались показать, что так называемые психометрические теории интеллекта берут свое начало в гальтоновских тестах на умственные способности и приводят к современным представлениям о содержании независимых факторов, их числе и другим вопросам. Авторы теорий этого направления, опираясь на метод факторного анализа, разрабатывают процедуры проверки выдвигаемых ими таксономических концепций интеллекта. На сегодняшний день нет ответа на вопрос о том, лежит ли в основе интеллекта один или несколько различных факторов. Нет даже единого мнения относительно того, один или большее число неких первичных процессов образуют источник индивидуальных различий по фактору общего интеллекта. Возможность выделения более элементарных процессов на сегодняшний день представляется сомнительной. Их природа, содержание и структура должны стать предметом дальнейших исследований.
4.3.2. Связь индивидуальных различий в сфере
интеллекта с процессами переработки информации
и биологическими процессами
В настоящее время для объяснения межиндивидуальных различий по фактору общего интеллекта привлекаются элементарные процессы переработки информации. Как известно, инструменты, предназначенные для измерения интеллекта, представляют собой меры продукта, т.е. они измеряют только результат, не затрагивая его механизмы или приводящие к нему процессы. Отсюда логично вытекает следующий вопрос: от каких способностей в сфере переработки информации и от каких биологических процессов зависят измеряемые тестами индивидуальные различия?
Существует огромное число работ, направленных на изучение корреляций между первичными, так сказать, элементарными и основными психическими процессами (памятью, восприятием, учением, элементами логического рассуждения), с одной стороны, и тестовыми оценками интеллекта, с другой. Эта сторона проблемы исследована весьма тщательно. Первоначальный энтузиазм и надежды на то, что таким образом удастся проникнуть в сердцевину интеллекта, давно прошли. На смену им пришло понимание того, что, в.опреки ожиданиям, между названными процессами и интеллектом не существует высоких корреляций. Более того, упомянутые процессы нельзя использовать для усовершенствования тестов интеллекта путем уточнения конструктной и предсказательной валидности (Sternberg, 1991). Стернберг обсуждает несколько подходов к интеллекту и ставит вопрос: что дают эти подходы для разработки более совершенных инструментов? Вначале он рассматривает подход, основанный на «когнитивных корреляциях». В русле данного подхода когнитивные задачи, применяемые в лабораторных экспериментах, используются для объяснения тестовых оценок. Например, проводился анализ того, насколько результаты в пробах на сопоставление буквенного состава слов и скорость лексического выбора в специальных когнитивных заданиях могут служить основой для предсказания тестовых оценок. Нередко использовался и показатель времени реакции. Создана батарея специальных заданий на процессы переработки информации (Rose, 1980). Суммируя накопленные фактические данные, Стернберг пришел к выводу, что корреляции между параметрами когнитивных задач, с одной стороны, и оценками интеллекта и школьными достижениями, с другой, являются значимыми, но весьма низкими. Ему известно лишь несколько исследований, в которых сообщается о высоких корреляциях такого рода, и он объясняет их особенностями построения самих этих исследований. В частности, там было мало испытуемых, а в уровне их способностей отмечался большой разброс. В итоге Стернберг пришел к выводу, что подход, основанный на анализе когнитивных корреляций, не оправдывает ожиданий и не может служить альтернативой классическим тестам интеллекта, поскольку измерение времени реакции было бы более эффективным и точным тестом.
148
149
В качестве второго направления Стернберг обсуждает исследования «когнитивных компонентов». Этот подход предполагает «разложение» заданий из тестов интеллекта на составляющие их элементарные единицы и стратегии переработки информации. Кроме того разграничиваются упомянутые единицы и метакомпоненты стратегий. Это относится к пониманию способа решения задачи, к тому, как должны быть организованы компоненты — последовательно или одномоментно,— к определению момента, когда процесс решения можетбыть прекращен, например, по причине достижения определенного критерия. Приводятся также такие исполнительные компоненты, как декодирование, установление отношений более высокого уровня и их использование, сравнение ответов, обоснование ответа и, наконец, решение проблемы. Таким образом, необходимо провести измерение многих процессов. Результаты же их измерения обнаруживают весьма умеренные корреляции с интеллектом. Полученные данные оказались не столь многообещающими, как ожидалось. Тем более, что практическое применение такого подхода в целях получения надежной оценки интеллекта ограничено по причине сложности измерения многих процессов и больших затрат времени.
Имеется и третий подход к измерению интеллекта — так называемый «жесткий» путь («hard way»), как назвал его Вернон (1991). Это путь корреляции интеллекта с показателями нейрофизиологических и биологических процессов. Например, берутся такие показатели, как вызванные потенциалы, время реакции или некоторые характеристики электро-энцефалограммы. При этом обычно обнаруживаются невысокие, хотя и значимые корреляции, реже — довольно высокие. Тем не менее Стернберг критически относится и к этому подходу. Он подчеркивает тот факт, что до определения корреляций полученные показатели подвергаются обработке согласно определенным правилам. Конечно, нужный количественный показатель нельзя непосредственно в готовом виде «считать» с экрана. Мониторы компьютеров чаще всего высвечивают весьма хаотические картины данных, и поэтому требуется вводить сложные компьютерные программы, чтобы выявить смысл полученных данных и суммировать определенные тенден-
ции. Стернберг считает преждевременным делать выводы о том, могут ли показатели нейрофизиологических процессов принять на себя функции интеллектуальных тестов. Мнение Стернберга не разделяет Айзенк, который с большим энтузиазмом относится к сообщениям о высоких корреляциях между временем реакции и интеллектом. Однако будущие исследования могут существенно изменить эту картину, так как станет больше известно о работе человеческого мозга.
Достарыңызбен бөлісу: |