36
37
Croker& Algina, J 986). Можно, однако, отстаивать ту точку зрения, что теория IRT — это «мини-теория о мини-поведении». Сторонники теории IRT замечают, что если-несовершенны концепции (модели) среднего уровня, то что же можно сказать о более сложных конструктах в психологии?
Классическая и современная теории тестов. Люди не могут не сравнивать вещи, которые выглядят почти одинаково. (Возможно, житейский эквивалент психометрии и состоит, главным образом, в сравнении людей по значимым характеристикам и выборе между ними). Каждая из представленных теорий — и теория измерения ошибок оценивания, и математическая модель ответов на задания теста — имеет своих сторонников (Goldstein & Wood, 1986).
Модели IRT не вызывают упреков в том, что это «оценивание по правилам», в отличие от классической теории тестов. Модель IRT ориентирована на анализ оцениваемых характеристик. Характеристики личности и характеристики заданий оцениваются с помощью шкал (порядковых или интервальных). Более того, возможно сопоставление показателей выполнения разных тестов, направленных на изучение сходных характеристик. Наконец, надежность неодинакова для каждого значения на шкале, а средние показатели обычно являются более надежными, чем показатели, расположенные в начале и в конце шкалы. Таким образом, модели IRT в теоретическом отношении представляются более совершенными. Существует и различия в практическом использовании современной теории тестов и классической теории (Sijstma, 1992, стр. 127—130). Современная теория тестов более сложна по сравнению с классической, поэтому она реже используется неспециалистами. Более того, IRT предъявляет особые требования к заданиям. Это означает, что задания должны быть исключены из теста, если они не удовлетворяют требованиям модели. Данное правило относится далее к тем заданиям, которые входили в состав широко используемых тестов, построенных по принципам классической теории. Тест становится короче, и, следовательно, надежность его снижается.
IRT предлагает математические модели для изучения реальных феноменов. Модели должны помочь нам понять ключевые аспекты этих феноменов. Однако здесь кроется основной теоретический вопрос. Модели можно рассматри-
ватькак подход к изучению сложной реальности, в которой мы живем. Но модель и реальность — не одно и то же. Согласно пессимистическому взгляду, возможно моделирование лишь единичных (и притом не самых интересных) типов поведения. Также можно встретить утверждение, что реальность вообще не подлежит моделированию, т.к. она подчиняется не одним лишь причинно-следственным законам. В лучшем случае возможно моделирование отдельных (идеальных) поведенческих феноменов. Существует и другой, более оптимистичный, взгляд на возможности модели-рования. Приведенная выше позиция блокирует возможность глубокого постижения природы феноменов человеческого поведения. Применение той или иной модели поднимает некоторые обшие, фундаментальные вопросы. На наш взгляд, не подлежит сомнению, что IRT является концепцией теоретически и технически превосходящей классическую теорию тестов.
Практическим назначением тестов, на какой бы теоретической основе они не создавались, является определение значимых критериев и установление на их основе характеристик тех или иных психологических конструктов. Имеет ли модель IRT преимущества и в этом отношении? Вполне возможно, что тесты, созданные на основе этой модели, не дают более точного прогноза по сравнению с тестами, созданными на основе классической теории, и возможно, что их вклад в разработку психологических конструктов не является более весомым. Диагносты предпочитают такие критерии, которые непосредственно относятся к отдельному человеку, институту или сообществу. Модель, более совершенная в научном отношении, «ipso facto»* не определяет более подходящий критерий и в определенной степени ограничена в объяснении научных конструктов. Очевидно, что разработка тестов на основе классической теории будет продолжаться, но вместе с тем будут создаваться и новые модели IRT, распространяющиеся на изучение большего числа психологических феноменов.
В классической теории тестов различаются понятия «надежности» и «валидности». Тестовхяе результаты должны быть надежны, т.е. результаты первоначального и повторного тестировании должны согласовываться. Кроме того,
* ipso facto (лак) — сама по себе (прим. перев.).
38
39
результаты должны быть свободны (насколько это возможно) от ошибок оценивания. Наличие валидности — одно из требований, предъявляемых к полученным результатам. При этом надежность рассматривается как необходимое, но еще не достаточное условие валидности теста.
Понятие валидности предполагает, что полученные результаты относятся к чему-либо важному в практическом или теоретическом отношении. Выводы, сделанные на основе тестовых оценок, должны быть валидными. Наиболее часто говорят о двух видах валидности: прогностической (критериальной) и конструктной. Существуют также и другие виды валидности (см. гл. 3). Кроме того, валидность может быть определена и в случае квазиэкспериментов (Cook & Campbell, 1976, Cook & Shadish, 1994). Однако основным видом валидности все же является прогностическая валидность, под которой понимается возможность предсказывать по тестовому результату нечто существенное о поведении в будущем, а также возможность более глубокого понимания того или иного психологического свойства или качества.
Представленные типы валидности обсуждаются в каждом справочнике и сопровождаются описанием методов анализа валидности теста. Факторный анализ более подходит для определения конструктной валидизации, а уравнения линейной регрессии используются для анализа прогностической валидности. Те или иные характеристики (успеваемость, эффективность терапии) могут быть предсказаны на основе одного или нескольких показателей, пол-ученных при работе с интеллектуальными или личностными тестами. Такие техники обработки данных, как корреляционный, регрессионный, дисперсионный анализ, анализ частичных корреляций и дисперсий, служат для определения прогностической валидности теста.
Также часто описывается содержательная валидность. Предполагается, что все задачи и задания теста должны принадлежать специфической области (психических свойств, поведения и т.д.). Понятие содержательной валидности характеризует соответствие каждого задания теста измеряемой области. Содержательная валидность иногда рассматривается как часть надежности или «обобщаемость» (Cronbach, Gleser, Nanda & Rajaratnam, 1972). Однако при
выборе заданий для тестов достижений в конкретной предметной области важно также обращать внимание на правила включения заданий в тест.
В классической теории тестов надежность и валидность рассматриваются относительно независимо друг от друга. Но существует и другое понимание соотношения этих понятий. Современная теория тестов основывается на применении моделей. Параметры оцениваются внутри некоторой модели. Если задание не соответствует требованиям модели, то в рамках этой модели оно признается невалидным. Конструктная валидизации представляет собой часть проверки самой модели. Эта валидизации относится главным образом к проверке существования одномерной латентной исследуемой черты с известными шкальными характеристиками. Шкальные оценки, несомненно, могут быть использованы для определения соответствующих критериев, и возможна их корреляция с показателями других конструктов для сбора информации о конвергентной и дивергентной валидности конструкта.
Психодиагностика аналогична языку, описываемому как единство четырех компонентов, представленных на трех уровнях. Первый компонент, теория тестов, аналогичен синтаксису, грамматике языка. Порождающая (генеративная) грамматика — это, с одной стороны, остроумная модель, с другой — система, подчиняющаяся правилам. С помощью этих правил на основе простых утвердительных предложений строятся сложные. При этом, однако, данная модель оставляет в стороне описание того, как организован процесс коммуникации (что передается и что воспринимается), и с какими целями он осуществляется. Для понимания этого требуются дополнительные знания. То же можно сказать и о теории тестов: она является необходимой в психодиагностике, но она не способна объяснить, что психодиагност делает и каковы его цели.
1.3.2. Психологические теории и психологические конструкты
Психодиагностика — это всегда диагностика чего-то конкретного: личностных характеристик, поведения, мышления, эмоций. Тесты предназначены оценивать индивидуальные различия. Существует несколько концепций
40
41
индивидуальных различий, каждая из которых имеет свои отличительные особенности. Если признается, что психодиагностика не ограничивается только оценкой индивидуальных различий, то тогда и другие теории приобретают существенное значение для психодиагностики. Примером является оценка различий процессов психического развития и различий в социальном окружении. Хотя оценка индивидуальных различий не является непременным атрибутом психодиагностики, тем не менее существуют определенные традиции исследования в этой области. Психодиагностика начиналась с оценки различий интеллекта. Основной задачей тестов было «определение наследственной передачи гениальности» (Gallon) или отбор детей для обучения (Binet, Simon). Измерение коэффициента интеллектуальности получило теоретическое осмысление и прак-тическую разработку в трудах Спирмена (Великобритания) и Терстоуна (США). Раймонд Б.Кеттел сделал подобное для оценки личностных характеристик. Психодиагностика становится неразрывно связанной с теориями и представлениями об индивидуальных различиях в достижениях (оценка предельных возможностей) и формах поведения (уровень типичного функционирования). Эта традиция продолжает оставаться эффективной и сегодня. В учебных пособиях по психодиагностике гораздо реже оцениваются различия в социальном окружении по сравнению с рассмотрением особенностей самих процессов развития. Для этого не существует каких-либо разумных объяснений. С одной стороны, диагностика не ограничивается определенными теориями и понятиями. С другой стороны, она нуждается в теориях, поскольку именно в них определяется диагностируемое содержание (т.е. «что» диагностируется). Так, например, интеллект может рассматриваться и как общая характеристика, и как основание для множества независимых друг от друга способностей. Если психодиагностика пытается «уйти» от той или иной теории, то тогда основой психодиагностического процесса становятся представления здравого смысла. В исследованиях применяются различные способы анализа данных, и общая логика исследований определяет выбор той или иной математической модели и определяет структуру используемых психологических понятий. Такие методы математической статисти-
ки, как дисперсионный анализ, регрессионный анализ, факторный анализ, подсчет корреляций предполагают существование линейных зависимостей. В случае некорректного применения этих методов они «привносят» свою структуру в полученные данные и используемые конструкты.
Представления о различиях в социальном окружении и о развитии личности почти не оказали влияния на психодиагностику. В учебных пособиях (см., например, Murphy & Davidshofer, 1988) рассматривается классическая теория тестов и обсуждаются соответствующие методы статистической обработки, описываются известные тесты, рассматриваются вопросы использования психодиагностики в практике: в психологии управления, при отборе персонала, при оценке психологических характеристик человека.
Теории индивидуальных различий (а также представления о различиях между социальным окружением и о психическом развитии) аналогичны изучению семантики языка. Это изучение и сущности, и содержания, и значения. Значения структурируются определенным образом (подобно психологическим конструктам), например, по сходству или контрасту (аналогия, конвергенция, дивергенция).
1.3.3. Психологические тесты и другие методические средства
Третий компонент предложенной схемы — тесты, процедуры и методические средства, с помощью которых происходит сбор информации о характеристиках личности. Дрене и Сийтсма (1990, стр. 31) дают следующее определение тестам: «Психологический тест рассматривается как классификация согласно определенной системе или как процедура измерения, которая позволяет вынести определенное суждение об одной или нескольких эмпирически выделенных или теоретически обоснованных характеристиках конкретной стороны поведения человека (за рамками тестовой ситуации). При этом рассматривается реакция респондентов на определенное число тщательно подобранных стимулов, а полученные ответы сравниваются с тестовыми нормами».
Диагностике необходимы тесты и методики для сбора надежной, точной и валидной информации об особенностях
42
43
и характерных чертах личности, о мышлении, эмоциях и поведении человека. Помимо разработки тестовых процедур в этот компонент входят также следующие вопросы: как создаются тесты, как формулируются и отбираются задания, как протекает процесс тестирования, каковы требования к условиям проведения тестирования, как учитываются ошибки измерения, как подсчитываются и интерпретируются тестовые результаты.
В процессе разработки тестов различаются рациональная и эмпирическая стратегии. Применение рациональной стратегии начинается с определения основных понятий (например, понятия интеллекта, экстраверсии), и в соответствии с этими представлениями формулируются задания теста. Примером такой стратегии может служить концепция аспектного анализа (the facet theory) Гуттмана (1957, 1968, 1978). Сначала определяются различные аспекты основных конструктов, затем подбираются задачи и задания таким образом, чтобы был учтен каждый из этих аспектов. Вторая стратегия состоит в том, что задания подбираются на эмпирической основе. Например, если исследователь попытается создать тест профессиональных интересов, который бы позволял дифференцировать медиков от инженеров, то процедура должна быть такой. Обе группы респондентов должны ответить на все задания теста, и те пункты, в ответах на которые обнаружены статистически значимые различия, входят в окончательный вариант теста. Если, например, между группами существуют различия в ответах на утверждение «Я люблю ловить рыбу», то это утверждение становится элементом теста. Основным положением этой книги является то, что тест связан с концептуальной или таксономической теорией, определяющей эти характеристики.
Назначение теста обычно определено в инструкции по его применению. Тест должен быть стандартизирован для того, чтобы с его помощью можно было оценить различия между людьми, а не между условиями тестирования. Существуют, однако, отклонения от стандартизации в процедурах, называемых «тестированием границ возможностей» (testing the limits) и «тесты оценки потенциальных возможностей в обучении» (learning potential tests). В этих условиях респонденту оказывается помощь в процессе
тестирования и затем оценивается влияние такой процедуры на результат. Подсчет баллов за ответы на задания объективен, т.е. осуществляется в соответствии со стандартной процедурой. Интерпретация полученных результатов также строго определена и осуществляется на основе тестовых норм.
Третий компонент психодиагностики — психологические тесты, инструменты, процедуры — содержит определенные задания, которые являются наименьшими единицами психодиагностики и в этом смысле задания аналогичны фонемам языка. Число возможных сочетаний фонем ограничено. Лишь определенные фонематические структуры могут образовывать слова и предложения, обеспечивающие доведение информации до слушателя. Также и тестовые задания: лишь в определенном сочетании друг с другом они могут стать эффективным средством оценки соответствующего конструкта.
1.3.4. Диагностический процесс
Любая целенаправленная деятельность имеет определенную последовательность и структуру: всегда есть начало, основная часть и завершающий этап. Психодиагностику тоже можно рассматривать как процесс, направленный на достижение определенных целей. Рассмотрим четвертый компонент психодиагностики — диагностический процесс. Началом этого процесса, как правило, является постановка проблемы клиентом, основную часть составляет сбор информации, окончание процесса — ответ на запрос клиента. Очень часто диагностический процесс определяется как процесс принятия решения. Диагностический процесс может быть описан как действия, происходящие «в голове» психодиагноста: какую информацию он собирает, как и почему он структурирует материал о клиенте и его проблеме, как он формулирует рекомендации. В дополнение к этому нормативная модель описывает, что должен делать психодиагност и как должна быть обработана информация для того, чтобы выбрать из набора возможных вариантов необходимый тип воздействия. Существует две модели обработки информации, наиболее часто используемые в психодиагностике. Это модель полезности ожидаемых последствий (Multi Attribute Utility Model) и правило Бай-еса. Первая представляет собой нормативную модель, ко-
44
4.5
торая стремится к максимизации полезности решения (в седьмой главе об этом будет рассказано более подробно). Эта модель предполагает существование системы количественного анализа данных и описывает правила обработки информации для определения наиболее подходящего варианта. Если выбор сделан не в соответствии с наибольшей привлекательностью, то он, очевидно, «нерационален» или «неоптимален». Второй подход может быть применен для анализа единичного случая. Правило Байеса описывает алгоритм изменения априорной гипотезы в свете новых данных. Хотя принятие решения в соответствии с этим правилом может выглядеть как противоречащее нашему интуитивному пониманию, тем не менее правило получает поддержку со стороны эмпирических данных.
При изучении диагностического процесса используются некоторые представления из общей психологии (например, диагност рассматривается как «процессор», имеющий ограниченные возможности по переработке информации), из теории принятия решений и социальной психологии (например, интеграция социальных представлений о людях).
Как уже отмечалось выше, существует описание последовательности действий психодиагноста. В Германии и Нидерландах особенно интенсивно обсуждается вопрос о такой модели диагностического процесса, где была бы отражена последовательность действий по достижению оптимального результата. Хорошо известна модель проверки гипотез, которая явилась альтернативой традиционной практике в области психодиагностики. Важные элементы работы психодиагноста — это тестовый материал и методы обработки данных. Процесс сбора данных должен быть объективным, т.е. должен следовать определенному плану. Согласно точке зрения многих психологов, этот процесс напоминает проверку гипотез в эксперименте. Эта модель была заимствована из модели эмпирического цикла (De Groot, 1961, первое издание, 1994, второе издание). Она используется как при проведении эксперимента, так и при проведении корреляционных исследований. Сам цикл был описан для проведения исследования на какой-либо популяции. С помощью метода дисперсионного анализа при лро-ведении экспериментальных исследований и корреляционных методик при рассмотрении связей между конструктами оцениваются различные характеристики по-
пуляции. При индивидуальной работе с клиентом диагност для сравнения использует средние данные по выборке (см. также седьмую главу).
В качестве альтернативы модели эмпирического цикла существует вариант, предложенный Ван Страйном (1984,1986). Ван Страйн замечает, что эмпирический цикл, в который студент вовлечен в первые годы обучения, включает в себя лишь номологический подход к людям и ознакомление с методами статистики, необходимыми для проверки гипотез о причинах поведения и о взаимоотношениях. Никакой психологии, направленной на оказание помощи людям, нет. Ван Страйн описывает так называемый диагностический или регулятивный цикл. Согласно его модели, описание этого цикла объединяет характеристики деятельности диагноста и описание научно обоснованной процедуры.
В последнее время предпринимаются попытки интеграции этих моделей. Новый вариант носит название модели проверки гипотез для диагноста. В ней содержится описание этапов работы психодиагноста (De Bruyn, 1992). Здесь же приводится примерная схема представления результатов психодиагностики. Модель включает в себя шесть последовательно выполняемых этапов.
-
Ориентация в проблеме, изложенной клиентом.
-
Описание проблемы на языке конкретных фактов. Восприятие проблемы клиентом. Контекст, в котором он ставит проблему.
-
Формулирование и отбор независимых гипотез об особенностях восприятия проблемы или проблемного поведения. Название модели связано именно с этим шагом. Проверка гипотезы рассматривается как центральный элемент научно обоснованной психодиагностики.
-
Выбор (или разработка) средств и методов операциона-лизации конструктов с целью проверки каузальных факторов, отбор тестов, методов, процедур, сопоставление результатов с гипотезой и в конечном итоге формулировка диагноза.
-
Формулировка рекомендаций для процесса терапии, направленного на устранение данной проблемы.
-
Оценивание результатов.
Эти этапы сравниваются с моделью эмпирического цикла (она будет обсуждаться в седьмой главе). Во избежание
46
47
недоразумении заметим, что модели эмпирического и диагностического циклов не являются взаимоисключающими. Ван Страйн подчеркивает, что его модель представляет собой вариант, описывающий практическую деятельность диагноста. Исходные научные положения обеих концепций не противоречат друг другу.
Подведем некоторые итоги. Четвертый компонент психодиагностики может быть рассмотрен по аналогии с прагматикой в языке. Подразумевается присутствие трех других компонентов (синтаксиса, фонологии, семантики) внутри этого компонента. В коммуникации существуют общепринятые правила. Сирль (1969) назвал их «речевыми действиями». Подобная ситуация существует и в диагностическом процессе. Предполагается наличие в структуре диагностического процесса трех компонентов: теории тестов, психологических теорий и конструктов и собственно тестов. К этому добавляются правила проведения научно обоснованной диагностики.
1.3.5. Психодиагностика и психология: содержание
Психодиагностику описывают как систему из четырех компонентов. Она не имеет собственного, присущего только ей объекта, который бы не изучался в рамках других психологических дисциплин. Содержание процесса психодиагностики определяется основными понятиями психологических теорий. Отправной точкой являются представления об индивидуальных различиях. Теории и представления о развитии личности и о характеристиках социального окружения также могут иметь определенное значение в диагностическом процессе. Таким образом, содержание психодиагностики рассматривается как тесно связанное с содержанием психологической науки, рассматриваемым как совокупность теорий о поведении, мышлении, эмоциях человека. Это всегда диагностика некоторых конкретных проявлений, содержание которых как раз и определяют психологические теории. В рамках этих теорий определяются основные конструкты и связи между этими конструктами. Уровень теорий преимущественно таксономический или концептуальный (Snow, 1973). Такие психологические конструкты, как интеллект, способности и склонности, достижения в различных областях, интрсвер-сия и нейротизм, будучи включены в определенную номо-
логическую сеть, становятся отправной точкой при создании тестов, опросников и других методических средств.
1.3.6. Психодиагностика и психология: методы
Считается, что психодиагностика не имеет собственных методов. Используемые здесь методы — это, по существу, некоторые из общепсихологических методов. В данной концепции основное место отводится описанию эмпирического цикла, в рамках которого осуществляется проверка гипотез. Это и есть модель проведения психологических исследований. Эмпирико-аналитическая ориентация является основной в психологии. Она определяет критерии, которым должно соответствовать исследование, чтобы считаться «научно обоснованным». Психология многим обязана этой ориентации, но отдельные элементы эмпирического цикла не всегда могут быть использованы в психодиагностической работе. Психодиагност предпочитает иметь дело с независимыми переменными и значимыми зависимостями, установленными в исследованиях. Однако иногда использование этих факторов и зависимостей ограничено. Эффективность этих факторов и их значение зависит от контекста, т.е. они могут быть обнаружены только в специфических, иногда «идеальных» условиях и обстоятельствах. Существуют причины, из-за которых результаты некоторых исследований не могут быть воспроизведены. Результаты психологических исследований необычайно чувствительны даже к незначительным изменениям внешних условий.
Для изменения существующего положения вещей предпринимались попытки найти стабильные результаты при анализе ограниченных, поддающихся контролю областей поведения. Мы, следовательно, избегаем таких «глобальных» или нетривиальных вопросов, с которыми связаны эмоциональные переживания. Например, являются ли люди активными или пассивными, хорошими или плохими, рациональны ли они или нерациональны, является ли их поведение кооперативным или конкурентным? Это ограничение обусловливает некоторую фрагментарность знаний. Эксперименты направлены на анализ отдельных феноменов, и для них были разработаны соответствующие модели.
В русле теоретико-аналитической традиции выполнено большое количество интересных исследований, но объеди-
Достарыңызбен бөлісу: |