Лаак Я. тер Л01 Психодиагностика: проблемы содержания и методов



бет3/21
Дата15.07.2016
өлшемі2.06 Mb.
#201078
түріКнига
1   2   3   4   5   6   7   8   9   ...   21

25

В Нидерландах существует несколько справочников по психодиагностике. Наиболее часто встречаемые в них оп­ределения таковы: «Клиническая психодиагностика (пони­маемая как психодиагностика, ориентированная на конкретного человека, его вопросы и проблемы) есть про­цесс принятия решений, в котором теоретическая ориента­ция и эмпирические исследования существуют как единое целое, что и определяет область приложения сил клиниче­ской диагностики». Очевидно, что объектом исследования является конкретный человек, но в процессе исследования должно быть учтено все многообразие знаний психологиче­ской науки. ДеЗеу пишет: «Назначением психодиагности­ки является оценка индивидуальных различий, эта • информация в дальнейшем может быть использована так, чтобы способствовать позитивным изменениям в жизни ин­дивида». В последних изданиях при определении психоди­агностики акцент делается на процессе принятия решений.

Однако сфера психодиагностики не является исключи­тельной «собственностью» психологов, пишущих о ней кни­ги. У широкого круга людей, профессионально никак не связанных с психологией, также имеются определенные представления о диагностах и диагностике. Интересно мне­ние студентов—психологов о том, кто такой «психодиаг­ност». С их точки зрения, это человек, знающий жизнь. Он также «судья, интервьюер, детектив, следователь, человек, который может оказать помощь, человек, принимающий решения, ученый, тот, кто собирает и перерабатывает ин­формацию, просто любопытный человек, наблюдатель, предсказатель, человек с развитым чувством интуиции, ис­полнитель черновой работы, тот, кто сам ставит и решает проблемы».

Некоторые определения затрагивают такие вопросы, как организация самого процесса психодиагностики, напри­мер, отбор и организация работы специалистов-психодиаг­ностов. В процессе отбора решается вопрос о компетентности или некомпетентности претендентов. Сле­дующий вопрос — как организовать работу новых сотруд­ников, чтобы она была максимально эффективной. Кроме этого, в процессе психодиагностики могут возникнуть та­кие вопросы, как помощь в решении жизненных проблем клиента или классификация и оценивание.

1.3. Психодиагностика: четыре компонента и три уровня

Существует множество различных определений психо­диагностики. Это многообразие обусловливается тем, что диагностические процедуры используются во многих обла­стях и с разными целями. В такой ситуации можно предло­жить еще одно определение психодиагностики. Это вполне обычное положение дел для психологии, где существует множество понятий, теорий, концепций и методов. Предла­гаемое нами определение не есть нечто радикально новое: предпринята попытка связать в единое целое отдельные элементы психодиагностики, объединить теоретические представления и диагностические процедуры.

Психодиагностика описывается как единство четырех компонентов:



  1. теории тестов или психометрии;

  2. теоретических представлений об индивидуальных разли­чиях, психическом развитии и различиях в социальном окружении. Эти теории дают нам важные понятийные конструкты;

3)тесты, методики и процедуры, как-то: задания, вопросы, задачи, тестовые пробы, системы подсчета результатов, типы интерпретаций. Методики связаны с исходными те­оретическими представлениями; 4)процесс диагностики. О четырех компонентах.

Выделенные четыре компонента психодиагностики сопо­ставимы с четырьмя компонентами языка. Язык выполняет множество функций, и, соответственно, может быть опре­делен разными способами. Не существует одной теории, способной охватить все стороны человеческого языка. Со­здание такой теории, по-видимому, невозможно, да и вряд ли в этом есть необходимость (Bloom, 1993, стр. 40). В филологии существует четыре области знания: синтаксис (грамматика), фонология, семантика и прагматика. Все пе­речисленные области имеют одинаково важное значение. Все.эти компоненты в равной степени необходимы для про­цессов передачи речевого сообщения, его восприятия и по­нимания. Но, безусловно, каждый компонент может изучаться отдельно.




26

27

О трех уровнях.

Как уже упоминалось выше, профессиональные психо­логи являются не единственными пользователями психоло­гической и психодиагностической информации. Обычные люди, чьи профессиональные занятия далеки от психоло­гии, также имеют свои собственные представления об ин­дивидуальных различиях, о причинах, вызывающих изменения поведения и о процессах развития. Этот уровень представлений мы называем уровнем здравого смысла или уровнем обыденных (житейских) представлений, в данной книге этот уровень будет рассмотрен применительно к каж­дому предметному содержанию.

Второй уровень определяется тем, что существует мно­жество психологических теорий, конструктов и концепций. Эти теории признаются исследователями в большей или меньшей степени. Вместе с выдвигаемыми гипотезами и психологическими методами они образуют основу научной психологии.

На третьем уровне представлены попытки математиче­ского моделирования поведения. Некоторые типы поведе­ния не могут быть (может быть, пока) рассмотрены на этом уровне. И классическая теория, и современная теория тес­тов содержат примеры математического моделирования не­которых феноменов и типов поведения.

В психологии существуют теории различного уровня — от рабочих гипотез до математического моделирования от­дельных феноменов поведения. Сноу (1973) проводит раз­личие между уровнем теории и последующим тестированием. Два упомянутых выше уровня могут быть рассмотрены как два полюса одной шкалы.

При всех существующих различиях между названными уровнями, они не являются совершенно независимыми, так как тесно взаимосвязаны. У них одна цель — понять пове­дение, мышление, эмоции отдельного человека или группы людей. Но взаимоотношения между уровнями не свободны от некоторых противоречий. Так, легко обвинить в ненауч­ности житейские представления, к тому же, сторонники психометрических процедур могут отвергнуть тесты, по­скольку те основаны на слишком неопределенных психоло­гических теориях, а не на строго обоснованных (классических) теориях тестов. На наш взгляд, то обстоя-



28

тельство, что эти три уровня не находятся в полной гармо­нии, не является недостатком. Задача данной книги — по­казать, что хотя эти три уровня имеют свою собственную динамику и могут быть противопоставлены друг другу, между ними существуют и точки соприкосновения. Это по­ложение будет раскрыто в последующих главах.



Приведенная ниже схема иллюстрирует соотношение че­тырех вышеназванных компонентов и трех уровней.

Таблица 1




Теория тестов

Психоло­гические теории и понятия

Тесты и методи­ческие средства

Диагнос­тический процесс

Уровень обыденного сознания

например,

понятие

«надежный»

/человек/

например,

приписывание

личности

тех или

иных характе­ристик

например,

отбор

информации

на уровне

здравого

смысла

например,

оценивание

на уровне

здравого

смысла

Уровень психоло­гический теорий и концепций

например, повторя­емость

например, теория черт

например,

некоторые

тесты

например, эмпири­ческий и диагнос­тический циклы

Уровень математи­ческого моделиро­вания

rХХ-

отношение

истинной

дисперсии

к общей

дисперсии

модели личности, сконструи­рованные на

основе

факторного

анализа

шкалы, имеющие теорети­ческую основу

например,

нормативные

модели

решения

1.3.1. Теория тестов Первый компонент, теория тестов, содержит описание статистических моделей обработки диагностических дан­ных. Здесь содержатся модели анализа ответов в тестовых заданиях и модели подсчета суммарных результатов теста. Мелленберг (1980, 1990) назвал это «психометрией». Клас­сическая теория тестов, современная теория тестов (или модель анализа ответов на задания тестов — IRT) и модель

29


выборки заданий составляют три наиболее важных типа моделей теории тестов. Предметом рассмотрения психоди­агностики являются первые две модели.

Классическая теория тестов. На основе этой теории раз­работано большинство интеллектуальных и личностных те­стов. Центральным понятием этой теории является понятие «надежности». Под надежностью понимается согласован­ность результатов при повторном оценивании. В справоч­ных пособиях это понятие обычно представляется очень кратко, а затем дается подробное описание аппарата мате­матической статистики. В этой, вводной, главе мы предста­вим сжатое описание основного значения отмеченного понятия. В классической теории тестов под надежностью понимается повторяемость результатов нескольких проце­дур измерения (преимущественно измерений при помощи тестов). Понятие надежности предполагает вычисление ошибки измерения. Результаты, полученные в процессе тестирования, могут быть представлены как сумма истин­ного результата и ошибки измерения:



Xi = Ti + Еj

где Xi — оценка полученных результатов, Ti — истин­ный результат, а Еj — ошибка измерения.

Оценка полученных результатов — это, как правило, количество правильных ответов на задания теста. Истин­ный результат можно рассматривать как истинную оценку в платоновском смысле (Gulliksen, 1950). Широко распро­страненным является понятие ожидаемых результатов, т.е. представлений о баллах, которые могут быть получены в результате большого числа повторений процедур измере­ния (Lord & Novich, 1968). Но проведение одной и той же процедуры оценивания с одним человеком не представля­ется возможным. Поэтому необходим поиск других вариан­тов решения проблемы (Witlman, 1988).

В рамках этой концепции делаются некоторые допуще­ния относительно истинных результатов и ошибок измере­ния. Последние принимаются в качестве независимого фактора, что, конечно, является вполне обоснованным предположением, так как случайные колебания результа­тов не дают ковариаций: rЕЕ=0.

Предполагается, что корреляции между истинными бал­лами и ошибками измерения не существует: rEE=0.

Суммарная ошибка равна 0, т.к. в качестве истинной оценки берется среднее арифметическое значение:



Эти допущения приводят нас в итоге к известному опре­делению надежности как отношения истинного результата к общей дисперсии или выражению: 1 минус отношение, в числителе которого ошибка измерения, а в знаменателе — общая дисперсия:



, ИЛИ

Из этой формулы определения надежности получаем, что дисперсия ошибки S2(E) равна общей дисперсии в числе случаев (1 – rXX'); таким образом, стандартная ошибка из­мерения определяется по формуле:



После теоретического обоснования надежности и его производных необходимо определить индекс надежности того или иного теста. Существуют практические процедуры оценивания надежности тестов, такие как использование взаимозаменяемых форм (параллельные тесты), расщепле­ние заданий на две части, повторное тестирование и изме­рение внутренней согласованности. Каждый справочник содержит индексы постоянства тестовых результатов:



rXX=r(x1, x2)

где rXX — коэффициент стабильности, а x1 и x2 — результаты двух измерений.

Понятие надежности взаимозаменяемых форм введено и разработано Гулликсеном (1950). Данная процедура до­статочно трудоемка, поскольку связана с необходимостью создания параллельной серии заданий

rXX=r(x1, x2)

где rXX— коэффициент эквивалентности, а x1 и x2 — два параллельных теста.




30

31

Следующая процедура — расщепление основного теста на две части А и В — более проста в использовании. Пока­затели, полученные по обеим частям теста, коррелируются. С помощью формулы Спирмена-Брауна оценивается на­дежность теста в целом:

,

где А и В — две параллельные части теста.

Следующий метод — определение внутренней согласо­ванности выполнения заданий теста. Этот метод основан на определении ковариаций отдельных заданий. Sg — диспер­сия произвольно выбранного задания, и Sgh — ковариация двух произвольно выбранных заданий. Наиболее часто ис­пользуемый коэффициент для определения внутренней со­гласованности — это «коэффициент альфа» Кронбаха. Используются также формула КР20 и λ—2 (лямбда-2).

В классической концепции надежности определяются ошибки измерения, возникающие как в процессе тестиро­вания, так и в процессе наблюдений. Источники этих оши­бок различны: это могут быть и личностные особенности, и особенности условий тестирования, и сами тестовые зада­ния. Существуют конкретные методы вычисления ошибок. Мы знаем, что наши наблюдения могут оказаться ошибоч­ными, наши методические инструменты несовершенны так же, как несовершенны и сами люди. (Как не вспомнить Шекспира: «Ненадежен ты, чье имя человек»). То, что в классической теории тестов ошибки измерения эксплици­руются и объясняются, является важным положительным моментом.

Классическая теория тестов имеет ряд существенных особенностей, которые можно рассматривать и как ее недо­статки. Некоторые из этих характеристик отмечаются в справочниках, но их значение (с житейской точки зрения) подчеркивается нечасто, как не отмечается и то, что с тео­ретической или методической точки зрения их следует счи­тать недостатками.

Первое. Классическая теория тестов и понятие надежно­сти ориентированы на подсчет суммарных тестовых пока­зателей, представляющих собой результат сложения оценок, полученных в отдельных заданиях. Так, при работе

с тестом, содержащим 40 заданий (при оценке 0 или 1балл), существует несколько возможных вариантов сочетаний конкретных заданий, при которых можно получить, напри­мер, 20 баллов. Таким образом, de facto любое задание можно заменить другим.

Второе. Коэффициент надежности предполагает оценку величины разброса измеряемых показателей. Отсюда сле­дует, что коэффициент надежности будет ниже, если (при равенстве других показателей) выборка является более од­нородной. Не существует единого коэффициента внутрен­ней согласованности заданий теста, этот коэффициент всегда «контекстуален». Крокер и Альджина (1986), напри­мер, предлагают специальную формулу «коррекции для гомогенной выборки», предназначенную для самых высо­ких и самых низких результатов, полученных проходящи­ми тестирование. Для диагноста важно знать характеристики вариаций в выборочной совокупности, иначе он не сможет использовать коэффициенты внутрен­ней согласованности, указанные в руководстве к данному тесту.

Третье. Феномен сведения к показателю среднего ариф­метического является логическим следствием классической концепции надежности. Если оценка в тесте колеблется (т.е. она недостаточно надежна), то вполне возможно, что при повторении процедуры субъекты, имеющие низкие по­казатели, получат более высокие баллы, и наоборот, субъ­екты с высокими показателями — низкие. Этот артефакт процедуры измерения нельзя ошибочно принять за истин­ное изменение или проявление процессов развития. Но в то же время разграничить их нелегко, т.к. никогда нельзя исключить возможность изменения в ходе развития. Для полной уверенности необходимо'сравнение с контрольной группой.

Четвертая характеристика тестов, разработанных в со­ответствии с принципами классической теории,— это на­личие нормативных данных. Знание тестовых норм позволяет исследователю адекватно интерпретировать ре­зультаты тестируемых. Вне норм тестовые оценки лишены смысла. Выработка тестовых норм — это достаточно доро­гостоящее предприятие, поскольку психолог должен пол­учить результаты тестирования на репрезентативной выборке.




32

2 Я. тер Лаак



33

Если говорить о недостатках классической концепции надежности, то здесь уместно привести высказывание Сий-тсма (1992, р. 123—125). Он отмечает, что первое и главное предположение классической теории тестов состоит в том, что тестовые результаты подчиняются интервальному принципу. Однако никаких исследований, подтверждаю­щих это предположение, нет. По сути, это «измерение по произвольно установленному правилу». Данная особен­ность ставит классическую теорию тестов в менее выгодное положение по сравнению со шкалами измерения установок и, конечно же, по сравнению с современной теорией тестов. Многие методы анализа данных (дисперсионный анализ. регрессионный анализ, корреляционный и факторный ана­лиз) основаны на допущении существования интервальной шкалы. Однако оно не имеет твердого обоснования. Рас­сматривать шкалу истинных результатов как шкалу значе­ний психологических характеристик (например, арифметических способностей, интеллекта, нейротизма) можно только предположительно.

Второе замечание касается того, что результаты выпол­нения теста — это не абсолютные показатели той или иной психологической характеристики тестируемого, их необхо­димо рассматривать лишь как результаты выполнения того или иного теста. Два теста могут претендовать на изучение одних и тех же психологических характеристик (например, интеллекта, вербальных способностей, экстраверсии), но это не означает, что эти два теста равноценны и обладают одинаковыми возможностями. Сравнение показателей двух людей, прошедших тестирование разными тестами, некорректно. То же относится и к заполнению двух разных тестов одним испытуемым. Третье замечание относится к предположению, что стандартная ошибка измерения оди­накова применительно к любому уровню измеряемых спо­собностей индивида. Однако не существует эмпирической проверки этого предположения. Так, например, нет гаран­тии того, что тестируемый с хорошими математическими способностями при работе с относительно простым арифме­тическим тестом получит высокие баллы. В этом случае высокую оценку скорее получит человек с низкими или средними способностями.

В рамках современной теории тестов или теории анализа ответов в заданиях теста содержится описание большого

количества моделей возможных ответов респондентов. Эти модели различаются положенными в их основу допущени­ями, а также требованиями по отношению к получаемым данным. Модель Раша часто рассматривается в качестве синонима теорий анализа ответов в заданиях теста (1RT). На самом деле это только одна из моделей. Представленная в ней формула для описания характеристической кривой задания g выглядит следующим образом:



где g — отдельное задание теста; ехр — функция экспо­ненты (нелинейная зависимость); δ («дельта») — уровень трудности теста.

Другие задания теста, например h, также получают соб­ственные характеристические кривые. Выполнение условия δhg (g означает, что h — более трудное задание. Следовательно, для любого значения показателя Θ («тета» — латентные свойства способностей тестируемых) вероят­ность успешного выполнения задания h меньше. Эта модель называется строгой, поскольку очевидно, что при низкой степени выраженности черты вероятность выполнения за­дания близка к нулю. В этой модели нет места угадыванию и предположениям. Для заданий с вариантами выбора нет необходимости делать предположения о вероятности успе­ха. Кроме того, эта модель строга в том смысле, что все задания теста должны иметь одинаковую дискриминатив-ную способность (высокая дискриминативность отражается в крутизне кривой; здесь возможно построение шкалы Гут-тмана, согласно которой в каждой точке характеристиче­ской кривой вероятность выполнения задания меняется от О до 1). Из-за этого условия не все задания могут быть включены в тесты, созданные на основе модели Раша.

Существует несколько вариантов этой модели (напри­мер, Birnbaura, 1968, См. Lord & Novik). Она допускает существование заданий с различной дискриминативной

способностью.

Голландский исследователь Моккен (1971) разработал две модели анализа ответов в заданиях теста, требования которых не так строги, как в модели Раша, и поэтому, возможно, более реалистичны. В качестве основного усло-




34

35

вия Моккен выдвигает положение о том, что характеристи­ческая кривая задания должна следовать монотонно, без обрывов. Все задания теста при этом направлены на изуче­ние одной и той же психологической характеристики, из­мерять которую должна в. Допускается любая форма этой зависимости, пока она не прервется. Следовательно, форма характеристической кривой не определяется какой-либо специфической функцией. Такая «свобода» позволяет ис­пользовать больше заданий теста, и уровень оценивания при этом оказывается не выше, чем обычный.

Методология моделей ответов на задания теста (IRT) отличается от методологии большинства эксперименталь­ных и корреляционных исследований. Математическая мо­дель предназначена для изучения поведенческих, когнитивных, эмоциональных характеристик, а также фе­номенов развития. Эти рассматриваемые феномены часто ограничиваются ответами на задания, что позволило Мел-ленбергу (1990) назвать теорию IRT «мини-теорией о ми­ни-поведении». Результаты исследования могут быть в определенной степени представлены как кривые согласо­ванности, особенно в тех случаях, когда теоретические представления об изучаемых характеристиках отсутству­ют. До сих пор в нашем распоряжении имеются лишь еди­ницы тестов интеллекта, способностей и личностных тестов, созданных на основе многочисленных моделей тео­рии IRT. Варианты модели Раша чаще используются при разработке тестов достижений (Verhelst, 1993), а модели Моккена больше подходят для феноменов развития (см. также гл. 6).

Ответ тестируемого на задания теста является основной единицей моделей IRT. Тип ответа определяется степенью выраженности у человека изучаемой характеристики. Та­кой характеристикой могут быть, например, арифметиче­ские или пространственные способности. В большинстве случаев это тот или иной аспект интеллекта, характеристи­ки достижений или личностные особенности. Предполага­ется, что между положением данного конкретного человека в некотором диапазоне изучаемой характеристики и веро­ятностью успешного выполнения того или иного задания существует нелинейная зависимость. Нелинейность этой зависимости в определенном смысле интуитивно понятна. Известные фразы «Всякое начало трудно» (медленный не-

линейный старт) и «Стать святым не так просто», означают что дальнейшее совершенствование после достижения оп­ределенного уровня идет трудно. Кривая медленно прибли­жается, но почти никогда не достигает 100%-го уровня успеха.

Некоторые модели скорее противоречат нашему интуи­тивному пониманию. Возьмем такой пример. Человек с ин­дексом выраженности произвольной характеристики равным 1,5 имеет 60-процентную вероятность успеха при выполнении задания. Это противоречит нашему интуитив­ному пониманию такой ситуации, ведь можно либо успеш­но справиться с заданием, либо не справиться с ним вообще. Возьмем такой пример: 100 раз человек пытается взять высоту 1м 50 см. Успех сопутствует ему 60 раз, т.е. он имеет 60-процентную вероятность успеха.

Для оценки степени выраженности характеристики не­обходимо, по крайней мере, два задания. Модель Раша предполагает определение выраженности характеристик вне зависимости от трудности задания. Это также противо­речит нашему интуитивному пониманию: предположим, что человек имеет 80-процентную вероятность прыгнуть выше 1,30 м. Если это так, то в соответствии с характери­стической кривой заданий он имеет 60-процентную веро­ятность прыгнуть выше 1,50 м и 40-процентную вероятность прыгнуть выше 1,70 м. Следовательно, вне за­висимости от значения независимой переменной (высоты) можно оценить способность человека прыгать в высоту.

Существует около 50 моделей IRT (Goldstein & Wood, 1989).Имеется множество нелинейных функций, описыва­ющих (объясняющих) вероятность успеха в выполнении задания или группы заданий. Требования и ограничения этих моделей различны, и эти различия могут быть обнару­жены при сопоставлении модели Раша и шкалы Моккена. К требованиям этих моделей можно отнести:


  1. необходимость определения исследуемой характеристи­ки и оценку позиции человека в диапазоне этой черты;

  2. оценку последовательности заданий;

  3. проверку конкретных моделей. В психометрии разрабо­тано множество процедур для проверки модели.

В некоторых справочных пособиях теория IRT рассмат­ривается как форма анализа заданий теста (см., например,



Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   ...   21




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет