Достоверность теста
Особой разновидностью валидности является ДОСТОВЕРНОСТЬ, которая не всегда выделяется в учебниках по психодиагностике, хотя требует специальных усилий и процедур по обеспечению. Речь идет о сознательных или бессознательных искажениях, которые вносит в тестовые результаты сам испытуемый, руководствуясь в ходе теста особой мотивацией, отличающейся от той, которая присуща ему в реальном поведении. Способность теста защищать информацию от МОТИВАЦИОННЫХ ИСКАЖЕНИЙ и есть достоверность теста. Особенно. остро проблема достоверности стоит в случае тест-опросников, которые допускают больше свободы в выборе испытуемым любого варианта ответа.
Типичный прием обеспечения достоверности — наличие в тест-опросниках ШКАЛ ЛЖИ. Эти шкалы основываются главным образом на феномене СОЦИАЛЬНОЙ ЖЕЛАТЕЛЬНОСТИ — стремлении испытуемых давать в ходе тестирования социально одобряемую информацию. Если испытуемый набрал по шкале лжи балл выше критического, то его протокол объявляется недостоверным и ему предлагается либо выполнить данный тест еще раз более откровенно, либо выполнить другой тест. Многие более специфичные «ловушки», направленные на измерение достоверности, часто входят как компонент в структуру конкретного теста, а иногда даже не подлежат разглашению как элемент «ноу-хау» (инфор-
154
Психодиагностика как научная технология
мационного изобретения) и профессиональной тайны, разделяемой разработчиками только с лицензированными пользователями методики, подписавшими особое лицензионное соглашение при приобретении теста.
Достоверность тестирования тесно связана со степенью доверительности общения, которую смог психолог установить с данным испытуемым. Здесь полезно различать две диагностические ситуации: консультативную (СИТУАЦИЯ КЛИЕНТА) и аттестационную (СИТУАЦИЯ ЭКСПЕРТИЗЫ). В первом случае испытуемый участвует в тестировании на добровольной основе и сам заинтересован получить рекомендации по результатам тестирования (как, например, в профориентационной консультации). Во втором случае тестирование проводится по инициативе педагога или администрации, психолога, родителей, т. е. других лиц, и эти другие больше заинтересованы в результатах, чем сам испытуемый.
Понятно, что в аттестационной ситуации вопрос о достоверности особенно актуален. И опросники, не снабженные шкалами лжи, использовать в таких ситуациях бесполезно. Наоборот, в ситуации клиента могут быть использованы такие методики, на которые испытуемый заведомо будет отвечать некорректно в ситуации экспертизы.
Вопросы достоверности и стандартизации тесно связаны между собой. Очень часто даже объективные тесты достижений, если они проходили стандартизацию на добровольцах (в ситуации консультации), должны быть рестандартизированы для того, чтобы их использовали в аттестационной ситуации.
***
■
В заключение данной главы подчеркнем, что измерение психометрических характеристик теста, конечно, является прежде всего обязанностью разра-
155
Основы психодиагностики
ботчиков тестов. Но квалифицированный школьный психолог-методист с полным курсом университетского образования должен по своей подготовке уметь самостоятельно провести простейший психометрический эксперимент и пересчитать тестовые нормы, а также психометрические индексы надежности и валиднос-ти теста на своей собственной выборке (в своем регионе, обладающем определенной национально-культурной и социальной спецификой). Без этой проверки никто не может гарантировать, что тест действительно работает в данных условиях.
На сегодня подобная психометрическая работа с тестами облегчается, так как от массы рутинных вычислений специалиста освобождает компьютер. Научная фирма «Гуманитарные технологии» (МГУ) распространяет с 1993 года специализированный пакет программ ТЕСТАН (разработчик — А. Г. Шмелев) для психометрического АНализа ТЕСТов. Задача пользователя такой программы — не тратить время на вычисления, а только содержательно разбираться в том, что означает тот или иной коэффициент.
О перспективах метода тестов в связи с компьютеризацией школы предстоит особый разговор в параграфе 2.6.
■
Ключевые термины: оптимальная трудность, надежность теста, ошибка измерения, ретестовая надежность, валидность теста, критерий валидное ти, прогностическая валидность, стандартизация теста, выборка стандартизации, линейная стандартизация, конверсионная таблица, репрезентативность тестовых норм, рестандартизация, критериальные нормы, достоверность теста, мо-тивационные искажения, шкалы лжи, социальная желательность, ситуация клиента, ситуация экспертизы,
156
-
Психодиагностика как научная технология
2.4. МЕТОДИКИ ШКАЛИРОВАНИЯ И САМООЦЕНКИ
Очень широко используются в школьной практике методики шкалирования. Наиболее простые из них привлекают школьных психологов именно простотой проведения, прозрачностью интерпретации, возможностью как бы заглянуть во внутренний мир ребенка.
В отличие от экспертных оценок, которые дают преподаватели ребенку, мы говорим в данном случае о том, что сам ребенок оценивает либо какие-то объекты внешнего мира, либо людей (преподавателей, родителей, друзей), либо события своей жизни, либо себя самого. Ему дается, как правило, бланк с определенными шкалами, полюса которых обозначены какими-то краткими или развернутыми названиями. Шкалы могут быть даны в словесной, числовой или графической форме. От формы суть не меняется: методика все равно остается методикой шкалирования. Но от формы шкал иногда существенно зависит доступность методики для ребенка в его возрасте, а также достоверность.
Однако внешняя простота наиболее простых из методик шкалирования обманчива. И дело не в том, что многие из этих методик требуют для своего эффективного применения сложной статистической обработки с использованием современных компьютерных методов. А в том, что многим пользователям низкой квалификации самим недостаточно хорошо понятно, как именно понимает эту методику ребенок, что именно оценивает и оценивает ли он вообще что-либо, то есть обладают или нет полученные данные ожидаемой валидностью.
157
Основы психодиагностики
Вся трудность в том, что методики шкалирования требуют от ребенка высокого уровня развития речи, словарного запаса, ассоциативного и нередко рефлексивного мышления (последнее особенно необходимо для методик самооценки, требуюших умения взглянуть на себя со стороны). Если уровень развития этих психических свойств не соответствует требованиям методики, то с ее помощью нельзя получить валидные и достоверные результаты.
Рассмотрим для начала такую, пожалуй, самую популярную методику, как методика самооценки Дембо—Рубинштейн. Эта методика широко используется как самостоятельно, так и в контексте клинической беседы в детской психологии и психиатрической клинике. Испытуемому предлагаются одна за другой несколько графических шкал, ориентированных вертикально (это принципиально, так как «верх» и «низ» у каждого человека семантически маркированы — ассоциативно наполнены определенным смыслом). Испытуемому сообщают инструкцию (здесь дается ее укороченный вариант): «Все люди являются либо счастливыми, либо несчастными, либо немного счастливыми и немного несчастными одновременно. Представь себе на верхнем краю этой линии самого счастливого человека, а на нижнем краю — самого несчастного. Посередине — среднего человека по количеству счастья. Куда бы ты поместил себя на этой линии?» Далее ребенку предлагается оценить себя по уровню «здоровья», по «уму», по «доброте» и т. п.
А теперь посмотрим, какие понятия должны быть уже сформированы у ребенка для успешного выполнения этой методики? Это так или иначе понятие «уровня» (степени, количества, выраженности). Как бы вы ни назвали это понятие, какое бы простое обозначение вы ни использовали, искусно упростив инструкцию и включив ее в какой-то игровой кон-
158
Психодиагностика как научная технология
текст, само понятие должно уже сложиться в голове у ребенка. Следующие понятия — «максимум» и «минимум» (самый, крайний и т. п.). Далее — понятие «все люди» (логический квантор всеобщности), понятие «середина» (средний, промежуточный уровень), понятия «выше/ниже» (больше/ меньше), понятие «себя» (апелляция к рефлексивному «Я») и, наконец, понятия «счастье», «ум», и аналогичные, выступающие критерием оценки, задающие смысл шкале. Как видим, далеко не всем дошкольникам и даже младшим школьникам должна быть легко доступна такая методика. Если взрослые не развивали у ребенка ассоциативно-рефлексивное мышление, то, впервые столкнувшись с подобной методикой, ребенок оказывается перед задачей впервые сформировать у себя довольно сложное умение, включающее комплексную координацию целой системы понятий. Таким образом, несмотря на то, что ГРАФИЧЕСКОЕ ШКАЛИРОВАНИЕ, которое требуется произвести в методике Дембо—Рубинштейн, само по себе доступнее, чем вербальное или числовое шкалирование, само понимание инструкции — это проблема.
В многочисленных экспериментах, остроумно организованных знаменитым психологом Жаном Пиаже, было показано, что в эксперименте над ребенком настолько довлеет авторитет взрослого, что ребенок часто не думает над существом поставленной перед ним задачи, а стремится как бы угадать, чего именно от него ждет и хочет получить взрослый. Так и в методиках шкалирования от ребенка — требуется не только определенная интеллектуальная зрелость (по Пиаже она достигается только к 10—12 годам), но и определенная личностная независимость (ориентировка на предмет деятельности, а не на участников событий).
Сама по себе самооценка ребенка — явление
■
159
Основы психодиагностики
неустойчивое, ситуационное. Она еще не сложилась даже в подростковом возрасте. Нередко бывает так, что в социальном поле (зрительном окружении) хорошо знакомых людей ребенок чувствует себя уверенным, умным, сильным и т. п., а среди незнакомых теряется. Отсюда ясно, что результаты методики шкалирования в работе с детьми очень сильно зависят от того, какое впечатление произвел взрослый-экспериментатор на ребенка, какой контакт он мог с ним установить. '
Поэтому, несмотря на кажущуюся внешнюю простоту, использование методик шкалирования — не дело педагога, а дело специально подготовленного школьного психолога, который специально учится проведению этой методики под руководством опытных специалистов. Именно психолог может точно определить, в каком случае методика работает нормально и ребенок действительно оценивает то, что нужно, а в каком он только имитирует шкалирование, подлаживаясь под требования взрослого.
Теперь, сделав необходимые оговорки, повышающие уровень критического и серьезного отношения к методикам шкалирования, расскажем тем не менее, что они могут дать при квалифицированном использовании.
Семантический дифференциал
Одна из наиболее широко распространенных методик такого типа — так называемый «СЕМАНТИЧЕСКИЙ ДР1ФФЕРЕНЦИАЛ» (Ч. Осгуд, 1952). Это по сути не одна, а целая семья методик, целая технология. В работе с детьми она может использоваться как для изучения уровня сформированности и цельности представлений ребенка о мире (когнитивная диагностика), так и в качестве проективной
160
Психодиагностика как научная технология
методики — для исследования личностных установок и эмоциональных отношений ребенка к определенному кругу объектов.
Обычный «семантический дифференциал» (СД) — это несколько семибалльных шкал, нанесенных горизонтально на один бланк (ответный лист). Семь градаций обозначены, как правило, словами, так же, как и полюса шкалы. Приведем пример бланка:
объект «СОЛНЦЕ» АКТИВНЫЙ сильно сродно слабо никак слабо средне сильно ПАССИВНЫЙ ЗЛОЙ сильно средне слабо никак слабо средне сильно ДОБРЫЙ
МЯГКИЙ оильно средне слабо никак слабо средне сильно ЖЕСТКИЙ ЛЕГКИЙ сильно сродно слабо никак слабо средне сильно ТЯЖЕЛЫЙ ХОЛОДНЫЙ сильно сродно слабо никак слабо сродно оильно ТЕПЛЫЙ
Задача испытуемого — зафиксировать свою оценку в виде отнесения к определенному полюсу шкалы с определенной градацией. Выбранную градацию надо либо подчеркнуть на бланке, либо обвести кружком. Таким образом, в каждой строке бланка должна быть проставлена отметка, фиксирующая ответ испытуемого.
Как видим, по сравнению с методикой Дембо—
Рубинштейн «семантический дифференциал» совершеннее тем, что защищен от так называемой «позиционной тактики». Здесь позитивно окрашенные характеристики размещаются не на одном и том же полюсе каждой шкалы (наверху), а на разных — то слева, то справа.
В результате заполнения бланка СД на ответном листе возникает субъективный СЕМАНТИЧЕСКИЙ ПРОФИЛЬ прошкалированного объекта. Его легче увидеть, если соединить единой ломаной линией все
пометки.
При обработке результатов СД возможны два подхода: либо анализировать только профили, либо
6. Основы психодиагностики
161
Основы психодиагностики
строить так называемое «семантическое пространство».
Поясним, как можно действовать в первом случае. Допустим, мы проводим СД'В целях профориен-тационной консультации и просим школьника стар-
■
ших классов прошкалировать названия различных профессий, которые, как выясняется из беседы с ним, оказываются для него потенциально привлекательными. Но какая же самая привлекательная из них? Для ответа на этот вопрос школьника просят прошкалировать, кроме названия конкретных профессий, также и особый идеальный объект — «самую лучшую профессию для меня». После этого производится сравнение всех профилей реальных профессий и профиля идеальной профессии (опустим здесь формулу подсчета меры сходств, главное здесь —«■ понимание общего смысла метода). И та реальная профессия, профиль которой обнаруживает больше сходства с «идеальной», объявляется в результате наилучшим субъективным выбором.
[Примечание. Понятно, что для разных испытуемых такой выбор может быть разным не только в силу несовпадающих представлениии о реальных профессиях, но и в силу различия в профиле идеальной профессии: одни больше стремятся к «сильным» (или как на современном молодежном слэнге — «крутым») занятиям, другие — к сложным и интересным, третьи — к спокойным и добрым и т. п.].
Для построения «СЕМАНТИЧЕСКОГО ПРОСТРАНСТВА» производится объединение шкальных оценок по родственным шкалам, входящим в одну и ту же координату (фактор) семантического пространства. Как показали многочисленные факторноанали-тические исследования зарубежных и отечественных психологов (Е. А. Артемьева, 1980, В. Ф. Петренко, 1979, 1988, А. М. Эткинд, 1979, А. Г. Шмелев, 1983 и другие), большинство оценочных шкал объ-
162
Психодиагностика как научная технология
единяются в три сводные оценочные шкалы: «хороший — плохой», «сильный — слабый», «активный — пассивный». Например, оценки по шкале «мягкий — жесткий» оказываются психологически эквивалентными оценкам по шкале «хороший — плохой», а оценки по шкале «тяжелый — легкий» фактически близки к оценкам по шкале «сильный — слабый». В результате такого пересчета (очень похожего на подсчет суммарного балла по тесту, но только в данном случае не для испытуемого, а для объекта) каждый объект получает значение по трем главным семантическим факторам и может быть отображен геометрически в виде точки в трехмерном пространстве Оценка-Сила-Активность. Сходство профилей есть близость определенных точек в семантическом пространстве, ее буквально можно увидеть (визуализировать), как показано на рис. 4:
Рис. 4
Двумерное семантическое пространство
в результате шкалирования профессий
по «семантическому дифференциалу»
На приведенном примере самыми близкими к идеальной из всех рассматриваемых профессий для испытуемого оказываются профессии «летчика» и «инспектора ГАИ». После того остается выяснить,
163
Основы психодиагностики
имеются ли у испытуемого реальные профессионально важные качества для того, чтобы претендовать на овладение этими профессиями.
Специально отметим, что СД используется и для диагностики самооценки. Достаточно попросить ребенка оценить самого себя по тому же самому набору шкал. В результате в семантическом пространстве появляется точка «Я». Степень удалении этой точки от «идеальной» — мера недовольства собой. Например, на рис.4 мы видим, что ребенок считает себя в целом «хорошим», но несколько «слабым» и оказывается ближе всех не к «летчику» и «инспектору ГАИ», а к «маляру».
Подчеркнем еще раз, что для успешного использования СД материал, который шкалирует ребенок, должен соответствовать по возрасту его кругу интересов, иначе ребенок просто наставит в бланке более или менее случайный узор отметок.
С младшими школьниками и дошкольниками СД лучше проводить в индивидуальной и устной форме, то есть все отметки на бланк должен заносить сам экспериментатор — по устным ответам ребенка. В качестве материала (объектов для оценки) лучше использовать сказочных персонажей или героев мультфильмов. Специальные исследования В. Ф. Петренко показали высокую эффективность этого материала в работе с детьми. Особая модификация СД допускает, чтобы сказочные персонажи обозначали не объекты, а полюса шкал. В этом случае родители, друзья и учителя будут сравниваться ребенком с определенными сказочными персонажами.
Специфические проблемы и трудности семейной идентификации или школьной адаптации могут проявиться в СД как в любой проективной методике. Например, нелюбимая старшая сестра может оказаться близкой в семантическом пространстве к «Бабе
164
Психодиагностика как научная технология
Яге», а завуч, которого ребенок просто боится, — к какому-нибудь «роботу-киллеру».
* ■ »
Тест конструктов
■
Более разнообразные и гибкие техники шкалирования по сравнению с СД собраны под единым названием «ТЕСТ КОНСТРУКТОВ» (Келли, 1965). Главная специфика теста конструктов — выяснение названия для шкальных полюсов в процессе общения с испытуемым. Этот процесс может быть вполне формализован: например, в форме сравнения по тройкам, когда испытуемого просят назвать лишний объект среди тройки объектов и назвать признак, которым он отличается от двух других* Этот признак и будет «личностным конструктом», то есть персональной шкалой, предложенной (сконструированной) самим испытуемым. После того, как конструкт выделен, дальнейшая процедура может быть в принципе такой же, как в СД.
Информативны прежде всего сами названия этих конструктов и их смысл. Если подросток сравнивает известных ему молодежных эстрадных кумиров по тому, кто из них «сидит на игле», а кто «уже завя-зал», то можно не сомневаться в том, что он так или иначе вовлечен в мир наркотиков. То есть тест конструктов оказывается более изощренным и косвенным диагностическим инструментом, чем опросник, содержащий прямые, «лобовые» вопросы. Известны успешные примеры применения теста конструктов для выявления скрытых противоправных тенденций. Дело в том, что в структуре сознания противоправного подростка понятия, обозначающие мир легальных и обозначающие мир криминальных явлений, разделяются более жестко — они разнесены на противоположные полюса семантического простран-
165
Основы психодиагностики
ства.
Для того, чтобы построить семантическое пространство по результатам теста конструктов, необходимо воспользоваться определенными компьютерными программами. В отличие от СД конструкты нельзя заранее отнести к определенным глобальным факторам, так как они просто неизвестны. Поэтому приходится подвергать эти результаты факторному анализу. Первичные данные теста конструктов имеют вид таблицы (она также называется матрицей, или решеткой): по строкам — конструкты, по столбцам — объекты, в клетках таблицы — оценки, данные испытуемым. С помощью факторного анализа из каждой такой матрицы можно выделить факторы-конструкты, объединенные между собой по смысловому сходству. На сегодня в России уже имеются специализированные программы, позволяющие быстро строить семантические пространства по конструктам. Это уже упоминавшаяся в 2.2 программа ЭКСПАН и более специализированная программа КЕЛЛИ, позволяющая производить процедуру сравнения по тройкам прямо за компьютером. Программа КЕЛЛИ также распространяется научной фирмой «Гуманитарные технологии» (название новой версии этой программы — КОНСТРУКТОР).
Психодиагностической ценностью в тесте конструктов обладает не только содержание конструктов и факторов, но и число независимых факторов (размерность семантического пространства). Как правило, оно указывает на уровень дифференцированное™, развитости системы представлений испытуемого в той области, для которой проводился тест конструктов. Многократно показано, что для тех, кто увлекается, допустим спортом, существует больше независимых, не сводимых друг к другу конструктов именно в сфере спорта, а для тех, кто увлекается компьютерами, — в этой сфере.
166
Психодиагностика как научная технология
Методику конструктов часто также называют «техникой репертуарных решеток». Имеется в виду такой прием, когда сам список однозначно названных объектов тоже не дается испытуемому, а дается только список инструкций о том, как эти объекты подбирать. Подобные инструкции и называются «репертуарными». Испытуемый, например, сам подбирает известных ему людей на роли «человека, которому можно доверять», «самого преуспевающего из знакомых», «самого неудачливого из знакомых» и т- п.
Многие психологи видят главную силу и пафос данного подхода в том, что выявление круга людей, объектов и явлений, важных для самого испытуемого, которых он описывает на своем собственном языке, позволяют получить не только ценную структурную информацию, но прежде всего дают бесцен- ■ ный капитал для сокращения дистанции в консультативном диалоге, так как после этого диалог идет на языке самого испытуемого о понятных ему и значимых для него вещах.
Ранжирование
Одна из многочисленных модификаций техник шкалирования представлена методиками ранжирования. В этом случае испытуемому дается перечень слов или развернутых названий объектов (либо графических стимулов), и его задачей оказывается расположить их по порядку убывания (или возрастания) какого-то признака. Наверное, самая известная реализация этой техники представлена тестом «цветовых предпочтений» Люшера, когда испытуемый раскладывает на столе 6 цветных карточек — по критерию «нравится — не нравится».
Очень часто с помощью техник шкалирования измеряется самооценка. Это методика, в частности,
■
167
Основы психодиагностики
широко применялась знаменитым американским психотерапевтом-гуманистом К, Роджерсом. Вначале испытуемый ранжирует список качеств по тому, насколько они описывают его самого: «наблюдаются у меня — не наблюдаются у меня». Затем испытуемый ранжирует эти же качества по их выраженности у «идеального человека». Обработка результатов состоит в расчете ранговой корреляции между двумя ранжировками. Содержательная логика здесь та же, что и при сравнении семантических профилей в СД. К. Роджерс показал, что у невротизированной личности наблюдается «отвержение образа Я» — резкий контраст между идеалом и реальностью. Такая нетерпимость к себе у подростка, которому свойственна максималистская «Я-концепция», — источник внутренней конфликтности, которая нередко прорывается во внешних протяжных реакциях.
Ранжировке могут подвергаться не только словесные названия черт личности, но и графические символы. Например, в методике КИСС (Соколова, Федотова, 1982) вместо словесных обозначений используются схематические изображения разных лиц. Когда количество инструкций (проранжируй по сходству с отцом, с матерью и т. п.) увеличивается, то мы получаем опять же ранговую решетку (матрицу) конструктов, которую следует обрабатывать уже на компьютере — чтобы «вычерпать» из нее всю наиболее ценную информацию.
Парные сравнения и сортировка
Р
-
Различают парные сравнения по предпочтению и по сходству. В первом случае мы имеем дело с более трудоемким и надежным вариантом методики ранжирования. Отличие в том, что когда испытуемый сравнивает все пары объектов — каждого с каждым,
Достарыңызбен бөлісу: |