Учебное пособие для студентов педвузов. Москва, Ростов-на-Дону: «Феникс», 1996. 544 с

жүктеу/скачать 2.12 Mb.

бет	18/29
Дата	02.06.2016
өлшемі	2.12 Mb.
	#110133
түрі	Учебное пособие

1 ... 14 15 16 17 18 19 20 21 ... 29

3.6. ТЕСТ ОБЩЕОБРАЗОВАТЕЛЬНЫХ ЗНАНИЙ: КОМПЬЮТЕРНОЕ АДАПТИВНОЕ ТЕСТИРОВАНИЕ
Адаптивное тестирование

Диагностика учебных достижений

Для диагностики успешности обучения в школе разрабатываются специальные методы, которые разными авторами называются тестами учебных достижений, тестами успешности, дидактическими тестами и даже тестами учителя (под последними могут также подразумеваться тесты, предназначенные для диагностики профессиональных качеств педагогов либо малоформализованные диагностические средства, которые может использовать учитель, такие как наблюдение, беседа и др.)- Как отмечает американский психолог А. Анастази, по численности этот тип тестов занимает первое место.

Тесты достижений предназначены для того, чтобы оценить успешность овладения конкретными знаниями и даже отдельными разделами учебных дисциплин и являются более объективным показателем обученности школьника, чем отметка. Последняя зачастую становится не только оценкой знаний учащегося, но и инструментом воздействия на него,

* * ■ * ■ *

302

Практический задачи школьной психодиагностики

может выражать отношение учителя к степени его дисциплинированности, организованности, особенностям поведения и т. д. Тесты достижений лишены этих недостатков, разумеется при условии грамотного их составлении и применения.

Тесты достижений отличаются от собственно психологических тестов (способностей, интеллекта). Их отличие от тестов способностей состоит, во-первых, в том, что с их помощью изучают успешность овладения конкретным, ограниченным определенными рамками учебным материалом, например, разделом математики «стереометрия» или курсом английского языка. На формирование способностей (например, пространственных) влияние обучения также будет сказываться, но оно не является единственным фактором, определяющим уровень их развития. Поэтому при диагностике способностей трудно найти однозначное объяснение высокой или низкой степени их развитости у школьника. Во-вторых, различие между тестами определяется целями их применения. Тесты способностей направлены главным образом на выявление предпосылок к тем или иным видам деятельности и претендуют на прогнозирование выбора для индивида наиболее подходящей профессии или профиля обучения- Тесты же достижений применяются для оценки успешности овладения конкретными знаниями с целью определения эффективности программ, учебников и методов обучения, особенностей работы отдельных учителей, педагогических коллективов и т. д., то есть диагностируют прошлый опыт, результат усвоения тех или иных дисциплин или их разделов. Хотя нельзя отрицать того факта, что тесты достижений также могут в определенной степени предсказывать темпы продвижения учащегося в той или иной учебной дисциплине, поскольку имеющийся на момент тестирования высокий или невысокий уровень овладения знаниями не может не

l

303

Основы психодиагностики

отразиться на дальнейшем процессе обучения. Указывая на разницу в обсуждаемых типах тестов, А. Анастази отмечает, что она наиболее выпукло выступает при оценке их валидности: «Лучший способ оценить тесты способностей — это осуществить прогностическую критериально-ориентированную вали-дизацию, тогда как тесты достижений в основном оцениваются в терминах валидности по содержанию» (А. Анастази, 1982, т.2, с. 37).

Тесты достижений отличаются также и от тестов интеллекта. Последние направлены не на диагностику конкретных знаний или фактов, а требуют от учащегося умения совершать с понятиями (пусть даже и учебными) определенные умственные действия, такие как аналогий, классификации, обобщение и др. Это отражено и в формулировании конкретных заданий тестов того и другого типа. Например, тест достижений на материале истории определенного периода может содержать такие вопросы:

«Заполни пропуски в предложениях:

Вторая мировая война началась в ........ году.

а) 1945

б) 1941

в) 1939

г) 1935

22 июня 1941 года фашисты напали на ........

а) Польшу

б) Советский Союз

в) Францию

г) Венгрию».

В тесте же умственного развития вопросы с использованием понятий из истории будут иметь следующий вид:

304

Практические задачи школьной психодиагностики

«Вам даны пять слов. Четыре из них объединены общим признаком, пятое слово к ним не подходит. Его надо найти и подчеркнуть.

а) товар б) город в) ярмарка г)'натуральное хозяйство д) деньги

а) рабовладелец б) раб в) крестьянин г) рабочий д) ремесленник».

Для того, чтобы правильно ответить на вопросы, входящие в тест достижений, необходимы знания конкретных фактов, дат и др. Старательный ученик, обладающий хорошей памятью, без труда может найти правильные ответы в заданиях большинства тестов достижений. Однако, если у него плохо сформированы умения работать с понятиями, анализировать их, находить существенные признаки и т. д., то задания теста интеллекта могут вызвать значительные затруднения (поскольку для их выполнения одной хорошей памяти недостаточно). Необходимо владение целым рядом мыслительных операций, знание тех понятий, на материале которых составлены задания теста.

[Примечание редактора. В разделе 3.7 даются примеры того, как избежать буквальной зависимости успешности в тестах достижений от уровня развития «механической» памяти и основанного на ней поверхностно-ассоциативного мышления, как разрабатывать задания, требующие обнаружить понимание внутрипредметнои логики, т. е. концептуальное освоение материала.]

Наряду с тестами достижений, предназначенными для оценки усвоения знаний по конкретным дисциплинам или их циклам, в психологии разрабатываются и более широко ориентированные тесты. Это, например, тесты на оценку отдельных навыков, требующихся школьнику на разных этапах обуче-

305

Основы психодиагностики_____ '

ния, таких как некоторые общие принципы решения математических задач, анализа литературных текстов и др. Еще более широко ориентированными являются тесты для изучения умений, которые могут пригодиться при овладении рядом дисциплин, например, навыки работы с учебником, математическими таблицами, географическими картами, энциклопедиями и словарями. И, наконец, существуют тесты, направленные на оценку влияния обучения на формирование логического мышления, способности рассуждать, строить выводы на основе анализа определенного круга данных и т. д. Эти тесты в наибольшей степени приближаются по своему содержанию к тестам интеллекта и высоко коррелируют с последними. Поскольку тесты достижений предназначены для оценки эффективности обучения по конкретным предметам, то обязательным участником формулирования отдельных заданий должен стать учитель. Психолог же обязан обеспечить соблюдение всех формальных процедур, требуемых для создания надежного и валидного инструмента, с помощью которого можно было бы осуществлять диагностику и проводить сопоставления по исследуемым качествам отдельных учащихся или их групп (классов, школ, регионов и т. д.). То есть психолог должен выполнить роль методиста-тестолога.

Отдельные тесты достижений можно объединять в батареи, что позволяет получать профили показателей успешности обучения по разным школьным предметам. Как правило, тестовые батареи предназначены для разных образовательно-возрастных уровней и не всегда дают результаты, которые можно сопоставлять друг с другом для получения целостной картины успешности обучения от класса к классу. Наряду с ними созданы батареи, которые позволяют получать такие данные. Это, например, тесты основных навыков (штата Айова) и успехов в обуче-

306

Практические задачи школьной психодиагностики

нии, тесты достижений и тесты учебных навыков Стэнфордского университета и др.

Рассмотрим в качестве примера Стэнфордский тест достижений (SAT), краткое описание которого приведено в книге А. Анастази (А. Анастази, 1982 г., т.2, с.42—43). Разработанный в 1923 г., он неоднократно перерабатывался, и последний вариант появился в 1973 г. Проведение всей батареи занимает 4—5 часов и осуществляется в несколько приемов- Некоторые блоки батареи могут использоваться самостоятельно, для оценки эффективности обучения по отдельным дисциплинам. Вот, например, какие субтесты входят в батарею SAT, предназначенную .для детей 5 и 6-х классов (с середины 5-го до окончания 6-го):

1. Словарь: изучает словарный запас с помощью устного предъявления незавершенных предложений с просьбой к ребенку выбрать наиболее подходящее слово. Например, «Человек, который большую часть времени находится в плохом настроении, называется: а) отшельник б) актер в) брюзга д) учащийся»..

2. Понимание прочитанного: ребенка просят прочитать отрывок прозы или стихотворения и к каждому задают серию вопросов. Для того, чтобы дать правильные ответы, учащийся должен уметь выделить главную мысль отрывка, ключевые моменты текста, понимать его скрытый смысл, уметь делать выводы из прочитанного.

3. Навыки анализа слов: ученик должен произнести зрительно предъявляемые ему отдельные буквы и их сочетания, составить слова из слогов.

4. Математические понятия: изучает понимание математических терминов и систем обозначений и действий, например, дробей, множеств, процентов и

т. Д.

5. Математические вычисления: включает оценку умений действовать с числами (буквенные обоз-

307

• *

Основы психодиагностики

начения не используются).

6. Применение математики: содержит типичные арифметические задачи, задания на измерения и составление графиков и др.

7. Грамотность: нахождение неправильно написанных слов.

8. Язык: требуется правильно использовать прописные буквы, формы глаголов и местоимений, верно строить предложения, соблюдать правила пунктуации и т. д.

9. Социальные науки: требуется выполнение заданий на основе знаний из области истории, экономики, политики, социологии и др.

10. Естественные науки: задания выявляют знания некоторых методов и терминов из области физики и биологии.

11. Понимание прослушанного: требуется прослушать текст и ответить на ряд вопросов.

В 1973 году SAT был стандартизован на национальной выборке школьников с 1-го по 9-й классы.

Следует отметить, что в США тесты достижений получили очень широкое распространение и используются не только в школе, но и в дошкольных учреждениях и для выборок взрослых людей (например, для определения уровня грамотности тех или иных слоев населения).

Что касается дошкольников, то наиболее актуальной задачей является определение готовности ребенка к обучению в школе. Здесь также широко могут использоваться тесты достижений (о других тестах, используемых в диагностике готовности к школе, см. 3.2). Широкую известность в США приобрела батарея, которая называется национальным тестом готовности (MRT). С его помощью диагностируется уровень овладения некоторыми важными для дальнейшего обучения понятиями (языковыми и

308

Практические задачи школьной психодиагностики

количественными), такими как умение выделять разные звуки, находить последовательность событий (в картинках). В других тестах диагностируется уровень осведомленности ребенка в окружающем мире, овладение языком и основами математических понятий, понимание на слух.

При составлении заданий теста достижений следует соблюдать ряд правил, которые позволяют создать надежный, сбалансированный инструмент оценки успешности овладения определенными учебными дисциплинами или их разделами (см. 3.7).

Ключевые термины: умственное развитие, тесты интеллекта, тесты достижений, социально-психологический норматив, качественный анализ, компьютерные тесты, осведомленность, аналогии, обобщение, классификация, числовые ряды.

3.6. ТЕСТ ОБЩЕОБРАЗОВАТЕЛЬНЫХ ЗНАНИЙ: КОМПЬЮТЕРНОЕ АДАПТИВНОЕ ТЕСТИРОВАНИЕ

В отличие от предметно ориентированных тестов умственного развития (ТУР), описанных в предыдущей главе, в настоящей главе излагаются принципы создания Теста Общеобразовательных Знаний (ТОЗ). Если в различных вариантах ТУРа шкалы отражают прежде всего уровень сформированности определенных логических операций мышления, реализованных на материале понятий из школьных учебников (аналогии, обобщение и т. п.), то любые версии ТОЗ отражают в показателях по субшкалам достижения ученика по самим пред-

309

ОСНОВЫ ПСИХОДИАГНОСТИКИ

мотам школьной программы (математика, физика и

т. п.). Моли ТУР......междисциплинарный поихолого-

педагогический инструмент» то ТОЗ чисто педагогический инструмент, то есть педагогический тест достижений. Примеры-образцы отдельных заданий ТОЗ даются в параграфе «4.7.

Разработка ТОЗ для российской школы означает создание российского аналога SAT (Стоифордокий тест достижений или, как позднее его стали называть, — Школьный тест достижений), который, как известно, является в (ЛИЛ определенным стандартом федерального масштаба. Только наличие общефедераль-НОГО стандарта позволит обеспечить в России реальную эквивалентность аттестатов Зрелости, выяснить, в частности, объективную цепу невиданному количеству «медалистов», которые вдруг начинают

появляться в какой-нибудь рядовой и мало чем знаменитой школе где-нибудь в городе N-оке.

Программа создания и распространения российского ТОЗ должна, безусловно, учитывать как мировой опыт, так и специфику современной ситуации в России. Критики справедливо возражают: организационные решения, что стандартны для Запада в России могут не сработать из-за повиданного уровня «групповой сплоченности* (а попросту коррупции), имеющей место во всех слоях общества» в том числе; среди чиновников и учителей, занятых в системе образования.

Но и технологические возможности разработчиков тестовых методик не стоят на месте, Новые возможности, и прежде всего в плане обеспечения

информационной безопасности, дает компьютеризация.

Опишем здесь опыт решения проблемы создания ТОЗ, который накоплен в центре компьютерной психодиагностики «Гуманитарные технологии* при факультете психологии МГУ (руководитель центра —

■

310

Практический задачи школьной психодиагностики

А. Г. Шмелев). Данный материал поможет читателям не только сориентироваться в самой проблеме создания ТОЗ, но и получить опыт знакомства с кратким и типичным научным отчетом о проведении экспериментальной апробации некоторого теста в процессе его разработки, а также с перспективами использования компьютеров в процессе тестирования.

В отличие от Стэнфордского теста ТОЗ в своих субшкалах буквально повторяет названия учебных предметов и в этом смысле является формализованным компьютеризированным аналогом школьных выпускных и вузовских вступительных экзаменов.

С самого начала ТОЗ разрабатывается как принципиально компьютерный тест. Важнейшие его особенности таковы: наличие очень широкого компьютерного БАНКА ЗАДАНИЙ (длинного перечня) по каждому предмету и наличие особой программы ТЕСТОВОГО ДИАЛОГА, которая позволяет предъявлять каждому испытуемому по сути дела уникальную выборку заданий (вариант) из этого банка заданий. Далее сами авторы ТОЗ не знают, какие именно задания предъявит компьютер данному конкретному испытуемому. Если же кто-то получит доступ к тексту заданий ТОЗ, и расшифрует их кодировку, то для того, чтобы «обмануть» ТОЗ необходимо выучить не только правильные ответы к сотням заданий, но и научиться их отличать от ложных формулировок. Легче выучить стройно и логично написанный учебник, чем заниматься этой работой.

В первую версию ТОЗ, прошедшую апробацию на абитуриентах МГУ в 1995 году, вошло 360 заданий — по 45 заданий на каждый из 8 основных предметов школьной программы. Это математика, русский и литература, физика, химия, биология, история, география и иностранный язык (английский). В каждом задании испытуемому предлагалось 4 вари-

1 I • I

311

Основы психодиагностики

анта ответов, из которых 1 — правильный. В ра#!Р ботке заданий приняли участие независимые (не 31*** шие друг друга) учителя-предметники из московс*^**"^ школ и преподаватели МГУ, много лет участво***"¹шие в составлении и проверке заданий на встуГ*^и~ тельных экзаменах. Задания проходили анонимйУ¹⁰перекрестную предварительную экспертизу, и за**^вМлучшие из заданий были разбиты на однород*£*^,1еблоки по тематике и уровню сложности. По сод^Р" жанию йадания охватывают всю программу среди:с***⁰образования и ориентированы на выпускников шк^-⁷¹' абитуриентов вузов.

Испытуемый выполняет ТОЗ непосредственно **^акомпьютером. Программа тестирования (ТЕСТАН-^' «Гуманитарные технологии», 1995) последователь-**⁰предъявляет вначале 15 заданий по математике, заТ®^м15 — по русскому и литературе и т. д. — всего 1 320 заданий за 80 минут. Компьютер автоматические** контролирует расход времени на каждый предмет* ** при исчерпании лимита времени по одному предг/г**-ту программа начинает предъявлять задания по следующему предмету, засчитывая «пропуск» испытуемому по всем заданиям, на которые он не усгтол ответить (из предусмотренных 15).

По каждому предмету 15 заданий представляют

пять тематических блоков и 3 уровня сложности -Применяется алгоритм БЛОЧНОЙ РАНДОМИЗАЦИИ, т. е. частично случайного выбора заданий, ограниченного рамками блоков — определенных подмножеств заданий, среди которых каждый р«з производится случайный выбор. Вначале предъявлю!-ются 5 самых легких заданий, затем 5 заданий среднего уровня трудности, затем — 5 самых трудимся заданий. В результате даже плохо подготовленные и испытывающие волнение испытуемые получают возможность с самого начала «зацепиться», справитьо-яс по крайней мере с первыми простыми заданиям:**.

312

Практический задачи школьной психодиагностики

Сильные испытуемые получают серьезное испытание на последней пятерке заданий. Здесь-то и проявляется различие между настоящими отличниками и «хорошистами». Самые слабые, как правило, просто не успевают приступить к пятерке самых трудных заданий, так как им не хватает времени.

Реальная трудность задания проверялась в пилотажном эксперименте и после этого корректировалась. В число легких попадали задания, с которыми справлялись более 70 процентов испытуемых, в числе трудных — с которыми справлялись менее 30 процентов испытуемых, остальные причислялись к средним по уровню трудности.

Схема начисления очков в ТОЗ-1 при расчете суммарного балла такова:

за правильный ответ — 4 очка,

за пропуск задания — 1 очко,

за ошибочный ответ — 0 очков.

Такая схема вносит необходимую поправку на вероятность случайных правильных ответов, которые по теории вероятности возможны с вероятностью 0,25.

После завершения такого нелегкого испытания испытуемые могли вспомнить только 10, максимум 25 процентов из предъявленных им заданий, но, конечно, не могли пересказать своим друзьям точные формулировки фальш-альтернатив (ложных ответов, или так называемых «дистракторов»). И если теоретическая вероятность повторения одного и того же задания у двух испытуемых равнялась 0,33-15 ~ 5 заданиям, то практически крайне редко два испытуемых могли вспомнить больше одного одинакового задания. Даже после интенсивного обсуждения впечатлений от теста между собой у испытуемых оставалось полное впечатление, что тест включает сотни заданий по одному предмету. Естественно, что при дальнейшем наращивании банка заданий в ТОЗ-2 та-

313

Основы психодиагностики

кое впечатление будет еще более усиливаться.

ТОЗ-1 имеет ряд модификаций для специальных групп абитуриентов- Например, версия ТОЗ-ПСИ (для абитуриентов психологического факультета) включала по 90 заданий всего по 3 предметам, входящим в состав вступительных экзаменов на факультет психологии МГУ: математика, русский и литература, биология. Каждый абитуриент отвечал за 50 минут на 90 заданий (по 30 на каждый предмет).

На этих абитуриентах факультета психологии проверялась, в частности, прогностическая валидность ТОЗ в отношении успешности сдачи вступительных экзаменов. Общая корреляция суммарного балла ТОЗ с суммарным баллом по вступительным экзаменам оказалась равной 0,61. При этом почти такое же значение достигла эта корреляция для субтеста «математика» (0,57). А вот с оценкой по сочинению балл по субтесту «словесность» коррелировал просто плохо. Сказалось, видимо, два обстоятельства: слабые представления абитуриентов о том, что такое «раскрыть тему», и высокая степень лотерейности в вариантах формулировок этих тем (вполне грамотным и в целом начитанным абитуриентам приходилось писать сочинения по авторам и произведениям, которых они либо никогда не читали, либо забывали и не успели повторить). Таким образом, невысокую суммарную корреляцию можно интерпретировать, в частности, как следствие низкой надежности не столько ТОЗ, сколько самого критерия — ведь элемент случайности на вступительных экзаменах выражен даже сильнее, чем в ТОЗ. За это говорит и факт резкого возрастания корреляции с результатами экзаменов для крайних групп по ТОЗ (самых успешных и самых неуспешных). Так, например, НИ ОДИН испытуемый с баллом ниже 50 процентов правильных ответов по ТОЗ не смог пройти на факультет психологии МГУ по конкурсу (конкурс был, как

ш ш

*

314

_

Практические задачи школьной психодиагностики

всегда, высоким — выше 7 человек на место). А самые лучшие абитуриенты по ТОЗ практически все успешно прошли конкурс.

Таким образом, на шкале ТОЗ можно найти граничные точки для «высшей» и «низшей» группы, позволяющие прогнозировать успешность при сдаче экзаменов с высокой степенью надежности — близкой к 0,95. Можно сказать, что для заведомо сильных и заведомо слабых учащихся будущие экзамены не оказываются «лотереей»: одни надежно их сдают, другие — надежно «проваливают». «Лотереей» с элементом везения-невезения экзамен становится для «середнячков», которые освоили учебную программу выборочно, частично.

Вопрос о «конкурентной валидности» ТОЗ по сравнению с вступительными экзаменами (т. е. позволяет ли ТОЗ лучше или хуже прогнозировать успешность обучения в вузе) может быть разрешен только после многолетнего, так называемого «лонги-тюдного» наблюдения за тем, как будут учиться в вузе студенты, прошедшие ТОЗ в 1995 году.

Конечно, версия ТОЗЛ есть только первый шаг к созданию.эталонной методики такого типа. Она нуждается в существенной модернизации, масштабной апробации и накоплению репрезентативных норм, чтобы занять место федерального стандарта в данной области.

*

Адаптивное тестирование

Планируемая версия ТОЗ-2 должна включать уже не менее 200—300 заданий по каждому предмету, а также опираться на более совершенный программный алгоритм, использующий принципы так называемого АДАПТИВНОГО ТЕСТИРОВАНИЯ.

Адаптивным тестированием называется такая

315

Основы психодиагностики

диалоговая тестовая программа, которая изменяет порядок предъявления тестовых заданий в зависимости от результатов выполнения испытуемым уже предъявленных заданий. Когда опытный экзаменатор проводит устный экзамен, он фактически всегда применяет некий упрощенный интуитивный вариант адаптивного тестирования. После первых удачных ответов экзаменующегося экзаменатор старается задать вопрос посложнее, и если учащийся справляется и с этим сложным вопросом, то экзаменатор, вполне,справедливо экономя свое собственное время, ставит учащемуся оценку «5». После первых же ошибочных ответов экзаменатор, наоборот, «снижает планку» — задает самый простой вопрос, и если учащийся не справляется и с этим простейшим вопросом, то экзаменатор ставит учащемуся оценку «2». Таким образом, для выявления крайних случаев требуется гораздо меньше тестовых заданий при обеспечении практически того же уровня надежности. Дольше времени надо потратить и большее количество вопросов задать в случае «середнячков», которые с одними заданиями справляются, а с другими нет, так как освоили учебную программу не полностью. Смысл адаптивности в алгоритме тестирования в том, что тест адаптируется, настраивается на доступный испытуемому уровень сложности и тем самым быстрее локализует его истинный тестовый балл на шкале измеряемого свойства.

Конечно, 15 заданий по одному предмету — это мало, эта выборка заданий не обеспечивает полноценный охват всей учебной программы. Но если эти задания различаются по сложности хотя бы на 3 уровня, то возникает возможность для применения следующего упрощенного (и потому понятного начинающим) адаптивного алгоритма. После первой пятерки самых простых заданий программа сразу же подсчитывает процент правильных ответов. Если

316

Практические задачи школьной психодиагностики

решены все 5 заданий, то программа сразу переводит испытуемого на самый высокий уровень трудности- Если решены от 2 до 4 заданий, то программа переводит испытуемого на средний уровень трудности. В противном случае испытуемый остается на первом уровне трудности. На втором этапе программа применяет аналогичную логику. С теми, кто справился с 4—5 заданиями высшего уровня трудности, тестирование можно прекращать и ставить балл, учитывающий общий процент решенных задач с учетом их цены (более трудные имеют, конечно, более высокую цену). Если же на высшем уровне трудности испытуемый допустил более одной ошибки, то тестирование продолжается уже на среднем уровне трудности. Те испытуемые, которые долго остаются на среднем уровне, выполняют тест значительно дольше — пока колебания их текущего балла (процента правильных ответов) не стабилизируются в рамках пренебрежимо малого интервала, равного ошибке измерения.

«ТРЕХУРОВНЕВЫЙ АЛГОРИТМ», подобный описанному выше, позволяет при предъявлении в среднем 15 заданий добиваться такой же точности-надежности, как и тест со сплошным предъявлением 45 заданий, не учитывающий уровень трудности заданий. То есть, огрубленно говоря, введение трех уровней трудности и оптимального алгоритма перехода с уровня на уровень позволяет втрое сократить расходы на продолжительность тестирования.

Впрочем, выигрыш от адаптивности состоит не только в экономии времени, но и в информационной безопасности. Чем меньше заданий предъявляется одному испытуемому из банка заданий, тем менее становится «прозрачным», обозримым для испытуемых весь банк заданий.

Постепенное расширение банка заданий и создание специализированных версий ТОЗ для более млад-

317

Основы психодиагностики

ших классов будет создавать у детей привычку к выполнению таких процедур контроля знаний. Применение тематической блочной структуры в рамках одного предмета, наряду с адаптивными алгоритмами тестирования, не только сэкономит дорогое компьютерное время в компьютерных классах, но и позволит быстро и надежно локализовать «проблемные» зоны — провалы в усвоении материала у данного конкретного ученика.

Если тестовые задания не классифицированы по уровню сложности, то при применении компьютеров возможность для использования адаптивного тестирования в принципе сохраняется. В частности, может быть использован простейший АЛГОРИТМ «СХОДЯЩИХСЯ ПОРОГОВ». После предъявления какого-то начального набора заданий (минимально тематически представительного для данной учебной дисциплины) компьютерная программа начинает постоянно сравнивать (после каждого нового задания) текущий процент правильных ответов, показанный испытуемым, с двумя порогами — высоким порогом «зачета» и низким порога «незачета». Те испытуемые, которые хорошо овладели учебным материалом и достигли за минимальное число тестовых заданий верхнего порога (например, в 90 процентах правильных ответов), быстро получают «зачет» и освобождаются от дальнейшего тестирования. Так же быстро «освобождаются» те испытуемые, которые заведомо на выучили материал, и их ответы мало чем отличаются от случайного гадания (поначалу порог незачета может быть низким — в 40—50 процентов). Остальные испытуемые, попавшие в область неопределенности между двумя порогами, продолжают выполнение теста. С каждым новым заданиям два порога сближаются. Так что при исчерпании всех заданий, предназначенных для одного испытуемого (это не менее 40 за сеанс), каж-

318

Практические задами школьной психодиагностики

дый испытуемый либо попадает в группу успешных, либо в группы неуспешных (к последней относятся также те, кто не уложился с выполнением теста в отведенный временной лимит). Такая простейшая схема адаптивного тестирования обеспечивает серьезную экономию времени при проведении простейшей недифференцированной оценки уровня знаний («зачет/незачет»). Она может быть полезной и экономичной, например, в ситуации квалификационного отбора (селекции) кандидатов в группы, с которыми в дальнейшем производится более тонкая диагностика или специализированное дорогостоящее и индивидуализированное обучение.

В заключение подчеркнем, что адаптивное тестирование — такой подход к компьютерному тестированию, который фактически позволяет привнести в стандартные групповые тесты элементы индивидуализации, учета индивидуальных особенностей данного испытуемого в процессе тестирования. Границы применения адаптивного тестирования не замыкаются на проверке знаний или способностей. В принципе, подобный подход с определенными модификациями вполне применим и для тестирования сферы интересов, установок и черт личности.

Ключевые термины: тест общеобразовательных знаний (ТОЗ), банк заданий, тестовый диалог, дис-трактор, блочная рандомизация, конкурентная ва-лидность, лонгитюдное исследование, адаптивное тестирование, трехуровневый алгоритм, алгоритм сходящихся порогов.

Основы психодиагностики

жүктеу/скачать 2.12 Mb.

Достарыңызбен бөлісу:

1 ... 14 15 16 17 18 19 20 21 ... 29