Аванесов В.С. Теория и практика педагогических измерений (материалы публикаций)
испытания. Всякий тест включает в себя элемент испытания, он не сводится весь к нему.
Ибо тест - это еще и концепция, содержание, форма, результаты и интерпретация - все,
требующее обоснования. Этим подразумевается, что тест является качественным
средством педагогического измерения. В соответствии с
положениями теории, тестовые
оценки не являются точными оценками испытуемых. Правильно говорить, что они лишь
репрезентируют эти значения с некоторой точностью.
Третья идея, развиваемая в нашем определении традиционного теста - это включение
нового понятия - эффективность теста, который ранее в литературе по тестам не
рассматривался в качестве критерия анализа и создания тестов. Ведущая идея
традиционного теста - минимумом числом заданий, за короткое время, быстро,
качественно и с наименьшими затратами сравнить знания как можно большего числа
учащихся.
По существу, этим отражается идея
эффективности педагогической деятельности в
области контроля знаний. Хотелось бы думать, что против самой этой идеи возражать уже
некому и незачем. Если наш учитель может разъяснить учебный материал не хуже своего
зарубежного коллеги, то хорошо проверить требуемые знания, у всех учеников, по всему
изученному
материалу, он не в состоянии из-за господствующей у нас классно-урочной
системы занятий, нехватки компьютерной техники, тестов и программ для организации
автоматизированного самоконтроля - самой гуманной формы контроля знаний. Не в
состоянии он это делать и физически. В силу, мягко скажем, ошибочной социальной
политики зарплата наших учителей уже давно не компенсирует затраты даже физической
энергии, необходимой для хорошего преподавания, не говоря уже о повышенных затратах
энергии интеллектуальной, что способно совершать только раскованное, а не озабоченное
поисками хлеба мышление. Как отмечается в литературе, квалифицированный работник
получает у нас в три-четыре раза меньше того уровня зарплаты, за границами которого
нарушается нормальная жизнедеятельность и начинается разрушение трудового
потенциала (1).
Хотя в литературе имеются сотни
примеров определений теста, с которыми либо
трудно, либо вообще нельзя согласиться, это совсем не означает, что данное определение
традиционного теста - истина в последней инстанции. Как и все остальные понятия, оно
нуждается в постоянном улучшении. Просто оно представляется автору пока более
аргументированным, чем некоторые другие известные понятия педагогического теста.
Впрочем, стремление к улучшению понятий - явление совершенно нормальное и
необходимое для нормально развивающейся практики и науки. Конструктивные попытки
дать другие определения теста или оспорить уже имеющиеся всегда полезны, но именно
этого нам не достает.
К традиционным тестам относятся тесты гомогенные и гетерогенные. Гомогенный
тест представляет собой систему заданий возрастающей трудности, специфической
формы и определенного содержания - система, создаваемая с целью объективного,
качественного, и эффективного метода оценки структуры и измерения уровня
подготовленности учащихся по одной учебной дисциплине. Легко видеть,
что в своей
основе определение гомогенного теста совпадает с определением традиционного теста.
Гомогенные тесты распространены больше других. В педагогике они создаются для
контроля знаний по одной учебной дисциплине или по одному разделу такой, например,
объемной учебной дисциплины, как физика. В гомогенном педагогическом тесте не
допускается использование заданий, выявляющих другие свойства. Наличие последних
Подготовлено ЦТ и МКО УГТУ-УПИ, 2005 г.
12
Аванесов В.С. Теория и практика педагогических измерений (материалы публикаций)
нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест
измеряет что-то заранее определенное.
Например, тест по физике измеряет знания, умения, навыки и представления
испытуемых в данной науке. Одна из трудностей такого измерения заключается в том, что
физическое знание изрядно сопряжено с математическим. Поэтому в тесте по физике
экспертно устанавливается уровень математических знаний, используемых при решении
физических заданий. Превышение принятого уровня приводит к
смещению результатов;
по мере превышения последние все больше начинают зависеть не столько от знания
физики, сколько от знания другой науки, математики. Другой важный аспект - стремление
некоторых авторов включать в тесты не столько проверку знаний, сколько умение решать
физические задачи, вовлекая, тем самым, интеллектуальный компонент в измерение
подготовленности по физике.
Гетерогенный тест представляет собой систему заданий возрастающей трудности,
специфической формы и определенного содержания - система, создаваемая с целью
объективного, качественного, и эффективного метода оценки структуры и измерения
уровня подготовленности учащихся по нескольким учебным дисциплинам. Нередко в
такие тесты включаются и психологические
задания для оценки уровня
интеллектуального развития.
Обычно гетерогенные тесты используются для комплексной оценки выпускника школ,
оценки личности при приеме на работу и для отбора наиболее подготовленных
абитуриентов при приеме в вузы. Поскольку каждый гетерогенный тест состоит из
гомогенных тестов, интерпретация результатов тестирования ведется по ответам на
задания каждого теста (здесь они называются шкалами) и кроме того, посредством
различных методов агрегирования баллов делаются попытки дать общую оценку
подготовленности испытуемого.
Напомним, что традиционный тест представляет собой метод диагностики
испытуемых, в котором они отвечают на одни задания, в одинаковое время, в одинаковых
условиях и с одинаковой оценкой. При такой ориентации задачи определения точного
объема и структуры освоенного учебного материала отступают, по необходимости, на
задний план. В тест отбирается такое минимально
достаточное количество заданий,
которое позволяет сравнительно точно определить, образно говоря, не "кто что знает", а
"кто знает больше". Интерпретация результатов тестирования ведется преимущественно
на языке тестологии, с опорой на среднюю арифметическую, моду или медиану и на так
называемые процентильные нормы, показывающие - сколько процентов испытуемых
имеют тестовый результат хуже, чем у любого взятого для анализа испытуемого с его
тестовым баллом. Такая интерпретация называется нормативно-ориентированной. Здесь
вывод достраивается рейтингом: задания ® ответы ® выводы о знаниях испытуемого ®
рейтинг, понимаемый как вывод о месте или ранге испытуемого.
Литература
1. Львов Дм. Экономическая наука в Новой России//Наука. Политика.
Предпринимательство. 1997. № 1. С. 5.
Подготовлено ЦТ и МКО УГТУ-УПИ, 2005 г.
13