Аванесов В.С. Теория и практика педагогических измерений (материалы публикаций)
Показатель трудности теста и тестовых заданий является содержательным и
формальным одновременно. Содержательным показателем, потому что в хорошем тесте
трудность может зависеть только от содержания и от уровня подготовленности самих
испытуемых, в то время как в плохом тесте на результаты начинают заметно влиять форма
заданий (особенно если она не адекватна содержанию), плохая организация тестирования,
если имеются возможности списывания, утечки информации. Особого упоминания в этой
связи заслуживает спорная практика нацеленной подготовки к централизованному
тестированию.
Формальная составляющая сторона показателя трудности возникает при рассмотрении
тестирования как процесса противоборства каждого испытуемого с каждым
предлагаемым ему заданием. Получаемый при этом исход
полезно рассматривать как
результат такого противоборства. При упрощенном истолковании каждого случая
противоборства испытуемого с очередным заданием обычно рассматриваются только два
исхода: победа испытуемого при правильном решении задания, где он получает один
балл, или поражение, за что даётся ноль баллов. Оценка результата противоборства
зависит от соотношения уровня знания тестируемого к уровню трудности задания, от
избранной единицы измерения знаний и от заранее принятого правила (конвенции) - что
считать "победой" испытуемого и допустима ли ничья, если говорить языком спорта.
Принцип возрастающей трудности используется при изложении содержания многих
учебников и пособий, особенно по тем учебным дисциплинам, которые построены по
кумулятивному принципу, что означает: знание последующих
элементов курса в явном
виде зависит от знания предыдущих учебных элементов. Такое построение присуще
учебникам по математике, логике, иностранным языкам, статистике, техническим и
многим другим наукам. В них ранее изученные понятия активно используются в
последующих темах. Поэтому изучать такие дисциплины нужно только с самого начала, и
без пробелов.
Большинство авторов, особенно зарубежных, не делают различий между понятиями
"трудность" и "сложность". Многие разработчики тестов - то же. Однако есть работы, в
которых эти понятия определяются различно. Например, А.Н.Захаров и А.М.Матюшкин
отмечают, что степень трудности учебного задания не совпадает с его сложностью.
Степень сложности учебного материала характеризуется реальной (объективной)
насыщенностью учебного задания и формой его изложения, а степень трудности всегда
предполагает соотнесение подлежащего усвоению учебного материала с ранее усвоенным
учебным материалом и интеллектуальными возможностями учащихся (1).
Л.Н. Ланда объясняет трудность учебной задачи тем, что учащиеся часто не знают тех
операций, которые надо производить, чтобы найти решение. Если систему операций для
решения некоторого класса задач назвать методом решения, то, по его мнению, трудность
связана с незнанием метода, с незнанием, как нужно думать в процессе решения, как и в
какой последовательности надо действовать с условиями задачи (2). Возникающие
затруднения
объясняются тем, что педагог часто старается дать знания о содержании
изучаемого и значительно меньше заботится о том, как надо думать, рассуждать (там же).
Подобное истолкование пересекается с идеей о связи сложности задания с числом
операций, которые необходимо совершить для достижения успеха. Эти определения
трудности и сложности являются, по большей части, психологическими; они полезны при
психологическом анализе содержания тестовых заданий.
Традиционной мерой трудности каждого задания долгие годы была доля правильных
ответов в группе испытуемых, изображаемая символом pj, где индекс j указывает на
Подготовлено ЦТ и МКО УГТУ-УПИ, 2005 г.
28
Аванесов В.С. Теория и практика педагогических измерений (материалы публикаций)
номер интересующего задания (1, 2 и т. д.). Например, если правильные ответы
испытуемых на третье задание теста оценивать одним баллом, а неправильные - нулем, то
значение показателя p3 можно найти из элементарного отношения
p3 = R3 / N ,
где R3 означает число правильных ответов на данное задание, а N - общее число
испытуемых в группе. Общая формула расчета доли правильных ответов на любое
задание (j) имеет соответственно вид
Pj = Rj/ N (1)
Показатель pj. долго использовался в качестве меры трудности в так называемой
классической теории тестов (3). Позже была осознана содержащаяся в
ней смысловая
неточность: ведь увеличение значения pj указывает не на возрастание трудности, а,
наоборот, на возрастание легкости, если можно использовать такое слово. Поэтому в
последние годы с показателем трудности заданий стали ассоциировать противоположную
статистику - долю неправильных ответов (qj). Эта доля вычисляется из отношения числа
неправильных ответов (Wj- от англ слова Wrong - неправильный) к числу испытуемых
(N):
qj = Wj/ N (2)
Естественным образом принимается, что pj + qj = 1. В классической теории тестов
многие годы рассматривались только эмпирические показатели трудности. В новых
вариантах психологических и педагогических теорий тестов больше внимание стало
уделяться характеру умственной деятельности учащихся в процессе выполнения тестовых
заданий различных форм (4).
Содержание теста не может быть только легким, средним или трудным. Здесь в
полной мере проявляется известная мысль о зависимости результатов применяемого
метода. Легкие задания теста создают только видимость наличия знаний у учащихся,
потому что ими проверяются минимальные знания. В
этой связи можно заметить, что
ориентация федерального органа управления образованием на проверку минимального
уровня знаний не дает, и не может, даже по определению, дать представление о реальном
уровне знаний, т.е. дать ту информацию, которая давно уже нужна обществу и органам
управления. Искажает результаты тестирования и подбор заведомо трудных заданий, в
результате чего у большинства школьников оказываются заниженные баллы. Ориентация
на трудные задания нередко рассматривается как средство усиления мотивации к учебе.
Однако это средство действует неоднозначно. Одних трудные задания могут подтолкнуть
к учебе, других - оттолкнуть от нее. Подобная ориентация искажает результаты и в итоге,
снижает качество педагогического измерения. Если тест построен строго из заданий
возрастающей трудности, то этим открывается путь к созданию одной из самых
интересных шкал измерения - шкалы Л. Гутмана.
При определении теста уже отмечалось, что все задания теста, хотелось бы
подчеркнуть, независимо от содержания тем, разделов и от учебных дисциплин,
располагаются в порядке возрастающей трудности.
Распространенная, до недавнего
времени, рекомендация включать в тест больше заданий средней трудности, оправдана с
точки зрения определения надежности измерения по формулам т.н. классической теории
тестов. Существующие в этой теории методы оценки надежности теста дают снижение
надежности при включении в тест легких и трудных заданий. В то же время увлечение
Подготовлено ЦТ и МКО УГТУ-УПИ, 2005 г.
29