171
ГЛАВА 9: ОЦЕНКА
9.1 Введение
Под термином «оценка» в данной главе понимается оценка умений человека пользоваться языком. Все имеющиеся языковые тесты являются определенной формой оценки, однако, существует также много других форм (например, листки контроля, применяемые для оценки в течение длительного периода времени; неформальное наблюдение учителя), которые не могут быть отнесены к тестам. Понятие «оценивание» шире, чем «оценка». Все оценки - это форма оценивания, однако, в языковой программе оценивается не владение изучаемым языком, а некоторые другие аспекты, например, эффективность конкретных методов или материалов, тип и качество дискурса, успешность сотрудничества между учителем и учеником, эффективность обучения и т.д. В данной главе речь пойдет не о более широких вопросах оценивания программ, а об оценке.
Существуют три понятия, которые традиционно считаются основополагающими в обсуждении вопросов оценки: валидность, надежность и осуществимость. В данной главе необходимо осветить значение этих терминов, определить, как они соотносятся друг с другом и насколько они существенны для общепринятой шкалы уровней.
Валидность - концептуальное понятие, рассматриваемое в «Компетенциях». Тест или оценочные мероприятия могут характеризоваться как валидные, если они (всем своим содержанием) оценивают действительно тот аспект, который они должны оценивать, и если результаты оценки с точностью определяют уровень владения языком тестируемых.
Надежность, наоборот, является техническим термином. Она означает степень совпадения результатов тестирования групп учащихся одного уровня в двух отдельных (реальных или смоделированных) случаях проведения одних и тех же мероприятий по оценке.
В действительности, более важным, чем надежность, является точность определения результатов оценки, выводимой в соответствии с принятыми стандартами. Если результатом оценки выступают заключения типа «зачет/незачет» или определение уровня - Уровень А2+/В1/В/1+, то насколько точными можно считать эти заключения? Точность этих заключений будет зависеть от валидности самого стандарта (например, Уровень В1) для определенной ситуации. Также она будет зависеть от валидности критериев, используемых для принятия решения и валидности методов разработки этих критериев.
Если две разные организации или два региона используют критерии, относящиеся к одним стандартам, с целью оценить одни и те же умения, если сами стандарты валидны и соответствуют ситуациям и если стандарты последовательно используются при разработке оценочных заданий и при самой оценке выполнения этих заданий, то результаты в этих двух системах будут соотносимы друг с другом. Традиционно соотношение результатов двух тестов, направленных на оценку одного и того же, называется «совпадающая валидность». Это понятие, безусловно, связано с надежностью, так как ненадежные тесты не будут соотноситься друг с другом. Однако, что является более важным - это степень общности между двумя тестами с точки зрения того, что оценивается и как оценивается выполнение заданий.
172
Именно эти два вопроса рассматриваются в «Общеевропейских компетенциях». Следующий раздел посвящен трем основным способам использования «Компетенций»:
1.Для конкретизации содержания тестов и экзаменов:
2.Для установления критериев, определяющих степень достижения учебных целей:
3.Для описания уровней владения языком, определяемых с помощью имеющихся тестов и экзаменов, и таким образом позволяющих сравнивать результаты, полученные разными квалификационными системами:
|
что оценивается
как оценивается выполнение заданий
как можно осуществлять сравнение
|
Эти проблемы по-разному трактуются в разных видах оценки. Существует множество видов и традиций оценивания. Ошибочно полагать, что какой-либо один вид (например, публичный экзамен) безоговорочно важнее, чем другой подход (например, оценка учителя). Основное преимущество «Компетенций» состоит в том, что они позволяют соотносить разные формы оценки.
Третий раздел данной главы иллюстрирует возможность выбора разных видов оценки. Возможные альтернативы представлены в форме противоположных пар. В каждом случае даются определения использованных терминов и обсуждаются преимущества и недостатки каждого вида с точки зрения целей оценки в определенном образовательном контексте. Приводится обоснование использования той или иной альтернативы. Затем раскрывается релевантность «Компетенций» для данного вида оценки.
Процедура оценки должна быть практически осуществимой. Осуществимость особенно важна при тестировании речевого поведения. Те, кто оценивают, ограничены во времени. Они имеют перед глазами лишь небольшой образец речевого поведения, и в их распоряжении находится ограниченное число категорий и их типов, которые могут использоваться в качестве критериев. В «Компетенциях» сделана попытка установить отметки условных уровней, но сама монография не является инструментом оценки. «Компетенции» всеобъемлющи, но пользующиеся ими должны быть избирательны. Избирательность может означать использование более простой операционной схемы, которая сокращает число категорий, рассмотренных в «Компетенциях» в отдельности. Например, категории, используемые в иллюстративных шкалах дескрипторов, часто оказываются значительно проще по сравнению с категориями и языковыми примерами, приведенными в главах 4 и 5. В заключительном разделе этой главы раскрывается данный вопрос и приводятся примеры.
Достарыңызбен бөлісу: |