Калибровка дескрипторов для самооценки
К настоящему моменту в рамках проекта DIALANG было проведено только одно исследование, посвященное калибровке дескрипторов для самооценки. (Калибровка -это процесс, при котором при помощи статистических методов происходит определение уровня сложности положений, утверждений и т.д., с последующей организацией их в единую шкалу). Калибровка основывалась на выборке из 304 участников (проведение полного теста), которые также выполнили отдельные тесты в системе DIALANG для финского языка. Дескриптор для самооценки были
предоставлены участникам исследования либо на шведском языке (для 250-ти его носителей), либо на английском. Большинство участников могли также обращаться к финскому варианту дескрипторов2.
Полученные результаты были проанализированы при помощи программы OPLM (Verhelst et al. 1985; Verhelst and Glass 1995)3 . Результаты могут считаться положительными: более 90% дескрипторов могли быть шкалированы (то есть они «подходили» к использованной статистической модели). Три основные шкалы самооценки, которые были образованы на основе этой калибровки, являются однородными, о чем свидетельствуют высокие индексы надежности (альфа Кронбаха): 0.91 для чтения, 0.93 для аудирования и 0.94 для письма4 .
Сходная калибровка, основанная на подходе, разработанном группой анализа данных, будет произведена и при опробовании материалов для остальных тринадцати языков. Это позволит выяснить, могут ли быть воспроизведены результаты первого исследования и существует ли тенденция, ввиду которой отдельные дескрипторы с повторяющейся регулярностью больше подходят для проведения самооценки.
Хотя первая калибровка - единственное исследование подобного рода, важно отметить, что она подтверждает, насколько качественно сформулированы дескрипторы для самооценки на нескольких языках в рамках DIALANG. Возможность сделать такой вывод обусловлена тем, что участники исследования могли выбирать любой вариант дескрипторов для самооценки (английский, шведский, финский) или даже пользоваться всеми тремя одновременно, хотя большинство из них, скорее всего, предпочли шведский вариант. Благодаря тщательно разработанной процедуре перевода мы можем с уверенностью предположить, что дескрипторы для самооценки адекватно сформулированы на разных языках, хотя это предположение должно быть проверено в ходе других калибровочных исследований.
Дополнительное доказательство качества шкал, разработанных для самооценки в рамках проекта DIALANG - и в рамках «Общеевропейских компетенций» в целом -было получено д-ром Кафтандиевой путем соотнесения величин, указывающих на трудность тех или иных дескрипторов, входящих в настоящее исследование, с величинами для этих же дескрипторов, полученных в ходе другого исследования (North 1996/2000). Величина совпадения составила 0.83 или даже 0.897, если исключить один дескриптор, дающий на удивление низкое значение совпадения.
Документ Cl объединяет 107 дескрипторов для самооценки умений чтения, аудирования и письма, отобранных в результате калибровочного исследования на материале финского языка. Дескрипторы в каждой таблице организованы от самого простого к самому сложному. Дескрипторы, заимствованные не из «Общеевропейских компетенций», даны курсивом.
_____________________
2 Исследование было проведено в Центре прикладных лингвистических исследований в университете города Jzvâskzlâ, который являлся координационным центром проекта в 1996-1999 годах, рабочей группой по анализу полученных результатов в составе: Fellyanka Kastandijeva (председатель), Norman Verhelst, Sauli Takala, John de Jong и Timo Tôrmâkangas. Координационным центром на втором этапе проекта DIALANG является университет Freie, Берлин.
3 Программа OPLM представляет собой дальнейшее развитие методики Раша и позволяет калибруемым объектам различаться своими параметрами. Разница между этой моделью и моделью, основанной на соотношении двух параметров, заключается в том, что параметры различия не оцениваются, а вводятся как известные постоянные.
4 Когда дескрипторы калибровались в сочетании друг с другом, совпадение в рамках общей модели было достаточно значимым (р=0.26). Совпадение при калибровке отдельно для каждого вида деятельности также было значимым (р=0.10 для чтения, 0.84 для письма и 0.78 для аудирования).
Достарыңызбен бөлісу: |