(а) Данные, полученные качественными методами № 6, 7, 8, могут быть при помощи методики Раша описаны в виде арифметической шкалы.
(б) Могут быть разработаны тесты для того, чтобы упростить практическое применение дескрипторов, описывающих владение языком, в частности, в экзаменационных заданиях. Эти задания могут быть затем отшкалированы по методу Раша, и их значения на этой шкале будут выражать относительную трудность каждого дескриптора (Brown et al 1992; Carroll 1993; Masters 1994; Kirsch 1995; Kirsch and Mosenthal 1995).
207
(в) Дескрипторы могут использоваться как пункты опросника для оценки преподавателями знаний своих учащихся (Может он/она сделать X?). Таким образом, дескрипторы могут быть откалиброваны и размещены на арифметической шкале подобно тому, как задания в банке заданий классифицированы по уровню трудностей. • (г) На основании этой методики были разработаны шкалы дескрипторов, описываемых в главах 3, 4 и 5. Все три проекта, описываемые в приложениях В, С и D, использовали метод Раша для шкалирования дескрипторов и для установления соотношения полученных шкал между собой.
Помимо разработки шкал, метод Раша может быть использован для учета того, каким образом осуществляется практическое применение полученных шкал оценки. Это помогает уточнить нечеткие формулировки, определить, малы или наоборот излишне крупными являются применяемые отрезки шкалы и осуществить уточнение и пересмотр шкал (Davidson 1992; Milanovic et al 1996; Stansfield and Kenyon 1996; Tyndall and Kenyon 1996).
Рекомендуется обдумать и ответить на следующие вопросы:
• до какой степени оценки, выставляемые в их системе, обладают сходным значением ввиду использования одних и тех же определений;
• какие из вышеперечисленных методов и какие еще методы могут быть использованы для разработки и формулирования этих определений.
|
Библиография: разработка шкал языковой компетентности
Alderson, J.С. 1991: Bands and scores. In: Обсуждает проблемы, вызванные сме-Alderson, J.С. and North B. (eds.): шением цели и ориентации, и рассмат-Language testing in the 1990s London: puвaem вопросы разработки шкалы для British Council/Macmillan, Developments навыка устной речи в рамках IELTS.
in ELT, 71-86.
Brindley, G. 1991: Defining language Принципиальная критика положения о ability: the criteria for criteria. In: Anivan, том, что шкалы языковой компетен-S. (edj Current developments in language тности должны отражать оценку, опи-testing, Singapore, Regional опирающуюся на систему критериев.
Language Centre.
Brindley, G. 1998: Outcomes-based assess- Критикует описание результатов в
ment and reporting in language learning терминах того, какие действия уча-programmes, a review of the issues, щиеся могут совершать, а не в терми Language Testing 15(1), 45-85. нах того, какие языковые компетенции
они приобретают
Brown, Annie, Elder, Cathie, Lumley, Tom, Классическое применение метода Раша McNamara, Tim and McQueen, J. 1992: для шкалирования различных видов Mapping abilities and skill levels using тестовых заданий, используемых для оп-Rash techniques. Paper presented at the ре деления уровня владения навыком чте-
4th Language Testing Research Colloquium, ybz
Vancouver. Reprinted in Melbourne Papers
in Applied Linguistics 1/1, 37-69.
208
Carroll, J.B. 1993: Test theory and behavioural scaling of test performance. In: Frederiksen, N., Mislevy, R.J. and Bejar, I.I. (eds.) Test theory for a new generation of teats. Hillsdale N.J. Lawrence Erlbaum Associates: 297-323.
Chaloub-Deville M. 1995: Deriving oral assessment scales across different tests and rater groups. Language Testing 12(1), 16-33.
Davidson, F. 1992: Statistical support for training in ESL composition rating. In: Hamp-Lyons (éd.): Assessing second language writing in academic contexts. Norwood N.J. Ablex: 155-166.
Fulcher 1996: Does Thik description lead to smart tests? A data-based approach to rating scale construction. Language Testing 13 (2), 208-38.
Gipps, С 1994: Beyond testing. London, Falmer Press
Kirsch, I.S. 1995: Literacy performance on three scales: definitions and results. In: Literacy, economy and society: Results of the first international literacy survey. Paris, Organisation for Economic Cooperation and Development (OECD): 27-53.
Kirsch, I.S. and Mosenthal, P.B. 1995: Interpreting the IEA reading literacy scales. In Brincley, M., Rust, K. and Wingleee, M (eds.): Methodological issues in compa-
|
Ранняя статья, рекомендующая применение метода Раша для шкалирования разных видов тестовых заданий и создания шкал тестирования.
Исследование, выявляющее, какие критерии наиболее значимы для носителей арабского языка при оценке знания учащихся. Практически единственное применение метода многомерного шкалирования к языковому тестированию.
Четкая демонстрация того, каким образом подтвердить объективность оценочной шкапы путем ее проверки по методу Раша. В работе поддерживается «семантический» подход к шкалированию, а не «конкретный», принятый, например, в описательных дескрипторах.
Системный подход к разработке дескрипторов и шкал, который начинается с описания реального языкового поведения. Такой подход требует много времени.
Обоснование «ориентированной на требования» оценки деятельности преподавателя во взаимосвязи с системой общеевропейских компетенций, полученное в ходе взаимодействия и совместной работы участников (networking). Обсуждение проблем, вызванных нечеткой формулировкой дескрипторов в школьной программе Великобритании по английскому языку. Сравнение различных программ.
Упрощенное описание сложного применения методики Раша для построения шкалы на основе опытных данных. Метод, разработанный для предсказания и объяснения трудностей, связанных с новыми тестами в зависимости от заданий и уровней - т.е., относительно системы Общеевропейских компетенций.
Более подробная и технически сложная версия предыдущей статьи, отслеживающая развитие метода в ходе трех взаимосвязанных проектов.
|
209
rative education studies: The case of the IEA reading literacy study. Washington D.C.: US Department of Education, National Center for Education Statistics: 135-192.
Linacre J.M. 1989: Multi-faceted Measurement. Chicago: MESA Press.
Liskin-Gasparro, J.E. 1984: The ACTFL proficiency guidelines: Gateway to testing and curriculum. In: Foreign Language Annals 17/5,475-489.
Lowe, P. 1985: The ILR proficiency scale as a synthesising research principle: the view from the mountain. In: James, C.J. (éd.): Foreign Language Proficiency in the Classroom and Beyond/ Lincolnwood (111.): National Textbook company.
Lowe, P. 1986: Proficiency: panacea, framework, process? A Reply to Kramsch, Schulz, and particulary, to Bachman and Savignon. In: Modern Language Journal 70/4, 391-397.
Masters, G. 1994: Profiles and assessment. Curriculum Perspectives 14,1 48-52.
Milanovic, M., Saville, N. Pollitt, A. and Cook, A. 1996: Developing rating scales for CASE: Theoretical coserns and analyses. In Cumming, A. and Berwick, R. Validation in language testing. Clevedon, Avon, Multimedia Matters: 15-38.
Mullis, I.V.S. 1981: Using the primary trait system for evaluating writing. Manuscript # 10-W-51. Princeton N.J.: Educational Testing Service.
|
Новое слово в статистике, показывающее, что при подведении итогов оценки необходимо принимать во внимание суровость экзаменатора. Методика была применена в проекте, разрабатывающем иллюстративные дескрипторы, которые бы установили соотношение между уровнями языковой компетенции и годом обучения в школе.
Обзор цели и развития американской шкалы ACTFL на основе шкалы, применяемой в институте подготовки дипломатических кадров. (Foreign Service Institute).
Подробное описание разработки американской шкалы ILR на основе шкалы, применяемой в институте подготовки дипломатических кадров (Foreign Service Institute). Функции шкалы.
Защита системы, которая надежно работала — в определенном контексте, — вопреки теоретической критике, вызванной распространением ее методики опроса в образовании (шкала ACTFL).
Краткий обзор того, каким образом метод Раша использовался для шкалирования результатов тестов и результатов оценки преподавателей для разработки систем описания школьной программы (profiling) в Австралии.
Классическое описание применение метода Раша для уточнения шкалы, использованной при оценке навыков говорения, — с уменьшением общего количества уровней на шкале и повышением эффективности ее использования.
Классическое описание применения метода первичных черт для разработки шкалы оценки навыка письма в родном языке.
|
210
North, В. 1993: The development of descriptors on scales of proficiency: perspectives, problems, and a possible methodology. NFLC Occasional Paper, National Foreign Language Center, Washington D.C., April 1993.
North, B. 1994: Scales of Language proficiency: a survey of some existing systems. Strasbourg, Council of Europe CC-LANG (94) 24.
North, B. 1996/2000: The development of a common framework scale of language proficiency. PhD thesis, Thames Valley University. Reprinted 2000, New York, Peter Lang.
North, B. forthcoming: Scales for rating language performance in language tests: descriptive models, formulation styles and presentation formats. TOEFL Research Paper. Princeton N.J.; Educational Testing Service.
North, B. and Schneider, G. 1998: Scaling descriptors for language proficiency scales. Language Testing 15/2 217-262.
Pollitt, A. and Murray, N.L. 1996: What raters really pay attention to. In Milanovic, M. And Saville, N. (eds.) 1996: Performance testing, cognition and assessment. Studies in Language Testing 3. Selected papers from the 15-th Language Testing Research Colloquium, Cambridge and Arnhem, 2-4 August 1993. Cambridge: University of Cambridge Local Examinations Syndicate: 74-91.
|
Обсуждение и критика содержания и методов разработки традиционных шкал оценки уровня знаний. Изложение основных положений проекта, в рамках которого преподаватели бы разработали описательные дескрипторы и осуществили бы их шкалирование по методу Раша на основе результатов оценки преподавателей.
Подробный обзор шкал, применяемых в разных программах, и шкал, подвергнутых впоследствии анализу и использованных в качестве основы для разработки описательных дескрипторов.
Описание шкал оценки уровня знаний, обсуждение того, как шкалы связаны с моделями языковой компетенции и использованием языка. Описание этапов проекта, в ходе которого были разработаны описательные дескрипторы, — проблемы и решения.
Подробный анализ и исторический обзор разных видов шкал оценки, используемых при проверке говорения и письма: достоинства, недостатки и т. д.
Общий обзор проекта, в ходе которого были разработаны описательные дескрипторы. Обсуждение результатов и стабильности шкал. В приложении содержатся примеры использованных средств и полученных результатов.
Интересная методологическая статья, устанавливающая соответствия между анализом перечня навыков и умений и простой процедурой шкалирования с тем, чтобы выяснить, что именно оказывается в центре внимания при проведении тестирования на разных уровнях владения языком.
|
211
Scarino A. 1996: Issues in planning, describing and monitoring long-term progress in language learning. In Proceedings of the AFMLTA 10th National Languages Conference: 67-75.
Scarino A. 1997: Analysing the language of frameworks of outcomes for foreign language learning. In Proceedings of the AFMLTA 11th National Languages Conference: 241-258.
Schneider, G. and North, B. 1999: «In anderen Sprachen kann ich... «Skalen zur Beschreibung, Beurteilung undSelbstemschatzung der fremdsprachlichen Kommumkationsfahigkeit» Bern/ Aarau: NFP 33/SKBF (Umsetzungsbericht).
Schineider, G. and North, B. 2000: «Dans d'autres langues, je suis capable de... «Echelles la description, l'évaluation et l'auto-evaluation des competences en langues étrangères.» Berne/Aarau: PNR33/CSRE (rapport de valorisation).
Schneider, G. and North, В. 2000: Fremdsprachen konnen - Was heisst das? Scalen zur Beschreibung, Beurteilung und Selbstemschatzung der fremdsprachlichen Kommumkationsfahigkeit. Chur/Ziirich, Verlag Riiegger AG.
Skehan, P. 1984: Issues in the testing of English for specific purposes. In: Language Testing 1/2, 202-220.
Shohamy, E., Gordon, CM. and Kraemer, R. 1992: The effect of raters' background and training on the reliability of direct writing tests Modern Language Journal 76: 27-33.
Smith, P.C. and Kendall, J.M. 1963: Retranslation of expectations: an approach to the construction of unambiguous anchors for rating scales. In: Journal of Applied Psychology, 47/2.
|
Критикует использование расплывчатых формулировок и недостаток информации о том, насколько хорошо учащиеся владеют языком, что характерно для типичных английских и австралийских учебных программ оценки квалификации преподавателей.
См. выше.
Краткий доклад о проекте, в результате которого были созданы описательные шкалы. Также представляет швейцарскую версию языкового портфеля (40 страниц формата А5).
См. выше.
Полный доклад о проекте, в результате которого были созданы описательные шкалы. Подробная статья о шкалировании на английском языке. Также представляет швейцарскую версию языкового портфеля.
Критика формулировок в рамках программы ELTS, которые описывают уровни в отношении к норме и друг к другу.
Простое описание исходного качественного метода разработки шкалы для проверки навыка аналитического письма. Ошеломляющая надежность этого метода при сравнении результатов оценки навыка, выполненной людьми неподготовленными и далекими от преподавания.
Первая попытка отшкалировать сами дескрипторы вместо организации их в шкалы. Первая статья в рамках нового направления. Трудна для чтения.
|
212
Stansfield C.W. and Kenyon D.M. 1996: Comparing the scaling of speaking tasks by language teachers and the ACTFL guidelines. In Cumming, A. and Berwick, R. Validation in language testing. Clevedon, Avon, Multimedia Matters 124— 153.
Takala, S. and Kaftandijeva (forthcoming). Council of Europe scales of language proficiency: A validation study. In J.C. Alderson (Ed.) Case studies of the use of the Common European Framework. Council of Europe.
Tyndall, B. and Kenyon, D. 1996: Validation of a new holistic rating scale using Rasch multifaceted analysis. In Cumming, A. and Berwick, R. Validation in language testing Clevedon, Avon, Multimadia Matters 9-57.
Upshur, J. and Turner, С 1995: Constructing rating scales for second language tests. English Language Teaching Journal 49(1), 3-12.
Wilds, C.P. 1975: The oral interview test. In: Spolsky, B. And Jones, R. (eds.): Testing language proficiency. Washington D.C.: Center for Applied Linguistics, 29-44.
|
Применение метода Раша для подтверждения правильности порядкового расположения заданий, включенных в программы ACTFL. Интересная методика исследования, которая впоследствии была применена к разработке описательных дескрипторов.
Доклад о применении модели, созданной на основе метода Раша, к адаптированию описательных дескрипторов для создания шкалы самооценки языковых навыков. На примере проекта DIALANG (практическая проверка шкал, разработанных для финского языка).
Простое описание практической проверки шкалы оценки для теста ESL, используемого на вступительной беседе при поступлении в университет. Классический способ многомерного применения метода Раша для определения областей, в которых требуется дополнительное обучение.
Комплексная дальнейшая разработка метода первичных черт для разработки проверочных таблиц, основанных на методе бинарных оппозиций.
Исходная публикация, посвященная самой первой шкале оценки уровня языковой компетенции. Имеет смысл прочитать эту работу для того, чтобы увидеть некоторые нюансы, утерянные в последующих подходах, основанных на разных формах опроса.
|
213
ПРИЛОЖЕНИЕ В: ИЛЛЮСТРАТИВНЫЕ ШКАЛЫ
ДЕСКРИПТОРОВ
Это Приложение содержит описание швейцарского проекта, в ходе которого были разработаны иллюстративные дескрипторы для «Общеевропейских компетенций». В него также включены категории, которые подвергались шкалированию с указанием тех страниц, где они встречаются в основном документе. В ходе данного проекта дескрипторы были шкалированы и использованы для создания уровней в рамках «Общеевропейских компетенций» с помощью метода № 12в (моделирование по методу Раша), описанного в заключительной части Приложения А.
ШВЕЙЦАРСКИЙ ИССЛЕДОВАТЕЛЬСКИЙ ПРОЕКТ
Постановка задачи и общее описание
Шкалы дескрипторов, описываемые в главах 3, 4 и 5, были разработаны в результате проекта, осуществленного под эгидой Швейцарского национального совета по вопросам научных исследований в период с 1993 по 1996 год. Этот проект был реализован в соответствии с решениями, принятыми на симпозиуме в Рюшликоне в 1991 году. Его целью было разработать четкие описания языковых компетенций, а также возможно способствовать развитию Европейского языкового портфеля.
Исследование 1994 года рассматривало вопросы речевого взаимодействия и продуцирования речи и было ограничено проблемами обучения английскому языку как иностранному, а также вопросами оценки уровня знаний преподавателями. Исследование 1995 года частично повторяло исследование 1994 года, добавив проблему восприятия, но наряду с английским языком в него были включены также немецкий и французский. Вопросы оценки знаний преподавателями были расширены за счет рассмотрения процедур самооценки и изучения материалов некоторых экзаменов (Cambridge; Goethe; DELF/DALF).
В обоих исследованиях приняли участие почти 300 преподавателей и около 2800 учащихся, представляющих почти 500 различных классов. Учащиеся средней школы (начального этапа обучения и старших классов), учащиеся профессионально-технических учебных заведений и взрослые учащиеся были представлены в следующей пропорции.
|
Средняя школа, начальный этап
|
Средняя школа, старшие классы
|
Проф.-техн. учебные заведения
|
Взрослые учащиеся
|
1994
|
35%
|
19%
|
15%
|
31%
|
1995
|
24%
|
31%
|
17%
|
28%
|
В исследовании принимали участие преподаватели, проживающие в кантонах Швейцарии, где преобладает немецкий, французский, итальянский и ретророманские языки соответственно, хотя количество участников из двух последних областей было ограничено. Четверть преподавателей, участвовавших в исследовании, в год его проведения преподавали родной язык. Преподаватели заполняли анкеты на языке, который служил материалом исследования. Таким образом, в 1994 году используемые дескрипторы были сформулированы лишь на английском языке, в то время как в 1995 году анкеты были составлены на английском, французском и немецком.
214
Методика исследования
Вкратце методику исследования можно представить следующим образом:
Начальный этап:
1. Детальный анализ шкал уровней владения языком, используемых в преподавательской деятельности или полученных от Совета Европы в 1993 году; список приводится в конце обзора.
2. Вычленение из этих шкал описательных категорий, связанных с категориями, перечисленными в главах 4 и 5 для того, чтобы создать единый перечень классифицированных и отредактированных дескрипторов.
Качественный анализ:
3. Категориальный анализ записей заседаний, на которых преподаватели обсуждали и сравнивали результаты владения языком учащихся, продемонстрированные посредством видеозаписей, чтобы удостовериться, что разработанная система терминологии адекватно отражает обсуждаемое содержание.
4. 32 семинара с преподавателями, которые (а) классифицировали дескрипторы в соответствии с категориями, требующими описания, (б) характеризовали эти описания с точки зрения их ясности, точности и значимости для категорий, (в) распределяли дескрипторы между различными уровнями владения языком.
Этап количественных подсчетов:
5. Оценка знаний и умений учащихся по окончании учебного года при помощи взаимосвязанной цепочки анкет, составленных из дескрипторов, которые на предыдущем этапе были признаны наиболее ясными, точными, значимыми. На первом году исследования была использована серия из 7 анкет, включающих по 50 дескрипторов каждая, на основании которых была проведена оценка знаний учащихся в диапазоне от начинающих с 80-ю часами английского языка до учащихся продвинутого этапа.
6. На втором году исследования была использована другая цепочка из 5 анкет. Общим для обоих исследований является то, что одни и те же дескрипторы были использованы для оценки умения устного общения. Учащимся выставлялась оценка от 0 до 4 по шкале, описывающей отношение к условиям общения, при которых от говорящих следовало ожидать поведения, соответствующего описанному в дескрипторе. То, как преподаватели интерпретировали дескрипторы, было проанализировано по методу Раша. Этот анализ преследовал две цели:
(а) математически рассчитать «уровень трудности» для каждого дескриптора;
(б) выявить статистически значимую вариативность в интерпретации дескрипторов по отношению к разным типам учебных заведений, к географическим областям, различающимся своим языком, и к преподаваемому языку с тем, чтобы выявить дескрипторы, обладающие высокой стабильностью своего значения в разных ситуациях, и в дальнейшем использовать их для разработки холистических шкал, описывающих общеевропейскую систему уровней.
7. Оценка видеозаписи языкового поведения некоторых учащихся всеми участвующими преподавателями. Целью этой оценки было количественно описать
215
разницу в степени строгости оценки одного учащегося разными учителями с тем, чтобы учесть эту вариативность при определении диапазона результатов обучения.
Этап интерпретации результатов:
8. Выделение границ между отдельными дескрипторами на общей шкале с тем, чтобы создать систему уровней «Общеевропейских компетенций», описанных в главе 3, обобщение этих уровней в виде единой холистической шкалы (Таблица 1 ), Таблица для самооценки, описывающая виды языковой деятельности (Таблица 2), и Таблица оценки языкового поведения, описывающая различные аспекты коммуникативной компетенции (Таблица 3).
9. Введение иллюстративных шкал в главах 4 и 5 для тех категорий, которые могли быть шкалированы.
10. Приспособление дескрипторов для их использования в листах самооценки с тем, чтобы создать пробный швейцарский вариант языкового портфеля. Он включает: а) листы для самостоятельной оценки навыков аудирования, говорения, устного общения, продуцирования речи, письма (Таблица 2); б) контрольные листы самооценки для каждого из уровней «Общеевропейских компетенций».
11. Заключительная конференция, на которой были представлены результаты исследования, обсудила опыт создания языкового портфеля, и преподаватели были ознакомлены с системой уровней «Общеевропейскими компетенций».
Результаты
Шкалирование дескрипторов для различных языковых умений и различных видов языковой компетенции (лингвистической, прагматической, социокультурной) упирается в вопрос о том, возможно ли объединить оценку этих различных аспектов в рамках единой измерительной системы. Эта проблема не связана с использованием модели Раша, а присуща всем видам статистического анализа. Однако использование методики Раша предполагает очень строгий отбор категорий. Результаты экспериментов, данные, полученные при преподавательской оценке владения языком, и данные, полученные при самооценке, могут давать различные результаты при интерпретации. В процессе оценки учителями языковых компетенций учащихся некоторые категории оказались неудачными и были изъяты из общего перечня категорий. К ним относятся:
а) социокультурная компетенция
Эти дескрипторы описывают социокультурную и социолингвистическую компетенцию. Неясно, были ли проблемы вызваны а) отличием этого явления от языковой компетенции; б) нечетко сформулированными дескрипторами, которые были отмечены как неудачные в ходе семинаров; или в) непоследовательными ответами преподавателей, проводивших оценку и не обладавших достаточными знаниями об оцениваемых учащихся. Эта проблема затронула дескрипторы, описывающие умения читать и оценивать достоинства художественной литературы.
б) языковые умения, необходимые для профессиональной деятельности
Эти дескрипторы требовали от преподавателей высказывать догадки относительно языковых умений (в основном связанных с профессиональной деятельностью),
216
выходящих за пределы непосредственно наблюдаемых ими навыков в учебных аудиториях, как-то: телефонные звонки; участие в деловых встречах и заседаниях; проведение официальных презентаций; написание эссе и докладов; ведение официальной переписки. Эти проблемы возникали несмотря на участие в проекте взрослых учащихся и учащихся профессионально-технических учебных заведений.
в) отрицательные понятия
Сюда включены дескрипторы, которые потребовали более упрощенной формулировки, разъяснения или повтора, и которые включают в себя отрицательные понятия. Такие дескрипторы воспринимались лучше, когда их включали в формулировки, содержащие позитивные положения, в качестве дополнительных условий, например:
В основном понимает обращенную к нему/ней разборчивую нормативную речь при обсуждении знакомых тем, при условии, что он/она может время от времени просить повторить или переформулировать отдельное высказывание.
Для преподавателей, участвующих в исследовании, оказалось, что чтение должно оцениваться по отдельной шкале в отличие от устного общения и порождения речи. Однако принципы отбора данных позволили шкалировать чтение отдельно и затем соотнести шкалу для чтения с основной шкалой по окончании проекта. Письменным навыкам не уделялось большого внимания, а дескрипторы, описывающие порождение письменной речи (см. глава 4), были разработаны на основании дескрипторов, описывающих порождение устной речи. Относительно высокая стабильность количественных значений на шкале для чтения и письма, что указывается в «Общеевропейских компетенциях» и подтверждается проектами DIALANG и ALTE (см. Приложения С и D, соответственно), позволяет заключить, что подходы, примененные к оценке умений чтения и письма, в целом были достаточно эффективными.
Трудности с вышеупомянутыми категориями связаны с проблемой выбора между одно- и многомерным шкалированием. Однако больше трудностей в этом плане было вызвано не многомерностью шкалирования, а контингентом учащихся. Было несколько случаев, в которых трудности, вызываемые каким-либо дескриптором, зависели от учебной аудитории. Например, преподаватели предполагают, что взрослые учащиеся на начальном этапе понимают задания из «реальной жизни» легче, чем 14-летние подростки. С интуитивной точки зрения это должно быть правильно. Такое различие может быть описано как «дифференциальная функция понятия» (ДФП). Дескрипторы, обладающие ДФП, по возможности, были исключены из системы уровней «Общеевропейских компетенций», включенных в Таблицы 1 и 2 в главе 3. Не было отмечено значительного влияния со стороны изучаемого языка и никакого влияния со стороны родного языка, за исключением того, что преподаватели родного языка могут более строго интерпретировать термин «понимание» на продвинутых этапах, особенно при изучении литературы.
Применение
Описательные дескрипторы, перечисленные в главах 4 и 5, были либо (а) помещены на тот уровень, на котором этот дескриптор был откалиброван непосредственно в ходе исследования; (б) созданы путем перекомбинирования элементов дескрипторов, откалиброванных для этого уровня в ходе исследования, или (в) отобраны на основании результатов качественного этапа (семинары) или (г)
217
сформулированы на стадии интерпретации для того, чтобы заполнить пробел на созданной эмпирическим путем вспомогательной шкале. Последнее положение относится почти исключительно к уровню владения языка в совершенстве, для которого в исследование было включено незначительное количество дескрипторов.
Дальнейшие исследования
Проект Базельского университета в 1999-2000 гг. скорректировал дескрипторы «Общеевропейских компетенций» для контрольных листов самооценки для поступающих в университет. Также были подкорректированы дескрипторы, касающиеся социолингвистической компетенции и описывающие умение конспектирования университетских лекций. С помощью методики, примененной в первом проекте, было установлено соответствие между новыми дескрипторами и системой уровней «Общеевропейских компетенций», и эти новые дескрипторы были включены в новое издание «Общеевропейских компетенций». Соотношение между значениями шкалы в исходной системе дескрипторов для «Общеевропейских компетенций» и в системе, включенной в данное издание, составляет 0,899.
Ссылки на литературу:
North, В. 1996/2000: The development of a Common Framework scale of language proficiency. PhD thesis, Thames Valley University. Reprinted 2000, New-York, Peter Lang.
North, B.forthcoming: Developing descriptor scales of language proficiency for the CEF Common Reference Levels. In J.C.Alderson (ed.) Case studies of the use of the Common European Framework. Council of Europe.
North, B. forthcoming: A CEF-based self-assessment tool for university entrance. In J.C.Alderson (ed.) Case studies of the use of the Common European Framework. Council of Europe.
North, B. and Schneider, G. 1998: Scaling descriptors for language proficiency scales. Language Testing 15/2:217-262.
Schneider and North 1999. «In anderen Sprachen kann ich»... Skalen zur Beschreibung, Beurteilung und Selbsteinschatzung der fremdsprachlichen Kommunikationsfahigkeit. Berne, Project Report, National Research Programme 33, Swiss National Science Research Council.
Дескрипторы для «Общеевропейских компетенций»
В дополнение к таблицам, включенным в главу 3 для обобщения системы уровней «Общеевропейских компетенций», описательные дескрипторы включены в тексты глав 4 и 5 следующим образом.
218
Документ В1. Описательные шкалы в главе 4: коммуникативные виды
Деятельности
ВОСПРИЯТИЕ
|
Устное
|
• Аудирование
• Понимание беседы между носителями языка
• Непосредственное аудирование, будучи участником аудитории
• Прослушивание объявлений и инструкций
• Прослушивание радио- и аудиозаписей
|
Аудиовизуальное
|
• Просмотр ТВ и кинофильмов
|
Письменное
|
• Чтение
• Чтение корреспонденции
• Чтение для ориентации
• Чтение для информации и дальнейшего аргументирования
• Чтение инструкций
|
ВЗАИМОДЕЙСТВИЕ
|
Устное
|
• Устное общение
• Понимание при общении
• Понимание собеседника - носителя языков
• Беседа
• Неформальное обсуждение
• Формальное обсуждение (деловая встреча)
• Взаимодействие для достижения цели
• Приобретение товаров и услуг
• Обмен информацией
• Интервьюирование и участие в интервью в качестве интервьюируемого
|
Письменное
|
• Общение в письменном виде
• Обмен корреспонденцией
• Записки, короткие сообщения, заполнение форм
|
ПОРОЖДЕНИЕ
|
Устное
|
• Порождение устной речи
• Продолжительный монолог: описание опыта
• Продолжительный монолог: изложение своей позиции (например, в рамках дебатов)
• Публичные объявления
• Обращение к аудитории
|
Письменное
|
• Порождение письменной речи
• Письменное творчество
• Написание докладов и эссе
|
Документ В2. Описательные шкалы в главе 4: коммуникативные стратегии
ВОСПРИЯТИЕ
|
• Понимание подсказок и намеков
|
ВЗАИМОДЕЙСТВИЕ
|
• Вступление в беседу
• Сотрудничество
• Запрос уточнения/пояснения
|
ПОРОЖДЕНИЕ
|
• Планирование
• Подбор альтернативного варианта выражения мысли при недостаточном словарном запасе
• Контроль за своей речью и исправление ошибок
|
219
Документ ВЗ. Описательные шкалы в главе 4: работа с текстом
Документ В4. Описательные шкалы в главе 5: компетенции языкового общения
ЛИНГВИСТИЧЕСКИЕ Диапазон
|
• Общий диапазон
• Словарный запас
|
Контроль
|
•
•
•
•
|
Грамматическая точность
Контроль за употреблением словаря
Фонологический контроль
Орфографический контроль
|
СОЦИО-ЛИНГВИСТИЧЕСКИЕ
|
•
•
•
•
•
•
•
|
Социолингвистические
Гибкость
Вступление в беседу - повторное
Развитие темы
Связность
Точность построения пропозиций
Беглость речи
|
ПРАГМАТИЧЕСКИ Е
|
Документ В5. Последовательность при калибровке дескрипторов
Положение, которое тот или иной дескриптор занимает на шкале, демонстрирует высокую степень последовательности. В качестве примера можно привести понятие топика, темы. Для этого понятия специальные дескрипторы не вводились, но ссылка на топики была сделана в дескрипторах для самых разных категорий. Три наиболее важные категории - Описание и рассуждение, Обмен информацией и Диапазон.
Нижеприведенные таблицы сравнивают то, каким образом топики рассматриваются в рамках этих трех категорий. Хотя содержание трех различных схем не одинаково, при сравнении можно выявить значительную степень последовательности, проявляющейся через набор шкалированных дескрипторов. Подобный анализ послужил основой для формулирования дескрипторов для категорий, не включенных в исходное исследование (например, Публичные объявления). Эти дескрипторы были образованы путем перекомбинирования компонентов дескрипторов.
ПОВЕСТВОВАНИЕ И ОПИСАНИЕ
|
AI
|
А2
|
В1
|
В2
|
Cl
|
С2
|
•Где
они
живут
|
• Люди,
внешность
• Социальное
положение,
работа
• Место и условия проживания
|
• Имущество,
домашние
животные
• События,
действия
• Предпочтения
• Планы, договоренности
•Привычки •Личный опыт
|
• Сюжет книги/
фильма
• Личный опыт
• Отношение к
первым двум
пунктам
• Мечты, планы, чаяния
• Умение сочинить рассказ
|
• Основные
подробности
непредсказуе
мого события,
например,
несчастного случая
|
|
• Ясное
детальное
описание
сложных
предметов
/тем
|
|
220
ОБМЕН ИНФОРМАЦИЕЙ
|
Al
|
А2
|
В1
|
В2
|
Cl
|
С2
|
•О себе и других
• Дом
• Время
|
• Простые повторяющиеся действия
• Отдельные аспекты профессиональной
деятельности и досуга
|
• Простые инструкции, объяснения как проехать
•Занятия, привычки, повторяющиеся действия
• Действия в прошлом
|
• Подробные объяснения как проехать
|
• Накопленная фактическая информация в той или иной области
|
|
|
|
ДИАПАЗОН: ПАРАМЕТРЫ
|
AI
|
А2
|
В1
|
В2
|
Cl
|
С2
|
|
• Основные обычные потребности
• Предсказуемые потребности для выживания
•Сообщение информации о себе, своих привычках, распорядке дня, запрос информации
|
•Повседневные обыденные действия
• Знакомые темы и ситуации
•Повседневные ситуации с предсказуемым содержанием
|
• Большинство тем из повседневной жизни: хобби, интересы, работа, поездки, текущие события
|
|
|
|
|
Документ В4. Шкалы уровней языковой компетенции, используемые
в качестве первоисточников
Холистические шкалы говорения
• Hofmann: Levels of Competence in Oral Communication 1974
• University of London School Examination Board: Certificate of Attainment -Graded Tests 1987
• Ontario ESL Oral Interaction Assessment Bands 1990
• Finnish Nine Level Scale of Language Proficiency 1993
• European Certificate of Attainment in Modern Languages 1993
Шкалы для различных видов коммуникативной деятельности
• Trim: Possible Scale for a Unit/Credit Scheme Skills 1978
• North: European Language Portfolio Mock-up: Interaction Scales 1991
• Eurocentres/ ELTDU Scale of Business English 1991
• Association of Language Testers in Europe, Bulletin 3, 1994
Шкалы для четырех умений
• Foreign Service Institute Absolute Proficiency Ratings 1975
• Wilkins: Proposals for Level Definitions for a Unit/Credit Scheme: Speaking 1978
• Australian Second Language Proficiency Ratings 1982
221
• American Council on the Teaching of Languages Proficiency Guidelines 1986
• Elviri et al: Oral Expression (in van Ek 1986)
• Interagency Language Roundtable Language Skill Level Descriptors 1991
• English Speaking Union (ESU) Framework Project: 1989
• Australian Migrant Education Program Scale (Listening only)
Шкалы для оценки умений устной речи
• Dade County ESL Functional Levels 1978
• Hebrew Oral Proficiency Rating Grid 1981
• Carroll В J. and Hall P.J. Oral Interaction Assessment Scale 1980
• International English Testing System (IELTS): Band Descriptors for the Speaking and Writing 1990
• Goteborgs Univeritet: Oral Assessment Criteria
• Fulcher: The Fluency Rating Scale 1993
Описание учебных программ и критерии оценки достижений при завершении курса в учебных заведениях различного уровня
• University of Cambridge/Royal Society of Arts Certificates in Communicative Skills in English 1990
• Royal Society of Arts Modern English Examinations: French 1989
• English National Curriculum: Modern Languages 1991
• Netherlands New Examinations Programme 1992
• Eurocentres Scale of Language Proficiency 1993
• British Language Lead Body: National Language Standarts 1993
222
ПРИЛОЖЕНИЕ С: ШКАЛЫ DIALANG
В данном приложении рассматривается система оценки уровня владения языком DIALANG, которая является дополнением к системе «Общеевропейских компетенций» для проведения различного ряда диагностических мероприятий. В Приложении основное внимание уделяется утверждениям, используемым для самооценки, и процедуре их калибровки, выполненной в ходе создания системы DIALANG. Приложение также включает две взаимосвязанные описательные шкалы, которые основываются на системе «Общеевропейских компетенций» и используются для информирования тестируемых учащихся о результатах и для объяснения этих результатов. Дескрипторы, используемые в рамках этого проекта, были шкалированы и приведены в соответствие с уровнями «Общеевропейских компетенций» при помощи метода № 12в (моделирование по методу Раша), описанного в конце приложения А.
ПРОЕКТ DIALANG
Система оценки DIALANG
DIALANG - это система оценки, предназначенная для изучающих иностранные языки и желающих получить диагностическую информацию относительно своего уровня владения языком. Проект DIALANG осуществляется при финансовой поддержке Европейской комиссии, Главного управления образования и культуры (программа SOCRATES, LINGUA мероприятие D).
Система включает листы самооценки, языковые тесты и материалы для объяснения полученных результатов, подготовленные на четырнадцати европейских языках: датском, голландском, английском, финском, французском, немецком, греческом, исландском, ирландском, итальянском, норвежском, португальском, испанском и шведском. DIALANG можно бесплатно получить из интернета.
Система оценки DIALANG и описательные шкалы, используемые для сообщения результатов пользователям непосредственно основаны на системе «Общеевропейских компетенций». Дескрипторы для самооценки, используемые в системе DIALANG, были в основном заимствованы из системы «Общеевропейских компетенций» и адаптированы к специфическим потребностям данной системы.
Предназначение DIALANG
DIALANG предназначена для взрослых пользователей, желающих определить свой уровень владения иностранным языком и получить подробное описание сильных и слабых сторон своих языковых умений. Эта система также позволяет учащимся понять, каким образом они могут улучшить свои языковые навыки, и, более того, она формирует осознанное представление о таких понятиях, как изучение иностранных языков и уровень владения языком. В рамках этой системы сертифицирование не производится.
Основными пользователями системы DIALANG являются, таким образом, учащиеся, изучающие язык самостоятельно или в рамках учебного заведения. Однако преподаватели иностранных языков также могут найти что-нибудь полезное для себя в рамках системы DIALANG.
223
Процедура оценки в рамках системы DIALANG
Процедура оценки в рамках системы DIALANG включает следующие этапы:
1. Выбор языка, на котором будут даваться инструкции и оценка (14 возможных языков)
2. Регистрация
3. Выбор языка, уровень владения которым будет тестироваться (14 возможных языков)
4. Тест на определение словарного запаса
5. Выбор умения (чтение, аудирование, письмо, словарь, грамматика)
6. Самооценка (только для чтения, аудирования, письма)
7. Предварительная оценка уровня знаний учащегося
8. Проведение теста соответствующего уровня сложности
9. Результаты и комментарии
Войдя в систему, учащиеся прежде всего выбирают язык, на котором они хотят получать инструкции, результаты оценки и комментарии. После регистрации им предъявляется тест для первичного определения уровня их знаний, который одновременно оценивает их словарный запас. После выбора навыка, который пользователи хотят подвергнуть тестированию, но до выполнения выбранного теста им предоставляется ряд дескрипторов для самооценки. Эти дескрипторы непосредственно относятся к тестируемому умению, и пользователи должны решить, умеют ли они выполнять действия, описываемые в каждом утверждении. Система DIALANG не предоставляет вопросы для самооценки в таких областях, как словарный запас и грамматика, несмотря на то, что тестирование этих знаний возможно. Это связанно с тем, что относящиеся к данным областям положения отсутствуют в системе «Общеевропейских компетенций». По окончании теста, в рамках комментария учащимся сообщается, совпадает ли их уровень по результатам тестирования DIALANG с их самооценкой. Здесь же учащимся предлагаются возможные объяснения, почему могло возникнуть некоторое расхождение.
Предназначение самооценки в рамках системы DIALANG
Система DIALANG использует листы самооценки по двум причинам. Во-первых, самооценка - это важный вид деятельности. Считается, что оценка собственных знаний развивает стремление к самостоятельному изучению предмета, дает учащимся дополнительный контроль над процессом обучения и делает его более осознанным.
Во-вторых, система использует тест на определение словарного запаса и результаты самооценки для предварительного установления уровня знаний учащегося, а затем направляет его/ее на выполнение того теста, который наилучшим образом соответствует его/ее способностям.
ШКАЛЫ САМООЦЕНКИ В СИСТЕМЕ DIALANG
Источники
Большая часть положений в листах самооценки, используемых в рамках DIALANG, была взята из англоязычной версии «Общеевропейских компетенций» (вариант 2, 1996). Таким образом, в системе DIALANG «Общеевропейские компетенции» применяются непосредственно для оценки уровня знаний.
224
Качественный этап разработки
Рабочая группа по вопросам самооценки в рамках DIALANG1 изучила положения «Общеевропейских компетенций» и отобрала те из них, которые представлялись наиболее ясными, простыми и конкретными; также во внимание были приняты эмпирические результаты исследования North 1996/2000. Для чтения, аудирования и письма было отобрано более сотни положений. Помимо них были отобраны и положения для оценки говорения, но так как говорение не оценивается в рамках существующей системы DIALANG, эти дескрипторы не были включены в изучение объективности и применимости разработанной системы, и поэтому они не входят в настоящее Приложение.
Формулировка положений была изменена с «Может/Умеет» на «Я могу/умею», поскольку они должны использоваться для самооценки, а не для оценки преподавателем знаний учащихся. Некоторые дескрипторы были изменены для простоты использования; несколько новых утверждений было создано специально для DIALANG, поскольку в рамках «Общеевропейских компетенций» эти разделы не были разработаны настолько подробно, насколько это требуется для данной системы (эти дескрипторы даны в таблице курсивом). Все дескрипторы были критически рассмотрены д-ром Брайаном Нортоном, автором исходных дескрипторов в рамках «Общеевропейских компетенций», и группой четырех экспертов по вопросам тестирования и преподавания языков, после чего были выработаны окончательные формулировки дескрипторов.
Перевод
Поскольку DIALANG строится на принципе многоязычия, дескрипторы для самооценки были затем переведены на остальные тринадцать языков. Перевод происходил по согласованной процедуре. Вначале были оговорены основные принципы перевода и обсуждения возможных проблем; основным критерием качества перевода была его понятность для пользователей. На начальном этапе два-три эксперта по каждому из языков переводили утверждения независимо друг от друга, а затем встречались для обсуждения различий в переводе и выработки единых формулировок. Эти переводы направлялись в рабочую группу по вопросам самооценки, участники которой обладали достаточными языковыми знаниями, чтобы еще раз проверить качество перевода для девяти языков. Все вопросы формулировок и необходимые изменения обсуждались с переводчиками и утверждались по итогам обсуждений.
Калибровка дескрипторов для самооценки
К настоящему моменту в рамках проекта DIALANG было проведено только одно исследование, посвященное калибровке дескрипторов для самооценки. (Калибровка -это процесс, при котором при помощи статистических методов происходит определение уровня сложности положений, утверждений и т.д., с последующей организацией их в единую шкалу). Калибровка основывалась на выборке из 304 участников (проведение полного теста), которые также выполнили отдельные тесты в системе DIALANG для финского языка. Дескриптор для самооценки были
предоставлены участникам исследования либо на шведском языке (для 250-ти его носителей), либо на английском. Большинство участников могли также обращаться к финскому варианту дескрипторов2.
Полученные результаты были проанализированы при помощи программы OPLM (Verhelst et al. 1985; Verhelst and Glass 1995)3 . Результаты могут считаться положительными: более 90% дескрипторов могли быть шкалированы (то есть они «подходили» к использованной статистической модели). Три основные шкалы самооценки, которые были образованы на основе этой калибровки, являются однородными, о чем свидетельствуют высокие индексы надежности (альфа Кронбаха): 0.91 для чтения, 0.93 для аудирования и 0.94 для письма4 .
Сходная калибровка, основанная на подходе, разработанном группой анализа данных, будет произведена и при опробовании материалов для остальных тринадцати языков. Это позволит выяснить, могут ли быть воспроизведены результаты первого исследования и существует ли тенденция, ввиду которой отдельные дескрипторы с повторяющейся регулярностью больше подходят для проведения самооценки.
Хотя первая калибровка - единственное исследование подобного рода, важно отметить, что она подтверждает, насколько качественно сформулированы дескрипторы для самооценки на нескольких языках в рамках DIALANG. Возможность сделать такой вывод обусловлена тем, что участники исследования могли выбирать любой вариант дескрипторов для самооценки (английский, шведский, финский) или даже пользоваться всеми тремя одновременно, хотя большинство из них, скорее всего, предпочли шведский вариант. Благодаря тщательно разработанной процедуре перевода мы можем с уверенностью предположить, что дескрипторы для самооценки адекватно сформулированы на разных языках, хотя это предположение должно быть проверено в ходе других калибровочных исследований.
Дополнительное доказательство качества шкал, разработанных для самооценки в рамках проекта DIALANG - и в рамках «Общеевропейских компетенций» в целом -было получено д-ром Кафтандиевой путем соотнесения величин, указывающих на трудность тех или иных дескрипторов, входящих в настоящее исследование, с величинами для этих же дескрипторов, полученных в ходе другого исследования (North 1996/2000). Величина совпадения составила 0.83 или даже 0.897, если исключить один дескриптор, дающий на удивление низкое значение совпадения.
Документ Cl объединяет 107 дескрипторов для самооценки умений чтения, аудирования и письма, отобранных в результате калибровочного исследования на материале финского языка. Дескрипторы в каждой таблице организованы от самого простого к самому сложному. Дескрипторы, заимствованные не из «Общеевропейских компетенций», даны курсивом.
_____________________
2 Исследование было проведено в Центре прикладных лингвистических исследований в университете города Jzvâskzlâ, который являлся координационным центром проекта в 1996-1999 годах, рабочей группой по анализу полученных результатов в составе: Fellyanka Kastandijeva (председатель), Norman Verhelst, Sauli Takala, John de Jong и Timo Tôrmâkangas. Координационным центром на втором этапе проекта DIALANG является университет Freie, Берлин.
3 Программа OPLM представляет собой дальнейшее развитие методики Раша и позволяет калибруемым объектам различаться своими параметрами. Разница между этой моделью и моделью, основанной на соотношении двух параметров, заключается в том, что параметры различия не оцениваются, а вводятся как известные постоянные.
4 Когда дескрипторы калибровались в сочетании друг с другом, совпадение в рамках общей модели было достаточно значимым (р=0.26). Совпадение при калибровке отдельно для каждого вида деятельности также было значимым (р=0.10 для чтения, 0.84 для письма и 0.78 для аудирования).
226
ДРУГИЕ ШКАЛЫ В РАМКАХ ПРОЕКТА DIALANG, ОСНОВАННЫЕ НА «ОБЩЕЕВРОПЕЙСКИХ КОМПЕТЕНЦИЯХ»
В дополнение к дескрипторам для самооценки DIALANG использует две описательные шкалы, основанные на «Общеевропейских компетенциях». Эти шкалы касаются чтения, письма и аудирования:
• Более сжатый вариант сопровождает результаты тестирования;
• Более полный вариант составляет часть комментариев.
Сжатый вариант шкалы
DIALANG использует более сжатый вариант шкалы для чтения, аудирования и письма при сообщении результатов теста. Когда учащиеся получают результаты тестирования, он сообщается им в терминах шкалы «Общеевропейских компетенций», от AI до С2, и значение результата также описывается с использованием этих шкал. Эти шкалы прошли дополнительную проверку на предмет того, могут ли они быть применимы в рамках проекта DIALANG. Двенадцать экспертов распределили утверждения между шестью уровнями. Затем эти общие шкалы были использованы экспертами для установления корреляции между положениями теста для финского языка и системой «Общеевропейских компетенций». Основание для шкалы изложено в таблице 2 «Общеевропейских компетенций»; описания были слегка модифицированы таким же образом, как и дескрипторы самооценки. Эти шкалы представлены в документе С2.
Достарыңызбен бөлісу: |