Следующий шаг – это перевод начальных значений логитов в единую интервальную шкалу стандартных оценок (стандартизация) с использованием следующих формул:
дисперсия по множеству значений .
дисперсия по множеству значений .
поправочные коэффициенты.
Оценки параметров и в единой интервальной шкале:
После подсчета имеем:
; ; ;
Таким образом, искомые скрытые характеристики, определяющие результаты тестирования, будут вычисляться по полученным формулам:
; .
Результаты вычисления сведены в таблицу, в которой первый столбец содержит порядковые номера испытуемых, а третий – номера заданий теста после удаления восьми «плохих» заданий:
|
Уровень
подготовки
испытуемого
|
По
возрастанию
|
№
испытуемых
|
|
Уровень
трудности
заданий
|
По
возрастанию
|
№ задания
|
1
|
2,4566
|
-3,4825
|
7
|
2
|
-0,9937
|
-2,9004
|
5
|
2
|
0,7308
|
-2,5138
|
9
|
5
|
-2,9004
|
-1,9941
|
10
|
3
|
-1,4712
|
-1,9174
|
17
|
8
|
-0,0979
|
-1,6334
|
21
|
4
|
2,4566
|
-1,4712
|
3
|
9
|
0,5418
|
-1,304
|
11
|
5
|
-1,4712
|
-1,4712
|
5
|
10
|
-1,9941
|
-1,304
|
28
|
6
|
-0,238
|
-1,4712
|
10
|
11
|
-1,304
|
-0,9937
|
2
|
7
|
-3,4825
|
-1,1052
|
13
|
12
|
2,4644
|
-0,694
|
23
|
8
|
0,9728
|
-0,5024
|
12
|
14
|
-0,0979
|
-0,0979
|
8
|
9
|
-2,5138
|
-0,5024
|
6
|
15
|
0,9025
|
-0,0979
|
14
|
10
|
-1,4712
|
-0,238
|
16
|
16
|
1,8088
|
0,2124
|
19
|
11
|
0,4927
|
-0,238
|
15
|
18
|
0,9025
|
0,2124
|
29
|
12
|
-0,5024
|
-0,238
|
19
|
19
|
0,2124
|
0,5418
|
9
|
13
|
-1,1052
|
0,4927
|
2
|
21
|
-1,6334
|
0,5418
|
24
|
14
|
2,0906
|
0,7308
|
11
|
22
|
2,4644
|
0,5418
|
25
|
15
|
-0,238
|
0,9728
|
8
|
23
|
-0,694
|
0,5418
|
26
|
16
|
-0,5024
|
1,7734
|
18
|
24
|
0,5418
|
0,9025
|
15
|
17
|
-1,9174
|
2,0906
|
1
|
25
|
0,5418
|
0,9025
|
18
|
18
|
1,7734
|
2,4566
|
4
|
26
|
0,5418
|
1,3134
|
27
|
19
|
-0,238
|
2,4566
|
14
|
27
|
1,3134
|
1,8088
|
16
|
|
28
|
-1,304
|
1,8088
|
30
|
29
|
0,2124
|
2,4644
|
12
|
30
|
1,8088
|
2,4644
|
22
|
заданий с положительными больше, чем с отрицательными. Значит, данный тест недостаточно хорошо сбалансирован, он содержит больше трудных заданий, чем легких. Желательно стремиться к тому, чтобы было близко к нулю.
Нахождение числовых значений латентных параметров (логитов) – главный этап в теории латентно-структурного анализа.
Затем вводится величина , называемая надежностью теста, коэффициент которой вычисляется по специальной формуле [4]:
где
– коэффициент надежности теста, – число заданий в тесте ( ),
доля правильных ответов на - е задание,
дисперсия индивидуальных баллов испытуемых ( ).
Коэффициент надежности исследуемого теста, состоящего из оставшихся 22 валидных заданий, составил 0,9, или 90%. Данный показатель надежности является нормой для нормативно-ориентированных тестов итогового контроля. Коэффициент надежности, имеющий значение в промежутке [0,8; 0,89] неприемлем для итоговых тестов, но вполне приемлем для тестов текущего контроля.
Помимо вышеизложенного вводятся и другие важные величины, характеризующие тест: асимметрия, эксцесс, информационные и вероятностные функции, разрешающая способность теста и др. В данной статье этот материал, в том числе соответствующие «громоздкие» вычисления, мы опускаем.
Вывод: Поставленные цели были достигнуты, была сделана апробация составленного автором нормативно-ориентированного теста и последующая обработка в рамках двух теорий тестов. В результате обработки результатов итогового тестирования следует признать, что исходный составленный тест был недостаточно сбалансирован по трудности заданий, получился слишком трудным для исследуемой выборки учащихся, но, тем не менее, достаточно дифференцирующим тестируемых по степени их подготовки, что и должно соответствовать назначению нормативно-ориентированного теста.
Литература
-
http://mirslovarei.com/content_soc/ANALIZ-LATENTNO-STRUKTURNYJ-6200.html
-
Челышкова М.Б. Теория и практика конструирования педагогических тестов: Учебное пособие. – М.: Логос, 2002. – 432 с.
-
http://www.ldt-tgpi.ru/vocabulary/pon_apparat/test_model_rasha
-
Нейман Ю.М., Хлебников В.А. Введение в теорию моделирования и параметризации педагогических тестов. – М.: 2000. – 168 с.
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ О ХАРАКТЕРИСТИКАХ КОРЕЛЛЯЦИОННЫХ ЗАВИСИМОСТЕЙ В УСПЕВАЕМОСТИ СТУДЕНТОВ ФМФ, ПОСТУПИВШИХ В 2006-2009 ГОДАХ ПО СИСТЕМЕ ЕГЭ.
Даваа С.С. , Кенден Д.А., 5 курс ФМФ.
Научный руководитель - Жданок А.И., д. ф.-м. н.,
профессор кафедры математического анализа и МПМ.
С 2009 года Единый Государственный Экзамен стал обязательным на всей территории России как инструмент оценки знаний всех выпускников школ. До этого ЕГЭ в течение восьми лет проводился в качестве эксперимента - тогда школы и вузы еще имели право выбирать между ним и традиционными формами оценки знаний. Республика Тыва также участвовала в этом эксперименте по ЕГЭ до 2009 года.
Мы в своей работе провели статистическую обработку данных по ЕГЭ, как вступительных экзаменов в ТывГУ, чтобы качественными выводами показать, насколько велика точность оценки знаний учащихся в результатах ЕГЭ, в плане прогнозирования их дальнейшей успеваемости в ВУЗе.
Исследования по статистическому анализу успеваемости студентов физико-математического факультета ТывГУ начались еще в 2001 году силами самих студентов и под руководством д. ф.-м. н., проф. (тогда – к. ф.-м. н.) Жданка А.И.
В настоящей работе мы проводим следующий (после первичной обработки) этап исследований по изучению статистических закономерностей в динамике успеваемости студентов физико-математического факультета. Поскольку выборки по объективным причинам (группы) достаточно малы, то нами выдвигаются и проверяются гипотезы о наличии значимой корреляционной зависимости, также вычисленной нами, между различным парами признаков успеваемости студентов.
Все данные по студентам занесли в компьютерную Базу данных в программе MS Excel. Настоящая База данных дополняет Базу данных, которую мы создавали ранее, исследованную в наших публикациях [1] и [2]. Далее мы провели статистическую обработку полученной информации с вычислением следующих числовых характеристик генеральной совокупности с помощью готовых статистических формул из программы MS Excel:
- средние значения (математическое ожидание) по строкам (студентам) и по столбцам (экзаменам);
- разброс (дисперсия) по строкам (студентам) и по столбцам (экзаменам).
Далее были найдены средние оценки всех групп по всем математическим дисциплинам и сессиям, динамику изменений которых мы отследили с помощью диаграмм программы MS Excel (результаты здесь не приводим).
Был проведен расчёт корреляционных зависимостей. При их вычислении мы использовали известную формулу для коэффициента корреляции [3].
Приведем лишь полученные данные коэффициентов корреляции r между оценками аттестата (по математике), вступительных экзаменов, сессионных экзаменов студентов ФМФ специальности «математика-информатика» 1 гр. 5курса 2006 года поступления.
Зависимость между
|
|
r =
|
|
Зависимость между
|
|
r =
|
Вступит.(x)
|
Аттест.(y)
|
0,208
|
|
Вступит.(x)
|
Аттест.(y)
|
0,208
|
Аттест.(x)
|
1 сем.(y)
|
0,068
|
|
Вступит.(x)
|
1 сем.(y)
|
0,264
|
Аттест.(x)
|
2 сем.(y)
|
0,215
|
|
Вступит.(x)
|
2 сем.(y)
|
0,362
|
Аттест.(x)
|
3 сем.(y)
|
0,256
|
|
Вступит.(x)
|
3 сем.(y)
|
-0,009
|
Аттест.(x)
|
4 сем.(y)
|
0,228
|
|
Вступит.(x)
|
4 сем.(y)
|
-0,101
|
Аттест.(x)
|
5 сем.(y)
|
0,080
|
|
Вступит.(x)
|
5 сем.(y)
|
-0,106
|
Аттест.(x)
|
6 сем.(y)
|
0,350
|
|
Вступит.(x)
|
6 сем.(y)
|
0,061
|
Аттест.(x)
|
7 сем.(y)
|
0,054
|
|
Вступит.(x)
|
7 сем.(y)
|
-0,043
|
Аттест.(x)
|
8 сем.(y)
|
0,977
|
|
Вступит.(x)
|
8 сем.(y)
|
0,213
|
Аттест.(x)
|
9 сем.(y)
|
0,159
|
|
Вступит.(x)
|
9 сем.(y)
|
0,310
|
Из таблицы можно сделать следующие выводы:
-
Между оценками вступительных экзаменов и аттестата слабая прямая зависимость.
-
Между оценками аттестата и результатами экзаменов почти по всем семестрам слабая прямая зависимость, но в 8 семестре очень сильная прямая зависимость.
-
Между результатами вступительных экзаменов и результатами экзаменов в первые два и последние два семестра есть слабая прямая зависимость, а с 3 по 5 семестр – очень слабая обратная зависимость первой группы.
-
Из предыдущих выводов можно заключить, что оценки аттестата предопределяют уровень знаний студентов 1 группы 5 курса в сессионных экзаменах в большей степени, чем оценки вступительных экзаменов по системе ЕГЭ, особенно в 8 семестре.
Таким же способом были сделаны расчеты по всем группам физико-математического факультета 2006-2009 г.г. поступления. Проведены и другие статистические расчеты.
Главной же целью данного проекта было методами альтернативных гипотез произвести численный анализ по принятию или опровержению гипотез о значимости (надежности) полученных корреляционных связей.
Статистическая гипотеза, которая проверяется, называется основной (нулевой) и обозначается Н0. Гипотеза, которая противопоставляется основной, называется альтернативной (конкурирующей) и обозначается Н1. Цель статистической проверки гипотез: на основании выборочных данных принять решение о справедливости основной гипотезы или отклонить ее в пользу альтернативной [4].
Значимость коэффициента корреляции проверяется с помощью статистики К=, имеющей распределение Стьюдента.
Пользуясь данными формулами, проверим значимость наших корреляций.
Выдвинем гипотезу:
Н0: Rxy=0 - коэф.корр. не значим и между переменными X и Y (в нашем случае оценки аттестата, вступит. и сессионных экз.) нет никакой связи;
Достарыңызбен бөлісу: |