D.
не может быть определена
2
.
При исследовании взаимосвязи между ростом (см) и объемом
циркулируемой крови (л) был получен коэффициент корреляции г =
0,6. Опишите характер этой связи:
A.
обратная, пропорциональная
B.
прямая, сильная
C.
отсутствует
D.
прямая, средняя
E.
обратная, средняя
Тема 10. Линейная регрессия
Регрессия - это функция, связывающая зависимую величину у с
независимой величиной х. Она показывает, как в среднем изменяется
у при изменениях х.
Уравнение линейной регрессии имеет вид
у = Ь0 + Ь,х, где у - зависимая переменная, х - независимая пере
менная, Z>o и bj — постоянные коэффициенты
Ь
, =
b0 = Y - b , X
48
Пример. По данным из таблицы вывести уравнение регрессии.
Нанести на график исходные данные и линию регрессии. По уравне
нию регрессии определить каков в среднем вес людей с ростом 180
кг.
X
Рост, см
170
162
165
178
182
159
175
188
167
175
У
В ес, кг
75
65
70
82
75
63
80
90
66
60
Результаты расчета сведем в таблицу
/
Xi
У,
х , - Х
у -
у
( X i - X X H - Y )
(X t - X f
1
164
52
-10,9
-21,8
237,62
118,81
2
177
65
2,1
-8,8
-18,48
4,41
3
165
70
-9,9
-3,8
37,62
98,01
4
178
82
3,1
8,2
25,42
9,61
5
182
75
7,1
1,2
8,52
50,41
6
185
88
10,1
14,2
143,42
102,01
7
175
80
0,1
6,2
0,62
0,01
8
188
90
13,1
16,2
212,22
171,61
9
160
64
-14,9
-9,8
146,02
222,01
10
175
72
0,1
-1,8
-0,18
0,01
Х = 174,9
*<
1
1
II
U
)
00
Е=792,8
£ = 7 7 6 ,9
Ь, = 1,02
Ь0 = - 104,7
Таким образом, уравнение имеет вид:
у = \ ,02х - 104,7
При росте 180 см вес в среднем составляет
7=1,02*180-104,7=79 кг
49
Рисунок 5 - Г рафик линейной регрессии
Самостоятельная работа
Задание. По данным из таблицы вывести уравнение регрессии.
Нанести на график исходные данные и линию регрессии.
С одерж ание андростеро-
нов в моче (мг/сутки)
0,82 0,90 0,98
1,06
1,20
1,29
В озраст (лет)
82
82
75
65
55
45
Определите концен
трацию гормона в
моче у лиц возраста
70 лет
Тесты для самоконтроля
1.
Какой метод используется для вычисления коэффициентов в
уравнении регрессии?
А.
неопределенных множителей
В.
наименьших квадратов
С.
условной средней
D.
оптимизации
Е.
Рунге-Кутта
2.
Уравнением регрессии называется уравнение, устанавливающее
зависимость между значениями переменных у по х. Какой перемен
ной является jc, а какой переменной у?
50
A.
зависимой, независимой
B.
условной, независимой
C.
независимой, зависимой
D.
средней, зависимой
E.
условной,средней
3.
Было проведено исследование о наличии взаимосвязи между
двумя параметрами: возрастом (в годах) и площадью поражения ар
терий таза (в %) и построено уравнение регрессии. В данном случае,
какой переменной является возраст?
A.
независимой переменной;
B.
зависимой переменной;
C.
в уравнении регрессии учитываться не может;
D.
ни зависимой, ни независимой переменной не является;
E.
постоянным коэффициентом.
4.
Уравнение регрессии имеет вид {у = b0-bix). Чем является Ь/ ?
A.
коэффициентом регрессии;
B.
зависимой переменной;
C.
независимой переменной;
D.
ф ункцией;
E.
табличным значением.
5.
Уравнение регрессии имеет вид (у = bo-b/х). Чем является Ь0?
A.
зависимой переменной;
B.
независимой переменной;
C.
функцией;
D.
табличным значением.
E.
постоянным коэффициентом
| Ответы |
IB
j
2С
|
ЗА
1
4А
|
5Е
Тема 11. Дисперсионный анализ. Метод однофакторного
дисперсионного анализа
51
Чтобы оценить влияние многоуровневого фактора на какой-то
признак, необходимо вычислить отношение межгрупповой дисперсии
к внутригрупповой дисперсии
•
Межгрупповая дисперсия вносится изучаемым фактором
Внутригрупповая дисперсия вносится какими-то другими
(неучтенными) факторами
i
Внутригрупповая дисперсия
к
I д
D
= —
анутригр
Где D, - дисперсия показателя в каждой из к групп
Межгрупповая дисперсия вычисляется по средним значе
ниям в группах
D
=-*=*------------
межгруп
к ~ \
t n x x - x j
И/ -количество объектов в / -той группе
Х т - общая средняя
•
Выдвигаем Н(0) - фактор не влияет на изучаемый
признак
•
Задаемся уровнем значимости а
•
Вычисляем критерий Фишера
D
тр межгр
внутргр
• Сравниваем с Fitii для заданного а и числа степеней сво
боды (Прилож ение 7)
f межгр — к — \
f тутргр — П — к
к - ч и с л о групп, «-общее количество объектов обследования
52
•
Если вычисленное значение критерия Фишера меньше кри
тического, то Н(0) принимается и делается вывод, что фактор не вли
яет на исследуемый показатель.
•
В противном случае принимается Н(1)
Пример. По данным из таблицы определить зависит ли срок ле
чения в стационаре от тяжести состояния (легкая, средняя, тяжелая)
при поступлении в больницу.
Выдвинем гипотезы:
Н(0): срок лечения в стационаре не зависит от тяжести пациента
при госпитализации.
Н(1): срок лечения в стационаре зависит от тяжести пациента
при госпитализации
Тяжесть
состояния
легкая
средняя
тяжелая
к=3
Срок лечения, дни
1
43
58
96
2
48
64
120
3
28
78
100
4
41
64
98
5
35
49
82
П;
5
5
5
п=15
х ,
39
62,6
99,2
Хш = 66>9
D,
59,5
1 1 1 ,8
185,2
£ = 3 5 6 ,5
D
= 356^5 = 1 18 8
внутригр
^
>
= 5 (39 ~ 6 6 ,9 ) 2 + 5 (6 2 ,6 - 6 6 ,9 ) 2 + 5 (9 9 ,2 - 6 6 ,9 ) 2 =
м е ж гр у п
"3
1
*
D
F ВЫ
Ч
f
а
F
крит
Межгрупповая дисперсия
4600,5
38,7
2
0,05
3,88
Внутригрупповая дисперсия
118,8
12
Т.к. Febl4> FKpum
принимаем Н(1).
Вы вод: с вероятностью не менее 95% можно утверждать, что
тяжесть состояния при госпитализации влияет на срок лечения в ста
ционаре.
53
П р ед ста в и м п ол уч ен н ы е р езультаты в ви де графика на р исун к е
тяжесть состояния
Рисунок 6 - График среднего значения и 95% доверительного интервала
Самостоятельная работа:
Задание 1. Используя факторный дисперсионный анализ опре
делить, изменяется ли количество тромбоцитов с возрастом.
Ч и сло тр о м б о ц и то в
Дети д о года
Дети д о 3 лет
С реднее Л/
196
221
Д исп ер си я/),-
359
340
Число обследованных и,-
31
13
Задание 2,Определить влияет ли фактор на случайную величину
Число уровней
фактора
количество объек
тов исследования
Вмемсгр
^внутр
4
28
1224
37,8
Тесты для самоконт роля
1.
В каких задачах используется дисперсионный анализ?
A.
в задачах сравнения двух средних
B.
в задачах сравнения долей
54
C.
в задачах определения взаимосвязи двух случайных
величин
D.
в задачах определения влияния многоуровнего фактора
E.
в задачах построения регрессионной модели
2
.
Сформулируйте альтернативную гипотезу при проведении
факторного дисперсионного анализа
A.
Случайная величина имеет нормальное распределение
B.
Уровни фактора независимы
C.
Дисперсия фактора равна дисперсии случайной величины
D.
Средние во всех изучаемых группах равны
E.
По крайней мере две средние в изучаемых группах не
равны
3.
Результаты дисперсионного анализа определяются по критерию
Фишера. При каком условии нулевая гипотеза отвергается?
-А
Рвыч^ FlCpHT
В-
F Bb,4< Ркрит
C .
F B„ 4~ F KpHT
D .
по соотношению FBbl4 и FKpiIX нельзя сделать вывод
4.
Каково соотношение между внутригрупповой и межгрупповой
дисперсиями? если известно, что многоуровневый фактор не
оказывает действия на случайную величину?
A.
внутригрупповая дисперсия больше межгрупповой
B.
внутригрупповая дисперсия меньше межгрупповой
C.
внутригрупповая дисперсия равна межгрупповой
D.
соотношение между дисперсиями не имеет значения
E.
сумма дисперсий равна нулю
5.
Чему равна внутригрупповая дисперсия, если дисперсия первой
группы равна 27, второй 14, а третей 10?
A.
22
B.
17
C.
18
D.
16
E.
23
1
Ответы
|
1D
|
2Е
1
ЗА
|
4А
]
5В
55
Метод стандартизованных показателей позволяет устранить
(элиминировать) возможное влияние различий в составе совокупно
стей по какому-либо признаку на величину сравниваемых интен
сивных показателей. Стандартизованные показатели свидетельству
ют о том, каковы были бы значения сравниваемых интенсивных по
казателей, если бы были исключены различия в составах совокуп
ностей.
Достарыңызбен бөлісу: |