Методика расчета средней величины по способу моментов
Число ягнят (V)
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
|
Частота встречаемости признака (p)
|
2
|
4
|
6
|
6
|
8
|
4
|
2
|
1
|
Σ р = n =33
|
а
|
- 4
|
- 3
|
- 2
|
- 1
|
0
|
+1
|
+2
|
+3
|
|
ар
|
- 8
|
-12
|
-12
|
-6
|
0
|
+4
|
+4
|
+3
|
Σар=-27
|
а2р
|
32
|
36
|
24
|
6
|
0
|
4
|
8
|
9
|
Σа2р=119
|
Этапы расчета средней арифметической по способу моментов:
За условно принятую среднюю (или моду) А принимают варианту, чаще других повторяющуюся в вариационном ряду, например А = Мо = 5.
Определяем а – условное отклонение от условной средней; для этого из каждой варианты вычитаем условную среднюю а = (V – А).
Умножаем условное отклонение (а) на частоту (р) каждой варианты и получаем произведение (а×р).
Получаем сумму Σ а×р = -27
Определяем интервал между группами вариант i =1
Определяем момент первой степени
Рассчитываем среднюю арифметическую по способу моментов
М= А + i
Таким образом, можно сделать вывод, что в среднем у овец романовской породы рождается 4,2 ягненка.
Основные свойства средней величины: 1) имеет абстрактный характер, так как является обобщающей величиной: в ней стираются случайные колебания; 2) занимает срединное положение в строго симметричном ряду; 3) сумма отклонений всех вариант от средней величины равна нулю. Данное свойство средней величины используется для проверки правильности расчета средней. Она оценивается по уровню колеблемости вариационного ряда. Критериями такой оценки могут служить: амплитуда (разница между крайними вариантами); среднее квадратическое отклонение, показывающее, как отличаются варианты от рассчитанной средней величины; коэффициент вариации.
Среднеквадратическое отклонение ( ) наиболее точно характеризует степень разнообразия варьирующего признака, без чего нельзя достаточно полно охарактеризовать явление. Для простого вариационного ряда (р = 1) среднеквадратическое отклонение рассчитывается по формуле . Для взвешенного вариационного ряда по формуле: , где d = V – M - отклонение каждой варианты от средней арифметической. При числе наблюдений меньше 30 в знаменателе этих формул берется не n, а n – 1 (так называемое в статистике число степеней свободы). При числе наблюдений более 30 уменьшение знаменателя на единицу не имеет практического значения, т.к. существенно не сказывается на конечном результате. Значительно упрощает вычисления расчет среднего квадратического отклонения по способу моментов. где, величина называется моментом первой степени, а - моментом второй степени.
Для нашего примера среднеквадратическое отклонение равно:
Степень разнообразия (колеблемости) признака в вариационном ряду можно оценить по коэффициенту вариации, который является относительной мерой разнообразия признака, так как исчисляется как процентное отношение среднего квадратического отклонения к средней величине.
Сυ = = %
При вариации менее 10% отмечается слабое разнообразие, при вариации 10—20% — среднее, а при вариации более 20% — сильное разнообразие признака.
Коэффициент вариации находит применение и в селекционной работе. Например, при сравнении двух сходных по продуктивности и качественным показателям сортов предпочтение должно быть отдано тому из них, который при равных условиях обладает меньшей изменчивостью.
Из теории статистики и эмпирических исследований известно, что выборка, репрезентативно отражающая генеральную совокупность, как правило, обладает следующими свойствами:
в пределах M ± 1 сконцентрировано 68.3 % вариантов генеральной совокупности;
в пределах M ± 2 сгруппировано 95.5% вариантов генеральной совокупности;
в пределах M ± 3 расположено 99.7% вариантов генеральной совокупности. Таким образом, M ± 3 охватывает почти весь вариационный ряд.
Указанная закономерность, получившая название нормального распределения, является одной из ключевых в вариационной статистике и её следует запомнить. Термин “нормальное распределение” введен в биологическую лексику Гальтоном в 1889 году. Однако ещё задолго до этого оно было хорошо известно математикам, которые это распределение часто называют законом Гаусса – Лапласа. Как видно из рисунка 1, нормальное распределение или распределение Гаусса - Лапласа графически может быть отображено симметричной колоколообразной кривой, вершиной которой является свойственная генеральной совокупности средняя величина. При нормальном типе распределения число случаев наблюдений с различной величиной признака располагается симметрично по отношению к середине ряда: от меньшего значения признака к большему его значению. При этом наибольшее число случаев наблюдений приходится на середину ряда.
Распределение вариантов в конкретной выборке далеко не всегда полностью совпадает с нормальным. Наиболее типичными несоответствиями являются: асимметрия, то есть смещение вершины распределения относительно среднего значения, и эксцесс - выраженная плоско - или островершинность распределения [Лакин,1990 и др.]. При ассиметричном распределении наибольшее число случаев наблюдений скапливается не на уровне середины ряда, а сдвигается в сторону меньшего значения признака (правосторонняя асимметрия) или в сторону большего значения признака (левосторонняя асимметрия), или же скапливается по концам ряда (двугорбое бимодальное распределение). Правосторонняя асимметрия характерна, например, для распределения такого признака, как число детей в семье. Как известно, в большинстве семей имеется 1-2детей. С увеличением числа детей в семьях соответственно уменьшается число семей. Однако в большинстве случаев всё же можно использовать тесты, основанные на предположении о нормальности распределения. Дело в том, что при возрастании объёма выборки форма выборочного распределения средней арифметической приближается к нормальной. Отсюда следует, что для статистического анализа всегда предпочтительнее иметь многочисленную выборку (n>30).
Рис.1. Диаграмма нормального распределения.
В биологии и медицине с величиной М ± 1σ связано понятие нормы; отклонения от средней (в любую сторону) больше, чем на 1σ, но меньше чем на 2σ, считаются субнормальными (выше или ниже нормы), а при отклонении от средней больше, чем на 2σ, варианты считаются значительно отличающимися от нормы (патология).
Наконец, среднее квадратическое отклонение является важным компонентом при расчете средней ошибки средней арифметической (ошибки репрезентативности), которая является мерой точности и достоверности результатов выборочных статистических величин. Средняя ошибка средней арифметической – m (отношение среднего квадратического отклонения к квадратному корню из общего числа наблюдений — объектов). Статистические ошибки присущи только выборочным характеристикам, возникая в процессе отбора вариант из генеральной совокупности. Ошибка является именованной величиной и выражается в единицах измерения основного параметра. Ошибку средней находят по формулам:
m = ± - для большой выборки, а для малой выборки, где (n<30) средняя ошибка средней арифметической - m = ± , так как чем меньше выборка, тем больше ошибка. Полученный результат записывается как М ± m, это означает, что средняя генеральной совокупности находится в пределах от М - m до М + m.
Совершенно очевидно, что наилучшим методом для повышения точности исследования является увеличение объёма наблюдений. Иными словами, ошибка статистического параметра, вычисленного по данным выборки, будет тем меньше, чем больше число наблюдений, составляющих эту выборку.
Мерой достоверности среднего показателя наряду с его ошибкой являются доверительные границы и достоверность разности между двумя средними величинами.
Достарыңызбен бөлісу: |