Регрессионный анализ дает возможность построить модель, наилучшим образом соответствующую набору данных, полученных в ходе машинного эксперимента. Под наилучшим соответствием понимается минимизированная функция ошибки, являющаяся разностью между прогнозируемой моделью и данными эксперимента. Такой функцией ошибки при регрессионном анализе служит сумма квадратов ошибок.
После нахождения коэффициентов модели возникает задача установления пригодности модели и значимости коэффициентов. С этого момента метод наименьших квадратов превращается в регрессионный анализ. Применение регрессионного анализа возможно только при выполнении следующих предположений.
1. Математическое ожидание величины при заданном значении является линейной функцией по параметрам, т.е. модели должны быть линейными по параметрам.
2. Значения не являются случайными величинами.
3. Дисперсия ошибки равна дисперсии величины : . Эта дисперсия может быть постоянной либо зависимой от x.
4. Различные измерения величины y взаимно независимы.
При выполнении этих четырех условий МНК дает несмещенные оценки b0 и b1 параметров b0 и b1 .
В случае нахождения доверительной области для коэффициентов b0 и b1 должно выполняться еще одно предположение.
5. Условие распределения имеет нормальный закон распределения относительно математического ожидания .
С помощью корреляционного анализа исследователь может установить, насколько тесна связь между двумя (или более) случайными величинами, наблюдаемыми и фиксируемыми при моделировании конкретной системы S. Корреляционный анализ результатов моделирования сводится к оценке разброса значений случайной величины h относительно среднего значения при различных значениях . Существование этих связей при наличии линейной связи между величинами выразить с помощью коэффициента корреляции .
Рис. 4.9. Различные случаи корреляции переменных
Для оценки точности полученного по результатам моделирования оценки коэффициента корреляции используется коэффициент
w = ln [(1+ rxh)/(1-rxh)]/2,
причем w приближенно подчиняется гауссовскому распределению со следующими средним значением и дисперсией:
,
.
Наличие статистически значимой корреляционной зависимости между переменными модели можно сделать проверкой гипотезы Н0 о том, что rxh=0. Если гипотеза Н0 при анализе отвергается, то корреляционную зависимость признают статистически значимой. Очевидно, что выборочное распределение введенного в рассмотрение коэффициента w при rxh= 0 является гауссовским с нулевым средним mw = 0 идисперсией .
При анализе результатов моделирования важно отметить то обстоятельство, что даже если удалось установить тесную зависимость между двумя переменными, то отсюда еще не следует их причинно-следственная взаимообусловленность. Возможна ситуация, когда случайные x и h стохастически зависимы, хотя причинно они являются для системы S независимыми.
Таким образом, корреляционный анализ устанавливает связь между исследуемыми случайными переменными машинной модели и оценивает тесноту этой связи. Однако в дополнение к этому желательно располагать моделью этой зависимости, полученной после обработки результатов моделирования.
При обработке и анализе результатов моделирования часто возникает задача сравнения средних выборок. Если в результате такой проверки окажется, что математическое ожидание совокупностей случайных переменных {у{1)}, {у{2)}, …, {у{n)} отличается незначительно, то статистический материал, полученный в результате моделирования, можно считать однородным (в случае равенства двух первых моментов). Это дает возможность объединить все совокупности в одну и позволяет существенно увеличить информацию о свойствах исследуемой модели Мм, а следовательно, и системы S. Так как попарное использование критериев Смирнова и Стьюдента в этом случае затруднено, в связи с наличием большого числа выборок, то для этой цели используется дисперсионный анализ.
дисперсионный анализ позволяет вместо проверки гипотезы о равенстве средних значений выборок проводить проверку гипотезы о тождественности выборочной и генеральной дисперсий.
Возможны и другие подходы к анализу и интерпретации результатов моделирования, но при этом необходимо помнить, что их эффективность существенно зависит от вида и свойств конкретной моделируемой системы S.
Достарыңызбен бөлісу: |