5. Генерирование случайных чисел
Инструмент Генерация случайных чисел используют как вспомогательный инструмент для получения набора случайно выбранных элементов из генеральной совокупности (т.е. для получения выборки).
Итак, чтобы получить набор случайных чисел, выполняются ряд действий.
1. Выбрать команду Сервис-Анализ данных.
2. В диалоговом окне Анализ данных из списка Инструменты анализа выбрать пункт Генерация случайных чисел и щелкнуть на кнопке ОК.
3. Указать, сколько строк и сколько столбцов должен включать диапазон сгенерированных случайных чисел. Количество столбцов задается в текстовом поле Число переменных, а для указания количества строк предусмотрено текстовое поле Число случайных чисел (рис. 8.).
4. Выбрать закон распределения случайных чисел. Выбрать один из пунктов раскрывающегося списка Распределение, каждый из которых обозначает один из законов распределения. В этом списке представлено несколько вариантов: Равномерное, Нормальное, Бернулли, Биноминальное, Пуассона, Модельное и Дискретное. Каждое из этих названий соответствует названию одного из законов распределения случайных чисел.
Рис.8. Установление параметров генерации случайных чисел
5. Определить параметры выбранного закона распределения (по необходимости).
6. Выбрать начальную точку, которая будет использована при генерировании случайных чисел (по необходимости).
7. Указать Параметры вывода, чтобы определить место, куда должны быть помещены генерируемые случайные числа.
8. Подтвердить выполнение операции.
6. Выборка данных
Инструмент Выборка предназначен для выбора из общего списка данных некоторого набора случайных элементов или отбора каждого n-го элемента.
Предполагается, что имеются введенные в электронную таблицу исходные данные (рис.9.). Для получения выборки элементов из списка данных выполняются ряд действий.
1. Выбрать команду Сервис-Анализ данных.
2. В диалоговом окне Анализ данных из списка Инструменты анализа выбрать пункт Выборка и щелкнуть на кнопке ОК.
-
Определить диапазон входящих данных. Область введенных данных и будет определять Входной интервал.
Рис.9.Общий список данных.
4. Определить метод получения выборочных значений. Предусмотрено два метода: периодический и случайный. Использование первого метода позволяет получить выборку, состоящую из каждого n-го значения исходного набора данных. Далее в текстовом поле Период определить шаг, с которым должен извлекаться значения из исходного набора данных. Во втором случае получают выборку из некоторого набора случайных элементов (рис.10.).
Рис.10. Установление параметров выборки
-
Определить параметры вывода. Результаты в зависимости от метода отбора данных представлены на рис.11 и 12.
|
|
Рис.11. Выборка (случайный метод отбора данных
|
Рис.12. Выборка (периодический метод отбора данных)
|
7. Создание точечных графиков
Одной из наиболее интересных форм анализа данных является метод проведения регрессионного анализа. Используя регрессионный анализ, исследуется характер зависимости между двумя наборами наблюдаемых значений.
Обычным шагом при проведении регрессионного анализа является построение точечной диаграммы, позволяющей визуально определить степень зависимости значений двух наборов данных. В Microsoft Excel среди стандартных типов диаграмм предусмотрен тип Точечная. Предположим, например, нужно определить, существует ли зависимость между значениями, представленными на рис. 13. В диапазоне ячеек A1:A11 расположены данные о количестве введенных доз. В диапазоне ячеек В1:В11 показаны значения одного из параметров изменения качественного роста культуры в соответствующие периоды времени. Нужно определить, существует ли зависимость между значениями.
Для создания по имеющимся данным точечную диаграмму, выполним ряд действий.
1. Выделить диапазон ячеек, включающих оба ряда данных.
2. Запустить мастер построения диаграмм, щелкнув на стандартной панели инструментов на кнопке Мастер диаграмм. Или выполнить команду Вставка - Диаграмма.
3. В диалоговом окне во вкладке Стандартные в списке Тип выбрать пункт Точечная (рис. 14.).
Рис. 13. Исходные данные.
Рис.14. Первое диалоговое окно Мастер диаграмм
4. В разделе Вид выбрать схему диаграммы, не включающей никаких линий и щелкнуть по кнопке Далее (рис.15.).
Рис.15. Второе диалоговое окно Мастер диаграмм
5. Проверить правильность выбранного диапазона с исходными данными, адрес которого отображается в поле Диапазон (рис.16.).
6. Щелкнуть на кнопке Далее.
7. Подписать диаграмму, т. е. указать название диаграммы и осей координат. При необходимости настроить параметры, представленные во вкладках Оси, Линии сетки, Легенда, Подписи данных (рис.17.).
Рис.16. Третье диалоговое окно Мастер диаграмм
8. После установления необходимых параметров щелкнуть на кнопке Далее.
9. Определяется способ размещения создаваемой диаграммы.
Рис.17. Четвертое диалоговое окно Мастер диаграмм
Опция отдельном позволяет разместить диаграмму на отдельном вновь созданном листе.
Опция имеющемся позволяет поместить диаграмму на текущем рабочем листе.
Название листа, на которым должна быть размещена диаграмма, можно выбрать из расположенного справа от этого переключателя раскрывающегося списка.
Рис.18. Размещенная на рабочем листе точечная диаграмма
10. Щелкнуть на кнопку Готово.
11. Для добавления к диаграмме линии тренда выбрать команда Диаграмма - Добавить линию тренда. Для того чтобы меню Диаграмма стало доступным, нужно предварительно выделить вставленную в рабочий лист диаграмму или перейти на созданный лист диаграммы. для выделения достаточно указатель манипулятора мышь подвести к области диаграммы и нажать левую кнопку.
12. Добавление к диаграмме уравнения регрессии. Диалоговое окно Линия тренда содержит две вкладки: Тип и Параметры. Перейти во вкладку Параметры. В этой вкладке установить флажки показывать уравнение на диаграмме и поместить на диаграмме величину достоверности аппроксимации (R^2). Microsoft Excel добавит к диаграмме ключевую информацию о проведенных регрессионных вычислениях, с помощью которых была построена линия тренда (рис. 19).
Рис. 19. Добавление линии тренда
13. Щелкнуть на кнопке ОК.
Рис.20. Вкладка Параметры диалогового окна Линия тренда
Рис. 18. Точечная диаграмма с размещенной на ней информацией о проведенных регрессионных вычислениях
Регрессия'>8. Использование инструмента Регрессия
Мы уже построили для своего набора данных точечную диаграмму и добавили к ней линию тренда, что позволило поверхностно оценить имеющиеся данные. Для проведения детального исследования и получения полной и точной информации воспользуемся инструментом Пакета анализа - Регрессия. Выполняются ряд следующих действий.
1. Выбрать команду Сервис-Анализ данных.
2. В диалоговом окне Анализ данных из списка Инструменты анализа выбрать пункт Регрессия и щелкнуть на кнопке ОК.
3. Определить значения X и Y (рис. 19). В диалоговом окне Регрессия в поле Входной интервал Y указать ссылку на диапазон ячеек, в которых содержится набор зависимых значений (диапазон ячеек во втором столбце). Затем перейдите к полю Входной интервал X и указать ссылку на диапазон ячеек, в которых содержится набор независимых значений (диапазон ячеек в первом столбце).
4. Установить флажок Константа-ноль (по необходимости).
Рис. 19. Диалоговое окно Регрессия
5. Указать, нужно ли при проведении регрессионного анализа учитывать уровень надежности. для этого установить флажок Уровень надежности и в расположенном справа текстовом поле задать значение этого уровня.
6. Указать параметры вывода.
7. Определить, какие именно значения должны быть вычислены. Включение группы Остатки позволяет определить, информация какого рода об остатках должна быть включена в отчет о проведенном регрессионном анализе. Установление флажка График нормальной вероятности добавляет информацию об остатках, которые соответствуют нормальной вероятности, и отображает график нормальной вероятности.
8. Щелкнуть на кнопке ОК.
Полученный отчет содержит значения некоторых ключевых статистических регрессионных показателей, включая значение R-квадрат, значение стандартной ошибки и количество наблюдений. Далее следуют данные дисперсионного анализа, включая информацию о количестве степеней свободы, суммы квадратов, среднего квадратов, значений f-величины и данные о значимости f-величины. ниже следуют данные о построенной линии регрессии, включая показатели коэффициентов, стандартной ошибки, t-статистики, вероятностные показатели, а также некоторые данные о независимой переменной.
Рис.20. Результаты, полученные в ходе проведения регрессионного анализа
V. ЛИТЕРАТУРА
1. Бажин И.И. Информационные системы менеджмента.- М.: ГУ-ВШЭ.-2000.
2. Боровиков В.П., Боровиков И.П. Statistica /Статистический анализ и обработка данных в среде Windows. М.: Филинъ, 1997.- 583 с.
3. Мазер К., Джинкс Дж. Биометрическая генетика: Пер. с англ.- М.: Мир, 1985.- 463 с.
4. Меркурьева Е.К., Шангин-Березовский Г.Н. Генетика с основами биометрии.- М.: Колос, 1983.
5. Нельсон С. Анализ данных Microsoft Excel для «чайников».: Пер. с англ.- М.: Издательский дом «Вильямс», 2002.
6. Петухов В.Л. и др. Ветеринарная генетика.- М.: Наука, 1996.
7. Плохинский Н.А. Руководство по биометрии для зоотехников.- М.: Колос, 1970.
8. Чекотовский Э.В. Графический анализ статистических данных в Microsoft Excel 2000.- М.: ГУ-ВШЭ, 2000.
СОДЕРЖАНИЕ
I. Принципы биометрической обработки ………………………………………
1. Вводная часть …………………………………………………………………
Получение и первичная обработка материала ……………………………....
Графическое изображение вариационных рядов ……………………………
II. Специальная часть ……………………………………………………………
1. Учение о средних ……………………………………………………………
Средняя арифметическая ……………………………………………………..
Способ произведений ………………………………………………………….
Способ сумм ……………………………………………………………………
Свойство средней арифметической …………………………………………..
Взвешенная средняя арифметическая ………………………………………..
Средняя квадратическая ………………………………………………………
Средняя геометрическая ………………………………………………………
Средняя гармоническая, мода, медиана ……………………………………..
2. Показатели разнообразия …………………………………………………
Лимиты ………………………………………………………………………...
Среднее квадратическое отклонение …………………………………………
Способ произведений …………………………………………………………
Способ сумм …………………………………………………………………..
Способ взвешенных вариаций ……………………………………………….
Коэффициент вариации ………………………………………………………
Нормированное отклонение …………………………………………………
3. Статистические ошибки ……………………………………………………..
Оценка генеральных параметров ……………………………………………
Оценка средней разности ……………………………………………………
Оценка средней разности …………………………………………………….
4. Достоверность разницы показателей ……………………………………..
Критерий согласия ……………………………………………………………
5. Биометрическая обработка качественных показателей ……………………
6. Учение о связях (Корреляция)...………………………………………….
Коэффициент корреляции ……………………………………………………
7. Элементы дисперсионного анализа……………………………………….
Стандартные значения критерия Стьюдента ……………………………….
III. Вопросы для самостоятельной работы …………………………………….
IV. Статистический анализ с использованием Microsoft Excel ………………
1. Базовые понятия ………………………………………………………………..
Набор функции вручную……………………………………………………….
Типы функций …………………………………………………………………..
Использование команды функция …………………………………………….
2. Краткое описание некоторых статистических функций ……………………
Подсчет количества элементов ………………………………………………….
Средние значения, моды и медианы ……………………………………………
Поиск значений, рангов …………………………………………………………
Стандартное отклонение и дисперсия ………………………………………….
Распределение хи-квадрат ……………………………………………………….
Корреляция ……………………………………………………………………….
3. Использование инструментов описательной статистики …………………….
4. Создание гистограмм ……………………………………………………………
5.Генерирование случайных чисел ………………………………………………
6.Выборка данных …………………………………………………………………
7. Создание точечных графиков …………………………………………………..
8. Использование инструмента Регрессия ……………………………………….
V. ЛИТЕРАТУРА ………………………………………………………………….
УЧЕБНОЕ ПОСОБИЕ
Ромазан Закарьянович Сиразиев
Любовь Маратовна Малакшинова
Нима Батодоржиевич Садуев
Геннадий Александрович Игумнов
Статистический анализ математических данных в биологии
(для самостоятельной работы)
Редактор Д.Д.Филиппова
Достарыңызбен бөлісу: |