Р. З. Сиразиев л. М. Малакшинова


IV. СТАТИСТИЧЕСКИЙ АНАЛИЗ С ИСПОЛЬЗОВАНИЕМ



бет5/6
Дата11.07.2016
өлшемі1.64 Mb.
#192583
1   2   3   4   5   6

IV. СТАТИСТИЧЕСКИЙ АНАЛИЗ С ИСПОЛЬЗОВАНИЕМ

MICROSOFT EXCEL

 

Microsoft Excel предоставляет для проведения анализа данных широкий набор функций, основное назначение которых - проведение простого статистического анализа данных. Данный табличный процессор включает более 70 статистических функций. Правильное использование статистических функций помогает глубоко и всесторонне изучить имеющиеся наборы данных, сохраненных в рабочих листах Microsoft Excel, списках или сводных таблицах.



Функции в Microsoft Excel используются для выполнения стандартных вычислений в рабочих книгах. Значения, которые используются для вычисления функций, называются аргументами. Значения, возвращаемые функциями в качестве ответа, называются результатами. Помимо встроенных функций вы можете использовать в вычислениях пользовательские функции, которые создаются при помощи средств Microsoft Excel.

 

1. Базовые понятия


Набор функции вручную.

Чтобы использовать функцию, нужно ввести ее как часть формулы в ячейку рабочего листа. Последовательность, в которой должны располагаться используемые в формуле символы, называется синтаксисом функции. Все функции используют одинаковые основные правила синтаксиса. Если вы нарушите правила синтаксиса, Microsoft Excel выдаст сообщение о том, что в формуле имеется ошибка.

Если функция появляется в самом начале формулы, ей должен предшествовать знак равенства, как и во всякой другой формуле.

Если необходимо использовать какую-то функцию, то создается формула с участием этой функции.

В качестве аргументов можно использовать числа, текст, логические значения, массивы, значения ошибок или ссылки. Аргументы могут быть как константами, так и формулами. В свою очередь эти формулы могут содержать другие функции. Функции, являющиеся аргументом другой функции, называются вложенными. В формулах Microsoft Excel можно использовать до семи уровней вложенности функций.

Для большинства функций необходимо указать значения аргументов. Аргументы функции заключаются в круглые скобки. Если функция требует для себя значения сразу нескольких аргументов, они отделяются друг от друга точкой с запятой.

Задаваемые входные параметры должны иметь допустимые для данного аргумента значения. Некоторые функции могут иметь необязательные аргументы, которые могут отсутствовать при вычислении значения функции.

Продемонстрируем сказанное на двух примерах использования простейших функций. Цел настоящих примеров - дать общие знания об использовании функций.

Функция СУММ предназначена для вычисления суммы всех значений, указанных в качестве ее аргументов. В приведенном ниже примере этими аргументами являются числа 2, 2, значение ячейки А1 и значения, введенные в диапазоне В3:G5.

=СУММ(2;2;А1;В3:G5).

В следующем примере показано использование функции СРЗНАЧ, которая вычисляет среднее для всех значении, сохраненных в диапазоне В2:В100.



=СРЗНАЧ(В2:В100).

В выше приведенных примерах необходимо знать следующее. Ввод ссылок на ячейку (в нашей ситуации А1) или на диапазон ячеек (В3:G5 или В2:В100) можно осуществить двумя способами: непосредственный ввод и указание манипулятором мышь. В первом случае регистр клавиатуры должен быть переведен на английский либо комбинацией клавиш CTRL+SHIFT (или ALT+SHIFT), либо изменением индикатора клавиатуры на панели задач с помощью манипулятора мышь. Во втором случае фиксируется манипулятором мыши соответствующая ячейка на рабочем листе или выделяется диапазон ячеек. Выделение диапазона производится следующим образом: указатель манипулятора мышь устанавливается в предполагаемую начальную ячейку диапазона и при фиксированном положении левой кнопки мыши указатель перемещается до последней ячейки диапазона, а затем отпустить кнопку.

В большинстве случаев для ввода ссылок используется второй способ.

Способ набора в ячейках формул, содержащих функции, зависит от того, насколько хорошо вы представляете себе способ использования этих функций. Если вы точно знаете, как правильно использовать ту функцию, которая вам нужна, или по крайней мере точно знаете ее название, можно просто набрать в ячейке название функции. При наборе после названия функции круглой скобки, Microsoft Excel отобразит рядом экранную подсказку с указанием всех необходимых для функции аргументов.

 

Типы функций.

Для удобства работы функции в Microsoft Excel разбиты по категориям: функции управления базами данных и списками, функции даты и времени, DDE/Внешние функции, инженерные функции, финансовые, информационные, логические, статистические, текстовые и математические и др.

При помощи текстовых функций имеется возможность обрабатывать текст: извлекать символы, находить нужные, записывать символы в строго определенное место текста и многое другое.

С помощью функций даты и времени можно решить практически любые задачи, связанные с учетом даты или времени (например, определить возраст, вычислить стаж работы, определить число рабочих дней на любом промежутке времени).



Логические функции помогают создавать сложные формулы, которые в зависимости от выполнения тех или иных условий будут совершать различные виды обработки данных.

В Microsoft Excel широко представлены математические функции. Например, можно выполнять различные операции с матрицами: умножать, находить обратную, транспонировать.

С помощью статистических функций возможно проводить статистическое моделирование. Кроме того, возможно, использовать элементы факторного и регрессионного анализа.

В Microsoft Excel можно решать задачи оптимизации и использовать анализ Фурье. В частности, реализован алгоритм быстрого преобразования Фурье, при помощи которого вы можете построить амплитудный и фазовый спектр.

 

Использование команды Функция.

Если не ясно представляете название функции или, может быть, не знаете как ее использовать, то необходимо воспользоваться командой Вставка - Функция для поиска нужной функции и последующего корректного определения всех ее аргументов.

Процесс использования команды Вставка - Функция заключается в следующем.

1. Перейти к ячейке, в которую должна быть введена формула, содержащая функцию.

2. Выбрать команду Вставка - Функция. Или щелкнуть манипулятором мышь на кнопке Вставка функции.

3. На появившемся диалоговом окне определить категорию функции.

4. Выбрать нужную функцию и подтвердить.

5. На появившемся диалоговом окне выбранной функции указать значения аргументов функции. Значение аргумента определяется путем набора в поле аргумента числа, формулы, ссылки на ячейку или диапазон ячеек. Если для выполнения функции необходимо несколько аргументов, то определяются значения для каждого из них. Результат отображается в нижней части диалогового окна возле слова Значение.

6. После определения значения всех аргументов щелкнуть по кнопке ОК.

 

2.Краткое описание некоторых статистических функций

 

Подсчет количества элементов.

Подсчет количества ячеек с числовыми значениями: =СЧЕТ(диапазон). Значение аргумента диапазон указывает на диапазон ячеек, содержащих исходные данные. Пример: =СЧЕТ(А1:В5).

Подсчет непустых ячеек: =СЧЕТЗ(диапазон). Пример: =СЧЕТЗ(С1:D6).

Подсчет количества пустых ячеек: =СЧИТАТЬПУСТОТЫ(диапазон). Пример: =СЧИТАТЬПУСТОТЫ(А5:H8).

Посчет ячеек, значения которых удовлетворяют заданному критерию: =СЧЁТЕСЛИ(диапазон;критерий). Пример: =СЧЁТЕСЛИ(С1:С10;">4").

 

Средние значения, моды и медианы.



Среднее абсолютных отклонений: =СРОТКЛ(диапазон). Определяет среднее абсолютных отклонений точек данных от среднего. Пример: =СРОТКЛ(А1:В6).

Вычисление среднего: =СРЗНАЧ(диапазон). Используется для вычисления арифметического среднего набора числовых значений.

Приближенное среднее: =УРЕЗСРЕДНЕЕ(диапазон;процент). Вычисляет среднее арифметическое набора числовых значений, но только после того, как будет отброшен определенный процент экстремальных значений. Пример: =УРЕЗСРЕДНЕЕ(С2:С10;0,1). Производится вычисление среднего арифметического набора числовых значений, собранных в ячейках С2:С10, но только после того, как будут отброшены 10 % экстремальных значений (т.е. 5% максимальных и 5% минимальных).

Вычисление медианы: =МЕДИАНА(диапазон). Находит среднее значение в наборе исходных числовых значений. Таким образом, половина исходных значений будет больше найденного значения, а вторая половина - меньше. При обработке четного количества исходных значений функция находит два средних значения и определяет их среднее арифметическое. Пример: =МЕДИАНА(В3:В24).

Вычисление моды набора чисел: =МОДА(диапазон). Находит число, которое наиболее часто встречается в наборе исходных значений. Пример: =МОДА(А5:А13).

Вычисление геометрического среднего: =СРГЕОМ(число1;число2...). Функция предназначена для нахождения геометрического среднего набора числовых значений. Среднее вычисляется как корень n - ой степени от произведения всех чисел. Аргумент число1 и последующие необязательные аргументы представляют собой числа, для которых должно быть найдено геометрическое среднее.

Вычисление среднего гармонического: =СРГАРМ(число1;число2...). Используется для вычисления среднего гармонического множества исходных числовых значений. Аргумент число1 и последующие необязательные аргументы представляют собой числа, для которых должно быть найдено среднее гармоническое.

 

Поиск значений, рангов.



Поиск максимального значения: =МАКС(диапазон). Пример: =МАКС(D1:D15).

Поиск минимального значения: =МИН(диапазон). Пример: =МИН(А5:А10).

Поиск k-того наибольшего значения: =НАИБОЛЬШИЙ(массив;k). В данном случае массив - это множество данных, среди значений которого проводится поиск, а k - порядковый номер искомого значения в рейтинге наибольших значений. Пример: =НАИБОЛЬШИЙ(А1:А10;3).

Поиск k-того наименьшего значения: =НАИМЕНЬШИЙ(массив;k). В данном случае массив - это множество данных, среди значений которого проводится поиск, а k - порядковый номер искомого значения в рейтинге наименьших значений. Пример: =НАИМЕНЬШИЙ(В1:В9;2).

Определение ранга числа: =РАНГ(число;ссылка;порядок). Используется для определения номера позиции числа в упорядоченном списке. Аргумент число обозначает само число, для которого нужно определить ранг, аргумент ссылка указывает на диапазон ячеек, содержащих список исходных значений, аргумент порядок задает порядок сортировки значений в списке: нуль или логическое значение Ложь обозначает сортировку по убыванию,а единица или логическое Истина - сортировку по возрастанию. Если в списке встречаются одинаковые значения, то присваивается им одинаковый ранг, однако ранг последующих значений все равно вычисляется с учетом предыдущих. Если не указано значение аргумента порядок, значения в списке автоматически будут сортированы по убыванию. Пример: =РАНГ(6;А1:А9;1).

Подсчет количества значений, попадающих в указанные диапазоны: =ЧАСТОТА(массив_данных;массив_интервалов). Аргумент массив_данных указывает на ячейки, содержащие набор исходных значений, а аргумент массив_интервалов является ссылкой на ячейки, значения которых идентифицируют интервалы, куда попадают исходные значения. Отчет о количестве исходных значений, попавших в заданные интервалы, и будет результатом. Пример: =ЧАСТОТА(А2:А20;В2:В20).

 

Стандартное отклонение и дисперсия.



Стандартное отклонение по выборке: =СТАНДОТКЛ(диапазон). Оценивает степень разброса случайных значений относительно среднего показателя. Пример: =СТАНДОТКЛ(А1:А5).

Стандартное отклонение для генеральной совокупности: =СТАНДОТКЛОНП(диапазон). Пример: =СТАНДОТКЛОНП(А1:А5).

Вычисление дисперсии по выборке: =ДИСП(диапазон). Пример: =ДИСП(А1:А5).

Вычисление дисперсии по генеральной совокупности: =ДИСПР(диапазон). Пример: =ДИСПР(А1:А5).

Вычисление ковариации: =КОВАР(массив1;массив2). Аргумент массив1 указывает на первое множество данных, а массив2 - на второе.

Вычисление доверительного интервала: =ДОВЕРИТ(альфа;станд_откл;размер). Здесь альфа - это уровень значимости, используемый для вычисления уровня надежности. Уровень надежности равняется 100*(1-альфа) процентам; другими словами, альфа, равное 0.05, означает 95%-ный уровень надежности. Аргумент станд_откл - это стандартное отклонение генеральной совокупности; размер - это размер выборки. Пример: =ДОВЕРИТ(1-0,95;20000;100).

 
Распределение хи-квадрат.



Распределение хи-квадрат: =ХИ2РАСП(х;степени_свободы). Вычисляет уровень значимости. Здесь х - числовое значение, степени_свободы - число степеней свободы.

Вычисление величины хи-квадрат: =ХИ2ОБР(вероятность;степени_свободы). Вычисляет значение хи-квадрат, которому соответствует заданный уровень значимости. Здесь вероятность - заданный уровень значимости, степени_свободы - число степеней свободы.

 

Корреляция.



Коэффициент корреляции: =КОРРЕЛ(массив1;массив2). Оценивает степень и характер зависимости между различными наборами данных. Аргумент массив1 указывает на первое множество данных, а массив2 - на второе.

 

3.Использование инструментов описательной статистики

 

Под описательной статистикой подразумевается метод описания больших наборов данных с помощью нескольких ключевых показателей. Некоторые инструменты описательной статистики в Microsoft Excel становятся доступными после подключения надстройки Пакет анализа. В случае отсутствия оной необходимо выбрать команду Сервис - Надстройки, в открывшемся диалоговом окне установить флажок напротив опции Пакет анализа и щелкнуть на кнопке ОК. Инструментальные средства Пакета анализа позволяют провести анализ данных по широкому кругу статистических показателей, и в т.ч. показателей описательной статистики.



 

Использование инструментов описательной статистики.

Продемонстрируем особенности его работы на примере списка данных (рис. 1 ).



Рис. 1 . Исходный набор данных




  1. Выбрать команду Сервис-Анализ данных.

  2. В диалоговом окне Анализ данных в списке Инструменты анализа выделить пункт Описательная статистика и щелкнуть на кнопке ОК (рис.2.).


Рис. 2 . Диалоговое окно Анализ данных


3. Использовать раздел Входные данные диалогового окна Описательная статистика для определения исходных данных, на основании которых должны проводится вычисления. Для указания диапазона исходных данных щелкнуть в текстовом поле Входной интервал и ввести ссылку на требующий диапазон непосредственным вводом или указать манипулятором мышь. Чтобы определить, содержаться ли записи по строкам или столбцам, выбрать соответственно переключатель по столбцам или по строкам. Чтобы указать, что в первой строке содержатся названия полей, активизировать опцию Метки в первой строке (рис3.).

Рис. 3 . Диалоговое окно Описательная статистика


4. Используйте раздел Параметры вывода диалогового окна Описательная статистика для описания того, значения каких параметров и где именно должны быть отображены. Значения показателей описательной статистики представлены на рис.4.

Рис. 4. Значения показателей описательной статистики


4. Создание гистограмм

 

Инструмент анализа Гистограмма используется для построения распределения частот и при необходимости для создания гистограммы. Распределение частот показывает, как значения из набора данных распределяются по категориям. Гистограмма представляет ту же информацию в виде диаграммы, состоящей из столбцов.



Чтобы приступить к использованию инструмента Гистограмма, вначале нужно задать категории (границы классов), по которым будет построено распределение частот. Введем данные представленные в таблице 1 в ячейки столбца А электронной таблицы. Наименования и значения показателей вводим в отдельные свободные ячейки (n, Vmax, Vmin, r, K, W, Wa, Ww). Вначале необходимо подсчитать число данных n (функция СЧЁТ(диапазон)), рассчитать число классов разбиения данных r по формуле r = 1+3,3*lgn ( в Microsoft Excel функция вычисляющая значение десятичного логарифма Log10(число) ) определить максимальное и минимальное значение данных Vmax и Vmin(соответственно функции(МАКС(диапазон), МИН(диапазон)), величину классового промежутка К по формуле К=(Vmax-Vmin) / r и округляем до ближайшего четного числа. Определяются границы классов и записываются в отдельный столбец таблицы, например в ячейки столбца Е электронной таблицы. За середину первого класса W обычно принимают число с максимальным значением. Начало класса определяется по формуле W=W - K/2. Конец класса - W=W + K/2 - принятая точность.

Вышеуказанные действия можно оформить в соответствии с рис. . В результате подтверждения ввода формул в ячейках будут представлены числовые значения, полученные в ходе вычислений, а не сами формулы. Адреса ячеек вводятся фиксированием указателем соответствующей ячейки. Названия используемых функций в данном примере могут вводить непосредственно, или использованием команд Вставка – Функция. Для округления полученного значения классового промежутка К до ближайшего четного числа используется функция ЧЕТН(К).



Таблица 1

413

423

414

423

433

450

420

410

434

395

419

416

409

402

433

412

407

416

431

420

427

427

430

410

439

435

428

403

405

398

404

417

426

436

437

430

398

407

405

422

421

424

400

424

394

399

420

423

405

416

414

401

425

412

424

386

424

391

413

434

428

411

432

444

408

441

426

409

392

443

397

380

418

411

407

417

419

418

428

421

418

406

388

394

422

414

419

421

431

410

429

429

415

411

423

417

406

417

422

409

Введем название классы в ячейку G3.

Введем в G4 значение W.

Введем в G5 значение W.

Зная значение классового промежутка К введем остальные границы классов (ячейки G6 по G11). Правильность определения границ классов проверить по рис.5.

Чтобы построить распределение частот и гистограмму, необходимо выполнить перечисленные ниже действия:

1. Использовать команду Сервис-Анализ данных.

2. В диалоговом окне Анализ данных в списке Инструменты анализа выбрать пункт Гистограмма и щелкнуть на кнопке ОК.

3. В диалоговом окне Гистограмма определить диапазоны ячеек, содержащих данные, которые необходимо проанализировать. Входной интервал - диапазон ячеек с исходными данными, интервал карманов - диапазон ячеек с границами классов (категории) (рис.6.).

4. В диалоговом окне Гистограмма определить параметры вывода. Выбрать один из трех вариантов вывода.
Рис. 5. Пример оформления расчетов.

Рис. 6. Установление параметров гистограммы


5. В диалоговом окне Гистограмма определить параметры гистограммы ( по необходимости). При активизации ( установление флажка манипулятором мышь) опции Парето (отсортированная диаграмма) создается гистограмма, у которой все столбцы будут отсортированы в убывающем порядке. Для расположения столбцов в естественном порядке с учетом указанных категорий эту опцию не активизировать. Выбор опции Интегральный процент дает возможность отобразить на гистограмме линию, точки которой обозначают нарастающее количество значений в процентном выражении (аналог функции распределения). Выбор опции Вывод графика позволяет отобразить гистограмму рядом с распределением частот. В случае отказа от выбора данной опции будет показано распределение частот (рис. 7).
 Рис. 7. Распределение частот и гистограмма, демонстрирующие количество значений, попадающих в тот или иной интервал.

Достарыңызбен бөлісу:
1   2   3   4   5   6




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет