Лабораторная работа №4
Принятие решений в условиях неопределенности. Игры с природой
Цель работы: освоить и закрепить практические навыки по принятию и обоснованию управленческих решений в условиях недостатка информации, когда одним из игроков не имеет конкретной цели и случайным образом выбирает очередные «ходы».
Краткие теоретические сведения
Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игрок1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные «ходы» партнер по игре. Поэтому термин «природа» характеризует некую объективную действительность, которую не следует понимать буквально.
Матрица игры с природой А = ||аij||, где аij – выигрыш (потеря) игрока 1 при реализации его чистой стратегии i и чистой стратегии j игрока 2 (i=1, …, m; j=1,…,n).
Мажорирование стратегий в игре с природой имеет определенную специфику: исключать из рассмотрения можно лишь доминируемые стратегии игрока 1: если для всех g=1,…, n akj alj, k, l = 1,…,m, то k-ю стратегию принимающего решения игрока 1 можно не рассматривать и вычеркнуть из матрицы игры. Столбцы, отвечающие стратегиям природы, вычеркивать из матрицы игры (исключать из рассмотрения) недопустимо, поскольку природа не стремится к выигрышу в игре с человеком, для нее нет целенаправленно выигрышных или проигрышных стратегий, она действует неосознанно.
Рассмотрим организацию и аналитическое представление игры с природой. Пусть игрок 1 имеет m возможных стратегий: А1,А2, … , Аm, а у природы имеется n возможных состояний (стратегий): П1, П2, ..., Пn, тогда условия игры с природой задаются матрицей А выигрышей (потерь) игрока 1:
Возможен и другой способ задания матрицы игры с природой: не в виде матрицы выигрышей (потерь), а в виде так называемой матрицы рисков R = ||rij||m,n. Величина риска - это размер платы за отсутствие информации о состоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей (потерь) А.
Риск - это разность между результатом, который игрок мог бы получить, если бы он знал действительное состоянием среды и результатом, который игрок получит при j-ой стратегии.
Зная состояние природы (стратегию) Пj, игрок выбирает ту стратегию, при которой его выигрыш максимальный или потеря минимальна, т.е.
rij = j-aij, где j = max aij, при заданном j. 1 i m если аij - выигрыш
rij = aij - j, где j = min aij, при заданном j. 1 i m если аij – потери (затраты)
Неопределенность, связанную с полным отсутствием информации о вероятностях состояний среды (природы), называют «безнадежной».
В таких случаях для определения наилучших решений используются следующие критерии: Вальда, Сэвиджа, Гурвица.
Критерий Вальда. С позиций данного критерия природа рассматривается как агрессивно настроенный и сознательно действующий противник.
Если в исходной матрице по условию задачи результат aij представляет выигрыш лица, принимающего решение, то выбирается решение, для которого достигается значение W = max min aij, 1 i m, 1 j n – максиминный критерий.
Если в исходной матрице по условию задачи результат aij представляет потери лица, принимающего решение, то выбирается решение, для которого достигается значение W = min max aij, 1 i m, 1 j n – минимаксный критерий.
В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучшей. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай.
Критерий минимаксного риска Сэвиджа. Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей А, а матрицей рисков R:
S = min max rij 1 i m, 1 j n.
Применение критерия Сэвиджа позволяет любыми путями избежать большого риска при выборе стратегии, а значит, избежать большего проигрыша (потерь).
Критерий пессимизма-оптимизма Гурвица. Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом.
Критерий основан на следующих двух предположениях: «природа» может находиться в самом невыгодном состоянии с вероятность (1-р) и в самом выгодном состоянии с вероятностью р, где р – коэффициент пессимизма.
Согласно этому критерию стратегия в матрице А выбирается в соответствии со значением:
HA = max p max aij + (1-p) min aij , 1 i m, 1 j n. если aij – выигрыш
HA = min p min aij + (1-p) max aij , 1 i m, 1 j n. если aij – потери (затраты)
При p = 0 критерий Гурвица совпадает с критерием Вальда. При p = 1 приходим к решающему правилу вида max max aij, к так называемой стратегии «здорового оптимизма», критерий максимакса.
Применительно к матрице рисков R критерий пессимизма-оптимизма Гурвица имеет вид:
HR = min p max rij + (1-p) min rij , 1 i m, 1 j n.
При р = 0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков (min rij); при р = 1 – по критерию минимаксного риска Сэвиджа.
Значение р от 0 до 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или оптимизму. При отсутствии ярко выраженной склонности р = 0,5 представляет наиболее разумный вариант.
В случае, когда по принятому критерию рекомендуются к использованию несколько стратегий, выбор между ними может делаться по дополнительному критерию. Здесь нет стандартного подхода. Выбор может зависеть от склонности к риску игрока1.
Контрольный пример
Транспортное предприятие должно определить уровень своих производственных возможностей так, чтобы удовлетворить спрос клиентов на транспортные услуги на планируемый период. Спрос на транспортные услуги не известен, но прогнозируется, что он может принять одно из четырех значений: 10, 15, 20 или 25 тыс. т. Для каждого уровня спроса существует наилучший уровень провозных возможностей транспортного предприятия. Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения провозных возможностей над спросом (из-за простоя подвижного состава), либо из-за неполного удовлетворения спроса на транспортные услуги. Возможные прогнозируемые затраты на развитие провозных возможностей представлены в табл.4.1.
Таблица 4.1
Варианты
провозных возможностей
транспортного предприятия
|
Варианты спроса
на транспортные услуги
|
1
|
2
|
3
|
4
|
1
|
6
|
12
|
20
|
24
|
2
|
9
|
7
|
9
|
28
|
3
|
23
|
18
|
15
|
19
|
4
|
27
|
24
|
21
|
15
|
Необходимо выбрать оптимальную стратегию. Использовать: критерий Вальда, критерий Сэвиджа, критерий Гурвица.
Решение
Имеются четыре варианта спроса на транспортные услуги, что равнозначно наличию четырех состояний «природы»: П1, П2, П3, П4. Известны так же четыре стратегии развития провозных возможностей транспортного предприятия: А1, А2, А3, А4. Затраты на развитие провозных возможностей при каждой паре Пi и Аi заданы следующей матрицей:
Построим матрицу рисков. В данном примере aij представляет затраты т.е. потери значит для построения матрицы рисков используется принцип rij = aij - j, где j = min aij.
Для П1: j = 6
Для П2: j = 7
Для П3: j = 9
Для П4: j = 15
Матрица рисков имеет следующий вид:
Критерий Вальда
Так как в данном примере aij представляет затраты т.е. потери, то применятся минимаксный критерий.
Для А1: max aij = 24
Для А2: max aij = 28
Для А3: max aij = 23
Для А4: max aij = 27
W = min max aij = 23 наилучшей стратегией развития провозных возможностей в соответствии с минимаксным критерием Вальда будет третья стратегия (А3).
Критерий минимаксного риска Сэвиджа
Для А1: max rij = 11
Для А2: max rij = 13
Для А3: max rij = 17
Для А4: max rij = 21
S = min max rij = 11 наилучшей стратегией развития провозных возможностей в соответствии с критерием Сэвиджа будет первая стратегия (А1).
Критерий пессимизма-оптимизма Гурвица
Положим значение коэффициента пессимизма р = 0,5.
Так как в данном примере aij представляет затраты (потери), то применятся критерий:
HA = min p min aij + (1-p) max aij
|
min aij
|
max aij
|
p min aij + (1-p) max aij
|
Для А1
|
6
|
24
|
15
|
Для А2
|
7
|
28
|
17,5
|
Для А3
|
15
|
23
|
19
|
Для А4
|
15
|
27
|
21
|
Оптимальное решение заключается в выборе стратегии А1
Рассчитаем оптимальную стратегию применительно к матрице рисков
HR = min p max rij + (1-p) min rij
|
min rij
|
max rij
|
p max rij + (1-p) min rij
|
Для А1
|
0
|
11
|
5,5
|
Для А2
|
0
|
13
|
6,5
|
Для А3
|
4
|
17
|
10,5
|
Для А4
|
0
|
21
|
10,5
|
Оптимальное решение заключается в выборе стратегии А1
Вывод: в примере предстоит сделать выбор, какое из возможных решений предпочтительнее:
-
по критерию Вальда – выбор стратегии А3;
-
по критерию Сэвиджа – выбор стратегии А1;
-
по критерию
-
Гурвица – выбор стратегии А1.
Достарыңызбен бөлісу: |