Что представляют элементы платежной матрицы. Платежная матрица

Суть каждого принимаемого руководством решения - выбор наилучшей из нескольких альтернатив по конкретным установленным заранее критериям. (Если вы захотите вспомнить рассмотрение ограничений и критериев для принятия решений, обратитесь к гл. 6).Платежная матрица - это один из методов статистической теории решений, метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целей.

По словам Н. Пола Лумбы: <Платеж представляет собой денежное вознаграждение или полезность, являющиеся следствием конкретной стратегии в сочетании с конкретными обстоятельствами. Если платежи представить в форме таблицы (или матрицы), мы получаем платежную матрицу>, как показано на рис. 8.4. Слова <в сочетании с конкретными обстоятельствами> очень важны, чтобы понять, когда можно использовать платежную матрицу и оценить, когда решение, принятое на ее основе, скорее всего будет надежным. В самом общем виде матрица означает, что платеж зависит от определенных событий, которые фактически свершаются. Если такое событие или состояние природы не случается на деле, платеж неизбежно будет иным.

В целом платежная матрица полезна, когда:

1. Имеется разумно ограниченное число альтернатив или вариантов стратегии для выбора между ними.

2. То, что может случиться, с полной определенностью не известно.

3. Результаты принятого решения зависят от того, какая именно выбрана альтернатива и какие события в действительности имеют место.

Кроме того, руководитель должен располагать возможностью объективной оценки вероятности релевантных событий и расчета ожидаемого значения такой вероятности. Руководитель редко имеет полную определенность. Но также редко он действует в условиях полной неопределенности. Почти во всех случаях принятия решений руководителю приходится оценивать вероятность или возможность события. Из предшествующего рассмотрения напомним, что вероятность варьирует от 1, когда событие определенно произойдет, до 0, когда событие определенно не произойдет. Вероятность можно определить объективно, как поступает игрок в рулетку, ставя на нечетные номера. Выбор ее значения может опираться на прошлые тенденции или субъективную оценку руководителя, который исходит из собственного опыта действий в подобных ситуациях.

Если вероятность не была принята в расчет, решение всегда будет соскальзывать в направлении наиболее оптимистических последствий. Например, если исходить из того, что инвесторы на удачной кинокартине могут иметь 500% на инвестированный капитал, а при вложении в торговую сеть - в самом благоприятном варианте всего 20%, то решение всегда должно быть в пользу кинопроизводства. Однако если взять в расчет, что вероятность большого успеха кинофильма весьма невысока, капиталовложения в магазины становятся более привлекательными, поскольку вероятность получения указанных 20% очень значительна. Если взять более простой пример, то выплаты при ставках в заезде на длинную дистанцию на скачках выше, поскольку выше вероятность, что не выиграешь вообще ничего.

Вероятность прямо влияет на определение ожидаемого значения - центральной концепции платежной матрицы. Ожидаемое значение альтернативы или варианта стратегии - это сумма возможных значений, умноженных на соответствующие вероятности. К примеру, если вы считаете, что вложение средств (как стратегия действий) в киоск для торговли мороженым с вероятностью 0,5 обеспечит вам годовую прибыль 5000 долл., с вероятностью 0,2 - 10 000 долл. и с вероятностью 0,3 - 3000 долл., то ожидаемое значение составит.

В данной матрице элементы величины α i и β j соответственно минимальные значения элементов a ij по строкам и максимальные по столбцам.

Построение платежной матрицы – наиболее трудоемкий этап подготовки принятия решения. Ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.

Возможен и другой способ задания матрицы игры с природой – в виде матрицы рисков R, или матрицы потерь (упущенных возможностей) . Величина риска – это размер платы за отсутствие информации о состоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей.

Риском r ij игрока А при использовании им стратегии А i , а игроком В – стратегии В j называют разность между выигрышем, который игрок А получил бы, если бы знал, что игрок В выберет стратегию В j , и выигрышем, который игрок получил бы, не имея этой информации. Зная стратегию игрока В, игрок А выбирает вариант действий, при котором его выигрыш максимален, то есть r ij = β j – a ij , где при заданномj .

Рассмотрим способ построения матрицы рисков на примере (табл. 8.2, 8.3).

Таблица 8.2

Пример платежной матрицы

α i

β j

Согласно выведенным определениям r ij и β j получаем матрицу рисков.

Таблица 8.3

Матрица рисков

Независимо от вида матрицы игры требуется выбрать такую стратегию игрока, которая была бы наиболее выгодной по сравнению с другими.

В условиях неопределенности для определения наилучших решений могут быть использованы следующие критерии:

1. Критерий максимакса (критерий крайнего оптимизма) . Позволяет определить стратегию, максимизирующую выигрыш игрока (М ):

.

Очевидно, что для матрицы выигрышей, представленной в табл. 8.2 , наилучшим решением будет А 1 , при котором достигается максимальный выигрыш – 9.

Следует отметить, что ситуации, требующие применения такого критерия, в экономике в общем нередки, и пользуются им не только безоглядные оптимисты, но и игроки, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом "или пан, или пропал".

2. Критерий Вальда (критерий максимина) . Данный критерий позволяет максимизировать минимально возможный выигрыш:

.

Для стратегии А 1
;

Для стратегии А 2
;

Для стратегии А 3
.

Соответственно W = 3, что соответствует стратегии А 2 игрока А.

Особенность максиминного критерия в том, что он ориентирует на выбор наиболее безопасного варианта. Это своего рода критерий для осторожного человека. Им главным образом следует пользоваться в тех случаях, когда действия направлены на удовлетворение жизненно важных потребностей и необходимо обеспечить успех при любых возможных условиях. Он имеет в качестве недостатка неубедительность использования в разных условиях окружающей обстановки. Однако в тех случаях, когда действия направлены на удовлетворение жизненно важных потребностей и необходимо обеспечить успех при любых возможных условиях, максиминный критерий в наибольшей степени соответствует существу задачи. Так или иначе, выбор такой стратегии определяется отношением игрока к риску.

3. Критерий Сэвиджа (критерий минимакса) . Позволяет минимизировать максимальные потери. Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрыша, а матрицей рисков:

Для матрицы рисков, представленной в табл. 8.3,

Для стратегии А 1
;

Для стратегии А 2
;

Для стратегии А 3
.

Соответственно, S = 4, что соответствует стратегии А 1 игрока А.

Слабость данного критерия заключается в допущении, что результаты выбираются разумным противником, интересы которого прямо противоположны нашим собственным, то есть мы полагаем следующее: если применяемые правила принятия решений позволяют противнику извлечь какое-либо преимущество, то он обязательно это сделает. Однако если исключить вполне определенные условия конкурентной борьбы, то столь пессимистические допущения нельзя оправдать. Действительно, ведь результаты могут выбираться нерациональным "противником", а цели "противника" не обязательно полностью противоречат нашим собственным.

    Критерий Гурвица (критерий обобщенного максимина или критерий пессимизма – оптимизма) . Был предложен с учетом недостатков указанных выше критериев. При выборе решения он рекомендует руководствоваться неким средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом. Критерий имеет следующий вид:

,

где р – коэффициент пессимизма (
).

При р = 0 критерий Гурвица совпадает с максимаксным критерием, а при р = 1 – с критерием Вальда.

Покажем процедуру применения данного критерия для платежной матрицы при р = 0,4:

Для стратегии А 1
;

Для стратегии А 2
;

Для стратегии А 3 .

Тогда Н А = 6, что соответствует стратегии А 2 (для сравнения, при р = 0,3, оптимальной будет являться стратегия А 1).

Применительно к матрице рисков критерий Гурвица выглядит следующим образом:

,

    Критерий Лапласа . В его основу положено предположение, что поскольку о вероятностях получения того или иного результата ничего неизвестно, то можно полагать их равновероятными. Поэтому оценка каждой i -й стратегии производится как среднее арифметическое в i -й строке (L):

Для представленной выше платежной матрицы:

Для стратегии А 1
;

Для стратегии А 2
;

Для стратегии А 3
.

Соответственно, L = 4,75, что соответствует стратегии А 1 .

В случае, когда по принятому критерию рекомендуется к использованию несколько стратегий, выбор между ними может делаться по дополнительному критерию. Например, в расчет могут приниматься средние квадратичные отклонения от средних выигрышей при каждой стратегии.

Попытка сформулировать критерий оценки возможных решений в условиях неопределенности отражает стремление сделать более наглядными преимущества и недостатки каждого варианта действий в различной обстановке.

Как видно из представленных выше расчетов, использование различных критериев при решении одной задачи, как правило, приводит к получению неодинаковых результатов. Существует два подхода к выбору критериев для решения задач в условиях неопределенности. Первый из них – это разработка новых критериев или требований для выбора критерия принятия решения. Второй путь заключается в использовании любой, пусть самой скудной, информации о вероятностях реализации различных условий внешней среды (различных результатов, получаемых при реализации той или иной стратегии) или в проведении экспериментов с целью получения оценок этих вероятностей. Тем самым неопределенная задача становится вероятностной.

Оба пути трудоемки и, как правило, трудновыполнимы на практике, однако предпочтительнее все же второй путь. Первый путь приводит к поискам новых критериев для выбора лучшего из числа известных, затем – к поискам критериев для выбора из числа рассматриваемых и т. д. Иными словами, не существует критерия принятия решения, не основанного на оценках вероятностей, который удовлетворял бы определенным обоснованным требованиям "хорошего" критерия.

Ни один из предложенных методов выбора решений не является универсальным, способным удовлетворить любого ЛПР. Люди по-разному относятся к элементам риска, содержащимся в каждом решении. Один склонен рисковать в надежде добиться большего успеха, другой предпочитает всегда действовать осторожно. Разумеется, размеры риска, допускаемые в решении, зависят не только от характера ЛПР, но и от содержания целей.

Ученые считают, что правило минимаксных (осторожных) решений интуитивно применяется большинством руководителей в повседневной практике, в то время как стремление к максимуму ожидаемых результатов могло бы быть более эффективным для организации. Так, многие руководители предпочитают иметь на складах предприятия некоторые излишки запасов материалов, чем подвергаться риску возникновения простоев в производстве из-за перебоев в поставках.

В платежной матрице игры существует элемент, являющийся одновременно минимальным в своей строке и максимальным в своем столбце. Такой элемент называют седловой точкой. Седловая точка в игре имеет место тогда, когда наблюдается равенство α i = β j . При этом значение α i = β j V называют чистой ценой игры. В этом случае решение игры (совокупность оптимальных стратегий игроков) обладает следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии. Поэтому для игры с седловой точкой минимаксные стратегии обладают устойчивостью.

В целом теория игр может рассматриваться как своеобразный методический инструмент для анализа ситуаций, характеризующихся конфликтом сторон и неопределенностью.

Однако в связи с отмеченными выше существенными ограничениями, лежащими в основе формализации игры, далеко не все реальные ситуации допускают такую формализацию, а полученные выводы в реальных ситуациях выглядят зачастую банальными (например, направить все ресурсы на наиболее эффективные операции) и могут требовать корректировки с позиций здравого смысла, диверсификации видов деятельности и т.д. Это снижает практическую эффективность игрового подхода в реальной деятельности.

Платежная матрица - это один из методов статистической теории решений, метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целей.

В целом платежная матрица полезна, когда :

1. Имеется разумно ограниченное число альтернатив или вариантов стратегии для выбора между ними.

2. То, что может случиться, с полной определенностью не известно.

3. Результаты принятого решения зависят от того, какая именно выбрана альтернатива и какие события в действительности имеют место.

Кроме того, руководитель должен располагать возможностью объективной оценки вероятности релевантных событий и расчета ожидаемого значения такой вероятности. Руководитель редко имеет полную определенность. Но также редко он действует в условиях полной неопределенности. Почти во всех случаях принятия решений руководителю приходится оценивать вероятность или возможность события.

Подходы:

а) без учета численных значений вероятностей исходов

б) с учетом численных значений вероятностей исходов

После построения матрицы выбирается вариант действий, обеспечивает оптимальное значение критерия.

а) – Правила при выборе вариантов действий:

1)максимальное решение – максимизация максимума критерия. В качестве критерия прибыль или доход

2)максимальное решение – максимизация минимума критерия (критерий – прибыль или доход)

3)минимаксное решение – минимизация максимума критерия.

Минимаксное решение– средний по степени риска подход.

б) – все решения будут оптимистическими, т.к ориентированы на более благоприятный исход событий.

Подходы:

1)максимизация критериев

2)минимизация критериев

Платежная матрица с учетом вероятности исходов событий:

– вероятность i – того варианта исхода событий

математическое ожидание критерия при выборе i – того варианта альтернатив действий

Алгоритм выбора решений:

1)Максимизация наиболее вероятных значений критерия

2)На основе правила максимальной вероятности минимизации наиболее вероятных значений критерия

3)На основе правила максимизации математического ожидания

4)На основе правила минимизации математического ожидания критерия.

35.Существование метода «Дерево решений».

Примеры подразумевают един.решение, однако на практике результат одного решения заставляет принимать следствие. Эту последовательность нельзя выразить платежной матрицей, поэтому, когда нужно принимать несколько решений, каждое из которых зависит от исходов предыдущего, используем схему «дерево решений».

Составляя «Дерево решений», можно нарисовать «ствол» и «ветви», отображающие структуру проблемы. Располагаются «деревья» слева направо. «Ветви» обозначают возможные альтернативные решения, которые могут быть приняты, и возможные исходы, возникающие в результате этих решений, ветви выходят из узлов, которые бывают двух типов:

1.Квадратный узел обозначает место, где принимаются решения

2.Квадратный узел обозначает место, где проявляются различные варианты исходов квадрата.

Два вида «ветвей»:

Пунктирные линии, выходящие из квадратов возможных решений, движение по ним зависит от принятия решений. На соответствующей пунктирной «ветви» проставляются все расходы, вызванные решением.

Сплошные линии, выходящие из кружков возможных исходов, движение по ним определяется исходом событий. На сплошной линии указывается вероятность данного исхода.

Квадрат – узел принятия решения.

Круг – узел ветвления вариантов исходов событий.

Пунктир – ветви, движение по которым зависит от принимаемого решения

Линия – ветви, движение по которым зависит от исхода событий.

3 этапа поиска решений:

1.Строится «дерево», когда все решения и их исходы указаны на «дереве», просчитывается каждый из вариантов, и в конце проставляется его денежный доход.

2.Вычисляется и проставляется на соответствующих «ветвях» вероятности каждого исхода.

3.Справа налево рассчитываются и проставляются денежные исходы каждого из узлов. Любые возникающие расходы вычитаются из ожидаемых доходов.

После того, как пройдены квадраты решений, выбирается «ветвь», ведущая к наибольшему из возможных при данном решении ожидаемому доходу. Другая «ветвь» зачеркивается, а ожидаемый доход проставляется над квадратом решения.

Так в конце третьего этапа оказывается сформированной последовательность решений, ведущая к максимальному доходу, в качестве критерия может выступать как максимизация математического ожидания, так и математическое ожидание потерь.

36.Особенности метода «Ранжирования решений» .

Данный метод предполагает 3 варианта стратегий: 1. осторожное (пессимистичное), 2. оптимистичное, 3.рациональное (рассчитано на среднее условие)

Известно, что метод платежной матрицы, без учета вероятности исхода, так же предполагает 3 варианта действий с точки зрения их рискованности.

Оптимистичной стратегией в методе платежной матрицы можно считать максимизационный подход, пессимистической - максимальный, а рациональный – минимаксный.

Суть пессимистической стратегии состоит в том, что ЛПР должно рассчитывать при выборе решения на худшее(решение не требует знания вероятности решения)

Оптимальное по критерию пессимизма решения определяется путем нахождения для каждого решения наихудшей оценки по всем ситуациям и последующ.выбором наилучшей из них (наилучшего из наихудшего решения).

Пример алгоритма выбора решения по критерию пессимизма .

Мы имеем n-вариантов действий, Aj и m – вариантов, Si – (события?).

Определен.ранги bij, для каждого из решения Aj (j=1+n).

В случае, если события будут развиваться по варианту Si в этом же этапе ранги могут быть выставлены либо индивидуально ЛПР, либо методом коллективной экспертной оценки. Результат ранжирования сводится в таблицу.

Варианты

Коэф-ты важности Kj

Aj (j=1 ÷n), по всем ситуациям Si (i=1÷m)

Коэф.важности Kj соответствует максимальному АО абсолютной величине значению ранга решения по всем ситуациям (наихудшая оценка). Kj=max bij по i.

Выбирается оптимальное решение, которое соответствует минимальному, по абсолютной величине, значению Kj всех решений (наилучшая оценка). А пессим.=min Kj по j.

Оптимистичной стратегии соответствует критерий оптимизма. В этом случае ЛПР должно рассчитывать на лучшее.

Оптимальное, по критерию оптимизма, решение определяется путем нахождения для каждого решения наилучшей оценки по всем ситуациям и последующим выборам наилучших из них (наилучшее решение). Правило выбора оптимального решения в дан.случае имеет вид: Kj=min bij по i, A =min Kj по j.

Оптимал.решение min A1 и A2. A оптим. – A1 и A2.

Рациональная стратегия реализации по критерию максимума среднего выигрыша.

ЛПР должно рассчитывать решение на наибольшую вероятность условия. Для реализации рациональной стратегии требуется знание вероятностей Pi исходов, событий Si.

Коэффициент важности в дан.случае представляет собой средний выигрыш, который получается при каждом решении по всем ситуациям.

Вар-т исход

Вар.действий

Вар-т исход. Р

Коэф. важн.Kj

Mj=∑i aij*Pi. Оптимальное решение соответствует максимальному значению коэф.важности. Aрац.=max Kj по j. Оптимальным решением в дан.случае будет А3, т.к.ему соответствует max значение важности (К3=2,8)

ПРАКТИЧЕСКАЯ РАБОТА №3

Модели теории игр

Понятие об игровых моделях

Теория игр занимается разработкой различного рода рекомендаций по принятию решений в условиях конфликтной ситуации. Формируя конфликтные ситуации математически, их можно представить как игру двух, трёх и более игроков, каждый из которых преследует цель максимизации своего выигрыша за счет другого игрока. Математическая модель конфликтной ситуации называется игрой , стороны, участвующие в конфликте, – игроками , а исход конфликта – выигрышем . Для каждой формализованной игры вводятся правила , т.е. система условий, определяющая:

1. варианты действий игроков;

2. объем информации каждого игрока о поведении партнеров;

3. выигрыш, к которому приводит каждая совокупность действий.

Как правило, выигрыш может быть задан количественно (например, проигрыш – 0, выигрыш – 1, ничья – ½). Игра называется парной , если в ней участвуют два игрока, и множественной , если число игроков больше двух. Игра называется игрой с нулевой суммой , если выигрыш одного из игроков равен проигрышу другого. Выбор и осуществление одного из предусмотренных правилами действий называется ходом игрока. Ходы могут быть личными и случайными. Личный ход – сознательный выбор игроком одного из возможных действий (ход в шахматной игре), случайный ход – случайно выбранное действие (выбор карты из перетасованной колоды).

Стратегией игрока называется совокупность правил, определяющих выбор его действия при при каждом личном ходе в зависимости от сложившейся ситуации. Игра называется конечной , если у игрока имеется конечное число стратегий, и бесконечной – в противном случае.

Для того, чтобы решить игру, или найти решение игры , следует для каждого игрока выбрать стратегию, которая удовлетворяет условию оптимальности, т.е. один из игроков должен получить максимальный выигрыш , когда второй придерживается своей стратегии. В то же время второй игрок должен иметь минимальный проигрыш , если первый придерживается своей стратегии. Такие стратегии называются оптимальными. Целью теории игр является определение оптимальной стратегии для каждого игрока . При выборе оптимальной стратегии естественно предполагать, что оба игрока ведут себя разумно с точки зрения своих интересов.

Платежная матрица. Нижняя и верхняя цена игры

Рассмотрим парную конечную игру. Пусть игрок А располагает m личными стратегиями, которые обозначим А 1 , А 2 ,…,А m . Пусть у игрока B имеется n личных стратегий, обозначим их B 1 , B 2 ,…,B n . Говорят, что игра имеет размерность m ´ n . В результате выбора игроками любой пары стратегий А i и B j однозначно определяется исход игры, т.е. выигрыш a ij игрока А (положительный или отрицательный) и проигрыш (-a ij ) игрока В . Матрица Р=(a ij) , элементами которой являются выигрыши, соответствующие стратегиям А i и B j , называется платежной матрицей или матрицей игры .

B j A i B 1 B 2 B n
A 1 a 11 a 12 a 1n
A 2 a 21 a 22 a 2n
A m a m1 a m 2 a mn

Пример – игра «Поиск»

Игрок А может спрятаться в убежище 1 – обозначим эту стратегию за А 1 или в убежище 2 – стратегия А 2 . Игрок В может искать первого игрока в убежище 1 –стратегия В 1 , либо в убежище 2 – стратегия В 2 . Если игрок А находится в убежище 1 и его там обнаруживает игрок В , т.е. осуществляется пара стратегий (А 1 ,В 1) , то игрок А платит штраф, т.е. a 11 =–1. Аналогично получаем a 22 =–1. Очевидно, что стратегии (А 1 ,В 2) и (А 2 ,В 1) дают игроку А выигрыш 1, поэтому a 12 =a 21 =1. Таким образом, получаем платежную матрицу

Рассмотрим игру m ´ n с матрицей Р=(a ij) и определим наилучшую среди стратегий игрока А . Выбирая стратегию А i , игрок А должен рассчитывать, что игрок В ответит на нее той из стратегий В j , для которой выигрыш для игрока А минимален (игрок В стремится «навредить» игроку А ).

Обозначим через a i наименьший выигрыш игрока А при выборе им стратегии А i для всех возможных стратегий игрока В (наименьшее число в i -й строке платежной матрицы), т.е. .

Среди всех чисел a i выберем наибольшее: . Назовем a нижней ценой игры , или максимальным выигрышем (максимином ). Это гарантированный выигрыш игрока А при любой стратегии игрока В . Следовательно, .

Стратегия, соответствующая максимину, называется максиминной стратегией . Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А ; выбирая стратегию B j , он учитывает максимально возможный при этом выигрыш для A. Обозначим .

Среди всех чисел выберем наименьшее иназовем b верхней ценой игры , или минимаксным выигрышем (минимаксом ). Это гарантированный проигрыш игрока В при любой стратегии игрока А . Следовательно, .

Стратегия, соответствующая минимаксу, называется минимаксной стратегией . Принцип, диктующий игрокам выбор наиболее осторожных минимаксной и максиминной стратегий, называется принципом минимакса .

Статистические игры

Во многих задачах, приводящихся к игровым, неопределенность вызвана отсутствием информации об условиях, в которых осуществляется действие. Эти условия зависят не от сознательных действий другого игрока, а от объективной действительности, которую принято называть «природой». Такие игры называют играми с природой (статистическими играми).

Задача

После нескольких лет эксплуатации промышленное оборудование оказывается в одном из следующих состояний: В 1 – оборудование может использоваться в очередном году после профилактического ремонта; В 2 – для безаварийной работы оборудования в дальнейшем следует заменить отдельные его детали и узлы; В 3 – оборудование требует капитального ремонта или замены.

В зависимости от сложившейся ситуации В 1 ,В 2 ,В 3 руководство предприятия может принять такие решения: А 1 – отремонтировать оборудование силами заводских специалистов, что требует соответствующих затрат а 1 =6, а 2 =10, а 3 =15 ден.ед; А 2 – вызвать специальную бригаду ремонтников, расходы в этом случае составят b 1 =15, b 2 =9, b 3 =18 ден.ед; А 3 – заменить оборудование новым, реализовав устаревшее оборудование по его остаточной стоимости. Совокупные затраты в результаты этого мероприятия будут равны соответственно с 1 =13, с 2 =24, с 3 =12 ден.ед.

Задание

1. Придав описанной ситуации игровую схему, выявить ее участников, указать возможные чистые стратегии сторон.

2. Составить платежную матрицу, пояснив смысл элементов a ij матрицы (почему они отрицательные?).

3. Выяснить, какое решение о работе оборудования в предстоящем году целесообразно рекомендовать руководству предприятия, чтобы минимизировать потери при следующих предположениях: а) накопленный на предприятии опыт эксплуатации аналогичного оборудования показывает, что вероятности указанных состояний оборудования равны соответственно q 1 =0,15; q 2 =0,55; q 3 =0,3 (примените критерий Байеса); б) имеющийся опыт свидетельствует о том, что все три возможных состояния оборудования равновероятны (примените критерий Лапласа); в) о вероятности оборудования ничего определенного сказать нельзя (примените критерии Вальда, Сэвиджа, Гурвица). Значение параметра g=0,8 в критерии Гурвица задано.

Решение

1) Описанная ситуация представляет собой статистическую игру.

В качестве статистика выступает руководство предприятия, которое может принять одно из следующих решений: отремонтировать оборудование своими силами (стратегия А 1), вызвать ремонтников (стратегия А 2); заменить оборудование новым (стратегия А 3).

Второй играющей стороной – природой будем считать совокупность факторов, влияющих на состояние оборудования: оборудование может использоваться после профилактического ремонта (состояние В 1); нужно заменить отдельные узлы и детали оборудования (состояние В 2): потребуется капитальный ремонт или замена оборудования (состояние В 3).

2) Составим платежную матрицу игры:

Элемент платежной матрицы а ij показывает затраты руководства предприятия, если при выбранной стратегии А i оборудование окажется в состоянии В j . Элементы платежной матрицы отрицательны, так как при любой выбранной стратегии руководству предприятия придется нести расходы.

а) накопленный на предприятии опыт эксплуатации аналогично оборудования показывает, что вероятности состояний оборудования равны q 1 =0,15; q 2 =0,55; q 3 =0,3.

Платежную матрицу представим в виде:

Стратегии статистика, A i Состояния природы B j
B 1 B 2 B 3
A 1 -6 -10 -15 -10,9
A 2 -15 -9 -18 -12,6
A 3 -13 -24 -12 -18,75
q j 0,15 0,55 0,3

где , (i=1,3)

По критерию Байеса за оптимальную принимается та чистая стратегия А i , при которой максимизируется средний выигрыш статистика, т.е. обеспечивается =max .

Оптимальной стратегией по Байесу является стратегия А 1 .

б) имеющийся опыт свидетельствует о том, что все три возможных состояния оборудования равновероятны, т.е. = 1/3.

Средние выигрыши равны:

1/3*(-6-10-15) = -31/3 » -10,33;

1/3*(-15-9-18) = -42/3 = -14;

1/3*(-13-24-12) = -49/3 » -16,33.

Оптимальной стратегией по Лапласу является стратегия А 1 .

в) о вероятностях оборудования нельзя сказать ничего определенного.

По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.

.

= max (-15, -18, -24) = -15.

Таким образом, оптимальной является стратегия А 1 .

Построим матрицу рисков , где .

В зависимости от числа возможных стратегий игры делятся на "конечные" и "бесконечные".

Конечной называется игра, в которой у каждого игрока имеется только конечное число стратегий.

Конечная игра, в которой игрок А имеет m стратегий, а игрок В - n стратегий, называется игрой m´n .

Рассмотрим игру m´n двух игроков А и В ("мы" и "противник").

Будем обозначать наши стратегии A 1 , А 2 ,…, А m ; стратегии противника - B 1 , В 2 ,..., В n .

Пусть каждая сторона выбрала определенную стратегию; для нас это будет А i для противника. В j .

Если игра состоит только из личных ходов, то выбор стратегий A i , В j однозначно определяет исход игры - наш выигрыш. Обозначим его a ij .

Если игра содержит, кроме личных, случайные ходы, то выигрыш при паре стратегий А i , В j есть величина случайная, зависящая от исходов всех случайных ходов. В этом случае естественной оценкой ожидаемого выигрыша является его среднее значение (математическое ожидание). Мы будем обозначать одним и тем же знаком a ij как сам выигрыш (в игре без случайных ходов), так и его среднее значение (в игре со случайными ходами).

Пусть нам известны значения a ij выигрыша (или среднего выигрыша) при каждой паре стратегий. Значения a ij можно записать в виде прямоугольной таблицы (матрицы), строки которой соответствуют нашим стратегиям (A i ), а столбцы - стратегиям противника (В j ). Такая таблица называется платежной матрицей или просто матрицей игры.

Матрица игры (платежная матрица) - таблица, в которой заданы стратегии игроков и платежи.


Матрица игры m´n имеет вид:

А В B 1 B 2 B n
A 1 a 11 a 12 a 1 n
A 2 a 21 a 22 a 2 n
A m a m1 a m2 a mn

Сокращенно мы будем обозначать матрицу игры

Рассмотрим несколько элементарных примеров игр.

Пример 1 . Два игрока А и В , не глядя друг на друга, кладут на стол по монете вверх гербом или вверх цифрой, по своему усмотрению. Если игроки выбрали одинаковые стороны (у обоих герб или у обоих цифра), то игрок А забирает обе монеты; иначе их забирает игрок В . Требуется проанализировать игру и составить ее матрицу.

Решение. Игра состоит только из двух ходов: наш ход и ход противника, оба личные. Игра не принадлежит к играм с полной информацией, так как в момент хода выполняющий его игрок не знает, что сделал другой.

Так как у каждого из игроков имеется только один личный ход, то стратегия игрока представляет собой выбор при этом единственном личном ходе.

У нас две стратегии: А 1 - выбирать герб и А 2 - выбирать цифру; у противника такие же две стратегии: В 1 герб и В 2 - цифра. Таким образом, данная игра есть игра 2´2. Будем считать выигрыш монеты за +1 . Матрица игры приведена ниже:

А В B 1 (Г) B 2 (Ц)
A 1 (Г) –1
A 2 (Ц) –1

На примере этой игры, как она ни элементарна, можно уяснить себе некоторые существенные идеи теории игр.

Предположим сначала, что данная игра выполняется только один раз. Тогда, очевидно, бессмысленно говорить о каких-либо "стратегиях" игроков более разумных, чем другие. Каждый из игроков с одинаковым основанием может принять любое решение. Однако при повторении игры положение меняется.

Действительно, допустим, что мы (игрок А) выбрали себе какую-то стратегию (скажем, А 1 ) и придерживаемся ее. Тогда уже по результатам первых нескольких ходов противник догадается о нашей стратегии и будет на нее отвечать наименее выгодным для нас образом, т.е. выбирать цифру. Нам явно невыгодно всегда применять какую-то одну стратегию; чтобы не оказаться в проигрыше, мы должны иногда выбирать герб, иногда - цифру. Однако, если мы будем чередовать гербы и цифры в какой-то определенной последовательности (например, через один), противник тоже может догадаться об этом иответить на эту стратегию наихудшим для нас образом. Очевидно, надежным способом, гарантирующим, что противник не будет знать нашей стратегии, будет такая организация выбора при каждом ходе, когда мы его сами наперед не знаем (это можно обеспечить, например, подбрасыванием монеты). Таким образом, мы путем интуитивных рассуждений подходим к одному из существенных понятий теории игр - к понятию "смешанной стратегии", т.е. такой, когда "чистые" стратегии - в данном случае А 1 и А 2 -чередуются случайно с определенными частотами. В данном примере из соображений симметрии заранее ясно, что стратегии А 1 и А 2 должны чередоваться с одинаковой частотой; в более сложных играх решение может быть далеко не тривиальным.

Пример 2 . Игроки А и В одновременно и независимо друг от друга записывают каждый одно из трех чисел: 1, 2 или 3.

Если сумма написанных чисел четная, то В платит А эту сумму в тенге; если она нечетная, то, наоборот, А платит В эту сумму. Требуется проанализировать игру и составить ее матрицу.

Решение . Игра состоит из двух ходов; оба - личные. У нас (А ) три стратегии: А 1 - писать 1; А 2 - писать 2; А 3 - писать 3. У противника (В ) - те же три стратегии. Игра представляет собой игру 3´3 с матрицей, приведенной ниже

А В B 1 B 2 B 3
A 1 –3
A 2 –3 –5
A 3 –5

Очевидно, как и в предыдущем случае, на любую выбранную нами стратегию противник может ответить наихудшим для нас образом. Действительно, если мы выберем, например, стратегию А 1 противник будет всегда отвечать на нее стратегией В 2 ; на стратегию А 2 - стратегией В 3 ; на стратегию А 3 - стратегией В 2 . Таким образом, любой выбор определенной стратегии неизбежно приведет нас к проигрышу.

Пример 3 . В нашем распоряжении имеются три вида вооружения: А 1 , А 2 , А 3 ; у противника - три вида самолетов: B 1 , B 2 , В 3 . Наша задача - поразить самолет; задача противника - сохранить его непораженным. При применении вооружения А 1 самолеты B 1 , B 2 , В 3 поражаются соответственно с вероятностями 0,9, 0,4 и 0,2; при вооружении А 2 - с вероятностями 0,3, 0,6 и 0,8; при вооружении А 3 - с вероятностями 0,5, 0,7 и 0,2. Требуется сформулировать ситуацию в терминах теории игр.

Решение . Ситуация может рассматриваться как игра 3´3 с двумя личными ходами и одним случайным. Наш личный ход - выбор типа вооружения; личный ход противника - выбор самолета для участия в бою. Случайный ход - применение вооружения; этот ход может закончиться поражением или непоражением самолета. Наш выигрыш равен единице, если самолет поражен, и равен нулю в противном случае. Нашими стратегиями являются три варианта вооружения; стратегиями противника - три варианта самолетов. Среднее значение выигрыша при каждой заданной паре стратегий есть не что иное, как вероятность поражения данного самолета данным оружием. Матрица игры приведена ниже:

А В B 1 B 2 B 3
A 1 0,9 0,4 0,2
A 2 0,3 0,6 0,8
A 3 0,5 0,7 0,2

Оптимальной стратегией игрока в теории игр называется такая стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или, что тоже самое, минимально возможный средний проигрыш). При выборе этой стратегии основой рассуждений является предположение, что противник является по меньшей мере таким же разумным, как и мы сами, и делает все для того, чтобы помешать нам добиться своей цели.

В теории игр все рекомендации вырабатывают, исходя именно из этих принципов; следовательно, в ней не учитываются элементы риска, неизбежно присутствующие в каждой реальной стратегии, а также возможные просчеты и ошибки каждого из игроков.

Теория игр, как и всякая математическая модель сложного явления, имеет свои ограничения. Важнейшим из них является то, что выигрыш искусственно сводится к одному единственному числу. В большинстве практических конфликтных ситуация при выработке разумной стратегии приходится принимать во внимание не один, а несколько численных параметров-критериев успешности мероприятия. Стратегия, являющаяся оптимальной по одному критерию, необязательно будет оптимальной по другим. Однако, сознавая эти ограничения и не придерживаясь слепо рекомендаций, получаемых игровыми методами, можно все же разумно использовать математический аппарат теории игр для выработки если не в точности "оптимальной", то, во всяком случае, "приемлемой" стратегии.




Top