В случае, когда интересы игроков различны, получаются две платежные матрицы: одна – матрица выплат игроку А, другая – матрица выплат игроку В. такие игры называются биматричными . В общем случае биматричная игра – это игра с ненулевой суммой. Примеры биматричных игр Примеры этого раздела описывают некоторые типические конфликтные ситуации, приводящие к биматричным играм. Сначала мы обсудим вопросы, связанные с формализацией рассматриваемых конфликтов (построение платежных матриц), а позднее – с рекомендациями по их разрешению. Борьба за рынки Небольшая фирма (игрок А) намерена сбыть партию товара на одном из двух рынков, контролируемых другой, более крупной фирмой (игрок В). Для этого фирма А готова сделать на одном из рынков соответствующие приготовления (например, развернуть рекламную кампанию). Господствующая на рынках фирма В может попытаться воспрепятствовать этому, приняв на одном из рынков предупредительные меры (разумеется, в рамках закона). Не встречая противодействия на рынке, фирма А захватывает его; при наличии препятствий – терпит поражение. Будем считать для определенности, что проникновение фирмы А на первый рынок более выгодно для нее, нежели на второй. Естественно также считать, что и борьба за первый рынок потребует вложения больших средств. Например, победа фирмы А на первом
248 рынке принесет ей вдвое больший выигрыш, чем победа на втором, но зато и поражение при попытке освоиться на первом рынке пол- ностью ее разорит, а фирму В избавит от конкурента. Что же касается второго рынка, то при поражении фирмы А ее потери будут не столь разорительны, но и победа принесет не много. Таким образом, у фирмы А две стратегии: A1 – выбор первого рынка, А2 – выбор второго рынка. Такие же стратегии и у фирмы В: В 1
– выбор первого рынка, В 2
– выбор второго рынка. Для того чтобы составить платежные матрицы игроков, нужны расчетные количественные показатели, которые мы приведем здесь в условных единицах: А= ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − 11 210 , В=⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − 11 25 . Посмотрим на выписанные матрицы выплат. Из сказанного выше ясно, что если оба игрока выберут один и тот же рынок, то победа останется за более сильной фирмой В.
То, что в ситуации (A1, B1) выигрыш игрока В равен 5, а в ситуации (А2,В2) – 1, подчеркивает, что первый рынок более выгоден (удобно расположен, хорошо посещаем и т. п.), чем второй. Выигрыш (–10) игрока А в ситуации (A1,В1) (а точнее, проигрыш) в сопоставлении с его выигрышем (–1) в ситуации (А2,В2) выглядит, разумеется, вполне сокрушительно. Что же касается ситуации, когда фирмы уделяют основное внимание разным рынкам – (A1,B2) и (А2, B1), то здесь фирму А ждет настоящий выигрыш, больший на более выгодном рынке. Потери, которые при этом несет фирма В,
оказываются прямо противоположными. Дилемма узников Игроками являются два узника, находящиеся в предварительном заключении по подозрению в совершении преступления. При отсутст- вии прямых улик возможность их осуждения в большой степени за- висит от того, заговорят они или будут молчать. Если оба будут молчать, то наказанием будет лишь срок предва- рительного заключения (потери каждого из узников составят (–1)). Если сознаются, то получат срок, учитывающий признание как смягчающее обстоятельство (потери каждого из узников составят в этом случае (–
6)). Если же заговорит только один из узников, а другой будет молчать. то в этом случае заговоривший будет выпущен на свободу (его потери равны 0), а сохраняющий молчание получит максимально возможное наказание (его потери будут равны (– 9)).
249 Эта конфликтная ситуация приводит к биматричной игре, в которой каждый из игроков имеет по две стратегии – молчать (М) или говорить (Г). Выигрыши игроков А и В соответственно описываются так;
Семейный спор Два партнера договариваются о совместном проведении одного из двух действий, (1) и (2), каждое из которых требует их совместного участия. В случае осуществления первого из этих двух действий выигрыш первого партнера (игрок А) будет вдвое выше выигрыша второго партнера (игрок В). Напротив, в случае осуществления второго из этих двух действий выигрыш игрока А будет вдвое меньше выигрыша игрока В. Если же партнеры выполнят различные действия, то выигрыш каждого из них будет равен нулю. Эта конфликтная ситуация приводит к биматричной игре, в которой каждый из игроков имеет по две стратегии. Выигрыши игроков А и В описываются таблицами следующего вида: Пояснение. Понятно, что различные конфликтные ситуации могут иметь одну и ту же формализацию. В частности, рассмотренная биматричная игра часто интерпретируется как одновременный выбор супругами совместного развлечения: посещение оперного спектакля или хоккейного матча. При этом в посещении оперного театра жена заинтересована в большей степени, чем муж, а при посещении стадиона наблюдается обратная картина. В случае же непреодолимости разногласий, возникших при выборе, день оказывается вообще испорченным. Отсюда и название, вынесенное в заголовок. Студент - преподаватель Рассмотрим следующую ситуацию. Студент (игрок А) готовится к зачету, который принимает преподаватель (игрок В). Можно считать, что у студента две стратегии – подготовиться к сдаче зачета (+) и не (М) (Г) (М) (Г) –1 0 –9 –6 (М)(Г) (М) (Г) –1 –9 0 –6 (1)(2) (1) (2) 1 0 0 2 (1) (2) (1) (2) 2 0 0 1
250 подготовиться (–). У преподавателя также две стратегии — поставить зачет [+] и не поставить зачета [–]. В основу значений функций выигрыша игроков положим следующие соображения: Выигрыш студента Выигрыш преподавателя
(+)
[+] Оценка заслужена [–] Очень обидно
(+) [+] Все нормально [–] Был неправ (–)
Удалось обмануть Оценка заслужена (–) Дал себя обмануть Опять придет Количественно это можно выразить, например, так [+] [–] [+] [–] (+) (–) 2 –1 (+) 1 0 (–) 1 –3 –2 –1 Смешанные стратегии В приведенных примерах описаны ситуации, в которых интересы игроков не совпадают. Естественно встает вопрос о том, какие рекомендации необходимо дать игрокам для того, чтобы моделируемая конфликтная ситуация разрешилась. Иными словами, что мы будем понимать под решением биматричной игры? Попробуем ответить на этот вопрос так: вследствие того, что ин- тересы игроков не совпадают, нам нужно построить такое (компромиссное) решение, которое бы в том или ином, но в одинаковом смысле удовлетворяло обоих игроков. Иначе говоря, попробуем найти некую равновесную ситуацию, явное отклонение от которой уменьшает выигрыш игрока. Подобный вопрос мы ставили и при рассмотрении матричных игр. Напомним, что возникавшее при разработке минимаксного подхода понятие равновесной ситуации приводило нас к поиску седловой точки, которая, как оказалось, существует далеко не всегда. Естественно ожидать, что в более сложном случае биматричной игры дело вряд ли будет обстоять проще. В матричных играх эта трудность была преодолена путем перехода к смешанным стратегиям, т. е. к такому поведению игроков, при котором они чередуют свои собственные чистые стратегии. Иными словами, любая матричная игра в смешанных стратегиях разрешима. Поэтому, рассматривая здесь биматричные игры, разумно попробовать сразу же перейти к смешанным стратегиям игроков. Тем
251 самым мы предполагаем, что каждая игра может быть повторена в неизменных обстоятельствах многократно. 2 × 2 - биматричные игры. Ситуация равновесия В 2×2 - биматричной игре платежные матрицы игроков имеют следующий вид: А= ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ 2221 1211 аа аа , В=⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ 2221 1211 bb bb . Вероятности выбора стратегий игрока А р 1 =р , р 2=1 – р , игрока В q 1 =q , q 2=1– q , а средние выигрыши вычисляются по формулам HA( р , q ) = a 11 pq + a 12 p (l -
q ) + a 21(l -
p ) q + a 22(1 -
p )(l -
q ), HB( р , q ) = b 11 pq + b 12 p (l -
q ) + b 21(l -
p ) q + b 22(1 -
p )(l -
q ), где 0 ≤ р ≤ 1, 0 ≤ q ≤ l .
Определение. Будем говорить, что пара чисел ( p* , q *), 0 ≤ р* ≤ 1, 0 ≤ q* ≤ l, определяет равновесную ситуацию, если для любых р и q , подчиненных условиям 0 ≤ р ≤ 1, 0 ≤ q ≤ l, одновременно выполнены следующие неравенства: HA( р , q* ) ≤ HA( р* , q* ), HB( р* , q ) ≤ HB( р *, q *). (2.7.3) Пояснение. Неравенства (2.7.3) означают следующее: ситуация, определяемая смешанной стратегией ( р *, q *), является равновесной, если отклонение от нее одного из игроков при условии, что другой сохраняет свой выбор, приводит к уменьшению выигрыша первого. Тем самым получается, что если равновесная ситуация существует, то отклонение от нее невыгодно самому игроку. ТЕОРЕМА (Дж. Нэш). Всякая биматричная игра имеет хотя бы
одну
равновесную ситуацию (точку равновесия) в смешанных стратегиях.
Итак, равновесная ситуация существует. Но как ее найти? Для обоснования способа определения равновесной ситуации сошлемся на следующий теоретический результат. ТЕОРЕМА. Выполнение неравенств (2.7.3) равносильно выполнению неравенств HA(0, q*) ≤ HA(р*, q*), HB(р*, 0) ≤ HB(р*, q*), (2.7.4) HA(1, q*) ≤ HA(р*, q*), HB(р*, 1) ≤ HB(р*, q*). Иными словами, для того чтобы убедиться, что пара ( p* , q* )
определяет равновесную ситуацию, достаточно проверить справед- ливость неравенств (2.7.2) только для двух чистых стратегий игрока А ( р = 0 и р = 1) и для двух чистых стратегий игрока В ( q = 0 и q = 1).
252 Пропуская промежуточные алгебраические выкладки, приходим к следующему результату: Для того чтобы в биматричной игре пара ( p* , q* )
определяла равновесную ситуацию, необходимо и достаточно одновременное выполнение следующих неравенств: ( p- 1)( Cq- α) ≥ 0,
p ( Cq- α) ≥ 0, ( q- 1)( Dp- β)≥0,
(2.7.5)
q ( Dp - β) ≥ 0, 0 ≤ р ≤ 1, 0 ≤ q ≤ l, где С =
a 11 – a 12 – a 21 + a 22, α = a 22 – a 12, D
=
b 11 – b 12 – b 21 + b 22, β = b 22 – b 21, Поиск равновесных ситуаций Геометрический смысл условий (2.7.4) рассмотрим на примерах описанных выше биматричных игр. Борьба за рынки Напомним, что ситуация, сложившаяся в этой задаче, задается платежными матрицами следующего вида: А= ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − 11 210 , В=⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − 11 25 . Заменяя в неравенствах (2.7.4) величины С ,
р ( - 14 q- ( - 3)) ≥0, q (9 p- 2) ≥0. Рассмотрим сначала левую пару неравенств ( l ): ( p- l)( - 14 q
+ 3) ≥0, р ( - 14 q +3) ≥0. Возможны следующие три случая: 1) р =1, 2) р =0, 3) 0< р <1. Рассмотрим каждый из этих случаев подробно. 1. Полагая р = 1, получаем 0≥0, - 14 q +3≥0. Отсюда q ≥ 3/14. 2 . Полагая р= 0, получаем 0≥0, - ( - 14 q +3) ≥0, 0≥0, откуда 14 q - 3≥0
253 и, значит, q ≤ 3/14. 3. Наконец, положив 0 < р < 1, получим - 14 q +3≥0, - 14 q +3 ≤ 0, что возможно лишь в случае, если - 14 q +3=0, т. е. q = 3/14. Перенесем теперь полученные результаты на чертеж. Введем на плоскости прямоугольную систему координат ( р , q ) и выделим на ней единичный квадрат, соответствующий неравенствам 0 ≤ р ≤ 1, 0 ≤ q ≤ l, (рис.2.7.2). Рис. 2.7.2 Рис. 2.7.3 Нанесем на этот чертеж то множество точек, которое описывается условиями 1, 2 и 3. Это множество на рис. 2.7.3 выделено жирной линией и состоит из трех прямолинейных участков – двух вертикальных лучей и одного горизонтального отрезка – и представляет собой "зигзаг". Теперь обратимся к правой части неравенств ( r ): ( q- l) (9 p- 2) ≥0, q (9 p- 2) ≥0. Три интересных для нас случая: 1) q= 1,
2) q = 0,
3) 0 < q < 1 приводят к следующему результату: 1°. q =1, p ≥ 2/9, 2°. q =0, p ≤ 2/9, 3°. 0 < q < 1, р =2/9. Перенося его на чертеж, получим второй "зигзаг", но уже горизонтальный. Теперь остается только объединить полученное на рис. 2.7.4. Общая точка построенных зигзагов – точка равновесия – имеет координаты . 14 3 , 9 2 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛
р (2 q- 3) ≥0, q (2 p- 3) ≥0. и тогда получаем, что 1 l . p =1, q ≥ 3/2, 2 l . p =0, q ≤ 3/2, 3 l . 0 < p < 1, q =3/2; 1 r . q =1, p ≥ 3/2, 2 r . q =0, p ≤ 3/2, 3 r . 0 < q < 1, р =3/2. Полученные зигзаги изображены на рис. 2.7.5.
3/2
1
0 1 3/2
Рис. 2.7.5 Единственная равновесная ситуация – (0,0). Это ситуация, в которой каждый из игроков выбирает вторую чистую стратегию –
255 сознаться – и его потери составляют 6. Как мы уже отмечали ранее, отклонение от ситуации равновесия одного из игроков не дает ему никаких преимуществ. Однако при одновременном отклонении обоих каждый из них может получить больший выигрыш, нежели в равновесной ситуации. Например, в ситуации (1,1), когда оба игрока выбирают первую чистую стратегию – молчать, каждый из них теряет лишь 1. Напомним, что по условию задачи сговор (создание коалиции) между игроками недопустим. Совершенно ясно, однако, что в рассматриваемых обстоятельствах ситуация (1,1) неустойчива – любой из узников, изменяя свою стратегию, увеличивает свой выигрыш (избегает наказания). Семейный спор Выигрыши игроков А и В в этой биматричной игре задаются так: А= ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ 10 02 , В=⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ 20 01 . Проводя необходимые вычисления: С = 2– 0 – 0+1=3, α= 1– 0=1, D = 1 – 0 – 0 + 2 =3, β= 2 – 0 = 2 и рассуждения: ( l ) ( p- l) (3 q- 1) ≥0, ( r ) ( q- l) (3 p- 2) ≥0,
р (3 q- 1) ≥0, q (3 p- 2) ≥0, получаем, что 1 l . p =1, q ≥ 1/3, 2 l . p =0, q ≤ 1/3, 3 l . 0 < p < 1, q =1/3; 1 r . q =1, p ≥ 2/3, 2 r . q =0, p ≤ 2/3, 3 r . 0 < q < 1, р =2/3. Геометрически полученный результат изображен на рис. 2.7.6. Данная игра имеет три точки равновесия. Две из них отвечают чистым стратегиям игроков: р =1, q =1: HA(1, 1)=2, HВ(1, 1)=1, р =0, q =0: HA(0, 0)=1, HВ(0, 0)=2,
Рис. 2.7.6 одна — смешанной:
256 : 3 1 , 3 2 == qр HA⎟ ⎠ ⎞ ⎜ ⎝ ⎛ 3 1 , 3 2 = 3 2 , HB⎟ ⎠ ⎞ ⎜ ⎝ ⎛ 3 1 , 3 2 = 3 2 . В полученных результатах больше вопросов, чем ответов. Ситуации (1,1) и (0,0) означают одновременный выбор игроками первых или соответственно вторых стратегий, т. е. определенную договоренность о совместных действиях. Однако в данном случае есть еще одна ситуация равновесия, состоящая в выборе игроками вполне определенных смешанных стратегий. В ней оба игрока получают одинаковые выигрыши, правда, меньшие тех, которые давали две другие равновесные ситуации. Какой же из этих трех ситуаций равновесия следует отдать предпочтение? Если бы игроки договорились выбрать одновременно, скажем, первую чистую стратегию, причем игрок А за получение большего выигрыша, чем игрок В, заплатил бы ему 1/2, то выигрыш каждым полутора единиц можно было бы считать и выгодным, и справедливым. Однако в рамках теории бескоалиционных игр такого рода дележи не рассматриваются. Студент - преподаватель Наконец, обратимся к последнему из приведенных выше примеров биматричных игр – студент-преподаватель. Ожидания каждого из них относительно результатов общения в матричном виде выглядят следующим образом;
Ви переглядаєте статтю (реферат): «Биматричные игры» з дисципліни «Математична економіка»