Если нет игрока В с противоположными интересами, а необходимо выбрать одно из альтернативных решений, характеризующееся различными исходами, то возникает задача игры с природой или задача принятия решений в условиях неопределенности и риска. Если вероятности исходов не известны, это ситуация неопределенности, при известных вероятностях исходов – ситуация риска. Рассмотрим сначала правила принятия решений в условиях неопределенности (без использования численных значений вероятностей исходов – правила максимакса, Вальда, Сэвиджа, Лапласа). Пример 2.7.3 . Пусть себестоимость пирожного в нашей кондитерской составляет 7 руб., свеженькое продаем за 13 руб., а невостребованное за день сдаем на свиноферму за 3 руб. Сколько
238 пирожных надо производить в день, если известно лишь, что спрос на них составляет от 1 до 5? Составим таблицу возможных доходов (табл.2.7.1), расположив построчно наши альтернативы (производить от 1 до 5 пирожных), а в столбцах исходы (продать от 1 до 5), имея в ввиду, что доход от продажи одного пирожного составляет 6 руб., а потери при не продаже составляют 4 руб. Таблица 2.7.1 – Доход (прибыль) в день. Возможные исходы: спрос пирожных в день Объем производства 1 2 3 4 5 1 6 6 6 6 6 2 2 12 12 12 12 3 –2 8 18 18 18 4 –6 4 14 24 24 5 –10 0 10 20 30 Правило максимакса – максимизация максимального дохода. В каждой альтернативе найдем исход с максимальной оценкой (в табл.2.7.1 они все находятся в последнем столбце), и выбираем альтернативу, позволяющую получить самый большой доход. В нашем примере это соответствует решению производить 5 пирожных. Данный подход использует азартный карточный игрок (или пан или пропал). Правило максимина (Вальда) – максимизация минимального дохода. В каждой альтернативе найдем исход с минимальной оценкой (в табл.3 они все находятся в первом столбце), и выбираем альтернативу, позволяющую максимизировать доход в самых худших для нас исходах. В нашем примере это соответствует решению производить 1 пирожное. Это очень осторожный подход к принятию решений – стратегия крайнего пессимиста. Правило минимакса (Сэвиджа) – минимизация максимально возможных потерь. Составим таблицу возможных потерь или упущенной выгоды (Табл.2.7.2). Она составляется из таблицы доходов следующим образом: для каждого исхода (столбца) находится максимальный доход, затем вычисляются максимально возможные потери всех альтернатив данного исхода (из максимального дохода вычитается доход соответствующей альтернативы). Для каждой альтернативы находятся максимально возможные потери (выделены жирным цветом). Затем выбирается та
239 альтернатива, которой соответствует минимальное значение максимальных потерь. В данном примере этому правилу подходят альтернативы выпускать три или четыре пирожных в день. Таблица 2.7.2 – Возможные потери в день. Возможные исходы: спрос пирожных в день Объем производства 1 2 3 4 5 1 0 6 12 18 24 2 4 0 6 12 18 3 8 4 0 6 12 4 12 8 4 0 6 5 16 12 8 4 0 Правило, основанное на принципе неопределенности Лапласа. В соответствие с этим принципом предполагается, что все исходы равновозможные, поэтому выбирается альтернатива, дающая максимальный средний доход. В нашем примере этому правилу отвечают те же альтернативы выпускать три или четыре пирожных в день, имеющие средний доход 12 (у первой альтернативы средний доход 6, у второй и пятой – 10).
Критерий Гурвица – компромиссный способ принятия решений. Этот способ принятия решения представляет собой компромисс между осторожным правилом максимина (Вальда) и оптимистичным правилом максимакса. ЛПР задает уровень пессимизма α (вероятность худшего исхода), тогда оптимистичному исходу дается вероятность 1–α, и выбирается альтернатива, дающая наибольший средневзвешенный доход при наличии только пессимистического и оптимистического исходов с заданными вероятностями. Так, в нашем примере, худший исход – спрос на одно пирожное в день, лучший – пять пирожных. Зададим уровень пессимизма 0.4, тем самым мы предполагаем, что на каждые 4 дня худшего спроса в одно пирожное приходится 6 дней лучшего спроса в 5 пирожных. Рассчитаем средневзвешенные доходы для каждой альтернативы (табл. 2.7.3).
240 Таблица 2.7.3 – Критерий Гурвица. Доход при спросе в день вероятность исхода Объем производства 1 5 0.4 0.6 Средневзвешенный доход 1 6 6 2.4 +3.6 =6 2 2 12 0.8 +7.2 =8 3 –2 18 –0.8 +10.8 =10 4 –6 24 –2.4 +14.4 =12 5 –10 30 –4.0 +18.0 =14 В данном случае максимальный средневзвешенный доход имеет решение выпускать пять пирожных в день.
Правила принятия решений с использованием численных значений вероятностей исходов. Пусть теперь нам известны вероятности всех исходов. Например, дана статистика продаж за последние 50 дней (табл. 2.7.4). Таблица 2.7.4 – Относительные частоты (вероятности) дневного спроса на пирожные. Продано пирожных в день 1 2 3 4 5 Частота 5 10 15 15 5 Относительная частота (вероятность) 0.10.2 0.3 0.3 0.1 Правило максимальной вероятности – максимизация наиболее вероятных доходов. Наибольшая вероятность 0.3 соответствует спросу в три и четыре пирожных в день. Рассмотрим теперь доходы при каждом из этих исходов и выберем альтернативу, дающую наибольший доход (см. табл. 3). При спросе в 3 пирожных наибольший доход дает альтернатива производить 3 пирожных (доход составляет 18 руб.), при спросе в 4 пирожных наибольший доход дает альтернатива производить 4 пирожных (доход составляет 24 руб.), следовательно, по этому правилу надо производить 4 пирожных в день. Оптимизация математического ожидания (правило Байеса) Выбирается решение либо с наибольшим ожидаемым доходом, либо с наименьшими возможными потерями. Использование критерия математического ожидания наиболее приемлемо в случаях многократного принятия решения в одинаковых условиях, позволяя максимизировать среднюю прибыль (или минимизировать средние убытки) при большом временном промежутке. В соответствии с законом больших чисел (который мы проходили в разделе 3
241 «Математики») при многократном принятии решения мы как раз и получим математическое ожидание (среднее значение) дохода либо потерь. а ) Максимизация ожидаемого дохода. Составим таблицу ожидаемых доходов для каждой альтернативы(табл.2.7.5). Таблица 2.7.5. Возможный доход (вероятность×доход из табл. 2.7.1). Возможные исходы: спрос пирожных в день Объем производства 1 2 3 4 5 Ожидаемый доход 1 0.6 1.2 1.8 1.8 0.6 6 2 0.2 2.4 3.6 3.6 1.2 11 3 –0.2 1.6 5.4 5.4 1.8 14 4 –0.6 0.8 4.2 7.2 2.4 14 5 –1.0 0.0 3.0 6.0 3.0 11 Максимальное значение ожидаемого дохода 14 руб. в день, следовательно, используя критерий максимизации ожидаемого дохода необходимо производить три или четыре пирожных в день. б ) Минимизация возможных потерь. Составим таблицу возможных потерь для каждой альтернативы (табл.2.7.6). Минимальные ожидаемые возможные потери равны 4.6 руб. в день, т.е. наилучшее решение – также как и в случае а, производить три или четыре пирожных в день. Таблица 2.7.6 Возможные потери (вероятность×потери из табл. 2.7.2). Возможные потери: спрос пирожных в день Объем производства 1 2 3 4 5 Ожидаемые возможные потери 1 0 1.2 3.6 5.4 2.4 12.6 2 0.4 0 1.8 3.6 1.8 7.6 3 0.8 0.8 0 1.8 1.2 4.6 4 1.2 1.6 1.2 0 0.6 4.6 5 1.6 2.4 2.4 1.2 0 7.6 Значения вероятностей из табл.2.7.4 основаны на статистической либо экспертной информации, которая подвержена изменениям. Исследование зависимости выбора решения от изменений значений вероятностей называется анализом чувствительности решения .
242 Таблица 2.7.7. Зависимость выбора решения от изменений значений вероятностей Возможные решения: объем производства в день
Наименование показателей 1 2 3 4 5 Базовые вероятности 0.1 0.2 0.3 0.3 0.1 Ожидаемый доход в день 6 11 14 14 11 Альтернативные вероятности (1) 0.2 0.2 0.2 0.2 0.2 Ожидаемый доход в день (1) 6 10 12 12 10 Альтернативные вероятности (2) 0.1 0.2 0.2 0.2 0.3 Ожидаемый доход в день (2) 6 11 14 15 14 В альтернативном варианте (1) решение, дающее максимальный доход, не претерпело изменений, хотя средняя прибыль снизилась с 14 руб. до 12 руб. В альтернативном варианте (2) решение изменилось, наибольший средний доход 15 руб. дает альтернатива производить 4 пирожных в день. Таким образом, выбор решения оказался нечувствителен к варианту (1) изменений вероятностей, но чувствителен к варианту (2). Пример 2.7.4. Рассмотрим схожую с предыдущей задачу управления запасами. Пусть спрос на некоторый товар описывается следующим рядом распределения вероятностей: Спрос 0 1 2 3 4 5 Вероятность спроса 0.100.150.400.150.100.10 Определить уровень запасов, при котором вероятность полного истощения запасов не превышает 0.45. Определить также уровень запасов при условии, что средние значения дефицита и превышения запасов не должны быть больше 1 и 2 единиц соответственно. Будем анализировать данную задачу как игру уровня запасов со спросом. Для каждого значения уровня запасов последовательно вычисляем вероятность его полного истощения. Она равна сумме вероятностей событий, когда спрос превышает данный запас. Затем вычисляем средний дефицит для каждого уровня запаса. Для уровня 0 средний дефицит равен 1⋅0.15+2⋅0.4+3⋅0.15+4⋅0.1+5⋅0.1=2.3, для уровня 1 получаем 1⋅0.4+2⋅0.15+3⋅0.1+4⋅0.1=1.4 и т.д. Аналогично вычисляем среднее превышение запасов, например, для уровня 0 превышения нет, для уровня 1 среднее превышение составляет 1⋅0.1=0.1, для уровня 2 получаем 2⋅0.1+1⋅0.15=0.35 и т.д. Сведем все результаты расчетов в таблицу 2.7.8.
243 Таблица 2.7.8 Уровень запаса Q Вероятность полного истощения Средний дефицит Среднее превышение запасов 0 0.9 2.3 0 1 0.75 1.4 0.1 2 0.35 0.65 0.35 3 0.2 0.3 1.0 4 0.1 0.1 1.8 5 0 0 2.7 Из табл. 2.7.8 получаем ответы на все интересующие нас вопросы: При Q ≥2 вероятность полного истощения запасов не превышает 0.45. При 4≥Q≥2 средние значения дефицита и превышения запасов не больше 1 и 2 единиц соответственно. Пример 2.7.5. Введем в пример 2.7.4 условие, чтобы ожидаемый дефицит был меньше превышения хотя бы на 1. Тогда из табл. 2.7.8 находим уровень запасов, удовлетворяющий этому условию, Q ≥4.
Ви переглядаєте статтю (реферат): «Игры с природой» з дисципліни «Математична економіка»