ИГР ТЕОРИЯ
ИГР ТЕОРИЯ, раздел математики, предметом которого является анализ принятия оптимальных решений в условиях конфликта. Возникнув из задач классической теории вероятностей, теория игр превратилась в самостоятельный раздел в 1945–1955. Таким образом, теория игр – один из новейших разделов математики. Наиболее полное изложение идей и методов теории игр впервые появилось в 1944 в труде Теория игр и экономическое поведение (Theory of Games and Economic Behavior) математика Дж.фон Неймана (1903–1957) и экономиста О.Моргенштерна (1902–1977). Фон Нейман опубликовал несколько работ по теории игр в 1928 и 1935; другим предшественником теории игр по праву считается французский математик Э.Борель (1871–1956). Некоторые фундаментальные идеи были независимо предложены А.Вальдом (1902–1950), заложившим основы нового подхода к статистической теории принятия решений. См. также ВЕРОЯТНОСТЕЙ ТЕОРИЯ.
Первые приложения теория игр нашла в математической статистике и в решении некоторых возникших во время второй мировой войны военных проблем специального характера. Ее использовали как плодотворный источник теоретических моделей в экономике и социологии. Методы теории игр используются также в теории операций и в линейном программировании.
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
Математическое понятие игры необычайно широко. Оно включает в себя и т.н. салонные игры (в том числе шахматы, шашки, го, карточные игры, домино), а может использоваться и для описания моделей экономической системы с многочисленными конкурирующими друг с другом покупателями и продавцами, для обсуждения статистических проблем, возникающих при непрерывном контроле производственного процесса, а также для решения военных задач, например, при определении оптимальных маневров подводной лодки, преследуемой обнаружившим ее надводным кораблем противника.
Не вдаваясь в детали, игру в общих чертах можно определить как ситуацию, в которой одно или несколько лиц («игроков») совместно управляют некоторым множеством переменных и каждый игрок, принимая решения, должен учитывать действия всей группы, «платеж», приходящийся на долю каждого игрока, определяется не только его собственными действиями, но и действиями других членов группы. Некоторые из «ходов», или индивидуальных действий, в ходе игры могут носить случайный характер. Наглядной иллюстрацией может служить известная игра в покер: начальная сдача карт представляет собой случайный ход, последовательность ставок и контрставок, предшествующая финальному сравнению взяток, образована остальными ходами в игре.
Платежом называется сумма очков, получаемая игроком по окончании партии. Величина платежа зависит от исхода случайных ходов в игре и от индивидуальных выборов каждого игрока при последующих ходах. Платеж обычно принято выражать числом очков или денежной суммой; положительный платеж означает выигрыш игрока, отрицательный – проигрыш. Предполагается, что каждый игрок стремится максимально увеличить свой выигрыш.
«Наиболее разумные» стратегии в игре называются решениями этой игры. Основой проблематики теории игр как математической дисциплины, является изучение связей между условиями игры и ее решениями. Основными вопросами в каждой игре являются следующие: «Что такое решение данной игры?», «Существуют ли решения данной игры?», «Каково решение данной игры и как его найти?». Удовлетворительное понятие решения было выработано для важного класса игр с числом игроков не более двух. Для игр более общего типа используется ряд критериев, позволяющих получать «оптимальные решения», удовлетворяющие некоторым интуитивно правдоподобным требованиям; однако в настоящее время ни одно из таких решений нельзя считать вполне удовлетворительными.
ИГРЫ С ПОЛНОЙ ИНФОРМАЦИЕЙ
При анализе любой игры важно знать, в какой степени одному игроку известны стратегии, сделанные ходы и индивидуальные выборы другого игрока. В салонных играх эта информация заложена в явном виде в правилах игры. В военной игре эти сведения определяются широтой и глубиной разведывательной информации; однако следует также учитывать и разведывательную деятельность противника.
В шашках, шахматах, китайских шашках и в игре в крестики-нолики каждый игрок располагает т.н. «полной информацией». Это означает, что каждый игрок в любой момент времени полностью информирован о всех предыдущих ходах, сделанных в процессе игры, что позволяет придать простую математическую структуру любой конечной игре этого типа. Игру с полной информацией удобно изображать в виде дерева (или графа) с вершинами (черными и белыми кружками), соединенными ребрами. Играя в простую игру, изображенную на рис. 1, первый игрок (белые) помещает фишку в самую нижнюю вершину. Второй игрок (черные) может, делая ход, поставить фишку в любую соседнюю вершину, он выбирает ребро, исходящее из нижней вершины, и ставит свою фишку в ближайшую вершину, расположенную на следующем уровне. Так продолжается до тех пор, пока фишка не достигнет одного из треугольников. Платеж, получаемый белыми от черных, определяется треугольником, на котором фишка завершит свой путь. На рис. 1 платеж колеблется от +30 единиц до -50 (белые могут либо выиграть 30 единиц у черных, либо проиграть им 50).
Чтобы представить в виде дерева игру в шашки, каждая вершина должна означать одно из возможных расположений всех шашек на доске, а число ребер, исходящих из вершины, должно соответствовать количеству возможных ходов для игрока, играющего соответственно белыми или черными. В данном конкретном примере видно (и можно доказать, что так же обстоит дело и в общем случае), что в любой игре с полной информацией каждый из игроков может определить свою «наилучшую» стратегию. В модели игры, изображенной на рис. 1, черные могут заставить белых уплатить по крайней мере 5 единиц; кроме того, если белые будут придерживаться правильной стратегии, то черные не смогут выиграть больше 5 единиц несмотря на выбранную ими стратегию. Заметим, однако, что если бы игра состояла только из правой половины дерева, то наилучшая стратегия гарантировала бы белым проигрыш в 2 единицы; при менее удачной стратегии белые могли бы проиграть 10.
Теоретически шахматы и шашки имеют такую же структуру, как и приведенный выше более тривиальный пример. Однако представить эти игры в виде деревьев настолько сложно, что их полный анализ никогда не производился. Имеются некоторые основания полагать, что если оба игрока придерживаются оптимальных стратегий, то игра в шашки должна заканчиваться вничью, а в шахматы всегда должны выигрывать белые, делающие по правилам первый ход.
ИГРЫ В НОРМАЛЬНОЙ ФОРМЕ
Первый шаг при построении общей математической теории игр состоит в доказательстве того, что любую конечную игру можно свести к эквивалентной ей игре, имеющей более простую частную форму; в отличие от игры с полной информацией такие игры сопряжены с минимальным обменом информацией. Предположим, что n игроков X1, X2, ..., Xn играют в игру Г по следующим правилам. Каждый игрок Xk выбрал из множества Sk элемент xk, ничего не зная о том, какой элемент выбрал любой из остальных игроков; в качестве платежа игрок Xk получает величину Mk (x1, x2,..., xn). Точный характер игры Г определяется множествами S1, S2,..., Sn и n функциями платежей M1, M2,..., Mn. Элементы множества Sk называются чистыми стратегиями игрока Xk.
Любая игра, которая может быть представлена таким образом, называется игрой с «нулевой суммой», если функции платежей удовлетворяют условию
при всех возможных выборах стратегий x1, x2,..., xn. Смысл этого названия заключается в том, что игра не разрушает и не создает состояния, а лишь перераспределяет его между игроками. Любую игру в нормальной форме можно превратить в игру с нулевой суммой, если ввести фиктивного игрока («банк»), который не делает ходов, но получает платеж в размере, необходимом для поддержания общего баланса. В игре двух игроков с нулевой суммой условие (1) принимает вид:
Следовательно, игрок X1 выигрывает, только если игрок X2 проигрывает, и интересы игроков диаметрально противоположны. Но если число игроков больше двух, то существует возможность объединения нескольких игроков в коалицию для достижения совместными усилиями того, что они не могли достичь порознь.
Чтобы уяснить, как обычную игру можно теоретически свести к нормальной форме, нужно глубже вникнуть в то, что понимается под «стратегией» в теории игр. В самых общих чертах стратегия игрока представляет собой детальный план действий, который может быть составлен заранее, до того, как игра действительно будет сыграна, и содержит полные инструкции, необходимые для принятия любого возможного решения; решение должно учитывать всю информацию, которой располагает игрок относительно предыдущих ходов, сделанных во время игры.
В шашках или шахматах описание индивидуальной стратегии белых составило бы объемистую книгу; в ней не только указывался бы первый ход, но и перечислялись бы контрходы в ответ на любой ответный ход черных, перечислялись бы все возможные вторые ходы, ответные ходы белых на любой второй ход черных и т.д.
В «упрощенном покере» у игрока X имеется только четыре возможные стратегии. Их можно обозначить символами LL, LH, HL и HH, означающими следующее:
LL – независимо от извлеченной карты ставка минимальна (3 доллара);
LH – если извлеченная карта – королева, то ставка минимальна, если
король, то ставка максимальна (9 долларов);
HL – стратегия, обратная LH;
HH – ставка всегда максимальна.
Аналогично, игрок Y располагает только четырьмя стратегиями, которые можно было бы обозначить FF, FC, CF и СС:
FF – пропустить независимо от ставки, которую делает игрок X;
FC – пропустить, если X делает минимальную ставку, объявить
козырную масть, если X делает максимальную ставку;
CF – стратегия, обратная FC;
CC – объявить козырную масть независимо оттого, какую ставку делает X.
После того, как каждый из игроков выбрал свою стратегию, игру мог бы проводить любой беспристрастный посредник. В этом смысле платеж для каждого игрока полностью определен выбором чистых стратегий, и мы получаем требуемую нормальную форму. Игра с многочисленными ходами и в различной степени неполной информацией оказалась сведенной к простой игре, в которой у каждого игрока есть только один ход. Если имеются случайные ходы (в нашем примере с покером – это начальная сдача карт), то их делает посредник. Разумно также описать платеж, причитающийся игроку, в терминах величины, которую он рассчитывает получить. Например, если X выбирает стратегию HL, а Y – стратегию CC, то X выигрывает 3 доллара, если он извлекает короля, и проигрывает 9 долларов, если он извлекает королеву. Так как предполагается, что игра ведется честно, то ожидаемый в конечном счете платеж при указанном выборе стратегий составляет
Полная матрица для нормальной формы «упрощенного покера» представлена на рис. 2. Платежи указаны для игрока X; соответствующие платежи для Y равны тем же числам, но с противоположным знаком.
В России при построении математической модели конфликта делают различия между коалицией действия и коалицией интересов. Коалицией действия называются те или иные коллективы, участвующие в игре и принимающие решения. Коалицией интересов называются коллективы, участвующие в игре и отстаивающие некоторые общие интересы. Кроме того, вводится понятие ситуации – результат выбора всеми коалициями действия своих стратегий.
Мак Кинси. Введение в теорию игр. М., 1960
Берж К. Общая теория игр нескольких лиц. М., 1961
Матричные игры. М., 1963
Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. М., 1970
Воробьев Н.Н. Основы теории игр. Бескоалиционные игры. М., 1984
Ответь на вопросы викторины «Математика»