Теория игр глазами физика: власть жребия и жребий Власти
Jul 14, 2016 05:06
Эта заметка относится к циклу "Теория Власти". Смотрите Оглавление цикла.
Моя попытка найти для теории Власти (Щеглов, Хазин "Лестница в небо") твердое математическое обоснование заставила меня в очередной раз погрузиться и изучение теории игр. "В очередной раз" - потому что эта тема уже много раз сама собой входила мою жизнь с разных сторон, так что сегодня я уже осознаю, что она неслучайна. Добьюсь ли я успеха в создании "физики Власти" или потерплю неудачу - неважно. Если не я, это непременно сделает кто-то другой, и сделает достаточно скоро: тема уже созрела и перезрела, она висит в воздухе. Отсутствие хорошей математической базы в социальных науках давит уже почти невыносимо - как духота перед грозой. Скоро блеснёт молния, ударит гром, появится новая наука - и потоки новой информации, новые научные результаты хлынут на нас сверху потоками, очищая и смывая накопившиеся за века геологические слои социальной мифологии, лжи и демагогии.
Но красота теории захватывает и пробуждает желание поделиться с читателем. Поборовшись некоторое время с этаким соблазном, я уступаю ему и вот прилежно стучу по клавиатуре.
Теория игра интересна тем, что это первая строгая математическая теория, работающая с концепцией свободной воли. Её предмет - проблема выбора. Её задача - указать наилучший выбор. В принципе, задача поиска наилучшего из доступных вариантов сама по себе ещё не относится к теории игр. Это классическая математика, всевозможные методы поиска максимума или минимума, знакомые всем со школы (напомню: основной школьный результат - что в максимуме или минимуме производная равна нулю; умение вычислять производные оказывается ключом к поиску оптимального решения).
Настоящая теория игр начинается с ситуации, когда такого решения найти вообще-то нельзя, потому что имеются как минимум ДВОЕ, каждый из которых делает свой независимый и свободный выбор. Когда выбирающий - один, это ещё не теория игр. Настоящая ИГРА требует как минимум ДВУХ игроков. Не зная, какой выбор сделает визави, вообще-то невозможно определить, какой выбор является оптимальным для нас. Тем не менее, такие ситуации возникают на каждом шагу, и теория игр смело бросается в море возникающей неопределённости. В этом её пафос и суть, нетривиальность и огромное поприще практических приложений. Наверное, ни одна математическая теория не востребована в бизнесе (и политике) и не получает такой материальной поддержки своему развитию, как теория игр.
Сразу замечу, что в качестве второго игрока может выступать в теории игр и "природа" (это слово является принятым в науке стыдливым псевдонимом Божественного Промысла). Пример задачи теории игр - когда надо решить, брать с собою зонтик или не брать. При этом если каким-то образом вычислена хотя бы вероятность дождя, это ещё не теория игр, а обычная теория вероятностей. Теория игр - это когда мы не только не знаем, будет ли дождь, но не знаем даже и вероятности этого! Когда Промысел (атеист, читай "природа") выступает в качестве полноценного Субъекта, который может сделать тот или иной "ход" по Своему произволу. Теория игр никак не различает в этом смысле Бога и человека. Для неё важен лишь сам факт наличия свободы; она принимает его как данность и с ним работает.
Интересно, что физика со своей стороны тоже подходит к проблеме свободной воли. А именно, на него напрямую выходит квантовая теория. Сегодня уже никто не пытается оспаривать тот факт, что природа, строго говоря, никогда не допускает точного предсказания будущего. Даже в том случае, когда настоящее известно нам с абсолютной точностью, мы физики можем предсказать лишь варианты дальнейшего развития ситуации, можем лишь рассчитать вероятности осуществления каждого из этих вариантов. Но какой из них реализуется в действительности - это Бог оставляет в Своей власти, нам этого предугадать не дано. (Принцип неопределенности Гейзенберга.)
При этом квантовая физика использует для вычисления этих вероятностей аппарат линейной алгебры, математической теории линейных пространств. Странным образом, оказывается, что в реальном физическом мире работают не вероятности, а амплитуды вероятностей - комплексные числа, модуль которых равен корню квадратному из вероятности. При расчетах вероятностей на квантовом уровне физики почему-то имеют дело не с вероятностями, а с их амплитудами, и "мнимая единица", которая когда-то казалась абстрактной игрой ума, внезапно оказывается инструментом для более точного отражения реальности физического мира ("амплитуда вероятности"), чем классическая, интуитивно понятная "вероятность".
Отсюда рождается вполне понятная и естественная идея. Итак, Бог не гнушается являть нам Свою свободную волю сквозь изящную квантовую ширму комплексной "амплитуды вероятности" - так что невероятного, если и свободную волю человека нам физикам придется описывать при помощи такой же комплексной амплитуды, а не простой вероятности? Я думаю, этим дело и кончится. Несмотря на самоочевидный религиозный пафос этой идеи, в ней легко уловить содержание, понятное и даже приятное и для атеиста. Принципиальная непредсказуемость человеческого поведения - это важный бонус нашей природы, реально повышающий наши шансы на выживание. Животное предсказуемо, и на него легче расставить силки, чем на человека - по крайней мере пока человек действует разумно, в соответствии со своей природой, а не уподобляется неразумной скотине, чье поведение можно просчитать и предвидеть. Не потому ли человек возвысился над всеми биологическими видами, оказался опаснее всех зубастых и клыкастых?
Теория игр мало-помалу подталкивает к этой идее. Оказывается, что наиболее оптимальным в условиях неопределенности является и поведение неопределенное, вероятностное.
Когда нужно делать выбор в условиях неопределенности, наиболее основательной и осторожной является стратегия минимакса, согласно которой следует, насколько это зависит от нашей воли, предпочесть среди наихудших независящих от нас вариантов наилучший. Иными словами, надо делать выбор таким образом, чтобы даже в худшем случае у нас все-таки получался максимально хороший результат, насколько это возможно. Минимакс каждый раз опирается на максимально пессимистический прогноз относительного того, что от нас не зависит - и требует сделать наиболее приемлемый выбор исходя из этого пессимистического прогноза.
Минимакс - это идеальная стратегия для тех, кто органически не выносит риска. Хотя в реальности таких людей очень мало, и все мы в той или иной степени предпочитаем рисковать, веря каждый в свою удачу, с точки зрения теории игр минимакс имеет то преимущество, что дает математику твердую опору в дальнейших рассуждениях. Кто не рискует, тот не пьет шампанское, но главное преимущество математика - предельно трезвый рассудок. Имея твердую и гарантированную опору в виде разумного пессимизма, можно уверенно двигаться дальше. Следующий шаг таков. Мы предпочитаем риск? Отлично! Можно и рискнуть, но на основе предварительного расчета. Оказывается, наилучшая стратегия умеренного оптимизма, разумного риска в условиях неопределенности, заключается в том, чтобы действовать случайным образом. Мы бросаем жребий и выбираем ту или иную из доступных нам альтернатив с такой вероятностью, чтобы усредненный выигрыш (математическое ожидание выигрыша) был максимальным даже при (опять-таки!) наихудшем из независящих от нас раскладов. При этом задача теории игр в том, чтобы вычислить такое распределение вероятностей.
Ну, например. Предположим, у нас есть возможность рискнуть или проявить осторожность. Если мы выберем риск, то при удаче получаем 5 каких-то единиц выигрыша, а при неудаче 0. Если же мы не станем рисковать, то в первом случае (при удаче) получим 0 (в наказание за то, что не поверили в удачу), зато при при неудаче 2 (в награду за осторожность) . Если применить принцип минимакса напрямую, без веротяностей, то есть, всегда исходить из самого пессимистического прогноза, то больше нуля нам не получить в обоих случаях. Но на самом-то деле шансы на успех у нас совсем неплохие! Простой расчет показывает, что в этой игре наилучший вариант жребия - это взять отношение шансов 2 к 5-ти в пользу осторожности. То есть, идти на риск надо в 2-х случаях из 7-ми, в остальных же 5-ти случаях следует предпочитать осторожность. Именно при таком раскладе достигается максимальная прибыль в данной игре. Подчеркну, что такую рекомендацию теория игр дает в том случае, если соотношение вероятностей удачи и неудачи неизвестно! Если бы оно было известно, то можно было бы обойтись и без жребия, и без теории игр, достаточно было бы применить простую теорию вероятностей. Например, при равных шансах на удачу и неудачу в нашем примере следовало бы в любом случае рискнуть. А если отношение шансов удачи и неудачи, например, 1 к 3-м, то следовало бы в любом случае проявить осторожность. Теория игр, повторюсь, дает рекомендации, как действовать в том случае, если верятности того или иного развития событий неизвестны. Если всяко может быть.
С точки зрения религиозной, применение жребия означает, что теория игр прямо рекомендует нам лучше положиться на Бога (язычник бы сказал, на фортуну), чем во всех случаях проявлять трусливый пессимизм. Интересно здесь то, что при этом мы будем получать (в среднем!) более хорошие результаты даже в том случае, если Промысел не будет обнаруживать какого-то чудесного о нас попечения. Оказывается, сама готовность поверить в удачу уже повышает шансы на успех - правда, только при условии, что эта готовность опирается на сухой и точный математический расчет.
Именно так и действуют люди, имеющий хороший опыт работы в условиях реального риска. Естественно, они не применяют математику, они действуют интуитивно. Но действуют они именно так: иногда полагаются на удачу, а иногда предпочитают осторожность. Теория игр всего лишь дает строгое математическое обоснование этой естественно присущей каждому из нас интуиции. И уточняет, как часто надо в той или иной игре иди на риск, и как часто - осторожничать.
Итак, минимальное число игроков в игре - это два. Один игрок - это не игрок. Но с точки зрения теории Власти наиболее интересен случай, когда в игре участвует множество людей, которые могут попытаться договориться между собою о совместных действиях к общей выгоде. При этом может оказаться (и часто оказывается), что какой-то коалиции участников выгоднее действовать независимо от всех остальных. Чтобы рассчитывать такие ситуации, теория игр опять-таки опирается на принцип минимакса. И опять-таки, оптимальным поведением для всякой коалиции оказывается умеренный, расчетливый риск: иногда следует действовать так, а иногда иначе. В общем случае теория игр рекомендует использовать жребий и дает точный расчет шансов, в скольких случаях надо действовать так, а в скольких - иначе.
При этом возникает, однако, новое качество, новый смысл, которого не было и не могло быть, когда игроков было всего двое. (В качестве второго, напомню, может выступать и "природа".) А именно. Когда мы играем за себя, использование внешнего жребия необязательно, так как каждый из нас имеет в своей душе "вшитый" жребий в виде свободной воли. Мы иногда действуем так, а иногда иначе, расклад шансов зависит только от нас и извне такое поведение непредсказуемо. Однако для того, чтобы действия целой коалиции были согласованы, необходимо отказаться от этого внутреннего произвола. Тут уже должен бросаться один жребий на всех! Если уж идти на риск, то не вразнобой. Если проявлять осторожность, то опять-таки согласованно. Словом, успешную коалицию должен кто-то возглавить! Тут два варианта. Либо надо действовать "безлично", когда все повинуются общему жребию, воле Бога. Либо же коалиция должна выделить из своей среды одного лидера, свободная воля которого и сыграет роль "вшитого" жребия.
В общем, идеология современной теории игр склоняется к первому варианту. Математики дают нам средства для точного расчета шансов и предлагают последовать безличному жребию. При таком подходе самые вкусные плюшки, естественно, должны по справедливости достаться математику, который успешно выполнил все необходимые расчеты. Ну, а как же? ;)
Но по жизни мы чаще наблюдаем действие другого принципа, единоначалия. При этом начальник отличается от математика тем, что он отнюдь не беспристрастен в своих расчетах. Начальник принимает такое решение, которое выгоднее для него самого. Но возглавляемая им коалиция должна мириться с этим до тех пор, пока выигрыш от согласованности их действий превышает те потери, которые возникают в результате эгоизма начальника. Другого выхода они не видят: ведь и математик может при желании смухлевать, фактически взяв на себя функции начальника под маской беспристрастия. Каким образом коалиция могла бы гарантировать себя от подобного лицемерия? Я думаю, таких гарантий быть не может в принципе. Конечно, выход есть: люди должны действовать согласно воле беспристрастного Бога. Но если уж люди выбирают своеволие, им приходится мириться с вытекающими из этого выбора издержками.
Бог устроил этот мир так, что наиболее эффективное совместное действие требует единоначалия. И если мы отвергаем Бога, то какой-то человек (или небольшая группа людей, политическая элита) берет на себя Его функции, а вместе с тем и Его привилегии.
Из всего вышесказанного я хочу выделить и особо подчеркнуть мысль, наиболее важную и перспективную с точки зрения теории Власти: общество должно мириться с эгоизмом элиты до тех пор, пока выигрыш от согласованности действий превышает те потери, которые возникают в результате этого эгоизма. Это важный критерий устойчивости Власти. Он действует также и внутри самой Власти: вассалы должны мириться с эгоизмом сюзерена до тех пор, пока выигрыш от согласованности их действий превышает те потери, которые возникают в результате этого эгоизма. Похоже, что вот это соотношение (между разумно допустимым для Власти эгоизмом и выигрышем от единства) и является предметом торга при расчетах устойчивости. Мне кажется, именно этот критерий должен использоваться при математических расчетах устойчивости Власти и общества в целом. А ведь именно устойчивость и является той полезной функцией Власти, ради которой общество должно мириться с нею.
Замечание: один из моих читателей столь упорно критиковал принцип минимакса в комментариях, что мне захотелось сделать вот такую оговорку. При игре "с природой" лучше оценивать возникающие ситуации таким образом, чтобы каждому "ход" "природы" соответствовала по крайней мере одна наша стратегия, для которой наш проигрыш оценивается как "нулевой". Это всегда возможно, ведь оценка того или иного результата игры - дело произвольное. Её всегда можно сдвинуть вверх или вниз простым переопределением "нуля". В теории игр такую переоценку называют "принципом наименьшего сожаления", потому что при этом каждый наш ход мы оцениваем исходя из идеи "сколько мы потеряли сравнительно с тем, что могли бы получить, если бы знали заранее, как повернется дело". Ну, например, если мы решаем, брать зонтик или не брать, то ситуацию, при которой мы взяли зонтик и попали под дождь, мы возьмем за ноль. И ситуацию, при которой мы не взяли зонтик, и не попали под дождь, мы тоже возьмем за ноль. А ситуацию, когда мы попали под дождь без зонта, мы будем оценивать, сравнивая её с ситуацией, когда мы "угадали" и взяли зонт. И, соответственно, ситуацию, когда мы ходили весь день с зонтом, а дождя не было, будем оценивать, сравнивая её с ситуацией, когда мы "угадали" и дождь таки начался. То есть, мы оцениваем сожаление, которое стали бы испытывать из-за того, что "не угадали" выбор Промысла, принимая за нулевое начало отсчета ситуацию, когда мы поступили оптимальным образом ("угадали" ход Промысла). Такой способ оценки нужен для того, чтобы минимакс не пренебрегал слишком хорошими "ходами" Промысла и не зацикливался на плохих альтернативах.