Неограниченный набор частных случаев

/ экономика / На рациональное поведение человека не стоит рассчитывать даже в теории

Теория игр - это о том, что может случиться, когда "живые сущности" (гены, животные, люди, нации) вынуждены взаимодействовать. Потому нет границы между тем, что торжественно именуется жизнью, и тем, что пренебрежительно зовется игрой.

Фото: Александр Горяшко

Изучая игры людей, мы увидим: поведение работника, который решает, стоит ли ему надрываться, когда начальство отсутствует; продавца, который, взглянув на покупателя, решает, стоит ли давать ему скидку; руководства компании Alibaba, которое выясняет, как должен выглядеть их веб-сайт, чтобы увеличились продажи; руководство концерна, инвестирующее в приобретение патента; ректора университета, приглашающего лауреата престижной премии; инвестора в предметы искусства или нефтяные скважины; муниципалитет, стремящийся уменьшить транспортные пробки...

В общем, теория игр рассказывает, как быть победителем (или хотя бы не быть лузером) в жизни, которая отпущена. Главное, что делает игру забавой Творца,- невозможность для игрока иметь всю информацию. Потому ли, что ее не существует по правилам игры (рулетка), или по законам природы (парусные гонки), или противник скрывает нечто важное (покер). А вот шахматы - игра с полной информацией - просты, как движение Земли в Солнечной системе. Но и в шахматы вмешивается человеческая природа, и в уравнениях классической механики появляются флуктуации, а значит, неопределенность.

Джон Нейман, основатель теории игр, был очень сдержан в оценках ее перспектив. Только настойчивые уговоры соавтора (знаменитого экономиста Оскара Моргенштерна) привели к появлению слов "экономическое поведение" после слов "теория игр" в работе, которая осталось непревзойденной и по сю пору. "Наши знания о существенных фактах в области экономики несравненно меньше, чем знания, которыми мы располагали в физике к тому моменту, когда была достигнута ее математизация... Необходимо знать как можно больше о поведении индивидуума и о простейших формах обмена",- Джон Нейман был гений, потому и не сомневался, что понять, как люди будут вести себя в ситуациях обмена, наверняка сложнее, чем понять, как элементарные частицы могут обмениваться зарядами.

Действовать рационально или просто действовать

Современная наука доверяет только числам - без числа (желательно рационального) гармонию не измерить. Но чтобы родилась теория, надо договориться об аксиомах, которые станут ее фундаментом. Фундамент классической теории игр - аксиома рационального поведения всех игроков. Это значит, что в каждой игре может существовать величина под названием полезность, а все участники игры мало того что понимают эту полезность одинаково, но и стремятся ее максимизировать.

Математики и экономисты, занимаясь теорией игр и принятия решений, отказываются рассматривать предположение о менее чем рациональном поведении людей. И их легко понять: существует произвольно много частных способов, позволяющих объяснить конкретную причину принятия решения в игре, но лишь один способ - теория рациональности - обладает простотой и общностью, недоступной частным моделям. Жизнь - это, конечно, набор частных случаев, но теория обязана изучать случай максимально общий. (Пусть даже в каждом частном случае теория не будет абсолютна верна.)

Основной задачей института, в котором автор работал до известной "геополитической катастрофы", была защита воздушного пространства тогдашней родины. Но теоретический отдел в нем был некой Афинской академией, сотрудники которой занимались массой любопытных вещей - от бионики до экономики. Однажды отделу было поручено помочь братской Грузии в решении задачи эффективной перевозки железнодорожных грузов по ее территории - председатель комитета по снабжению и сбыту Грузинской ССР Михаил Галактионович К. тесно дружил с руководством института. Когда многомесячная работа над проектом завершилась и создатели оптимального решения предъявили план, минимизирующий общие затраты на перевозки, вышел полный афронт. "Что это за оптимальность, дорогой,- возмущался Михаил Галактионович.- У тебя же часть грузов минует Тбилиси! Какой я начальник, понимаешь, если не могу сам все контролировать?"

Ах, как он был прав! За пятьдесят лет до этого инцидента один из самых знаменитых экономистов Джон Мейнард Кейнс для объяснения природы и поведения людей предложил термин animal spiri: людьми двигает не желание максимизировать отвлеченную "полезность", а спонтанное побуждение действовать, а не бездействовать. Догадайся разработчики спросить заказчика, что именно он полагает "полезным", задача могла оказаться много проще и увенчалась бы банкетом в "Арагви".

Слишком умные, или Опять на красный свет

Однажды один из столпов нашего отдела Аркадий Семенович Немировский в процессе поиска решения некоторой задачи с неопределенностью (игра с природой) показал, что оптимальный "игрок", получивший штраф за некоторое действие (скажем, переход дороги на красный сигнал светофора) не должен это действие впоследствии повторять.

Казалось бы, что может быть рациональней? И мы решили - не особо сомневаясь в результатах, ведь среди испытуемых были в основном кандидаты и доктора наук - убедиться в том, что уж наши-то homo sapiens не подкачают.

Каждому испытуемому предлагалось нажимать одну из четырех кнопок. После нажатия кнопки природа (в лице автора этих строк и Аркадия Немировского) сообщала результат - количество единиц рублей, который испытуемый получил или потерял. Было объявлено, что Природа не злонамеренна и случайными механизмами не балует. Потому стоит испытуемому понять алгоритм, и он за 20 попыток наверняка выиграет 10 рублей. Из условий эксперимента выбор оптимального решения вытекал однозначно: попробуй все четыре действия, а затем повторяй то, где тебя не штрафуют (а такое было только одно).

Каково же было недоумение исследователей, когда ни один из испытуемых не выиграл 10 рублей. Почему-то никто не смог побороть искушение вернуться к действию, за которое уже был оштрафован. Из соображений политкорректности исследователи решили, что подопытные слишком умны для столь примитивной рациональности.

Между тем - о чем стало известно много позже - ответ на вопрос, кого полагать более рациональными, взрослых царей природы, их малолетних детей или иных представителей животного царства, давно уже вызывал живой интерес. Эксперименты, напоминавшие "игру Немировского", но только с детьми от 4 до 15 лет, показали: чем испытуемые старше, тем их результаты хуже. Дети старшего возраста, как было написано в одной из западных работ, "too smart for their own good". Оказалось, чем испытуемые старше, тем больше их поведенческий опыт и тем чаще, используя сложные гипотезы в простых ситуациях, они попадают впросак. Животные, однажды найдя безопасную дорогу к водопою, не покидают ее без крайней необходимости. Эволюция ясно дала им понять, что ждать милостей от природы не стоит.

Цивилизации - это прежде всего поиск новых решений, но подобную деятельность трудно признать рациональной. "Не будучи нигде, цель может быть везде!" Тем не менее люди, "плывущие, чтоб плыть", раз за разом идут рациональности наперекор. Пока человечеству это сходит с рук.

Парадоксы поведенческой теории игр

Большую науку поведение людей особо не занимало, пока не вмешались те ученые, которым по роду деятельности приходилось наблюдать, как живые существа принимают решения. Психологи, экономисты, этологи во второй половине прошлого века начинают вести экспериментальные исследования (как и завещал Джон Нейман). Впоследствии вся эта деятельность объединилась под названием "поведенческая теория игр" и была отмечена несколькими Нобелевскими премиями. В основу исследований легли эксперименты, показавшие, что никаких общих принципов в принятии решений не существует, и процесс этот есть лишь неограниченный набор частных случаев.

Один из наиболее любопытных экспериментов описан в работе израильских психологов Канеманна и Тверского, работавших в США. Группе испытуемых предлагалось оценить новый набор из трех чайных чашек. Средняя оценка составляла $100. Затем такой же примерно по составу - возрасту, полу, социальному положению - группе предлагали оценить набор посуды, состоящий из тех же трех чашек, выщербленной тарелки и кофейной чашки без ручки. Средняя цена была $90.

Подобные эксперименты многократно повторялись - с аналогичными результатами.

А вот знаменитый sure-thing principle, упоминание которого почти всегда начинается с рассказа, придуманного автором. Инвестор накануне президентских выборов в США решает вопрос о продаже инвестиционного портфеля. Вначале он оценивает свои действия в случае, когда выиграет, скажем, Хиллари Клинтон, и понимает, что он бы продал портфель. Затем - в случае, когда выиграет Дональд Трамп. И в этом случае он готов продать портфель. Из этого делается рациональный вывод - sure-thing principle - что выборов можно не ожидать, поскольку их результаты не окажут никакого влияния на решение. Нетрудно догадаться, что в жизни подобный принцип постоянно нарушается.

Существует различное отношение к парадоксам принятия решений: как к предупреждению, пустяку, возможности и вызову. Если теория принятия решений пытается объяснить все разнообразие людского поведения, опираясь на несколько простых аксиом, то выявленные парадоксы - предупреждение о тщете подобных усилий. Если полагать, что отдельные эксперименты в принципе не в состоянии объяснить поведение людей, парадоксы можно полагать пустяком. Если результаты экспериментов свидетельствуют, что люди менее рациональны, чем должны были быть, то необходимо их учить искусству принятия решений.

Мы склонны считать, что в теории рациональности пропущен серьезный элемент, а значит, такой элемент должен быть обнаружен и описан. Не случайно в некоторых работах утверждается, что нарушение аксиом рациональности - не результат ошибок в рассуждениях, а следование совсем другому типу рассуждений, которые опираются не на классическую логику, а на логику квантовой механики. Человек подсознательно строит концептуальный "ландшафт предпочтений" - такое множество состояний принятия решений, где переход из одного состояния в другое сопровождается квантовым шумом. Потому в каждом конкретном случае можно говорить лишь о распределении вероятностей на множестве решений, не будучи уверенным в том, какое именно решение реализуется.

Фото: Александр Горяшко

Стратегические военные игры: о чем думают полководцы

По мнению Сократа, солдат, ожидающий атаки противника, рассуждает примерно так: "Если нашей армии суждено победить, мое участие в этой битве ничего не изменит, но я могу быть ранен или даже убит. Если же мы проиграем, я тем более ничем помочь не могу, а шансы погибнуть только возрастут". Рациональный вывод - для солдата исход, максимизирующий "полезность", (стремление выжить) состоит в том, чтобы покинуть поле боя.

Необходимость учета этой "полезности" всегда была актуальна. "И сказали ему Ольгердовичи: "Если хочешь крепкого войска, то повели переправиться через Дон, и да не будет ни у кого ни единого помышления об отступлении"". Дмитрий Донской после переправы своего войска через Дон во время Куликовской битвы приказал уничтожить мосты.

Война - это антагонистическая игра, в которую играют два полководца, каждый из которых желает победить. И победа одного будет означать поражение другого. Может ли теория антагонистических игр объяснить полководцам, как действовать?

Теория игр стала существовать, как прикладная, когда Джону Нейману удалось показать, что любая антагонистическая матричная игра имеет решение в смешанных стратегиях, т. е. когда стратегии играются с определенными вероятностями. Эта теорема требует, чтобы:

- игра была с полной информацией, когда каждый из противников знает всю матрицу платежей - величину штрафа или поощрения при всех возможных стратегиях;

- игра имела нулевую сумму, когда поощрение каждого игрока в точности равно штрафу противника;

- оба игрока рациональны и понятие о полезности у них одинаковы.

А главное, показателем качества игры будет математическое ожидание полезности, полученное каждым игроком. В такой игре каждый должен минимизировать проигрыш при условии, что противник максимизирует выигрыш,- или максимизировать выигрыш при условии, что противник минимизирует потери, что и позволит им получить цену игры. Для торжества справедливости полководцам даже не придется вступать в бой: платежная матрица известна обоим, достаточно решить соответствующую задачу на минимакс.

Не надо кончать Академию Генштаба, чтобы понять, что никакой помощи полководцам от теории антагонистических игр ждать не приходится. Что не помешало изучению того, как ослабление условий, повлияет на общность решения или его трудоемкость.

В классической работе Эмиля Бореля, опубликованной в 1921 году, то есть задолго до появления теории игр Джона Неймана, было предложено оптимальное решение задачи размещения ресурсов в простой среде. Борель замечал, что рассматривает пример игры, в которой "the psychology of the players matters". Спустя 30 лет в проекте RAND Co. на свет явился, словно поручик Киже, полковник Блотто, который размещал войска по полям, где совершались сражения. Начиная с 1990-х годов, игры полковника (а затем и генерала) Блотто приобрели популярность, а интерес к "психологии игроков" сменился поиском оптимальных решений этого класса матричных антагонистических игр при различных соотношениях ресурсов (войск) противников. Эта игра задается как множество "полей сражения" m, на которых два игрока должны, одновременно и независимо друг от друга, разместить свои ресурсы n, т. е. имеющихся солдат. На каждом поле выигрывает тот, у кого на нем больше солдат, а всю игру - тот, кто выиграл большее количество полей.

В платежной матрице этой игры - даже при относительно небольших значениях исходных параметров m и n - число возможных стратегий астрономическое. Например, платежная матрица для игры Блотто при n=120 и m=6 имеет размерность примерно 1010 х 1010. Получить оптимальное решение такой игры за практически допустимое время не представлялось возможным, и приходилось ограничиваться установлением некоторых общих закономерностей.

Например, установлено, что в простейшем случае, т. е. при равных ресурсах противников, в оптимальное решение должны входить все чистые стратегии, для которых ни в одном поле размещенный ресурс не превосходит 2(n/m) и их все надо применять равновероятно. Как это сделать реально, не очень понятно.

Зато игры Блотто оживили попытки понять, как люди принимают решение в играх с очень простыми правилами, но огромным множеством допустимых стратегий. Экспериментальная работа приобрела размах, и даже в фейсбуке появился "Проект Ватерлоо", который позволял пользователям играть в игру полковника Блотто.

Самый массовый эксперимент по игре Блотто собрал более 6 тысяч участников, из них 4605 были студенты из университетов 25 стран. Каждый участник турнира предлагал свою стратегию размещения ресурсов (120 солдат по шести полям), после чего компьютерная программа вычисляла результат, показанный каждым участником в игре Блотто со всеми остальными.

Наиболее любопытное в результатах - редкость хоть сколько-то нетривиальных рассуждений участников. Существующие теории "стратегических рассуждений" предполагают, что любая популяция состоит из людей, обладающих разной глубиной рассуждений k. Наиболее часто встречается 0-уровень, при котором люди, принимая решение, не проводят никаких рассуждений, следуя соображениям, основанным на прошлом опыте или инстинктивном внимании к "бросающимся в глаза" особенностям (разбитая чашка). Уровень k ? 1 предполагает решение, которое выиграет у решения любого уровня не выше k ?1.

Все результаты, показанные в эксперименте, сведены в таблицу, где кроме доли участников, демонстрирующих их глубину рассуждений, показан средний результат по числу выигранных полей (очевидно, чтобы выиграть у всех участников, такой результат должен быть не менее 4). В таблицу помещен еще и уровень-1, как свидетельство наличия почти 5% участников, которые ясно сказали: "Отстаньте!", разместив весь ресурс на одно поле.

Доля участниковУровень
рассуждений
Число выигранных
полей (в среднем)
4,7%-1< 3
11,4%0< 3
15%1< 3
53%2>3, но < 3,6
15%2>3,6, но < 3,69
0,15%23 3,69, но <= 3,8

Как видно, модель "глубины рассуждений" не объясняет разницу в результатах 2/3 участников с уровнем 2. Отчасти в связи с организацией игры (игра проводилась один раз и без поощрения), но главным образом по причине того, что уровень рассуждений никак не отражает более тонких различий в процессах принятия решений. (В шахматах обычно невозможно просчитать вперед на два любых полухода, но хороший шахматист считает только "существенные" варианты. Выбор "существенного" множества - главный инструмент победы.)

Эксперименты по решению стратегических игр дают все больше для создания эффективных моделей поведенческой теории игр. А значит, открывают путь пониманию того, какие требования экономика знаний должна предъявлять к человеческому капиталу и к отбору людей, способных к принятию нетривиальных решений.

В одной из недавних публикаций руководство Google заявляло: "Если Google вначале мог позволить себе нанимать лучших выпускников Гарварда и Массачусетского технологического института, то теперь он может позволить себе нанимать просто лучших".

Найти "просто лучших" и есть основная задача, стоящая перед экспериментальными исследованиями поведенческой теории игр.

Картина дня

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...