Главная Стратегия Теория всего

Теория всего

The Theory of Everything

Несколько лет назад на WSOP в Вегасе я столкнулся с Нилом Ченнингом. Время от времени Нил получает плохую прессу о том, что он если не сварливый старик, то стонущий, но, честно говоря, мало людей, с которыми мне нравится сталкиваться больше. Нил всегда хорош для болтовни и пустяков, и в этом случае он рассказал мне об еще одном английском игроке, у которого была небольшая побочная суета. Для этого нужно было взять денежную фишку, положить ее за спину и поспорить, что знак не может угадать правильную руку. Как только марка принимала ставку, он поднимал обе руки вперед, чтобы марка угадывала влево или вправо. Изюминка была в презентации: он выставлял одну руку вперед, так что закрытая ладонь была буквально прямо под носом метки, как будто осмеливаясь выбрать ее. Другая рука была отведена назад.

Уловка заключалась в том, что фишка всегда находилась в удерживаемой руке, а не в руке под носом марки. 9 из 10 человек угадали неправильно. Предположительно их мыслительный процесс сводился к следующему: «Кажется слишком очевидным, что он притворился, что чипа нет в руке прямо у меня под носом, поэтому он должен положить его туда, думая, что я угадаю другую руку», может быть, со стороной » Если он будет в руке, которая находится прямо у меня под носом, и я выберу другую, я буду выглядеть действительно глупо ».

Самая интересная часть истории (по крайней мере для меня как математика) заключалась в том, что тот парень, который правильно угадал, сделал это не потому, что превзошел своего оппонента, а потому, что использовал теорию игр. Теория игр звучит как своего рода теория игр, но на самом деле это область математики, которая охватывает принятие стратегических решений (название происходит от того факта, что игры являются наиболее очевидным источником реальных примеров таких стратегических решений). Одна из целей теории игр — «решить» любую игру в форме оптимальной стратегии, что означает, что независимо от того, что делает противник, он не может победить вас в долгосрочной перспективе, и, если он также не будет следовать оптимальной стратегии, он проиграет долгосрочную перспективу.

Это оптимальное стратегическое решение называется «равновесием по Нэшу». Часть Нэша происходит от математика Джона Форбса Нэша (он известен как A Beautiful Mind), который первым предложил эту концепцию. Равновесная часть относится к тому факту, что, когда два оппонента сошлись, чтобы играть оптимально друг против друга, они достигли такого равновесия, что ни один из них не может проиграть другому, если другой игрок не отклоняется от стратегии равновесия (Нэша). Подобно двум шарикам на вершине холма, они будут оставаться там до тех пор, пока один из них не переместится влево или вправо и не скатится с холма.

Придерживаться решения равновесия по Нэшу в игре считается невыгодным для использования играть, потому что противник ничего не может сделать, чтобы использовать вашу стратегию. Он не дает гарантии выигрыша, несмотря ни на что; просто гарантия, что вы не можете проиграть. Как и в итальянской футбольной команде, здесь цель — ничья в худшем случае.

Stacks of Chips

Стратегия не может проиграть? Отлично, я слышал, вы говорите, где мне зарегистрироваться? Но подождите, есть одна загвоздка (на самом деле две ловушки). Концепция равновесия по Нэшу лучше работает для простых игр, таких как камень, ножницы, бумага или «угадай руку», чем для таких сложных игр, как покер.

Первая проблема заключается в том, что — даже если равновесие по Нэшу существует для более сложных игр — мы, возможно, никогда его не узнаем. В покере равновесие по Нэшу было решено для ряда очень конкретных очень простых ситуаций, например, если у меня такой короткий стек, что единственным вариантом будет пуш или фолд на префлопе, какие руки я должен пушить? Равновесие по Нэшу также можно относительно легко вычислить для ситуаций с 20 большими блайндами или меньше, чтобы определить правильные руки для фолда, рейза, фолда, рейза, колла и решева. Но это все, что касается безлимитного холдема. На арене лимитов команде экспертов в области искусственного интеллекта в Альберте потребовалось более десяти лет и несколько сотен мощных компьютеров, работающих в тандеме, чтобы вычислить равновесие для хедз-ап Limit Hold’em. Они официально заявили, что намеренно придерживаются лимита хедз-ап, потому что считают, что, когда количество игроков превышает два, становится невозможным вычислить равновесие по Нэшу (одного может даже не существовать), и как только вы перейдете от лимита к нет Ограничьте и разрешите несколько размеров ставок, даже хедз-ап становится слишком сложным для решения.

Вторая проблема заключается в том, что даже там, где мы можем найти равновесие по Нэшу, все хорошо и хорошо при нулевой ставке. Суммарная игра, но покер редко бывает игрой с нулевой суммой. Нужно платить грабли и регистрационный сбор, а также кормить ртов. Если бы мы все придерживались невыгодного для использования равновесия Нэша, единственным долгосрочным победителем был бы дом (в виде казино, организаторов живых турниров и онлайн-сайтов).

Давайте рассмотрим конкретный пример этого: Игрок A и Игрок B попадают на ривер, в банке 1000, и Игрок A идет олл-ин на 1000. Игрок B должен коллировать 1000, чтобы выиграть банк 2000, поэтому, если он может побить блеф, ему следует уравнять, если он считает, что игрок А блефует более чем в половине случаев, но он должен сбросить карты, если игрок А блефует менее чем в половине случаев. Допустим, он не знает, как часто игрок А блефует. В этом случае он возвращается к теории игр и делает колл ровно в половине случаев, когда он может победить блеф. Если предположить, что игрок А также придерживается равновесия по Нэшу, он будет блефовать ровно в половине случаев.

Что, если один из них отклонится от равновесия по Нэшу? Допустим, игрок А решает никогда не блефовать. Так что теперь он делает только (вэлью) ставки, он у него всегда. Поскольку он никогда не блефует, ни он, ни его оппонент не выигрывают от блефа.

Давайте пойдем другим путем и скажем, что игрок А решает всегда блефовать. Они по-прежнему остаются безубыточными, когда игрок А блефует, поскольку в половине случаев он получает колл, а в другой половине выигрывает банк.

Так в чем же дело? Блефует ли он с невыгодной частотой 50%, с частотой испуганных нитов 0% или с маниакальной частотой 100%, кажется, что игрок А всегда безубыточен в своих блефах, а игрок Б также выходит на безубыточность, коллируя ровно в половине случаев. . Это будет оставаться так до тех пор, пока игрок Б будет твердо придерживаться равновесия Нэша — коллировать половину времени. Но предположим, что он в конце концов замечает, что игрок А либо никогда не блефует, либо всегда блефует, и решает изменить частоту своих коллов.

Если он замечает, что игрок А никогда не блефует, то он просто никогда не коллирует, когда все, что он бьет, — это блеф. Теперь игрок А не проигрывает и не выигрывает, блефуя на деньги (потому что он просто не делает этого), но он также больше не выигрывает по ставкам с вэлью, когда у него лучшая рука, потому что игрок Б теперь все время сбрасывает. Отклонившись от Нэша, он позволил своему оппоненту перейти к стратегии эксплуатации, которая использует тот факт, что он никогда не блефует.

Теперь давайте рассмотрим, когда игрок А идет маньячным путем. Как только он осознает это, игрок B просто коллирует каждый раз, когда он блефует. Теперь каждый раз, когда игрок А блефует, он проигрывает. Это частично компенсируется тем фактом, что его вэлью-беты теперь тоже всегда получают колл, но только частично, поскольку он блефует гораздо чаще, чем следовало бы.

В обоих случаях игрок А переключается с Нэша. равновесие к эксплуатируемой стратегии, и Игрок Б подстраивается, переключаясь с Нэша на эксплуататорскую стратегию, чтобы воспользоваться этим. Прибыль здесь не в том, что вы строго придерживаетесь Нэша (который просто гарантирует, что вы выиграете или проиграете точно такую ​​же сумму, независимо от стратегии вашего оппонента). Но, и это довольно много, но, когда игрок Б отклоняется от Нэша, чтобы использовать игрока А, он становится уязвимым для эксплуатации. Эксплуатационные стратегии также можно использовать.

Представьте, что игрок А каким-то образом обманом заставляет игрока Б думать, что он всегда блефует, но на самом деле он никогда не блефует. Теперь он просто отказывается блефовать. Сейчас он не теряет денег на блефе, но все его вэлью-ставки коллируют. Предполагаемый эксплуататор стал эксплуатируемым.

Но хватит о покере, вернемся к гораздо более интересной игре «угадай руку». В этом случае парень, который правильно угадал, сделал вывод, что, поскольку его противник был умным человеком, он не стал бы предлагать эту ставку, если бы не использовался какой-то трюк, призванный повлиять на его предположение. Вместо того, чтобы поддерживать себя, чтобы выяснить это на лету против оппонента, у которого было намного больше опыта в этой конкретной ситуации, он просто решил придерживаться равновесия по Нэшу, которое означало, что независимо от того, в чем был трюк, это не могло его вывести. недостаток. В этом случае равновесное решение по Нэшу для игры «угадай руку» состоит в том, чтобы просто заранее, случайным образом решить, влево или вправо, и твердо придерживаться этого решения независимо от того, что может сделать ваш оппонент.

0 комментарий
0

Похожие статьи

Оставить комментарий