Безлимитный Техасский Холдем: профи вчистую проигрывают программе Libratus AI

Getter 12 Oct 2022 20:04

Программа Libratus AI выиграла у четырех профессиональных игроков в покер, в игре Техасский Холдем. Учёные и программисты создали уникальную программу, принимающую решения на основе недостаточной информации. Один из самых главных принципов карточных игр - это умение в нужное время продолжать играть лот сбрасывать карты. Судя по всему, превосходство людей в покере теперь под большим знаком вопроса.

Libratus AI

Учёные из университета Carnegie Mellon University опубликовали в журнале Science одну очень любопытную статью. В публикации было разъяснено каким образом удалось обучить программу Libratus AI практически всегда одерживать победу над профессиональными игроками в покер, в игре безлимитный Техасский Холдем. Ещё один эксперимент из условной серии "компьютер против человека" закончился полным провалом людей, сначала машины обыграли людей в шашки и шахматы, затем в старинную игру Го, ну, а теперь вот очередь и за азартными карточными играми. Нужно отметить, что покер имеет существенные отличия от вышеперечисленных игр. Соперники не знают, какие карты могут быть друг у друга. А то значит, что есть возможность блефовать. Очень долго существовало мнение, что игры, где отсутствует полная информация, будет для компьютерного мозга слишком сложной, практически невозможной для освоения. Профессор университета Туомас Сэндхольм и кандидат докторских наук Ноам Браун доказали на практике ошибочность этого утверждения.

Программа участвовала в соревнованиях по покеру в течение двадцати дней и вышла победителем, оставив позади профессионалов игры в покер, турнир проводился в Питтсбурге, в казино Rivers. Libratus AI одержала уверенную победу над каждым игроком в таких разновидностях покера, как Head’s-Up, No-Limit Texas Hold’em, сыграла более 120,000 рук и собрала фишки казино на сумму более 1,8 млн. долларов. Технология Libratus не руководствуется какими-либо экспертными знаниями полученными от человека и под игру исключительно в покер не разрабатывалась. Программа с лёгкостью может использоваться для игр, с отсутствием полной информации. Но одними лишь играми спектр задач программы не ограничивается. Принятие верных решений, основанных на недостаточной информации - это важное умение для бизнеса, финансов, безопасности в сфере высоких технологий и, даже в военной отрасли, для разработки стратегий и тактики.

Возникает вполне резонный вопрос, какими образом учёным удалось добиться таких поразительных результатов? Для этого использовался метод, состоящий из трёх основных этапов. Для начала был разработан алгоритм, с помощью которого стало простым решением 1021 задачи, которые обычно используются в покере. С помощью алгоритма был создан шаблон, который стал для первого раунда максимально детальным, а для остальных обобщённым.

Ноам Браун также отметил, что понятно без каких-либо дополнительных вопросов, что будь то Флэш с дамой или та же комбинация с королем, принципиальной разницы нет. Если брать эти комбинации в расчет как одинаковые, то это облегчает игру, расчет проводить также становится легче. Когда партия подходит к своему логическому завершению, активируется дополнительный модуль, шаблон становится более универсальным. Модуль моделирует стратегию в режиме реального времени. В случае если соперник сделает шаг, который ещё не просчитан, то стратегия модернизируется с учётом новых данных о решении соперника. Третий модуль предназначен для проведения анализа того, сколько может ставить соперник, тем самым вычисляя слабые места в его стратегии. Благодаря этому программа располагает большей информации для осуществления выбора.

Программа Libratus AI уверенно победила причём всухую у профессионалов покера, у Джейсона Леса, Дон Кима, Дэниэла МакКоуи и Джимми Чу, а также у аналогичной программы Baby Tartanian8 и некоторых других. Джимми Чу в свою очередь отметил, что программа может приспосабливаться и адаптироваться под меняющиеся стратегии, не прекращая самосовершенствоваться и обучаться. Она испытывала его и других игроков, находясь в поиске слабых мест. Каждой удачному розыгрышу, в котором удалось выиграть у Libratus, нужно радоваться, так как это редкость, больше в подобной ситуации программа не даст себя обыграть.

Главный инженер компании Actian Алекс Хэншоу даже оставил по этому поводу шутливый твит, сказав, что бояться ядерной войны, развязанной искусственным интеллектом, не стоит, умные компьютеры попросту выиграют у человечества все деньги в покер. Однако создатели программы не разделяют такого оптимизма и предсказывают весьма серьезные последствия. Будущее наступает уже сегодня, ведь искусственный интеллект уже превзошел человека во всем и принятие решений на основе неполной информации - это ещё одна ступень выше для машин и ниже для человека.