Лучший в мире игрок в покер теперь отодвинут на второй план. Но не человеком, а компьютером, конечно. Ученые сообщили в журнале Science, что они нашли ключ к Texas Holdem Poker. Алгоритм представляет собой компьютерную программу, которую невозможно победить в этой игре.
Соперник, которого нельзя опередить
Ранее подобное уже было достигнуто для простых стратегий, таких как Connect Four. Однако впервые ученые решили игру, в которой часть информации скрывается от игроков. Эта технология сможет не только помочь любителям покера улучшить свои результаты, но и стать применимой во многих ситуациях, требующих принятия сложных решений. Например, ее можно будет использовать в областях безопасности и медицины.
Алгоритм разработан специально для одной разновидности покера, и он все еще позволяет пропустить руку, если раздаются плохие карты. В информатике подобный ход называют «слабым» решением. Однако, как объясняют авторы разработки, это позволит свести свои потери к минимуму, сделав данное решение идеальным при любом сценарии. Таким образом, даже если вы разыграете несколько миллионов комбинаций, программа по-прежнему будет оставаться победителем.
Игра вслепую
Существует множество различных видов покера, но все их объединяет одно: в процессе игры часть информации остается скрытой. Например, ни одному из оппонентов не могут быть известны карты противника.
Ученые уже полностью решали игры, в которых вся информация остается на виду. Например, они находили алгоритм к шашкам, где ни один ход не скрыт от глаз противников. Однако игры с неполным изложением информации оказались значительно сложнее. Найти к ним ключ всегда казалось практически невозможным.
Метод поиска «сожалений»
Покер является комплексной игрой, состоящей из совпадений, удачи и блефа, и Texas Holdem Poker – не исключение. Тем не менее, существует ее упрощенная версия, которая называется Heads Up Limit. Эта игра отличается фиксированными размерами ставок и числом их подъемов. Кроме того, в ней присутствует только два противника. Вот почему ученые из Альбертского университета решили выбрать эту игру в качестве примера для своего алгоритма.
Для разработки программы исследователи взяли за основу ранее созданное решение. Этот алгоритм-образец называется «минимизацией контрфактического сожаления». Он в основном включает в себя обзор сделанных ходов и рассмотрение вопроса о принятии иного решения (например, повышении ставки), которое бы могло привести к лучшему результату. Затем компьютерная программа подсчитывает свои потери из-за конкретного шага и сохраняет полученное значение как «сожаление». При необходимости принятия решения она будет знать, какие ходы нежелательны, что позволит действовать методом исключения.
С одной стороны, может показаться, что разработка алгоритмов к играм – весьма бесполезное дело. Однако в реальности попытки создания подобных программ оказывают более масштабное влияние на развитие науки. Приложения-алгоритмы могут широко использоваться не только в качестве развлечений, но и для выполнения серьезных функций. Например, ученые уверяют, что на основе таких программ можно усовершенствовать контрольно-пропускные пункты аэропортов. Кроме того, алгоритмы смогут стать отличными помощниками для врачей, оценивая вероятные результаты различных методов лечения.