Нейросеть все-таки переиграла человека в покер. Трехнедельный реванш в казино Питтсбурга закончился победой искусственного интеллекта под названием Libratus. Компьютер выиграл фишек на $1700000, сообщает The Guardian.
По словам разработчиков программы, они совсем не были уверены в успехе: букмекеры принимали ставки с коэффициентом 1 к 4.
В матче участвовали четверо профессиональных игроков: Джейсон Лес, Дун Ким, Дэниель МакОли и Джимми Чу, они играли в так называемый безлимитный техасский холдем хедз-ап, то есть каждая партия проходила «один на один», а максимальная ставка ограничивалась количеством фишек.
В 2015 году разработанная в университете программа Claudico проиграла трем из четырех игроков. Однако 80 000 разыгранных тогда рук оказалось недостаточно для статистически безупречного признания победы одной из сторон. Поэтому при подготовке к матчу-реваншу было принято решение увеличить общее число рук на 50%.
Libratus создали специально для матча-реванша. От предыдущей программы он отличается использованием равновесия Нэша, а также новой стратегией завершения игры: в отличие от Claudico, он не использовал «очевидные ходы», а перерассчитывал свое поведение заново. В результате программа с первых дней турнира вырвалась вперед, в середине игры люди сумели «сравнять счет», и даже выйти в плюс, но в итоге искусственный интеллект все-таки победил. Неудивительно, для «тренировки» Libratus использовали 15 миллионов часов суммарной работы ядер суперкомпьютера Bridges, в 5 раз больше, чем для «тренировки» Claudico.
Текст: Алексей Паевский