Штучний інтелект переміг професійних гравців у покер

Програма Libratus, розроблена в Університеті Карнегі - Меллона, перемогла в 20-денному покерному турнірі "Brains Vs. Artificial Intelligence: Upping the Ante». Комп'ютер виграв фішок на суму понад 1,7 мільйона доларів, повідомляє New Scientist.


Останнім часом напрацювання в галузі машинного навчання дозволили комп'ютерам значно просунутися вперед і обіграти людей в іграх, в яких це традиційно вважалося неможливим. Однак, аж до недавнього часу люди як і раніше перемагали в іграх з неповною інформацією. У 2015 році програма Claudico (попередник Libratus) грала з чотирма професійними гравцями і зайняла передостаннє місце. Протягом двох тижнів було зіграно 80000 роздач, і з чотирьох живих гравців тільки один набрав менше фішок, ніж комп'ютер.


У турнірі, який проходив у піттсбурзькому казино Rivers було зіграно 120 тисяч роздач у безлімітний техаський холдем один на один (Хедз-Ап), проти Libratus грали Даніель МакОлей, Джиммі Чу, Донг Кім і Джейсон Ліс. В результаті 20-денного турніру програма перемогла людей, заробивши понад 1,7 мільйона доларів у фішках. Незважаючи на це, розробники не отримають ніяких грошей, а призовий фонд в 200 тисяч доларів буде поділений між чотирма живими гравцями в залежності від зайнятого місця.

На даний момент точно не відомо, як саме працює Libratus, автори описали лише загальну структуру програми і планують в найближчому майбутньому опублікувати статтю в рецензованому журналі. За словами розробників, Libratus складається з трьох частин. Основне «ядро» Libratus було підготовлено заздалегідь, обчислення зайняли 15 мільйонів ядро-годин, в той час як на Claudico пішло два-три мільйони. Друга частина програми стежила за можливими помилками, які могли допустити суперники, і враховувала в процесі гри цю інформацію. Третя частина Libratus відстежувала власні слабкі сторони, які могли використовувати противники, і коригувала загальну стратегію з урахуванням цих даних. Такий підхід дозволив програмі як блефувати самостійно, так і розпізнавати дезінформацію з боку суперників.

На думку авторів програми у систем, подібних Libratus, велике майбутнє в різних сферах, де доводиться мати справу з неповною інформацією. Як можливі сфери застосування програми дослідники називають інформаційну безпеку, військову справу, аукціони, переговори і навіть ощадливий розподіл медикаментів.

Крім покеру машини також перемогли людей в го, гру з повною інформацією. Торік програма AlphaGo виграла в одного з найсильніших гравців у світі Лі Седоля чотири гри з п'яти. У деяких іграх з неповною інформацією людина досі перемагає комп'ютер, у тому числі в Starcraft.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND