Desenvolvido por pesquisadores em parceria com o Facebook, o Pluribus apresenta técnicas que podem ser utilizadas em transações de Wall Street

Em seus 14 anos de atuação no circuito do pôquer profissional, Darren Elias nunca havia enfrentado alguém que jogasse sem ter medo algum.

O típico jogador de pôquer, quando recebe dois valetes - uma carta aberta e outra fechada, uma mão nem boa nem ruim - costuma proceder com muita cautela. Mas não o adversário de Elias, que aparentemente tinha total segurança do devia fazer.  Mesmo quando Elias decidiu blefar, apostando como se tivesse uma mão forte, o seu adversário efetivamente pagou: agiu antes ou pagou cada aposta, aparentando plena confiança, e ganhou.

O mais notável é que este adversário era uma máquina. Pluribus, o jogador de pôquer automático, foi projetado por pesquisadores da Carnegie Mellon University da Pensilvânia em colaboração com o laboratório de inteligência artificial do Facebook em Nova York. Em um documento publicado no dia 11 de julho na revista Science, os pesquisadores descreveram como o Pluribus venceu recentemente Elias e vários outros profissionais de elite em um jogo com diversos jogadores, no Texas Hold'Em sem limites, a forma mais popular de pôquer.

Nos últimos 30 anos, pesquisadores construíram sistemas que derrotam os melhores jogadores em partidas de damas, xadrez, Go e, até mesmo no Jeopardy, sobre assuntos variados. Mas ao contrário destes jogos, o pôquer se baseia em informações ocultas. Cada jogador tem na mão cartas que o adversário não pode ver. Os melhores jogadores precisam dominar a maneira de descobrir o que os adversários estão escondendo, protegendo ao mesmo tempo os próprios segredos.

O Pluribus sabia quando blefar, quando pagar para ver o blefe de cada um, e quando deveria variar seu comportamento para que os outros jogadores não compreendessem sua estratégia. "Ele faz todas as coisas que os melhores jogadores do mundo fazem", disse Elias, 32, ganhador do recorde de quatro títulos no World Poker Tour. "E faz algumas coisas que os seres humanos têm dificuldade para fazer".

Os especialistas acreditam que as técnicas que permitem isso, e sistemas semelhantes, poderiam ser usadas nas transações de Wall Street, nos leilões, nas negociações políticas e na segurança cibernética, atividades que, como o pôquer, envolvem informações ocultas.

"Nem sempre as pessoas conhecem a situação do mundo real", disse Noam Brown, pesquisador do Facebook que supervisionou o projeto do Pluribus.

A máquina aprendeu as nuances do Texas Hold'Em jogando trilhões de mãos contra si mesma. No fim de cada mão, ela avaliava cada decisão, determinando se uma escolha diferente teria dado um resultado melhor.

Ao contrário dos sistemas que podem dominar os jogos de vídeo tridimensional, como o StarCraft - sistemas que precisam de treinos de semanas ou mesmo meses, a fim de o jogar contra seres humanos - o Pluribus treinou apenas cerca de oito dias em um computador bastante comum, ao custo de aproximadamente US$ 150. A parte difícil foi criar o algoritmo detalhado que analisava os resultados de cada decisão.

"Nem estamos usando um extraordinário poder de computação", explicou Brown. "Podemos lidar com informações ocultas de uma maneira muito peculiar".

No fim, o Pluribus aprendeu a aplicar estratégias complexas, inclusive blefar, e comportamentos aleatórios, em tempo real. Então, ao jogar contra adversários de carne e osso, apurou essas estratégias calculando possíveis resultados, como faria um jogador de xadrez.

Todas as partidas foram jogadas online, de modo que o sistema não decifrava as emoções ou as 'dicas' involuntárias de seus adversários humanos. O sucesso do Pluribus mostrou que o pôquer pode ser reduzido à matemática pura e simples, segundo Elias.

"Números e porcentagens, simplesmente, resolvem o jogo".

Fonte: https://internacional.estadao.com.br/noticias/nytiw,inteligencia-artificial-blefa-e-vence-os-melhores-no-poquer,70002928646