Les tenir ou les plier?

null

Un joueur de poker typique, lorsqu’il se voit attribuer deux valets – un face visible, l’autre caché, une main ni bonne ni mauvaise – procède avec prudence.

Encore plus remarquable: cet adversaire était une machine.

Le joueur de poker automatisé, appelé Pluribus, a été conçu par des chercheurs de l’Université Carnegie Mellon de Pittsburgh et du laboratoire d’intelligence artificielle de Facebook à New York.

Cette réalisation marque une autre étape importante dans les progrès de l’intelligence artificielle.

Comme le réalisait Elias, Pluribus savait quand bluffer, quand appeler le bluff d’une autre personne et quand modifier son comportement afin que les autres joueurs ne puissent pas en déterminer la stratégie.

Les experts estiment que les techniques à la base de ce système et de systèmes similaires pourraient être utilisées dans le commerce, les enchères, les négociations politiques et la cybersécurité à Wall Street, activités qui, comme le poker, impliquent des informations cachées.

Il y a deux ans, Brown et son collaborateur, Tuomas Sandholm, informaticien chez Carnegie Mellon, ont mis au point un système capable de battre les meilleurs professionnels lors des parties face à face du Texas Hold’em.

null

null

Brown a qualifié ce processus de «minimisation du regret contrefactuel» et l’a comparé à la façon dont les humains apprennent le jeu.

Contrairement aux systèmes capables de maîtriser les jeux vidéo tridimensionnels tels que Dota et StarCraft – des systèmes nécessitant des semaines, voire des mois, pour s’entraîner contre des humains – Pluribus n’a suivi que huit jours de formation sur un ordinateur relativement ordinaire, au prix de 150 USD environ.

null

Dans ce format, Elias n’était pas impressionné.

Le système n’a pas joué pour de l’argent réel.

Tous les matches ont été disputés en ligne, le système ne décryptait donc pas les émotions ni ne «raconte» physiquement ses adversaires humains.

La même chose se révélera-t-elle au-delà de la table de poker?

“L’attaquant et le défenseur ont une connaissance limitée de ce que font les autres”, a déclaré Wellman.

Bien entendu, le monde réel est encore plus complexe qu’un jeu de Texas Hold’em sans limite.

null

Cet article a paru à l’origine dans le New York Times.