All In: Artificial Intelligence Verslaat De Beste Pokerspelers Ter Wereld

{h1}

Een algoritme voor kunstmatige intelligentie dat bekend staat als libratus heeft de beste pokerspelers ter wereld verslagen in een enorm toernooi.

'S Werelds beste kunstmatige intelligentie pokerspeler lijkt precies te weten wanneer hij ze moet houden en wanneer hij ze moet folden.

Een kunstmatig intelligentieprogramma dat bekend staat als Libratus heeft 's werelds beste menselijke pokerspelers verslagen in een 20-dagen lang No-Limit Texas Hold'em-toernooi en vier tegenstanders verslaat met ongeveer $ 1,77 miljoen aan pokerchips, volgens Pittsburgh's Rivers Casino, waar de "Brains vs. Artificial Intelligence" pokertoernooi werd gehouden.

Aan het einde van elke dag versloeg minstens een van de menselijke spelers het AI-programma. Maar uiteindelijk was het niet genoeg.

"We waarderen hun harde werk, maar helaas heeft de computer gewonnen," zei Craig Clark, general manager van Rivers Casino.

Computerwetenschappers kunnen Texas Hold'em nu toevoegen aan een groeiende lijst met games - inclusief schaken, Go en "Jeopardy!" - waarin AI de beste menselijke concurrent ter wereld kan verslaan. [Super-intelligente machines: 7 Robotic Futures]

Kunstmatige intelligentie schrijdt voort

Sinds IBM's Deep Blue schaakspeler Garry Kasparov versloeg in 1997, zijn de robots aan het winnen bij mensen. Vorig jaar schokte AI de wereld door de beste Go-speler ter wereld te verslaan in een reeks wedstrijden in het strategiespel met zwarte en witte stenen. De taak was zo moeilijk omdat Go meer potentiële bewegingen bevat dan atomen in het universum. Om dat probleem aan te pakken, gebruikte de computer, bekend als AlphaGo, een diepgaande leerstrategie, een griezelig krachtige methode waarbij berekeningen op één laag worden berekend en die vervolgens naar een andere laag in het algoritme worden doorgevoerd.

En toch, in veel opzichten, is Texas Hold'em nog moeilijker, zei Tuomas Sandholm, een computerwetenschapper aan de Carnegie Mellon University die hielp bij het ontwerpen van Libratus en hielp bij het organiseren van het toernooi. (In het 'Let op-start'-spel houden twee spelers elk twee kaarten vast en moeten vervolgens de beste hand maken van de vijf kaarten die uiteindelijk met meerdere ogen open op de tafel worden gelegd over verschillende spelrondes. spelers kunnen de weddenschap van een andere speler callen of matchen, de weddenschap verhogen, of hun kaarten vouwen, of opgeven.)

Het blijkt dat het kraken van dit type spel zelfs lastiger kan zijn dan het beheersen van Go, waarbij elke speler de positie van de ander perfect kent. [5 Intrigerende toepassingen voor kunstmatige intelligentie (dat zijn geen moordenaarrobots)]

"In onvolledige informatiespellen zoals poker is het veel moeilijker", vertelde Sandholm aan WordsSideKick.com.

Stel je bijvoorbeeld voor dat je een hand tegen een tegenstander speelt. Je moet niet alleen denken aan de ace-aas in je hand, maar ook nadenken over wat er op tafel ligt, wat de andere speler zou kunnen hebben, wat zijn weddenschap je vertelt over zijn kaarten en wat hij probeert te leren met zijn weddenschappen.

Dus vertrouwden Sandholm en zijn collega's op een ander concept om Libratus te programmeren. Bekend als Nash-evenwicht, het is een wiskundige manier om de beste spelstrategie te bepalen om uw eigen uitbetalingen te maximaliseren terwijl die van uw tegenstander worden geminimaliseerd. In elke pokerhand dicteert toevallige kans dat het Nash-evenwichtsspel mogelijk verliest, maar in de loop van vele handen vertaalt Nash-evenwicht zich in de "onverslaanbare spelstrategie", zei Sandholm.

Echter, "het spel heeft 10 tot 160 verschillende situaties", wat betekent dat het veel, veel meer computationele mogelijkheden heeft dan Go. Het resultaat is dat het programma de perfecte Nash-evenwichtsoplossing niet kan berekenen, maar in plaats daarvan moet benaderen.

In het verleden was dat een struikelblok. Libratus was betrokken bij een pokertoernooi in 2015 en kon de mensen niet verslaan, waarbij de wedstrijd eindigde in een statistisch gelijkspel. De opgevoerde versie van Libratus gebruikt in het recente toernooi heeft echter een betere strategie voor het oplossen van eindspelen, zei Sandholm.

Het toernooi

Voor het "Brains vs. Artificial Intelligence" -toernooi stonden vier van 's werelds beste pokerspelers één-tegen-één tegenover Libratus in 120.000 handen van poker. Op het spel stond een pot van $ 200.000, die de menselijke spelers ontvingen, zelfs als ze verloren.

"Het zijn professionals, dus ze vochten tot het bittere einde, heel hard," zei Sandholm. "Ze studeerden elke nacht heel hard op hun computer en probeerden gaten in de AI te vinden."

Uiteindelijk was het geen wedstrijd: de AI had de overhand.

Als onderdeel van het programma, bluffen natuurlijk naar voren gekomen als een wiskundig gezonde strategie, merkte Sandholm.

De winst betekende ook enkele verrassende zetten. Bijvoorbeeld, AI had meer kans dan mensen om enorme overbets te maken - wat betekent dat ze drie, vijf of zelfs 20 keer de hoeveelheid chips in de pot zouden inzetten. Interessant is dat die overbets soms wiskundig gezien in twee zeer verschillende situaties plaatsvonden.

"Met een zeer sterke hand en met de zwakste handen, wil je die grote overbets maken," zei Sandholm.

Libratus was ook meer kans dan de mens om te onderbetalen in bepaalde verrassende situaties, zei Sandholm. En elke avond ging het naar huis en paste zijn strategie aan op basis van de handen die het had gespeeld.

"De aanpassing was niet om te leren om de tegenstander te exploiteren, maar om te bepalen welke gaten de tegenstander had gevonden in de AI-strategie en automatisch die gaten te patchen," zei Sandholm.

Toch is er enige hoop voor de gewone stervelingen. In Heads-Up Texas Hold'em concurreren twee spelers. Maar Libratus zou geen idee hebben hoe ze spelers in een pokerspel met vijf of zes spelers moeten verslaan. Daar werken Nash-evenwichtsoplossingen niet, zei Sandholm.

"Ik zou zeggen dat de topmensen in zoiets waarschijnlijk beter zouden doen dan de beste AI," zei Sandholm.

Oorspronkelijk gepubliceerd op WordsSideKick.com.


Video Supplement: .




Onderzoek


Ray-Gun Reality: Inside Two 'Star Wars'-Projecten
Ray-Gun Reality: Inside Two 'Star Wars'-Projecten

Waar Herinnert De Segway Zich Nog Over?
Waar Herinnert De Segway Zich Nog Over?

Science Nieuws


Wanneer Rampenbestrijding Een Ramp Is
Wanneer Rampenbestrijding Een Ramp Is

Hoe Een Gestrande Verpleegster Zijn Eigen Leven Redde Tijdens Een Hartaanval
Hoe Een Gestrande Verpleegster Zijn Eigen Leven Redde Tijdens Een Hartaanval

Waarom Dit Explosieve, Marsachtige Vulkanische Eiland De Nasa Fascineert
Waarom Dit Explosieve, Marsachtige Vulkanische Eiland De Nasa Fascineert

Hoe De Aarde Zichzelf Geneest Na Een Aardbeving
Hoe De Aarde Zichzelf Geneest Na Een Aardbeving

Bekijk Het International Space Station Cross Over The Eclipsed Sun
Bekijk Het International Space Station Cross Over The Eclipsed Sun


WordsSideKick.com
Alle Rechten Voorbehouden!
Reproductie Van Materialen Toegestaan Alleen Prostanovkoy Actieve Link Naar De Site WordsSideKick.com

© 2005–2019 WordsSideKick.com