Dit Computerprogramma Kan Iedereen Verslaan Bij Poker

{h1}

Een nieuw computerprogramma kan mensen overtreffen bij een pokergame met twee spelers.

Computers hebben berekend hoe ze kunnen winnen bij schaken, dammen en boterhamzen en nu heeft een computerprogramma het pokerspel overwonnen.

Een onderzoeksteam onder leiding van Michael Bowling, een professor in computerwetenschappen aan de Universiteit van Alberta in Canada, ontwikkelde een computerprogramma dat mensen kan overtreffen bij een pokergame met twee spelers - met name heads-up limiet houdt ze vast. De resultaten kunnen verregaande implicaties hebben voor andere situaties die complexe besluitvorming vereisen, zoals in het buitenlands beleid of medische behandeling.

In tegenstelling tot schaken of dammen, weet een speler bij poker niet altijd de eerdere zetten van de andere spelers. Bovendien kan een speler een hand winnen wanneer de andere spelers folden. Daarom heeft het spel in wiskundige termen onvolmaakte informatie. [Top 10 revolutionaire computers]

"Chess heeft een perfecte speeloplossing - het antwoord voor een bepaalde positie is, een overwinning voor zwart, een overwinning voor wit of een gelijkspel," zei Bowling. "Poker is meer probabilistisch." Met andere woorden, er is geen absoluut perfecte hand of strategie.

Hoe het werkt

In de versie van Hold'em poker die de computer heeft gespeeld, zijn de inzetten tussen twee spelers vastgesteld en is het aantal raises beperkt. De dealer geeft elke speler twee kaarten, de zogenaamde hole cards. Er volgt een ronde van weddenschappen, bekend als de 'pre-flop'. Daarna worden nog drie kaarten op tafel gelegd, een "flop". De flop is een set gemeenschappelijke kaarten die open wordt gedeeld, zodat beide spelers weten wat ze zijn. Er volgt nog een gokronde en dan wordt een vierde kaart op tafel gelegd, de "draai". Na een derde gokronde wordt de laatste gemeenschappelijke kaart gedeeld (dit wordt de "rivier" genoemd) en op dat moment moeten de spelers hun hole cards laten zien, ervan uitgaande dat één speler nog niet heeft gefold.

De computer berekent niet elke mogelijke hand als deze speelt. In plaats daarvan bouwt het een tabel met resultaten op voordat het spel start. Met ongeveer 4.000 centrale verwerkingseenheden gedurende twee maanden - gelijk aan ongeveer 1000 jaar rekentijd - simuleert het miljarden handen van poker. De tabel met resultaten alleen al nam ongeveer 15 terabytes aan computeropslag in beslag, aldus Bowling. Ter vergelijking: een standaard back-upschijf voor een desktop is één terabyte. [10 technologieën die je leven zullen veranderen]

Het algoritme doorloopt alle mogelijke handen die een andere speler zou kunnen hebben, en vergelijkt vervolgens de resultaten voor elke tactiek - bijvoorbeeld het verhogen, vouwen of het aanroepen van de weddenschap (d.w.z. het matchen van de tegenstander). Om een ​​idee te krijgen van hoe groot de taak is, zijn er 13,8 biljoen verschillende situaties die in de game kunnen voorkomen. Om daar te komen, zou elk mens op aarde bijna 4000 handen poker moeten spelen.

Dit verschilt van schaken, waarbij een computer brute-force berekeningen kan uitvoeren terwijl het spel vordert om een ​​resultaat te krijgen dat goed genoeg is om te winnen. (In tegenstelling tot wat veel mensen denken, gaan maar weinig computerprogramma's door elke permutatie heen, alleen degenen die de beste resultaten produceren). Stel je eens voor dat schaakspelcomputers de resultaten van miljarden vorige games moesten opzoeken met een specifieke configuratie van stukjes op het bord.

Als miljarden handen worden gespeeld, komt het programma met een optimale strategie - dat wil zeggen, het convergeert over wat de beste zet is voor een bepaalde hand. "De manier waarop dit werkt... het heeft al een biljoen miljard handen van poker gespeeld," zei Bowling.

Het spel beheersen

Omdat poker niet op te lossen is zoals schaken of dammen, bedachten Bowling en zijn team een ​​andere set vereisten om het spel "opgelost" te noemen. In wetenschappelijke termen is het spel 'in essentie opgelost', wat betekent dat er een manier is om de strategie die de computer gebruikt te exploiteren. De onderzoekers veronderstelden dat iemand 70 jaar lang, 365 dagen per jaar, 24 uur per dag op de computer speelde. Het programma dat ze schreven speelde zo goed dat als de big blind - de vaste gok - $ 1.000 is, de meest perfecte speler kan winnen, ongeveer $ 1 per hand is, of 1/1000 van de big blind.

Andere experts hebben gewerkt aan pokerspelcomputers die in casino's worden gebruikt en ten minste één bedrijf zegt dat het een algoritme voor computerleren heeft ontwikkeld dat de strategie aanpast aan de menselijke speler. Maar geen ervan heeft aangetoond dat de exploiteerbaarheid ervan - het vermogen van een perfecte menselijke speler om de machine te verslaan - even klein is als het programma dat werd ontworpen door het team van Bowling. Ook heeft het spel niet op dezelfde mathematisch rigoureuze manier opgelost.

Maar het algoritme heeft beperkingen. Ten eerste werkt het alleen met spellen met twee spelers. In een spel met drie spelers is het mogelijk dat een speler een vreselijke strategie heeft (de speler heeft bijvoorbeeld de neiging om de hele tijd te verhogen) en verliest hij minder dan de tweede speler, die een betere strategie heeft, resulterend in in een overwinning voor de derde speler.

Een ander probleem is het uitzoeken hoe eerlijk het is om games met drie spelers te testen. Bij één experiment konden twee mensen de machine spelen, maar Bowling zei dat de menselijke spelers tegen de machine kunnen samenspannen, zelfs onbedoeld. Vergelijkbare problemen kunnen zich voordoen bij experimenten met twee machinisten en één mens: zelfs als de twee programma's niet samenspannen, zou het op die manier op een mens kunnen lijken. "We weten niet hoe we het eerlijk moeten uitvoeren," zei hij.

Bowling zei dat deze technologie verschillende toepassingen kan hebben, variërend van nationale veiligheid, tot het volgen van tariefontwijking op doorvoersystemen, tot het nemen van beslissingen over medische behandeling.Het programma kan bijvoorbeeld een arts helpen die een beslissing moet nemen over de behandeling, maar is niet zeker van de mogelijke uitkomsten. De methoden die in het pokerprogramma worden gebruikt, zouden artsen kunnen helpen bij het identificeren van behandelingsopties met optimale resultaten, of een die de beste kans van slagen heeft.

Het onderzoek werd vandaag online (8 januari) beschreven in het tijdschrift Science.

Volg WordsSideKick.com @wordssidekick, Facebook & Google+. Oorspronkelijk artikel op WordsSideKick.com.


Video Supplement: The Lord of the Rings Voice over 10: De Anticlimax.




WordsSideKick.com
Alle Rechten Voorbehouden!
Reproductie Van Materialen Toegestaan Alleen Prostanovkoy Actieve Link Naar De Site WordsSideKick.com

© 2005–2019 WordsSideKick.com