Suomalaisprofessori Tuomas Sandholmin kehittämä Pluribus teki tekoälyhistoriaa voittamalla pokerimoninpelin maailman menestyksekkäimpiä ammattilaispelaajia vastaan.
Kaksitoistapäiväinen Texas-Hold'em no limit -peli kokosi kilpasille kolmetoista huippupelaajaa. Pelissä mukana olivat muun muassa pokerimaailman kiintotähdet Darren Elias sekä Chris “Jesus” Ferguson. Jokainen tekoälyn vastapelaajista on voittanut pokeriurallaan miljoonia.
Tekoäly on päihittänyt ihmisen lautapeleissä jo vuosia sitten, mutta pokeri on tiedostettu astetta vaikeammaksi haasteeksi. Googlen omistama tekoäly Alphago voitti ihmispelaajan go-lautapelissä lukemin 4–1 Soulissa vuonna 2016. Pelitutkijoiden mukaan go on maailman haastavin lautapeli. IBM:n shakkiohjelma Deep thought taas päihitti shakin moninkertaisen maailmanmestarin Garri Kasparovin jo vuonna 1997.
Kasparovin tappiosta on jo yli kymmenen vuotta ja tekoäly kehittyy kehittymistään. Tavallisen kuluttajatietokoneen shakkiohjelma kykenee näinä päivinä jo päihittämään kaikki maailman ihmispelaajat. Lautapelivoittojen jälkeen tekoälyn tutkijat ja ohjelmoijat käänsivät huomionsa noppa- ja korttipeleihin, joissa sattumalla ja psykologialla on suurempi merkitys. Pokerimoninpelivoitto on ollut tekoälyn kehittäjien tavoitteena jo vuosien ajan.
Pluribuksen kehittänyt suomalaisprofessori Sandholm on vetänyt tietokonepokeriin perehtynyttä tutkijaryhmää jo yli 15 vuoden ajan. Tekoäly kehitettiin Pittsburghin Carnegie Mellon -yliopistossa yhteistyössä Facebook AI:n kanssa.
Pluribuksen edeltäjä Libratus pelasi pokeria voitokkaasti jo vuonna 2017 neljää pokeriammattilaista vastaan. Libratus kuitenkin haastoi vain yhden ihmisvastustajan kerrallaan. Libratuksen tekoälyseuraajan tavoitteena olikin siirtyä kaksinpeleistä perinteisiin kuuden pelaajan pokeripelipöytiin.
Kuuden pelaajan peli tarjoaa tekoälylle huomattavasti kaksinpeliä monimutkaisemman haasteen. Casino tarjoaa tekoälylle myös muita haasteita, sillä toisin kuin shakin ja go'n kaltaisissa lautapeleissä, pokerissa pelaajilla on saatavillaan vain osa informaatiosta. Pokerissa pelaajat eivät tiedä vastustajiensa kortteja. Pokerissa vastapelaajat saattavat myös hämmentää peliä bluffaamalla. Pokerin asettama haaste vastaa mutkikkuudessaan monia tosimaailman haasteita, joita tutkijat toivovat tekoälyn kykenevän lähitulevaisuudessa ratkaisemaan.
Pluribus opettei pelaamaan pelaamalla itseään eli viittä kopiotaan vastaan. Varsinaisessa pelissä oli kerrallaan viisi ammattilaista sekä tekoäly. Pelin aikana pelattiin yli 10 000 kättä. Tekoäly hämmensi ihmisvastustajiaan yllättävillä panoksilla. Pluribus esimerkiksi “donkkasi” runsaasti.
Donkkaaminen on huonoksi koettu pelitaktiikka, joka harvoin nähdään strategisesti järkevänä. “Oli äärettömän kiehtovaa pelata pokeribottia vastaan ja nähdä mitä strategioita se valitsi. Näimme monia siirtoja joita ihmispelaajat eivät simppelisti tee. Tekoäly ja botit edustavat pokerin tulevaisuutta ja oli ainutlaatuista kokea niiden tarjoama vastus ensikädessä“, pokerilegenda Michael Gagliano kuvaili. “Tekoälyn vahvuus tiivistyy mielestäni sen kyvyssä käyttää sekalaisia strategioita. Ihmispelaajat pyrkivät samaan mutta harvoin kykenevät toteuttamaan epäjohdonmukaisiin strategioita täydellisen johdonmukaisesti.” lisäsi Darren Elias, pelin vahvin ihmispelaaja.
Tekoälylle shakissa aikanaan hävinnyt Kasparov muistuttaa, että konetta vastaan pelatessa pelaajan on muutettava pelitapaansa. On löydettävä outoja siirtoja, joilla hämätä koneen armotonta muistia ja virheetöntä logiikkaa. Myös pelikertoimet ovat armottomat. Siinä missä tekoälyn kohdannut eteläkorealainen go-mestari Lee Sedol kykenee pelaamaan korkeintaan tuhat mestaritason peliä vuodessa, häntä vastustanut tekoäly Alphago voittaa samassa ajassa miljoonia pelejä itseään vastaan, ja viisastuu jokaisesta. Kaikki pelatut pelit ja niiden aikana tehdyt siirrot tallentuvat tekoälyn muistiin ja palvelevat kun tekoäly seuraavan kerran etsii oikeaa peliliikettä. Tekoäly voi myös kopioida kaikkien kohtaamiensa vastustajien pelityylit.
Tekoälytutkijoiden tähtäimessä ovat pokeripelivoittoja suuremmat ratkaisut. Monimutkainen moninpelipokerivoitto todistaa, että tekoälyä voidaan relevantisti soveltaa monitahoisiin tosimaailman ongelmiin, joiden ratkaisemiseksi meillä ei ole kaikkea tarvittavaa informaatiota.
Pluribuksen luoneen Sandholmin mukaan vajaan tiedon pohjalta ratkaisuja tekevät algoritmit voivat tuoda ratkaisuja muun muassa sijoitusmarkkinoille, neuvottelupöytiin tai mainoskampanjoiden kohdentamiseen. Sandholm on perustanut kaksi yritystä, jotka ovat lisensoineet hänen laboratoriossaan kehitetyt strategisen päättelyn teknologiat. Toinen yrityksistä, Strategic Machine., soveltaa teknologiaa pelaamisen, pokerin, bisneksen sekä lääketieteen aloille ja toinen, Strategy Robot, maanpuolustukseen ja tiedusteluun. Samassa Carnegie Mellon -yliopiston laboratoriossa kehitellään myös tekoälyn biologisia sovelluksia, joiden avulla voidaan optimoida terveydenhoitoalan hoitopäätöksentekoa.
Ei kommentteja:
Lähetä kommentti
Huomaa: vain tämän blogin jäsen voi lisätä kommentin.