keskiviikko 5. toukokuuta 2010

Pokerissa bluffaaminen.

Minä olen tunnetusti vain keskinkertainen kortinlätkijä. Tunnen kuitenkin joitakuita ihan kohtuullisia pokerinpelaajia, he kilpailevat ja kaikkea. En ole niin typerä että pelaisin heidän kanssaan. Mutta toki aihe kiinnostaa, sehän on elokuvista tuttua.

Elokuvissahan pokerissa korostetaan tuuria ja bluffia. Eli sitä että satutaan saamaan oikeat kortit, ja sitä että huonoilla korteilla laitetaan messevä panos pöytään ja muut jänistävät. Tämä on kuulemma typerä strategia. Raha ei saa olla tarkasteltava kysymys, vaan tilastot. Itse asiassa hyvät pelajat pumppaavat pieniä voittoja. Ilmeet vihjaavat yllättävän vähän - ja ilmeitä voidaan valehdellakin jolloin niillä harhaanjohdetaan.

Pokerinpelaajat luottavatkin peliteoriaan.

Bluffaamisella on kannattava tiheys.
1: Jos bluffaa koko ajan, toiset tietävät tämän ja silloin he "tulevat mukaan" vain jos heillä on hyvä käsi, jolloin he pikku hiljaa voittavat. Jos kaksi tälläistä strategiaa kohtaa, voitto on silloinkin vain tuurista kiinni. Pokerissa ei siis pidä huijata koko ajan.
2: Ja jos ei huijaa koskaan, käy niin että toiset tietävät onko sinulla hyvä käsi, ja tätäkin kautta he osaavat valita strategian siten, että he voittavat pikku hiljaa. Jos kaksi tälläistä kohtaa, voiton määrää tuuri.

Pokeri on kuitenkin taitopeli, ja strategisella silmällä voidaan pumpata yllä olevat rahattomiksi - toki joskus joku noista voi puhtaalla mäihällä pärjätä, mutta pitkäjännitteinen pokerinpelaaja pelaakin tilastojen mukaan, sillä idealla että kun pelaa kymmeniä tuhansia pelejä, ei voi olettaa että olisi koko ajan mäihä (joko hyvä tai huono.) Keskimäärin kaikki konkarit ovat pitkällä tähtäimellä tilastollisesti tietyn onnekkaita. Hyvällä strategialla voittotodennäköisyys on tällä tilastollisella tasolla merkittävästi suurempi kuin huonoilla.

Ratkaisu haetaan etsimällä nashin tasapainoa. Tämä oli ensi kuulemalta todella yllättävä esitys, koska pokeri on nollasummapeli. Pokerissa jokainen voittamasi kolikko on joltakulta pelaajalta pois. Sen sijaan nashin tasapainoa haetaan useimmiten sellaisissa tilanteissa, jotka eivät ole nollasummapelejä - kuten vangin dilemman kaltaisessa tilanteessa. Pienellä miettimisellä tämä on tietysti päivänselvää. Sekastrategiaa - eri toimintojen oikeissa mittasuhteissa tehtyä sekoitusta - haetaan väistämättä, koska ääripäille on helppo keksiä toimivat vastastrategiat.

Laskentastategioina on kaksi päätyyppiä: Ensimmäisellä voitetaan mahdollisimman paljon ja toisella haetaan mahdollisimman pientä häviämistä. Parhaan ratkaisun hakemisessa katsotaan läpi vaihtoehdot ja etsitään sieltä keino jolla vastustajan hyöty minimoidaan. Minimax lauseen nojalla tämä tarkoittaa samaa kuin oma hyöty.

Pokerin idea on se, että siinä on pelaajia joilla on pelikassa joka muuttuu, ja pelaajat tekevät päätöksiä vaillinaisen informaation pohjalta. Osan informaatio on vaillinaisempaa kuin toisten: Toiset laskevat käsien ja voittamisensa todennäköisyyksiä paremmin, toiset hämääntyvät vaikkapa ilmeilystä. Hyvä pelaaja päättelee tietoja toisten käsien luonteesta siitä miten nämä panostavat, ja muistaen että korttipakka on satunnaiseti sekoitettu kombinaatio, jossa jokainen nostettu kortti painottaa jäljelle jäävien korttien jakaumaa. (Pakassa ei ole kahta pataässää.) Myös korotuksen määrä pottia kohden on kiinnostava tieto. Kuitenkin vaikka tietoa on saatavilla ja johdettavissa, pokeri on olennaiseti epätäydellisen informaation peli jossa toisten kaikkia kortteja ei tiedetä. (Toisin kuin vaikkapa shakki jossa kaikki oleellinen tieto on näkyvissä, nappulat ja mahdolliset liikkeet ovat tiedossa.)

Ainut ongelma on se, että pokeri on matemaattisesti mutkikas peli. Siinä on toki yksinkertaiset säännöt, mutta kun peliä tarkastellaan mahdollisuuksien kautta, tilanteet muuttuvat varsin raskaiksi. Oikeaa tasapainotilaa ja strategianvalintaa ei voida tarkasti tietää. Siksi "tehdään arvioita", parhaan sijasta otetaan hyvä strategia.
1: Shakkikoneiden lisäksi myös pokerinpeluualgoritmien kehittely on suosittua, koska se on ymmärrettävä, luonteeltaan käytännönläheinen ja se on kuitenkin haasteellinen. Ja tälläisellä on tienaamispotentiaalia sekä peliohjelmoijana että käyttämällä inhaa apuvälinettä vaikka nettipokerissa, jossa kakkoskoneelle kerää toisten pelaajen pelituloksia ja käyttää niitä profiilipohjina.

Pokerinpelaajilla tämän arviointikyky tietysti kasvaa kokemuksen mukaan merkittävästi - he tekevät yksittäisestä pelaajasta "profiilin", hänen pelitapansa, joka tekee tilanteen käsitettäväksi ja johon sovitetaan oma pelaaminen. Profiili voi olla dynaaminen tai pysyvä (riippuu pelaajasta tai arvioijan laadusta.)

Peliteorian jännittävin tulos on se, että bluffaamisessa keskeisintä ei ole "milloin pitää bluffata", vaan se, kuinka usein. Tasapainon yksittäistapaukseen laskeminen voi olla raskasta, mutta silti tiedetään että jos pelaaja bluffaa oikealla frekvenssillä, eikä ole kaavamainen (bluffaan joka X kerta) josta saisi kiinni, niin bluffaaminen ei vaadi erityistä kikkaa tai syytä. Bluffaamisessa ei siis ole kysymys oikeista tilanteista tai reteästä kaikki rahat pöytään -hengestä, vaan enemmänkin siitä että tekee bluffia satunnaistekona siten että bluffilla on joka kierrokselle oikea todennäköisyys.

Hauskinta tässä on tietysti se, että en muuttunut tämän tiedon kautta yhtään paremmaksi pokerinpelaajaksi.

Ei kommentteja: