tiistai 10. kesäkuuta 2014

"Eugene Goostman" ei ole persoona

Viime päivinä mediassa on puhuttu paljon Turingin testistä. Niin Independent kuin The Guardian kuin Science Daily uutisoivat. Asiaa on huomioitu myös kotimaan medioissa varsin kiitettävästi, YLE ja MTV ovat ottaneet sen puheeksi, puhumattakaan relevanteista uutislähteistä tärkeintä, "muropakettia". Uutisoinnin syynä on Eugene Goostmaniksi nimetty algoritmi, joka oli onnistunut hämäämään 33% niistä jotka sen kanssa keskustelivat. Ja mikä miellyttävintä, Turingin testistä puhuminen sattui kuin sopivasti Alan Turingin juhlan kunniaksi ; Testi tehtiin Turingin kuoleman 60 vuotispäivän juhlistamiseksi.
1: Ajatus kuolinpäivän juhlimisesta on toki hieman erikoista. Syntymä on symbolisesti positiivisempi. Eroa voi mietiskellä vaikka sitä kautta mitä eroa on juhlia "holokaustin päättymispäivää" ja "holokaustin alkamispäivää".

Turingin testi taas on maineeltaan ikoninen. Sitä pidetään tärkeänä. Jos tietokone laskee paremmin kuin fyysikko tai kassaneiti, ei sitä pidetä tärkeänä. (Vaikka muutama sata vuotta sitten tätä olisi pidetty mahdottomana. Sillä rationaalisuus oli vain ihmisten erityisasia, ei siihen mikään piisiru pysty, kalkyyliin. Ja ihmisistäkin vain tietoisin eliitti!) Tämän maineen vuoksi suosittelen esimerkiksi lukemaan kaunokirjallisen novellin "Tichyn kosmisesta kulttuurilaarista". Siinä imitaatiopeliä pelataan hyvin erikoisilla aseilla ja asteilla.

Jostain syystä Intelligent
Designin ystävät eivät ole
pitäneet Turingin testissä
onnistumisesta. Vaikka heidän
koko argumentaationsa nojaa
ajatukseen analogisuudesta
biologisten asioiden ja koneiden
 välillä. Tämä yllättää syvästi.
Luulisi että analogisuus
ihmisen ja koneen välillä
ilahduttaisi heitä kaikkia kovin.
Tai yllättäisi jos ei tietäisi että
liike on kaappikreationismia.
Testin ikonisuus on toki muutakin kuin kulttuurin, taiteen ja filosofian kannalta tärkeä. Testin ikonisuuden vuoksi osa pitää testissä onnistumista mahdottomana. Eli jos testissä onnistutaan testi on tehty väärin. Haluna on "sama kuin evoluutiossa, mutta suuremmin" ; Jos on nöyryyttävää että "me ollaan apinoita", niin kyllä se iskee sielukonseptia vastaan ikävästi jos kone ajattelee kuin ihminen. Jos tekoälyssä onnistutaan, se iskee yllättävän monen eksistentiaalisiin kokemuksiin ja aikaansaa murhetta ja ahdistusta. Siitä huolimatta että erittäin monet osaavatkin aivan oikein viitata Searlen "kiinalaiseen huoneeseen", jonka seurauksena on aivan hyväksyttävää ajatella että Turingin testi ei tosiasiassa mittaa tietoisuutta. Se onkin kenties lähinnä jonkinnäköinen älyllinen laskentatehosuorite.
1: Onnistumisesta on tehty erilaisia salaliittolaisia ajatuksia. Jopa vahvaa denialismia on ilmassa. Paranoidimmat esimerkiksi vihjaavat että testistä uutisoinnissa olisi reptiliaanisia ulottuvuuksia. Että esiin nousee lähinnä kysymys että miksi YLE haluaa meidän uskovan tämänlaisiin? Kaiken takana ovat tietysti reptiliaanit.

Suoralta kädeltä torjunta on siis asenteellista ja typerää. Mutta kriittinen on silti hyvä olla. ; Turingin testissä selviämisen uskottavuutta on hyvä analysoida ja todella katsoa mitä siinä tapahtuu. (Eikä pelkästään tulkita asioita sen mukaan minkä ajattelee mahdolliseksi tai mahdottomaksi.) Esimerkiksi katsomalla sen tekijöiden taustat. Tämän kyseisen uutisen kohdalla testissä onnistuneet toimijat ovat usein "olleet asiallisuuden kanssa siinä rajalla". Taustalla on esimerkiksi sitä, että ensimmäiset ihonalaiset sirut on nimetty mediaseksikkäästi "kyborgiudeksi". (Ei suoraan epätosi väite, mutta turhan lennokas ja laaja tulkinta "kyborgiudesta". Media ostaa tämänlaisia shokkisensaatioita sitten melko epäkriittisesti. Etenkin jos se ei ole suoraan epätosi väite.) Yhdistettynä Turingin syntymäpäivään syntyy ennakkoaavistus. On siis syytä olla varovainen.

Mutta tämä on kuitenkin vain aavistus. On syytä tarkkailla asiaa siten että vastakkain on kolme erilaista peruslähtökohtaa. Nyrkkisäännöksi voi sanoa sen, että aina kun havaitsija ei voi kertoa eroa piilossaolevan ihmisen ja tietokoneen välillä on tarjolla kolme vaihtoehtoa;  (1) Tietokone oli todella älykäs, (2) ihminen oli tyhmä tai (3) kokeen laatija ja tarkkailija oli tarkoitushakuinen ääliö. Ja vaikka epäilykset heräävätkin on syytä huomata että kokeen tekijä on korkeintaan aihetodiste kohdalle 3. Siksi tarvitaan lähempää asian miettimistä.

Turingin testiolosuhteissa onnistuminen on toki jotain jota olen odottanut melkoisen kauan. Ja uskon vakaasti, että siinä tullaan onnistumaan. (Oikeastaan riippumatta tietoisuuden perimmäisestä luonteesta Turingin testi on jotain joka varmasti läpäistään.) On kuitenkin hyvä katsoa Eugene Goostmania hieman kriittisestä kulmasta. Wired otti testissä onnistumiseen kriittisen kannan. Tärkein huomio on siinä että algoritmi ei ole merkittävän hyvä siihen mitä on ollut liikkeellä jo aikaisemmin. Toki 30 tuomaria on hyvä otosmäärä testaamaan ohjelmaa, ja kolmasosa heistä on ihan hyvä määrä. Se ei kuitenkaan ole mitenkään maagisen erinomainen. Huomiotaherättävää onkin kiinnittää huomiota siihen miksi 30% on kiinnostava. Se ei koskekaan sitä onko kone tietoinen, vaan se koski Turingin ennustusta siitä mihin tietokoneet kykenevät viidenkymmenen vuoden päästä. Esiin nousee Turingin oma lausunto ; "I believe that in about fifty years’ time it will be possible, to programme computers… to make them play the imitation game so well that an average interrogator will not have more than 70 per cent chance of making the right identification after five minutes of questioning" Nyt kun tässä onnistutaan 60 vuoden päästä, meidän pitäisi olla kaiketi hieman pettyneitä. Vässykkäsukupolvet ovat onnistuneet alittamaan vanhempien polvien odotukset kerran toisensa jälkeen. Ja tämä nyt on vain yksi syy lisää lietsoa pessimismiä. ~ En malta olla laittamatta Metroa joka nosti esiin alan asiantuntijan Murray Shanahan lausunnon. Hän tiivisti asian "It is a great shame the test was reported as passed. The 30% pass boundary was never set by Turing, who just said the test would be passed if ‘the interrogator decides wrongly as often when the game is played between a computer and a human as he does when the game is played by a man and a woman. It (the 30% figure) was his belief of what the pass rate would be in the year 2000, not the pass boundary."

Itse huomioinkin, että "testissä tavallaan onnistumisesta" huolimatta se ei täytä tiukemman Turingin testin kriteerejä.
* Testiaika on lyhyt joten sen voi vielä saavuttaa puhtaasti onnella. Jos keskustelua käytäisiin vaikka keskusteluna tunnin verran, se olisi vakuuttavampi.
* On hyvä huomata että algoritmi ei teeskennellyt olevansa kovin kypsä tai aikuinen. On selvää että on helpompaa imitoida jotain hyvin algoritminomaista tai kyvyiltään rajoittunutta. Kuten vaikka 3 -vuotiasta, ulkomaalaista joka ei osaa hyvin kieltä, uskonfanaatikkoa joka siirtää aiheen kuin aiheen tiettyyn aihepiiriin. ; Esimerkiksi PARRY niminen algoritmi onnistui jo 1970 -luvulla hämäämään ammattipsykiatreja. 48% uskoi että algoritmi oli aito skitsofreniasta kärsivä ihminen. ; Siksi noin karkeasti sanoen trollin tai biblethumberin imitointi alkeellisella algoritmilla on itse asiassa niin helppoa, että Turingin testi yhteydessä merkittävää menestystä on on aiemmin tullut jos keskustelua on rajattu tiettyihin aiheisiin. (Itse tosin uskoisin jos joku paljastaisi että valtaosa netin uskonnollisista saarnamiehistä ja YUP -vandaali ovat oikeasti algoritmeja, pahantahtoisen ohjelmoijan tekemiä typeriä paskanjauhantaa arpovia algoritmeja.)

Itse olisin vakuuttunut siihen että Turingin testistä jota ei sidota tämänlaiseen prosenttiin, vaan vertailuun. Eli vastakkain on tietokonealgoritmi ja ihmisiä. Kriittinen voisi epäillä kaikkia ihmisiäkin roboteiksi ja löyhä lähes kaikkia, ja näin prosenttimäärät riippuisivat testaajista. (Tätä muuten demonstroi hyvin ELIZA:n menestys. Ihmiset eivät olleet vertailumielellä liikenteessä ja ELIZA olisi varmasti saanut hyviä ihmismäisyysprosentteja.) Mutta jos testin kohteena on se, että uskotaanko konetta ihmiseksi yhtä usein kuin ihmistä ihmiseksi, tämänlainen kumoutuu. Tämä on tarpeen kun mietimme Shtetl-Optimized -blogin tekemiä kokeiluja Eugene Goostmanin julkisesta versiosta. Siellä tulee esiin se, miten Turingin testin olosuhteissa kysyjällä on hirvittävän suuri merkitys. Hän havaitsi koneen koneeksi varsin helposti ja ilmselvästi. Syitä on kaksi.
1: Hän mittasi selkeitä asioita jotka ovat ihmisille todella helppoja. Koneelle vastaavat kysymykset ovat kaikki yhtä vaikeita. "Which is bigger, a shoebox or Mount Everest?" on hyvä. Tämä on pseudokeskustelullista, joten tämänlaisen ohjelmointi vaatisi tietopankin eri käsitteistä. Teoriassa tämä on kuitenkin lähinnä muistipankkikysymys. Substantiiveille voidaan listata attribuutteja ja kaikki tämänlaiset ratkaisut ovat teoriassa peitettävissä puhtaalla laskentateholla. ; (Itse asiassa valtaosa Goostmanin menestyksestä perustuu siihen, että sillä on "omituinen huumorintaju". Se luo vastauksiin vapausasteisuutta, ja helpottaa kriteerejä. Moni pitää huumoria kognition korkeimpana saavutuksena silti. No niin se oli kalkyylinkin kanssa.) Itse asiassa jos Goodman pistettäisiin vitsailun lisäksi myös kiroilemaan, monet paljastavat paikat voitaisiin peittää jo nyt.
2: Tosiasiassa Goostman esitti kysymyksiä ja teki muita keinoja joihin ihmiset helposti vastaavat tietyllä tavalla. Näiden avulla keskustelusta tulee strukturoidumpi. Jos näihin ei mene mukaan, kone eroaa ihmisestä hyvinkin vahvasti. Tässä kohden bloggerilla on muuten mielenkiintoinen huomio siitä että Turingin testissä testataan algoritmia, ja testaava agentti ei ole velvoitettu olemaan itse jotain joka läpäisisi Turingin testin. "Right after I put up this post, several commenters pointed out that I didn’t necessarily pass the Turing Test, since I didn’t care about playing into Eugene’s script, and therefore repeatedly ignored his questions about my job. Well, Turing didn’t say anything in his paper about the interrogator also being tested! I was trying to illustrate how to unmask a robot as quickly as possible, not how to distinguish yourself from one."

Olen tässä kuitenkin kaiken kaikkiaan melko vahvasti Greg Ladenin linjoilla.Hän huomauttaa, että tosiasiassa tekoälyn saavutusten kohdalla tämänlaisiin testeihin on hirvittävän vähän halua ja kiinnostusta. Yleisö on toki kiinnostunut aiheesta. Mutta tämä ei auta. "I’m pretty sure the only reason a computer has not yet passed the Turing Test (despite rumors to the contrary) is because no one is really trying. When IBM finally decided it would make a computer that could beat a chess master at his own game, they just went and made one. Took piles of effort and money, but I don’t think there was ever any doubt it could eventually be done." Itse uskon että haluttomuuteen on monia syitä. Joista osa on kulttuurisia ja eksistentiaalisia. Ellei peräti ideologisia. Turingin testi nähdään sen ikonisuuden vuoksi uhkana. Ja tämän vuoksi sille on vaikea myös saada rahoitusta. Ja ainakin harvempi on kiinnostunut yrittämään koska pitää sitä a priorisesti mahdottomuutena maailmankuvansa vuoksi. Nytkin "menestynyt testi" kyhättiin kasaan jo tunnetusta materiaalista, vain koska Alan Turingia koskeva juhlapäivä oli lähellä. "Eugene Goostman" ei ollut uusiin innovaatioihin perustuva, vaan jo tutusta materiaalista koostettu purkkaviritelmä. Minulle tämä on jo yksinään jonkinlainen merkki siitä miten vähän yritämme. Se on kenties myös merkki siitä miten suurena uhkana Turingin testiä pidetään vain sen vuoksi miten ikoninen se on kaduntallaajien mielikuvissa.

3 kommenttia:

MrrKAT kirjoitti...

http://www.uusisuomi.fi/tiede-ja-ymparisto/69733-tekoalyn-lapimurto-olikin-potaskaa-ihmiskunnalla-nyt-vakava-pohdinnan

kirjoittaa, että tämä nykyinen uutinen oli markkinointitemppu koska jo v. 2011 Cleverbot sai 59% ihmisistä huijattua ja testaajien määrä oli suurempi yli 1300.
(Muuten samaan aikaan ihmiskeskustelijalle tuli vain 63% osuus !).

Tuomo "Squirrel" Hämäläinen kirjoitti...

Hienoa! (Bonuksena; kommenteissa esiintyvä Jumalan puhelinnumero -kommentti oli hauska.) Joo, markkinointitemppuhan tuo oli.

"Aika Hyviä prosentteja" on saatu ties millä. Niiden esimerkeiksi laittaminen on vähän kuin valikoisi sarjamurhaajista yhden. Mukaan päätyvät ne jotka itsestä on legendaarisimpia. (Järvenpään hiekkakuoppasurmaaja.)

Ja jo antamasi tulos kyllä aika hyvin demonstroi sitä että vaikka aito Tietoisuus todennäköisesti on mahdoton von Neumannin arkkitehtuurilla, niin Turingin testistä selviäminen ei nimenomaan ole sille mahdoton.

Tuomo "Squirrel" Hämäläinen kirjoitti...

"Lehti" muuten tiivisti tämän testin tieteellisen annin varsin hienosti. "Keinoälyn kehittyminen saavutti merkittävän virstanpylvään viikonvaihteessa, kun maailmalle kerrotttin tietokoneohjelman ensi kertaa läpäisseen niin sanotun Turengin testin. Testi mittaa sitä, kuinka hyvin ohjelmisto pystyy uskottelemaan ihmistuomaristolle, että se ei ole ohjelma vaan kantahämäläinen varhaisteini."

Priceless