lauantai 26. maaliskuuta 2016

Kuinka internet loi natsitekoälyn?

Microsoft on tietotekninen yritys jota on syytetty paljosta. Windows -käyttöjärjestelmä on saanut omistautuneita kriitikoita. (Itsekin käytän Linuxia.) Joskus tulee mieleen että syynä kaatumiseen, blue screen of deathiin ja muuhun on se, että he tekevät kohtuullisen monimutkaisia asioita. Tähän tuhon tematiikkaan sopii "natsitekoäly". "Microsoft on joutunut poistamaan käytöstä uuden tekoälyyn perustuvan chatbotin, kun Twitter-käyttäjät käyttivät bottia hyväkseen ja opettivat sen lausumaan rasistisia, seksistisiä ja muita loukkaavia kommentteja."

En ollut yllättynyt tästä monissa lehdissä uutisoituun tapahtumaan. olin huvittunut. Huvittunut siitä että tämä algoritmi on jotain josta voidaan rakentaa vitsejä Turingin testin läpäisystä.. (Kone kytkeytyi internettiin ja alkoi mouhottamaan kuin pahin oikeistokonservatiivikristitty. Ja juuri samoin twistein.. "A day after Microsoft introduced an innocent Artificial Intelligence chat robot to Twitter it has had to delete it after it transformed into an evil Hitler-loving, incestual sex-promoting, 'Bush did 9/11'-proclaiming robot.") Näin tapahtumassa vahvan väistämättömyyden hengen.

Mutta dualistinen "hengetön kone" ja "ihmisen hallinnan ulkopuolella oleva sattuma" -metafora tuntuivat leimaavan muuta keskustelua.

Toki tämä nousi myös keskusteluihin. "Takkirauta" -blogissa asiasta kirjoitettiin tavalla joka on varmasti maallikko-tavallinen. "Nokkelimmat lukijat yhdistivät tämänkertaisen masuuninlaskun otsikon trooppiin AI is Crapshoot, ts. tekoäly on crapsin pelaamista. Ja tämä trooppi - eli että tekoäly on täydellistä uhkapeliä, nopanheittoa jossa voi käydä miten tahansa ja jossa on hirveät mahdollisuudet saada aikaan todella kamala ja tuhoisa lopputulos, josta ei ole mitään takeita ja jossa voi hävitä paljon." Tämä ei mielestäni kuvaa tätä tilannetta. Mikä ei toki yllätä koska crapshoot -sanontakin on tarinankerrontaa koskeva. "Whenever an Artificial Intelligence (A.I.) is introduced in a story, there is a very good chance that it will, for whatever reason, become evil and attempt to Turn Against Its Masters, Crush. Kill. Destroy! All Humans, and/or Take Over the World." Ja tarinoissa tilanne on hieman vääristynty verrattuna tosielämään. Tosielämän kohdalla ns. yleisen tekoälyn vaarat ovat hyvin toisenlaisia kuin tarinoissa. Ja crapshoot -vertaus tuokin mieleen tekoälystä oikein mitään osaamattomien ihmisten viittaukset Asimovin robotiikan perussääntöihin kuin ne olisivat jokin oikea asia ja jopa perusasia.

Tämän voi toki vielä katsoa sormien läpi. Mutta esiin nostettiin toinenkin asia. "Näin se käy. Kun älykkyys ja logiikka yhdistetään elottomassa olennossa jolla ei ole mitään käsityksiä etiikasta, sosiaalisuudesta saati tolkusta, lopputulos on täydellistä nopanheittoa. Siinä voi käydä ihan miten tahansa." Toki lausunto tarjoaa tilaa isolle kasalle nastivastaisia vitsejä. (Kun kylmä rikostilasto syötetään olentoon jolla ei ole mitään käsitystä etiikasta, sosiaalisuudesta tai tolkusta lopputulos on nopanheittoa jossa voi syntyä VOK -polttopullonheittelijöitä.) Mutta sen takana on erikoinen ja essentiaalinen ajatus siitä että etiikka olisi jotain metafyysistä tai ainakin ei-fyysistä. Tämänlainen kuvaus on enemmän dualististen asenteiden levittämistä kuin mikään tosiasia. (Sulussa olevan vitsin tapaiset ovat vähän kuin ne jutut siitä autistisesta kaveristani joka ei läpäissyt Turingin testiä. Sinänsä totta, mutta kertoo enemmän siitä mitä itse valittu näkökulma tekee, ei tee ja merkitsee...)

Itse asiassa jos minulta kysytään ottaisin Microsoftin katastrofitekoälyn "vaikutuksille alttiina olemisen" enemmänkin kuin sen että se noudattaisi jotain kylmää kalkyyliä. Tässä on katsottava miten tekoäly toimii.

Microsoftin ohjelma perustui oppimiseen.


Se oli tässä mielessä huomattavasti fiksummin lähestyvä algoritmi kuin "Eugene Goostman". Se yritti lähestyä keskustelua ja tätä kautta se lähenteli suurelle yleisöllekin tutun Turingin testin aiheita. Oppiminen on hyvä määritellä. Karkeasti ottaen kysymys on jotain jossa lähestytään sellaisia kryptisiltä kuulostavia sanoja kuin "neuroverkko". Ytimessä on oikeastaan lähinnä sellainen asia kuin "data mining". Eli miten suuresta data-aineistosta kaivetaan "datan itsensä ehdoilla" tietoja.

Klassisesti tekoälyjen haasteena on ollut se, että ne sisältävät lajittelualgoritmeja. Näissä on yleensä jokin ennalta ohjelmoitu ohje jonka mukaan ne lajittelevat asioita. Katsotaan sellaisten käsitteiden taakse kuin "supervised learning", "unsupervised learning" (on myös "semi supervised learning" joka hakee vastauksia molemmista).

Kun tekoäly lähestyy dataa, on yleensä jokin aineisto ja siitä halutaan ulos informaatiota. Takana on jonkinlainen käsittely, järjestely, luokittelu tai mallintaminen.
1: Unsupervised learning tapahtuu tilanteissa joissa käsillä on dataa. Mutta kenelläkään ei ole "oikeaa vastausta". Toisin sanoen data-aineistossa on yksiköitä ja näiden ominaisuuksia. Mutta tiedossa ei ole mitä kategorioita nämä ominaisuudet edustavat ja mihin ne on luokiteltava. Ominaisuuksien relevanssit ja toisiinsa liittymiset eivät ole kerrottuja. Yleensä tässä algoritmi ottaa ensin jonkin datapisteen. Ja sitten se ottaa muita ja katsoo ovatko ne samanlaisia tai erilaisia. Ja millä tavoin. Tämä voidaan asettaa kauaskin, kohdaksi B. Kolmas datapiste voi olla lähempänä A:ta kuin B:tä. Tai sitten A ja B ovatkin samanlaisempia kun tämä C on erilaisempi. Näin syntyy klustereita. Syntyy ryhmiä. Lopputuloksista on yleensä paha sanoa ovatko ne relevantteja. Ne lähinnä kuvaavat aineistoa jostain näkökulmasta. Ongelmana on usein sekin että algoritmille täytyy kertoa montaako luokkaa tavoitellaan. Silti tässä on mukana "sattumaelementti" siinä mielessä että data järjestäytyy "sinänsä varsin deterministisesti" sitten kun näkökulma on valikoitunut. Mutta tämä näkökulman valinta on jotain jossa on joustoa johon on helppoa nähdä "sattuman käsi".
2: Supervised learning on sitä että on jotain vastauksia. Ja näin datasta voidaan oppia jotain. Tämä on neuroverkkojen tyyli oppia. Joku on sanonut että "nämä aineistot kuuluvat ryhmään A ja nämä eivät". Ja algoritmi tätä kautta katsoo ominaisuuksia ja katsoo millä tavalla nämä annetut vastaukset on ymmärrettävissä. Toisin sanoen ominaisuuksien relevanssi ja ominaisuuksien yhteisvaikutusten arvo haetaan siitä että tiedetään ominaisuudet ja mikä on tavoitetulos mutta ei ole "kunnon määritelmää miksi näin on". Tämä voi johtaa liian hyvin tehtyihin vastauksiin jotka eivät jousta uusien aineistojen kanssa. Algoritmi voi tunkea uudenlaisen aineiston satunnaisesti tai kaatua. Unsupervised learning ei ole herkkä tämänlaiselle kaatumiselle. Merkittävää on että tämä on ohjattua ja ohjautuvaa. Nopanpeluulla on hyvin vähän asian kanssa tekemistä.

Oleellista on tajuta että Microsoftin algoritmi on lähempänä "supervised learningia" kuin "unsupervised learningia". Tähän syötetään data-aineistoa jossa on luokitelmia jotka "ovat keskustelua" ja "eivät ole keskustelua". (Sen omat palautteet saavat vähintään arviointia. Ja siihen syötetty keskustelu luokitellaan kenties automaattisestikin "keskustelulliseksi" jotta on maali jota tavoitella.) Algoritmi hakee mitä piirteitä keskustelussa toistuu ja tätä kautta se oppii mitkä asiat liittyvät yhteen. Tekstissä on muuttujia kuten sanoja. Ja keskusteluneuroverkko oppii muuttujien epälineaariset riippuvuussuhteet suoraan havaintoaineistosta. Lopputulos tälläisessä ei ole moraaliton tai amoraalinen. Se on aina yhtä eettinen kuin siihen syötetty materiaali. Siksi algoritmille ylipäätään voidaan opettaa makaaberilla hirtehishenkisellä asenteella pahuutta. Pahuus on ohjelmoitavissa aivan kuten hyvyyskin. Ne ovat vain asiayhteyksiä. Voidaankin sanoa että Microsoftin algoritmin ongelma oli hyvin tiukka vaikutuksille alttiina oleminen. Algoritmi on jossain määrin samanlainen kuin "täysin avomielinen ja täysin vietävissä oleva" tyyppi joka uskoo mitä tahansa hänen lähteensä hänelle syöttävät.

Tämän rinnastus taas on jotain joka huutaa natsianalogiaa. Olen hieman tympääntynyt että natsiutta lähestytään tyhmyyden kautta. Kenties pitääkin lähestyä siten että he mallintavat etiikkaansa liiaksi tiettyjen vaikutteiden kautta. Prosessissa ei ole älyttömyyttä eikä satunnaisuutta. Supervised learning ei ole crapsinpeluuta.

Ei kommentteja: