sunnuntai 2. maaliskuuta 2014

Tuulilasilla ; Miten kielioppinatsius parantaa maailman ymmärtämistä


Kirjoitan usein facebookiin typeriä sanaleikkejä. Esimerkiksi tuoreesti eräs autoliikkeen mainos "Minkälaisilla tuulilaseilla sinä ajat?" sai minut kirjoittamaan, että jos hankin ajokortin niin ajan autolla. Tämänlainen kieliniuhotus on joskus johtanut hankaliin tilanteisiin. Esimerkiksi kerran viittasin uutiseen jossa rosvo "varasti lapsen haudalta". Pahastutin ihmisiä jotka ajattelivat, että nauroin rikokselle kun hihittelin sille että otsikossa oli epäselvää varastettiinko haudalta itse lapsi vai lähtikö luvattomasti mukaan haudalla ollutta pientä irtaimistoa.

Tämä on tietysti kieliniuhotusta. Se soveltuu puujalkavitseihin. Hyvää huumoria tai hyvää filosofiaa näistä ei oikein tahdo saada irti. Asiaa ei taatusti paranna se, että oma suhteeni oikeaoppiseen kielenkäyttöön on hyvin epämääräinen ellei peräti perverssi. Pidän enemmän sanoista ja ilmaisuista, kuin lauseista. Äidinkielenopettajat eivät luultavasti kykene seuraamaan kirjoituksiani ilman jonkin sortin itkun silmään tulemista.

Toki esimerkiksi Pasi Heikura on "Aristoteleen kantapää" -ohjelmassaan jalostanut tämänlaisista kielikukkasista varsin laadukasta äidinkieltä joka sattuu vieläpä huvittamaan. Edutainment jossa huumori kohtaa älykkyyden on mahdollinen. En kuitenkaan lennätä puujalkavitsejäni tähän suuntaan. Silti niiden harjoittaminen on oleellisen tärkeää hyvän filosofian tekemisessä.

Mitä nimittäin tapahtuu, jos saan eteeni tekstin "minkälaisilla tuulilaseilla sinä ajat?" Lauseessa on selvästi kaksoismerkitys. Mutta vaatii hirveän omituisen mielen näkemään tässä tulkinnallisuudessa mitään ongelmaa. Selvästi on tietty tulkintasisältö. Ja vain joku puolihullun facebookpäivitysvitsi voi ottaa vaihtoehtoista tulkintaa edes vakavasti. Väärillä tulkinnoilla tehty nenäkkyys osoittaa kypsymättömyyttä. Kyvyttömyys hyväksyä kielessä aivan tavallisia puutteita, jotka eivät oikeasti ole mitenkään ymmärtämistä haittaavia on persoonallisuushäiriö eikä oveluutta.

Itse asiassa valtava määrä viestintää vaatii kontekstin. Niin sanottu hyväntahtoisuuden periaate onkin tämän vuoksi tarpeen (kohtuudella). Siinä oletetaan että vastapuoli on koherentti ja ymmärrettävä järkevä ihminen. Ystävällisellä tulkinnalla ei nähdä ristiriitaa siellä missä sitä ei ole. Ihmiset tekevät tätä luonnostaan. Richard Wiseman kirjoittaakin "Yliluonnollinen ilmiö" -kirjassaan siitä miten tämänlainen aukkojen peittäminen on oleellinen osa prosessia jolla ihmiset saadaan uskomaan että jollakulla on selvännäkemisen lahja tai kyky lukea ihmisen luonnetta ja elämäntapahtumia (niin menneisyydessä, nykyisyydessä kuin tulevaisuudessa) vaikkapa horoskoopeista tai teelehdistä. Kun tulkinnoissa on monimerkityksellisyyksiä, ihmiset tulkitsevat ne ikään kuin luonnostaan parhain päin. Ennustajat siis ennustavat oikeasti monimerkityksellisiä mutta ihminen kontekstoi ne ja väärät tulkinnat jäävät kuin itsestään pois. Väärät tulkinnat ovat niitä "en aja tuulilasilla" -mallisia, niitä ei edes mietitä tietoisesti. Vahvistusharha ohjaa tulkintoja.

Ilmiötä voi valaista kognitiotieteen puolella käytetystä esimerkistä ; Jos luemme lauseen "Hiiri joka on pöydälläsi on rikki" syntyy mielikuva hiirestä. "Hiiri joka on pöydällä on papanoimassa" synnyttää toisenlaisen mielikuvan hiirestä. Emme helposti huomaa että toinen tulkinta olisi edes mahdollinen. (Molempia yhdistää lähinnä tilanteen ärsyttävyys.) Lauseen viimeinen sana muuttaa tulkintakenttää. Ja jos tämänlaisia lauseita ei laiteta vierekkäin, emme edes huomaa miten ovelasti kontekstintajumme on sulkenut tulkintakenttiä. (Tämän vuoksi suuri osa postmodernismista on epäuskottavaa. Ja tämän vuoksi voimme ymmärtää toisiamme edes jokseenkin hyvin. Kaikki tulkinnat eivät ole ollenkaan yhtä hyviä.)

Wiseman opettaa ainakin sen, että että jos haluaa välttää huuhaaseen hairahtumisen - tai jopa huijatuksi tulemisen - on tarpeen kiinnittää huomiota epätarkkuuksiin ja monitulkintaisuuteen. Ne kun paljastavat mitä kaikkea esimerkiksi ennustajan puhe tai kirjoitettu filosofinen teksti pitää sisällään. Onko sanoma selkeä, onko se ontto tavalla jossa ihminen täyttää tyhjät kohdat päästään kuin persoonallisuuden actionsankariin? Toki tämä koskee pääasiassa paranormaaleja ilmiöitä. Ja kenties tämän yhteyden vuoksi ateismi korreloi kielioppinatsiuden kanssa.

Tämä varovaisuus on arjelle vierasta. Ja tottavie se unohtuu helposti - viisailtakin. Siksi asiaa on hyvä harjoitella ahkerasti vaikka puujalkavitsien avulla. (Pahat kielet kertovat että filosofi on varovainen siihen päivään asti kunnes hänestä tulee professori. Sen jälkeen hän ei koe tai tunnusta olevansa koskaan väärässä. Väite ei liene täysin tosi, mutta se on oikeansuuntainen.) Monimerkityksellisyys luo tulkintaa ja rakentaa sisältöjä myös tieteentekijöillä. Wiseman kertoo Donald Naftulista joka arpoi hölynpölyä jonka akateeminen yleisö otti vakavasti. Uskottavuus oli rakennettu kertomalla kuvitteellinen CV. Luentoa kuvattiin mielenkiintoisena ja innostavana. Samoin esille nostettiin Sokal joka livautti hölynpölyä postmoderniin julkaisuun. Sekä Naftul että Sokal tekivät temppunsa aloilla joilla on tavallista käyttää kuvainnollista kieltä. Ja joissa eksakti määrittely ja matemaattinen ilmaus koetaan helposti kauhistuttavana ja kahlitsevana.

Viisaiden koulutettujen ja taatusti älykkäiden ihmisten hairahtuminen taas liittyy tuoreeseen, mielestäni hyvin mielenkiintoiseen asiaan. Siinä on kysymys Sokalin kaltaisesta tieteeseenlivahtamisesta. Ja siinä on mukana tekoälyä. Tätä kautta pääsen halailemaan monia lempiaiheitani samanaikaisesti.

Facebooksivuilleni tuli kommentti joka sanoi "Testasin SCIgeniä Kristevalla, Foucaultilla ja Derridalla niin se tuotti höpinää Turingin koneista ja von Neumannista. Fail, koska ei Kristeva osaisi tuottaa niin selkeää tekstiä." Tämä oli osuva huomio varsin hupaisaan tilanteeseen. (Trollaus laadunvalvonnanmenetelmänä ihastuttaa minua suunnattomasti.) Springer ja IEEE ovat nimittäin joutuneet poistamaan julkaisemiaan tutkimuksia. Tietokone kun oli arponut niihin sisältöä jossa oli käytetty lähdeviitteitä ja vastaavia tehokeinoja. "The papers were generated by a piece of free software called SCIgen, developed in 2005 by scientists at MIT. SCIgen randomly generates nonsense papers, complete with graphs, diagrams and citations, and its purpose was to demonstrate how easily conferences accept meaningless submissions. Labbé, who has built a website that allows users to check whether a paper was generated using the program, said he did not know why the papers had been submitted. Most of the conferences took place in China, and many of the papers named real authors, some of whom may or may not have known their names were being used in this way. One author claimed he had created the paper to test a conference." Julkaisuja oli mennyt läpi hirveän monta. 120 kappaletta. Selvästi kysymys ei ole yksittäistapauksesta. "For a layperson, looking at scientific papers can be an exercise in humility. We know most of those words, and surely they make sense in some capacity, but high concept research uses, by necessity, some very complicated language. Apparently not even the publishers of these papers are as adept as we thought at gauging their meaning, as the work of one researcher reveals."

Luultavasti Wisemanilla olisi paljon sanottavaa. Selvästi merkitystä tulkitaan ja yritetään olla suopeita. Ihmistieteiden symboliikan käyttö ja runollinen kieli ovat lähtökohtaisesti alttiita monitulkintaisuudelle, joten tietokoneen olisi tältä osin helpompaa tehdä uskottavia lausuntoja. Lausuntoja joilla olisi edes yksi järkevä tulkintatapa. Laskuvirhe taas on laskuvirhe ja tieteellisessä kaavassa oleva asiavirhe on asiavirhe. Näin huijaaminen on vaikeampaa, tai oikeastaan helpommin huomattavaa.

Monen, ainakin minun, mielessäni ensimmäinen ajatus tietokonearvotusta tutkimuksesta on "lööperi". Siksi tietokonearvottu teksti on jotenkin vielä vakuuttavampi kuin Sokalin ihmiskätten tuotos. (Itse asiassa Sokalin livahduksen taakse on nähty se, että Sokal olisi voinut hyvin laittaa lööperin sekaan ihan oikeaakin filosofiaa. Ja että ihmiset luottivat että Sokal osaa oman asiantuntemusalueensa, sen jossa törkeät asiavirheet olivat. Tietokone ei osaa huolehtia tämänlaisesta.) Kuitenkin on mahdollista että on olemassa algoritmin hienostuneisuuden raja, jonka jälkeen tekoäly joka imitoi tutkimustentekoa ei ole enää irvokas parodia vaan muuttuu itse asiaksi.

Kuitenkin selvästi algoritmi on varsin edistynyt. Se ei ole pelkkä "satunnaisia lauseita ja satunnaisia lähdeviitteitä". Muotoilussa ja lauseiden rakentamisessa on käytetty hyvinkin osaavaa algoritmia. SCIgen kertookin että generointi on tehty "SCIgen is a program that generates random Computer Science research papers, including graphs, figures, and citations. It uses a hand-written context-free grammar to form all elements of the papers. Our aim here is to maximize amusement, rather than coherence." Loppujen lopuksi tämä ei paina tämän kyseisen algoritmin kohdalla paljoa. Mutta laajemmassa mielessä tekoälyn suhde tieteentekoon ei ole "lähtökohtaisesti tukossa". Jos tekoäly keskittyisi sisäiseen koherenttiuteen, ja tekoäly olisi nykyistä tehokkaampi, olisi kenties aivan mahdollista että tieteellisessä konfrenssissa luettaisiin tietokonegeneroitu tutkimus jolla olisi aitoa uutta soveltamista, tieteellistä sisältöä ja arvoa.

Itseäni huvittaisi jos tekoäly saavuttaisi ensimmäiset menestyksensä juuri ihmistieteiden puolella. Siellä kun on korostettu ymmärtämisen tärkeyttä kalkyylinhallinnan yli. "Kylmä konemaisuus" on niitä syytöksiä joita sillä rintamalla heitetään vastapuolelle. Alkeellisen tekoälyn menestys vihjaa siitä, että satunnaisuus ja mielivalta olisivat laatua tärkeämpiä. Tieteenteon prosessin simulointiin keskittyneen algoritmin käyttö taas viittaisi siihen että robotti olisivat jotenkin oleellisesti samanlainen viisas kuin Derrida. Pahimmat kielet sanovat, luonnolliseti, että näin on jo tapahtunut. Ja korostaisivat että tieteessä, kuten kielioppinatsiudessakin, kysymys on huomiokyvystä, tarkkuudesta ja yksiselitteisyydestä. Kun taas postmodernismissa on kysymys epämääräisyydestä, monimerkityksellisyydestä ja siitä että tekstin takana ei ole mitään, "kirjailija on kuollut" ja kaikki järki, oivallus ja sisältö joka tekstissä on syntyy tulkitsijan omassa päässä.

Kaiken kaikkiaan on herkullista mietiskellä kysymyksiä kuten onko robotti parempi, huonompi, luovempi, vai samanlainen filosofi kuin vaikkapa Julian Kristeva. Minä en liene oikea henkilö sanomaan tästä mitään, sillä Kristevan ja SCIgenin tuottamia tekstejä yhdistää se, että molempia on hirvittävän nautinnollista lukea syvässä humalatilassa. Molempien lukukokemusta yhdistää se, että sitä ollaan syvästi yhteydessä jonkin itseään suuremman kanssa.

Ei kommentteja: