lauantai 1. marraskuuta 2014

"algokratia"

Jos ajatellaan mitä ihmiset pelkäävät teknologiassa, se näyttää olevan tietoisuuden saavuttanut konemieli. Kuitenkin kenties se, mistä pitäisi olla huolissaan ei ole yhtä futuristista ja abstraktia. Kenties suurempia ongelmia on tekoälyssä jolla ei ole tietoisuutta, mutta sen suurempi ongelma tekoälylle.

Me pidämme tästä. Ja sinun velvollisuutesi on tehdä samoin.

Jos katsomme internethakujen historiaa, voidaan muistuttaa mieleen nostalgisia aikoja jolloin ei ollut hakukoneita vaan listoja. Ihmiset laittoivat suosimiaan sivuja linkeiksi. Ne olivat vähän kuin julkisia "suositut" -kansioita jokaisessa nykyisessä selaimessa. Nämä ovat ehdottomasti käteviä. Mutta niiden kohdalla tajutaan että ne ovat mieltymyksiä. Suosituksilla on aina vallankäytöllinen elementti. Linkkiluettelon laatija on eräässä mielessä ensisijaisesti Mainostaja. ; Sittemmin asioita on algoritmistettu. Kukaan ihminen ei lue tekstimassoja ja suosittele, vaan arviointi on tehty automaattiseksi. Silloin mieltymykset irtautuvat yksilöstä ja muuttuvat ominaisuusluetteloiksi. Hakusanojen läsnäolon lisäksi kirjoittamispäivämäärä (tuoreus), sivulle ohjaavien linkkien määrä (viitattuus) ja vastaavat seikat vaikuttavat. Ja tästä tulee ongelmia. Sillä nyt hakukoneet itse asiassa määräävät mitä näemme ja mitä voimme lukea. Hakukoneet tarjoavat paitsi pääsyn tietoon niin tarjoavat myös valtavasti mainostusvaltaa. Valtaa päättää mitä näytetään ihmisille. Ja kääntäen tämä tarkoittaa aina sitä että jotain piilotetaan.

Lausunnon voisi tiivistää sanaan "Google". Mutta tämä olisi väärin. Käsittelemäni ongelma on ollut aina jossain määrin läsnä internetissä. Nykyään internet on vain suurempi joten ongelmat ovat jossain määrin kasvaneet. Näkisin että perimmäinen vika on internetin koossa itsessään. Nimittäin internetin koko pakottaa lajittelemaan aineistoa ja priorisoimaan niitä jotenkin. Ja usein tätä joudutaan tekemään nimenomaan epäsuorasti. Eli jotkin viitearvot antavat lukuja. Nämä nähdään hyvien ja arvokkaampien dokumenttien attribuuteiksi, ainakin tilastollisessa mielessä. Ja kun näin tehdään niistä myös käytännössä tulee arvokkaiden dokumenttien attribuutteja.

Ja yleensä tämä on hyvä asia. Se, että eiviitattu internetin pohjamudissa makaava ryönä - se jota kutsutaan 80% internetin sisällöksi - ei ansaitse tulla kenenkään lukemaksi ei ole mikään varsinainen arvoitus. Mutta algoritmien valta on aina johtanut omituisiin sivutuloksiin. Sillä menestykseen riittää näiden attribuuttien hankinta. Pornosivustot ovat kauan olleet ovelia tässä. Yksi syy miksi internet näyttää olevan täynnä pornoa johtuu siitä että pornosivustot luovat usein tiimiytyneitä sivustoja jotka linkittävät toisiinsa. Nyt ne saavat valtavasti sisäisiä viittauksia. Ne näyttävät olevan suosittuja koska niihin on paljon linkkejä muilta sivuilta. Porno siis näkyy, ei siksi että se olisi erityisen suosittua, vaan siksi että se osaa imitoida menestystä. Algoritmien valta johtaakin tämänlaisen kikkailun kautta juuri siihen että ulkomuoto ylittää sisällön.

Tällä on ollut suurta merkitystä. "YouTuben" priorisointimenetelmät ovat johtaneet omituisiin sivutuotoksiin. Ne nimittäin määrittävät miten videoita myös tehdään. Median muoto on seurannut näitä kriteereitä sitä kautta että (a) niitä mukailevat näkyvät koska vaikka ne olisivat harvinaisia niin ne kuitenkin saavat näkyvyyttä tämän avulla (b) ne huomataan hyviksi tempuiksi joten niitä aletaan käyttämään. Aikaisemmin klikkauksien määrä oli ratkaiseva kriteeri. Ja tällöin youtube -videon kuva sai hirvittävästi arvoa. Omituisena sivutuotteena oli se, että videokuvat jotka näyttivät perversseiltä tai seksiä sisältäviltä saivat hirveästi suosiota. YouTube vaihtoikin kriteeristöään ja mittasi sitä miten pitkään videoita on katsottu. Näin aloituskuvan illuusio sortui ja rivolta näyttävät videokuvat katosivat. Lisäksi YouTube luokittelee videoita ja tarjoaa sinua kiinnostavaa materiaalia.

Vajoa omaan kuplaasi, läjä.

Ihmiset eivät helposti pidä ylhäältä määrätyistä kriteereistä. Ja hakukoneet personifioivatkin aineistoa juuri sinulle sopivaksi. Näin ollen algoritmit tarjoavat jotain joka eroaa oleellisesti perinteisestä linkkisuositussivusta. Attribuutteihin voi oleellisen paljon vaikuttaa itse.

Ja pidän tätä älyllisessä mielessä vielä suurempana ongelmana. Googlen hakukoneet ovat nykyään melko hyvin spesifioituja. Itse esimerkiksi saan hieman eri tuloksia samalla hakusanalla riippuen siitä olenko kotikoneella vai työkoneella. Google tietää jotenkin että työkoneellani tehdään ihan eri asioita. Ja se sovittaa toimintaansa tähän. Tämän riskinä on johtaa echo chamberiutumiseen jossa saat sellaisia tuloksia joita haluat nähdä. Google ei esitä enää mitään ulkopuolista valtaa, vaan enemmänkin piilottaa ne sivut joita koet ikävinä ja uhkaavina. Riskinä onkin, hieman paradoksaalisesti, se että "olet oman vallankäyttösi uhri". ; Ajatus siitä että olet netissä kaltaisiesi seurassa omassa ideologisessa perheessäsi ilman että maailmankuvaasi uhataan on eräänlainen painajainen. (Painajainen jossa on miellyttävää elää, ajatus tuntuu omituiselta mutta ei se ehkä ihan niin outoa kuitenkaan ole.)

Ja toisaalta tämä personifiointi tarkoittaa perimmiltään yhtä asiaa. Tämä onnistuu jos ja vain jos sinusta kerätään dataa jota sitten ihan oikeasti myös käytetään jotenkin. Frank Pasquale on kirjoittanut "The Black Box Society" -kirjan jossa katsotaan miten ihmisistä kerätään tietoa. Ja kuinka tätä tietoa käytetään siihen että rahan ja informaation kulkua ohjataan. Selvästi luokittelulla on hyötyä siinä mielessä että itselle mieluisaa aineistoa löytyy helposti. Yksityisyyden menetys on jotain joka on tavallaan niin ilmiselvä osa elämää että en osaa siitä kauhistella. Kun sama yksityisyyden menetys koskee kaikkia, ei kukaan ihminen tosiasiassa oikein seuraa tuloksia. (Omat pornohakuni eivät kiinnosta rikospoliisia, ja jonkun algoritmin punastuminen ei ole nykyisellä teknologialla ongelma, koska se alussa mainittu tietoisuus puuttuu.) Suurin asia johon tietojen kerääminen vaikuttaa on se mitä mainoksia saat. Suurimmat ongelmat ovatkin siinä tiedon jakamisessa.

Tässä kohden voisin viitata "Takkiraudan" kirjoitukseen tekoälyn vaikutuksesta työelämään. Hän viittasi siihen miten teknisen alan ja juridiikan alan asiantuntemuutta on jo onnistuttu algoritmistamaan. (Yrityksiä on ollut jopa puhelinmyynnin algoritmistamiseksi. On kuitenkin aina helpompaa tehdä algoritmi joka lyö kaupustelijarobotille luurin korvaan.) Hakukoneet ovat itse asiassa kenties vahviten hoitamassa asiaa joka on perinteisesti ollut lehdistön ja uutisoinnin tehtävä. Nämä alat ovatkin kriisissä. Perinteinen lehdistö ei toki sekään ole ollut mikään ideologiaton tiedottaja. Se on tosiasiassa tarjonnut suunnilleen samanlaatuista materiaalia mitä ensimmäiset hakulinkkilistat ovat tehneet. Ne ovat valikoineet tiettyjä asioita näytille. Variaatio tiedossa henkilöiden kesken ja ylipäätään tarjolla oleva tietomäärä tuolloin ovat olleet kohtuu pieniä (verrattuna nykyaikaan). Eikä se, että asia on ihmisten kädessä ole minullekaan mikään arvo sinällään. Osalle jo ihmistyö ja sen teettäminen on arvo sinänsä. En kuulu heihin.

Vallan kolmijako

Ongelmana on enemmänkin se, että perinteisesti valtaa on tupattu fragmentoimaan. Montesquieun vallan kolmijaossa tuomiovalta, lainsäädäntövalta ja vallan toimeenpanovalta on pidettävä erillään. Näin estetään laajamittainen väärinteko. Samoin voidaan ajatella että kaupusteluvalta, valvontavalta ja tiedottaminen on syytä pitää erillään. Samasta syystä ammattillääkäreiden asiantuntemusta voidaan tarvita paljastamaan käärmeöljyä myyviä huijareita. Intressit ovat erillisiä ja toisistaan poikkeavia joten ei ole mitään syytä sille että lääkäri rapsuttelisi pikku vaihtoehtohoitotuotemyyjää vain siksi että tällä myyjän asiakaskunnalla on jokin maailmankuva jota ei saa loukata.

Isojen hakukoneiden kohdalla ongelmana on se, että jakoa ei voida tehdä samalla tavalla.
1: Sama taho on varmasti yhteistyössä poliisin kanssa. Kiinan kanssa tehty Googlen yhteistyö näyttää että sensuuri kuuluu tässä osana mahdollisia toimintamalleja. Kiina on maksava asiakas ja Google tätä kautta muutti hakuehtoja. Arvaa kuka on myös mainostaja? Vaihtoehtohoitojen myyjä. Ja lääkärit. Teoriassa tämä mahdollistaa sen että joku taho maksaa siitä mitä hakukoneet näyttävät ja eivät näytä. Algoritmi mahdollistaa keskusjohdetun hyvin tarkkaan säädellyn median. Ja mikä erikoisinta, se tekee sen juuri siksi että nämä algoritmit tekevät juuri sitä koko ajan. Se on suoraan niiden toimintaperiaatteessa : Isosta aineistokasasta etsitään ne harvinaiset parhaat. Jos sivuja sattumalta näpelöimällä saisi yhtä hyvän tuloksen helposti ja nopeasti, puhuttaisiin "todennäköisistä sivuista". Mutta hakukonetta tarvitaan in first place koska haemme aika spesifejä asioita jotka ovat "epätodennäköisiä sivuja" koko lähdeaineistossa.
2: Google on käytännössä vakoilija ja journalisti. Teoriassa olisi varmasti helppoa luoda yhteistyötä poliisin kanssa siten että vaikkapa pedofiliasivustojen asiakkaat saadaan poliisille. Ja mukaan tulisi tietysti data selaushistoriasta, eli syyllinen saadaan poliisille todisteiden kera. Tämä johtaa siihen että lakien toimeenpanovallasta osa yhtiöitetään. Tämä ei kenties ole ongelma pedofiilien kohdalla, mutta teoriassa Kiina voisi olla hyvin mielenkiintoisilla tavoilla kiinnostunut tämänlaatuisesta yhteistyöstä. Ja jos laki on esteenä, Kiina mielellään rukkaa alueensa lakeja uusisi niin että temppu on laiton.
3: Ja Googlen ja vastaavien yritysten suuri koko on sekin mielenkiintoinen. Nimittäin USA:ssa isot yritykset määräävät helposti alueen toimeentulosta. Google ei nimittäin vain tee lehtimiehiä työttömiksi vaan myös tarjoaa töitä hirveälle määrälle ohjelmoijia ja muita asiantuntijoita. Moni yritys ohjaakin paikallista politiikkaa - ja oikein isot yritykset laajemminkin - sillä jos alueella ei suostuta niiden ehtoihin ne vievät toimintansa muualle ja tästä seuraa paikallista massatyöttömyyttä. Alueella ei ole varaa kieltäytyä. Mitään lahjontaa ei tarvita, koska aiheena ovat perimmiltään äänestäjämassat.

Google on niin suuri että mieltymyksiemme sisältö on jollain tavalla sidoksissa googlen antamiin hakutuloksiin. ; "Algokratia" ei toki ole konkreettisesti ainakaan vielä toteuttanut pahimpia uhkakuviaan. Teoriassa siihen on kuitenkin paljon tilaa. Ja tämänlaatuinen riski on konkreettisuutensa vuoksi pahempi kuin mikään Terminator.

Ei kommentteja: