perjantai 10. tammikuuta 2014

Pystykorva, panda ja vesimies

Kävin tekemässä YLE:n poliittisia arvoja testaavan testin. Sain vastaukseksi "pystykorva" ja toisena päivänä "kettu". Profiilissa huomattavaa oli, että yhteenveto oli muutoin redundantti itse testin kanssa. Jos kysytään kannattaako homojen avioliittoa ja tämä painottuu arviossa, ei asiaa pidä ihmetellä. Se ei ole osuvuutta vaan luokittelua. Kiinnostavampaa oli sen sijaan se, että tulokset osasivat kertoa elinpiiristäni melko hyvin. Siis kysymyksiin joihin en ollut tarjonnut vastausta.

"Ikä 25-34 vuotias
Sukupuoli ; ei painotusta
Asuu \ 100 000 asukkaan kaupungissa
Ammatti toimihenkilö, asiantuntija, opiskelija
Koulutus korkeakoulututkinto"

Tämä onkin merkki siitä, miten "hyviä arvauksia" ihmisistä voidaan tehdä tilastotieteen voimalla. Ihmistuntemus on tässä tarkkuudessa pienempi. Olemme tavallaan vähemmän yksilöitä kuin haluaisimme uskoa. Jopa silloin kun olemme outolinnun maineessa olevia skientistihörhöjä.

Tosin yksittäistapauksesta en lähtisi kuitenkaan juhlimaan. Sillä luokituksia on yllättävän vähän. Ja tilastojen mukaan omiin luokituksiini kuuluu "Osuus 20 % suomalaisista." Luokkien vähyys ja niiden isot prosenttiosuudet tarkoittavat sitä, että moni osuisi pelkästään tuurilla. Näiden kasautumisesta syntyy vain "kasa anekdootteja" joka voi tuntua uskottavalta, ja vedota mieleen järkevänä, mutta joka olisi silti hoopoa.

Horoskoopitkin osuvat usein oikeaan tuurilla. Ja horoskooppejen kautta kuvataan ihmisten piirteitä ja hekin kokevat ne osuviksi. Forer -efekti varmistaa että näemme satunnaiset adjektiivit itseämme kuvaaviksi. Lake Wobegon efekti varmistaa, että koemme olevamme keskivertoista parempia joten positiiviset kuvaukset ovat paitsi kohteliaita, ne myös otetaan vakavasti. Ja monitulkintaiset piirteet takaavat että tulokset koetaan osuviksi.

Kysymys onkin siinä, mikä on horoskooppihömpän ja tieteellisesti perustellun profiloimisen välinen ero. Ja tässä kohden on hyvä vilkaista Jani Erolan kannanottoa. Hän ottaa esille sen, jonka itsekin huomasin. Eli sen, että testi on "liian tarkka" siinä mielessä että pienikin muutos yhdessäkin vastauksessa voi muuttaa tuloksen niin että päädyt eri luokkaan. Asia on kuten Erola ilmaisee ; Tämä ei kuitenkaan kerro testin virheellisyydestä, vaan siitä että testi mittaa prosentteja ja tekee tarkkojakin arvioita.

Kaltaiseni sivistyssanapuuroilija voisi sanoa, että testillä voi validiteettia, mutta heilahtelu viittaa heikkoon reliabiliteettiin. Erolan teksti viittaa siihen, että reliabiliteetti johtuu nyky-yhteiskunnan yhteiskuntarakenteista. Ihmiset kuuluvat helposti useisiin luokkiin. Tässä mielessä vika ei ole testissä vaan yhteiskunnan luokkarakenteesta.

Oma huomioni joka kiinnittyy "pystykorvien ja kettujen" sijasta loppuyhteenvedon tuloksiin, ei tietysti välitä yhtä suuresti tästä epämääräisyydestä. Sillä syntymävuosi ja asuinkunnan koko ovat melko tarkasti ja eksaktisti määriteltyjä. Se, että YLE tekee tässä "hyviä arvauksia" on perusteltua profilointia, se ei toki kerro suoraan totuutta ja epäonnistuukin jossain määrin, mutta se onnistuu useammin kuin pelkällä arvaamisella - lopputulosten määrittelytarkkuus huomioiden - voisi uskoa. Tässä mielessä se on astetta vähemmän humpuukia kuin horoskooppimaakarointi.

Näkisin, että YLEn testissä hyvää on se, että se menee "epämääräisestä määrättyyn". Eli joustavasta arvohöpinästä päätellään asuinaluetta. Tällöin sisään otetaan epäselvää (holhotaanko ihmisiä liikaa, pitääkö kettuja metsästää) ja ulos otetaan jotain joka on hieman selvempää. (Ikä, asuinkaupungin koko). Horoskooppien kohdallahan tilanne on juuri toisin päin. Sisään otetaan jotain eksaktia (syntymäaika) ja sitten tästä tuotetaan hämärin perustein luokkituksia, joita luonnehditaan joillakin epämääräisiä ominaisuuksia (sosiaalinen mutta ujo, hyvä suutelija). ~ Ja karkeasti sanoen ; perustellun profiloinnin ja horoskooppihumpuukin toisistaan erottamisen kannalta kenties helpoin nyrkkisääntö onkin katsoa tätä informaation kehityksen suuntaa. Tieto on sitä että epätarkasta siirrytään tarkkaan. Hörhöilyssä eksakti fakta on tarinankerronnan lähtökohta, joka pyöritellään osana prosessia, ja lopputuloksena on jotain maailmansyleilevää mutta epämääräistä.

Näin ollen oma luottamukseni horoskooppeihin kasvaisi siitä että ensin kyseltäisiin henkilön luonteenpiirteistä, tästä lyötäisiin lukkoon tulkinta ja annettaisiin lyhyehkö lista sallituista syntymäpäivistä jolloin kaikki nousevat ja laskevat merkit tuottaisivat tuon sallitun tuloksen. Ja tässä epäonnistuttaisiin tilastollisesti katsoen yllättävän harvoin. (Verrattaisiin puhtaaseen arvaukseen arpomalla.)

2 kommenttia:

Tom Kärnä kirjoitti...

Blogisti johon tekstissä viittaat on Erola eikä Eerola.

Tuomo "Squirrel" Hämäläinen kirjoitti...

Joo, tässä on taustalla se, että mulla on ihan älytön lukunopeus. Syynä on se, että luen sanahahmoja. Olen siksi lähes täysin sokea kirjoitusvirheille. Ja joskus mieli korjaa. Kirjoitin pitkään esimerkiksi Jussi Halla-Aho, kun mieleni liian automaattisesti luki sen väliviivaksi, joka on sukunimissä yleinen.

Joku voi pitää pikkuasiana typoja, mutta toisaalta haikarasta tulee haikala yhden kirjaimen muutoksella. Ja jos minun DNA typoilisi yhtä ahkerasti kuin minä, niin saattaisin olla simpanssi. (Tai kuollut.)

Eli tänks.