perjantai 29. toukokuuta 2015

Pitäisikö Skeptikon vastustaa Randin haastetta?

James Randin haaste on luultavasti yksi tunnetuimmista skeptikkohaasteista. Se kuuluu samaan sarjaan Skepsiksen haasteen kanssa. "James Randi Educational Foundation" tarjoaa miljoona dollaria sille joka todistaa paranormaalin ilmiön. "Skepsiksen" vastaavanlaatuinen haaste on 20 000 euroa.

Too elementary, Watson?
Haasteet ovat periaatteessa hyvää mainosta. Skepsis ja Randi tunnetaan hyvinkin vahvasti niiden kautta. Niissä on myös käytännöllisyyden ja riskinottokyvyn henkeä. Koska haaste on olemassa siitä voi ajatella että ollaan itsekriittisiä. Samalla testaus luo mielikuvaa siitä että ei suljeta paranormaali a priori pois maailmankuvallisista syistä. ; Kun tehdään testi, niin Skeptikko näyttää luottavansa tieteeseen ja asettavansa itsensä tulilinjalle. Huuhaahörhöt saavat demonstroida että olisivat oikeassa ja sitten he vain epäonnistuvat tässä. Ja näin rohkea kriittinen ja itsekriittinen ajattelu jyllää ja "tiede demonstroi olevansa oikeassa". Lisäksi miljoona dollaria (ja 20 000 euroakin) on niin haluttava määrä rahaa että haasteesta kieltäytyminen ei tunnu järkevältä. Asian voi todistaa ja rahat laittaa hyväntekeväisyyteen jos ihmeentekijän nöyryys estäisikin rahanhimon. Tai jotain.

Kaikki on tietenkin hienoa, hyvää ja kaunista. Mutta tässä paratiisissa on ongelmia. Ja nämä ongelmat ovat ironisia. Ne nimittäin eivät ole maailmankuvaeroista kumpuavia. Ne kumpuavat nimenomaan tieteellisestä metodista.

Pieni ongelma:

Pieni ongelma on toki jo siinä että mikä on paranormaali ilmiö. Voidaan kuvitella että 1700 -luvulla kännykkä voisi olla paranormaali kyky. Asia on toki siitä mielenkiintoinen että skepsiksen haasteessa paranormaali voidaan tiivistää "maagiseen ajatteluun" joka on lähestyttävissä esimerkiksi kognitiivisen uskontotieteen menetelmillä. Tällöin paranormaali ei ole by definition tieteen ulkopuolella oleva ilmiö. (Toisin kuin yliluonnollinen joka usein määritellään ekslusiivisesti eliminoimalla luonnonlait.) Tämä tietenkin sopii paranormaaleiden ilmiöiden kannattajille, koska hekin usein esittävät että esimerkiksi ajatustenluku on tieteellä havaittava ilmiö.

Lisäksi ennen koetta keskustellaan osallistujan kanssa mikä ilmiö on. Ja onko se ollenkaan paranormaali Randin mielestä. Näin asiasta on jonkinlainen yhteisymmärrys ja tämä pienentää ongelmia yllättävän paljon. Tässä mielessä "paranormaalia" ei tavallaan koske mikään sellainen ongelma mitä ei olisi esimerkiksi elämän tai älykkyyden tutkimisessa ; Molemmissa ei ole yhtä lukkoonlyötyä määritelmää. Mutta kun tarkastelunäkökulma on määritelty siitä voidaan saada kuitenkin jotain tietoa. Jotain joka voi olla tässä tietyssä määritteessä jopa hyvin tarkkaakin.
1: Elämä on tässä siitä kiinnostava esimerkki että radiossa Ivan Puopolo haastatteli tutkijaa joka selitti että replikaatioon keskittyvällä elämän määritelmällä virukset olisivat eläviä. On vaikeaa nähdä onki virus vastaesimerkki joka falsifioi replikaation käyttämisen. On vaikeaa nähdä pitääkö määritelmää täsmentää niin että monistuminen säilyy mutta jotain muuta otetaan mukaan niin että virukset saadaan määritelmän ulkopuolelle. Vai tarkoittaako tämä sitä että vaikka intuitio sanoisi että virus ei ole elävä niin se kuitenkin sitten olisi? Tutkija sanoi että "se riippuu siitä haluammeko virusten olevan eläviä". Elämä on tutkijan konstruktio joka määrää tutkimusmenetelmien valintaa. (Kun määritelmä muuttuu, muuttuu yleensä näkökulma ja se millä menetelmin asiaa lähestytään.) Ei mikään objektiivinen ideamaailmassa lillivä konsepti jota etsitään a priorisella tiedolla.

Suuri ongelma.

Mutta sitten taustalla on syvällinen ongelma. Voidaan sanoa että haaste kohtaa tieteenfilosofisen ylitsepääsemättömän ongelman joka on mallia "joko syteen tai saveen". Tämä koskee olemassaolevan ilmiön todistamista empiirisesti. Luonnontieteellisestä metodista sanan melko laajassa mielessä. Kysymyksessä ovat tilastotieteessä tunnetut Tyypin I ja Tyypin II virheet. Tilastollisessa ajattelussa otetaan hypoteesi testiin. Tyypin I virhe (false positive) tarkoittaa sitä että nollahypoteesi hylätään turhaan, eli ilmiö tunnistetaan vaikka sitä ei olisikaan. Tyypin II virhe (false negative) taas on nollahypoteesin turha hylkäämättömuus. Eli toden hypoteesin torjuminen.

Probleema on siinä että alttius molempiin on olemassa ja niiden kanssa enemmänkin tasapainoillaan kuin varmistetaan että kummankaan laatuisia virheitä ei voi olla testiasetelmassa. Itse asiassa ongelmaa ei voida kiertää koska ilmiöitä on tutkittava induktiivisesti ja induktiossa on aina jonkinlainen epävarmuus. Ja tämän epävarmuuden nollaaminen johtaa dogmaan jossa kokeen lopputulos on päätetty jo ennen kokeen alkamista. Tiedemaailma painii tämän saman tilastollisen asian kanssa eikä sielläkään tätä ole paikattu täydellisesti. Ei yksinkertaisesti ole mitään "kultakutrivyöhykettä" jossa estettäisiin sekä Tyypin I että Tyypin II virheet. Siksi tieteessä asioita varmistetaan esimerkiksi tekemällä samantyylisiä kokeita uusiksi.

Ja tässä suurten lukujen laki on suuren ongelman ydin ; Skepsiksen ja Randin haasteen piinaksi tulee se miksi lotossa voitetaan toistuvasti vaikka loton voittotodennäköisyys on hirvittävän pieni. Syynä on yritysten määrä. Itse asiassa tieteessäkin vaaditut luottamusvälit ovat siitä erikoisia että niissä tulee tunnistettua vääriä ilmiöitä. Ilman huijaamistakin tiedetään että jos meillä on sata itsenäistä yritystä ilmiölle "jota ei ole" ja meillä on P alle 0.05 -vaatimustasolla, onnistumismahdollisuus siihen että saadaan 1 merkitsevä tulos olisi yli 95 prosenttia. Eli tuurilla saataisiin haaste läpi melko usein. Skepsiksen haaste joutuukin erikoiseen haarukkaan:
1: Jos pidetään tieteellisessä tutkimuksessa yleensä vaadittu vaatimustaso niin noin 1/20 yritys tienaisi miljoonan. Tässä haasteena ei ole se että vaadittaisiin että 100 tyyppiä yrittäisi jotain tiettyä asiaa. Riittää että on huuhaaväitteitä isona kirjona. Niitä kokeilee ehkä vain yksikin tyyppi. Ja kun useita yrittäjiä tulee niin jossain vaiheessa joku niistä huuhaatesteistä menee läpi, ja ihan huijaamatta! Randi ei ole valinnut tätä tietä. Mutta se on vaihtoehto joka olisi voitu ottaa.
2: Randin haasteen vaatima p-arvo on 0,000001, ja se täytyy saavuttaa korkeintaan 8 tuntia kestävän kokeen aikana. Tämä on oikeastaan aika kohtuuton vaatimus. Näin tiukkaa seulaa ei ole valtaosalla legitiimistä tieteellisestä tutkimuksesta. 8 tuntia antaa rajoitteet kerättävän aineiston koolle. Ja aineiston koko määrittää, minkäkokoinen efekti voidaan huomata tilastollisesti merkitsevänä. Useiden aitojenkin ilmiöiden havaitsemiseen tarvitaan suurikokoinen aineisto riittävän p-arvon saavuttamiseksi. Randin koe vaatii joko erittäin suuria efektitehoja tai paljon suurempaa aineistoa. Ensimmäiset olisi todennäköisesti jo havaittu. Mutta se kiinnostavampi aihe, pieni efektikoko, on sitten hankala. Jos, sanotaan nut vaikka epämääräinen ja teholtaan satunnainen mutta kuitenkin olemassaoleva selvännäkökyky, ylittäisi vaaditun merkitsevyyskynnyksen, vaadittaisiin niin valtavaa otoskokoa että sitä ei olisi mahdollista edes kerätä 8 tunnin sisällä! (Randin vaatima p -arvo on esimerkiksi kertaluokkaa kovempi mitä CERN käytti perustellakseen Higgsin bosonin olemassaolon.)

Ongelma on varsin rasittava. Sillä se voidaan tiivistää seuraavaan haarukkaan.
1: Jos ollaan liian höveleitä joudutaan hyväksymään väärät positiiviset jolloin testissä onnistunut saa sikana tukea taikauskolle VAIKKA ilmiö ei sitten tiedemaailman hyväksymäksi tulisikaan. (Koska Skepsiksen ja Randin haaste nyt ovat skepsiksen eikä akatemian temppuja. Tiedemaailman ulkopuolella vaikka tekijät olisivatkin tiedemiehiä.) Tiedemaailmassa tässä on ratkaisuna toistettavuus. Eli samoja testejä tehdään uudestaan ja sitten muut laboratoriot tai sama tutkijakaan ei saa toistettua kokeen tulosta. Mutta Randin haaste on kertarykäisy ; Olisi PR -tasolla katastrofi jos testissä onnistuttaisiin ja sitten tätä huolimatta sanottaisiin että "Onnistuit jo mutta me ei uskota jos et onnistu uudestaan". Tuonlainen koetaan helposti, aivan ymmärrettävästi, maalitolppien siirtelyksi, petkuhuiputukseksi ja kiemurteluksi. Siksi testin onnistumisesta on pakko seurata palkkion maksu. Pseudotieteen kannattajien kohdalla tiedetään se, että he harrastavat ahkerasti kirsikantoimintaa (cherry picking). Tukeva aineisto otetaan ja sitä käytetään. Jos haasteessa palkinto maksettaisiin on maksaminen tulkittaisiin parapsykologian murskavoitoksi. Riippumatta siitä onnistuuko tempun toistaminen. Itse asiassa ; kun tällainen voitto ollaan saavutettu, pseudotieteilijöillä tuskin on motiivia koetteluun. Ilmiötä ei varmasti lähdetä enää siinä vaiheessa testaamaan uudelleen, vaan sitä hierottaisiin skeptikoiden naamaan kerta toisensa jälkeen ja toistaiseksi asian suhteen päättämättömästä yleisöstä saataisiin todennäköisesti käännytettyä uusia hörhöjä. Koska Randin haaste on ratkaistu on kova mainosvaltti. "Vedeltiin jauhot suuhun Randilta, ja skeptikoilta" on tehokas tavallisten ihmisten vakuuttaja. Ja kun testissä on kerran onnistuttu, sitä ei saa takaisin epäonnistuneeksi. Skeptikot ovat tähän asti selvinneet hyvin koska kukaan ei ole onnistunut. Mutta periaatteessa jos testissä onnistutaan siitä tulee rasite. Mutta tässä syynä onkin se että testi ei ole "liian höveli" nykymuodossaan.
2: Ei ole reilua jos testi on liian vaativa, koska sillä tavalla myös mahdolliset olemassaolevat yliluonnolliset kyvyt jäisivät tilastollisen testin jalkoihin. Se ei olisi itsekriittistä skeptikoilta. Testattavilla pitää olla mahdollisuus onnistua ja juuri tämä tekee haastamisesta rohkeaa. Sen puute tekee siitä vain tyhmää. Kun testi on liian tiukka päädytään itse asiassa hieromaan turhan läheistä suhdetta a prioriseen päättelyyn joka vaivaa esimerkiksi bayesilaiseen ajatteluun intoutuneita jumalatodistusteologeja. Tässä henki ei ole enää testaamisessa vaan jossain ihan muussa. Se on presuppositionismia. Sitä, että kun jonkin tiedetään olevan vastoin todellisuutta (skepsiksen tapauksessa naturalismia ja vakiintuneesti tunnettuja fysiikan lakeja jne.) voidaan sen a priori todennäköisyys tietää nollaksi ja näinollen ihan sama mitä tuloksia testissä tuotetaan ei kyseisiä tuloksia (kuten yliluonnollisia kykyjä) voitaisi pitää todellisina. Mikä on tällöin pointti tehdä testiä jota ei voi mitenkään päästä läpi? Mikä testi se on jonka kohdalla on jo ennalta päätetty että se ei mene läpi? Tämä johtaa siihen että testaus ei ole kriittistä tarkastelua vaan sitä että ollaan juuri kuin skeptikot epäreilusti haukuttuna ovat. Huuhaaihmisten skeptikko-stereotyypin mukaan skeptikko on nenäkäs mahdottomia vaativa "tiedeuskovainen" joka irvailee ja asettaa muita tulilinjalle kohtuuttomasti. On epäreilua ja ennen kaikkea epätieteellistä jos vastapuolelle ei edes anneta mahdollisuutta todistaa kantaansa todisteilla.

On toki selvää että juuri testien toiston puute on syy miksi vaatimukset on asetettu niin tiukoiksi. Se on ymmärrettävää. Koska toisintoja ei tule on pakko asettaa kriteerit tiukemmiksi. Mutta käytännön kannalta Randin testi on jo nyt niin "ylitiukka" että se vaatii "huuhaapiireiltä" enemmän ja parempia todisteita kuin tiede vaatisi tiedemaailmassa todellisilta ilmiöiltä. Yhtä kovan vaatiminen tieteessä johtaisi helposti denialismiin. Ja tämän tunnistaminen on siitä ikävä että fiksumpi huuhaan kannattaja voi käyttää tätä PR -työssään hyvien skeptikoiden nolaamiseen. Ja vaiheakan siihen olisi sanoa mitään kun huuhaaihminen olisi oikeassa empiristisen todistamistavan mukaan.

Mikä on jossain määrin kiinnostavaa jos "tieteellinen maailmankuva" on se mitä ajetaan. Randi - kuten itse asiassa akateeminen tiedekin - voi toki tehdä juuri sellaisia testejä kuin lystää. Mutta jos kriteerit ovat joko ylilöysät ja läpäisevät mitä tahansa soopaa tai jos ne ovat niin tiukkoja että sen kriteereitä ei edes olemassaoleva ilmiö jäisi tutkijan haaviin, niin siinähän nousee kysymys, että mitä tieteellistä arvoa kokeella on.
1: Skeptikoiden jalona ideaalina on nimenomaan se että puolustetaan tieteellistä maailmankuvaa ja tieteellistä ajattelua. Joka vaatii sitä että ollaan "ystävyyssuhteessa" moderniin empiristiseen tieteeseen. Joka vaatii esimerkiksi tilastollista ajattelua ja yhteyttä empiristiseen tietoteoriaan. Miten Randin tiukkuusvaatimuksien kautta enää edes voi puolustaa tiedettä, jos se ei noudata omissa toimissaan puolustamansa tiedemaailman ajattelutavan mukaisia käytäntöjä? Tieteenteko ei voi olla sitä, että kaikki asiat hyväksytään tosiksi, mutta aivan yhtä aivoton lähestymistapa on olla niin varovainen, ettei mitään voitaisi enää todistaa oikeaksi.
2: Riskinä on se että oltaisiin sitten jo tieteen kannalta denialisteja. Joka ei ole kovin kaukana dogmaattisesta uskomusjärjestelmästä. Randin vaatimus on niin tiukka että se muistuttaa jo hieman kreationistien "haasteita" joissa vaaditaan sitä että "kissa muuttuu koiraksi" tai muuten "apinapojun pitäisi hylätä evoluutioteoriansa". Denialismille tyypillistä onkin juuri se, että vaaditaan mahdottomia mittaustarkkuuksia ja ilmiönseuraamisia.

Lopputarkennus;

Mainittu ongelma ei koske aivan kaikkia asioita yhtä vahvasti. Jos esitetään väite teleportaatiosta, voidaan laittaa kamera suljettuun umpimuurattuun tilaan jossa on vain pieni reikä ilmastoinnille. Ja pyytää tyyppiä hyppäämään sinne teleportaatiollaan. Tässä on vaikeaa astua peliin tilastollisella ilmiöllä. "Levitoi tuurilla" ei ole sellainen tapahtuma jonka laatuisiin haasteisiin tämä tilastollisuus tarttuisi. Tämänlaiset testit olisivat aivan mahdollisia. Niitä tosin on vaikeaa mitoittaa p-arvoille. Temppu joko tehdään tai ei. Jossain mielessä kysymys levitoinnissa ja teleportaatiossa ovat enemmän asian dokumentointia kuin tutkimusta. (Oikeasti asia ei ole ihan näin, ilmiö on vahva ja niistä selviää pienillä otoskoilla. Mutta asian voi tiivistää noin ilman että mitään oleellista menee rikki. Ja kokonaisuus on helpompi ymmärtää arkijärjellä ja arkikielellä.)

Mutta jos pitää todistaa vaikka ajatustenlukukyky, tässä yritetään yleensä "tunnistaa" vaikka naapurihuoneessa katseltuja kuvia. Nämä ilmiöt perustuvat siihen että vaikka olisi 4 vaihtoehtoa joista 200 satunnaisen sarjasta ei tunnistettaisi kuin 199 niin se olisi silti "riittävä todiste" ajatustenlukukyvystä koska odotusarvo olisi 25 tienoilla ja on hyvin vaikeaa saada noin hyvä tulos tuurilla. Eli siinä vaiheessa kun esitetään vähän vivahteikkaampi ja enemmän systemaattista mittausta edellyttävä väite (kuten se, että ihminen voisi vaikuttaa asioihin, mutta hyvin pienellä skaalalla), sen todenmukaisuus on arvioitava tilastollisesti (kuten kaikki hyvä kvantitatiivinen tiede asiat hoitaa). Suurin osa Randin ja Skepsiksen haasteeseen tulevia on jälkimmäisiä. Skepsiksessä on esimerkiksi tutkittu varvun avulla kaivon paikan katsojia tilastollisella lähestymisellä. Ja näiden - testeissä yleisimpien juttujen - kohdalla ongelma räjähtää käsiin. Ja moninkertaisesti pahemmin kuin tiedemaailmassa. Koska tiedemaailmassa on toisto kun taas Randin haaste on kertarysäys.

Siksi onkin kenties houkuttelevaa hylätä koko Randin haaste. Onhan siinä vähän likainen maku. Sellainen joka muistuttaa siitä että pseudotieteilijöillä on huonot metodit ja epäreilut kikat käytössä sen vuoksi että heidän on pakko käyttää niitä jotta heillä olisi mitään. Itse luotan siihen että hyvällä skeptikolla on mahdollisuus parempaan. Ei ole tarve turvautua huonoihin kikkoihin kun on hyviä!

Toisaalta sitä voisi kuitenkin myös ottaa mahdollisuudet omiin käsiinsä ja väittää että kykenee hallitsemaan noppien silmälukuja "sillai paranormaalisti". Toki mahdollisuus päästä testistä läpi on olematon. Mutta toisaalta, voitetaanhan sitä lotossakin. Skepsis ei sentään sakota epäonnistumisesta.

Asiasta keskusteltiin "Skepsiksen" facebookryhmässä. Ja osa skeptikoista puolusti Randia varsin tunteenomaisesti. Heistä Randin haasteen kysenalaistaminen on esimerkiksi ollut "huonoa tapaa elää", koska testin läpimenoa ei pidä pelätä ja sitä on tarpeetonta pelätä. Toisaalta samat ihmiset ovat selittäneet että on hyvä että testit ovat mahdottomia koska paranormaali on mahdotonta. Tässä tilanteessa on jokseenkin huvittavaa keskustella tilastotieteestä kun kommentit ovat että pitää lopettaa filosofinen epätieteellinen saivartelu.

Ei kommentteja: