torstai 8. toukokuuta 2008

Todennäköisyys, sattuma, väistämättömyys.

"You say 'won the lottery', he says 'miracle'."
(Chase, House MD, episodi "House vs. God")

Olen käyttänyt apunani Mark Chu-Carrollin englanninkielistä todennäköisyysartikkelia sekä Sattuman matematiikkaa -artikkelia.

Monien tilastotieteeseen perustuvien ideoiden ymmärtäminen vaatii todennäköisyyden käsittelemistä. Esimerkiksi populaatioiden koon laskeminen otoksilla onnistuu vain koska todennäköisyyksillä on tietynlaisia ominaisuuksiksi. Tilastotiedettä voidaankin sanoa epävarmuuden tarkasti kuvaamiseksi. Epävarmuuteen taas liittyy läheisesti käsite satunnaisuus, joka tarkoittaa tarkoituksen ja säännönmukaisuuden puutetta. (Korrelaation puutetta.) Tämä tarkoittaa että satunnaista tapahtumaa ei voi ennustaa, satunnaiset prosessit kuitenkin noudattavat tilastollisia lakeja, mikä tarkoittaa sitä että se eroaa mielivaltaisuudesta tai irrationaalisuudesta. Todennäköisyysteorian piirissä satunnaisuutta analysoidaan ja käsitelläänkin. Todennäköisyyksiä ja sattumaa mietitään myös filosofiassa melko paljon.

Siksi sanon aiheesta pari sanaa.

Matematiikassa todennäköisyys ilmoitetaan nollan ja ykkösen välillä olevana lukuna. Varman tapahtuman todennäköisyys on 1, mahdottoman 0. Jos asian todennäköisyys on 50%, sen todennäköisyys on matematiikassa 0,5. Matemattisesti todennäköisyydessä on tiedettävä, tai ainakin oletettava, ovatko tapahtumat toisistaan
1: riippumattomia, jolloin asian tapahtuminen ei vaikuta toisiinsa. Jos heität nyt kolikolla kruunan, se ei määrää millään lailla onko seuraava kruuna tai klaava.
2: erillisiä, jolloin ne eivät voi sattua yhtä aikaa. (Jos nostettu kortti oli pata tarkoittaa että se ei ole hertta. Huomaa kuitenkin että tässä voi sattua sekaannuksia: Jos nostettu kortti oli hertta, se ei tarkoita että se ei voisi olla ässä. Ässyys ja herttuus eivät ole toisistaan erillisiä.)
3: ehdollisia jossa toteutunut tapahtuma vaikuttaa seuraavan todennäköisyyteen. (Venäläisessä ruletissa jossa ei pyöritetä pesää välissä todennäköisyytesi riippuu edellisen tuloksesta.)

Todennäköisyyksien pohjalla ovat yksinkertaiset, klassiset todennäköisyydet, joissa käsitellään vaihtoehtoja, joilla on yhtä suuret todennäköisyydet. Tämän täydennykseksi, sen vuoksi että voidaan matemaattisesti tutkia muunkinlaisia juttuja, joissa klassinen todennäköisyys on ikään kuin erikoistapauksena. Tämä on tietysti käytännöllistä koska tosielämässäkään kaikella aina ole tasatodennäköisyyksiä. Siitä miten todennäköisyyttä käsitellään tästä eteen päin, onkin sitten tarjolla kahdenlaista lähestymistapaa. Ja niiden tulkintaerojen hienot erot kaikuvat jopa niiden käytännön sovelluksissa asti:

1: frekvenssitodennäköisyys, joka perustuu tapahtuman suhteelliseen tapahtumiseen äärettömän pitkässä koeaineistossa, jossa koetilanne pysyy samanlaisena. Frekvenssitodennäköisyydessä todennäköisyyden määritteleminen ajatellaan koejärjestelyjen kautta. He ajattelevat että jos toistat kokeen loputtoman monta kertaa, ja huomaat että aina 1000 yrityksestä 100 tapahtuu, tapahtuman frekvenssitodennäköisyys on 10%. Ja tämän pohjalta tähän toistettujen kokeiden sarjaan ja tulokseen liittyy tapahtuman tosi todennäköisyys, todennäköisyys on siinä todellinen ilmiö. Frekvenssitodennäköisyys siis määrittää tiettyn ennusteen jostain samankaltaisuudesta joka perustuu havaittuihin sarjoihin.
2: Bayesiläinen todennäköisyys taas perustuu subjektiiviseen todennäköisyyteen, jossa tieto on vajavaista. Bayesilaisen näkemyksen mukaan asia koetaan todennäköisyytenä vain sen vuoksi että kaikki faktat eivät ole käsillä. Bayesilaisen mukaan asia joko tapahtuu tai ei tapahdu. Kaikki muu tältä väliltä johtuu siitä että tietoa ei ole riittävästi. Bayesiläinen todennäköisyys toisin sanoen voi muuttua uuden tiedon edetessä. Bayesiläinen ei siksi tarkoita että jonkin asian todennäköisyys olisi 30%, vaan että hän on 30% varma että asia tapahtuu.

Molempia näkemyksiä käytetään eikä niiden erot käytännön tasolla ole kovin suuria. Tosin esimerkiksi koeaineiston tulkinnassa jos havaitaan että 10 sadasta siasta saa lapapaiseen, frekventisti ajattelee että jos meillä on 300 sikaa, niistä todennäköisyys, joka on ominaisuus itsessään, ennustaa että juuri 30 todellakin saa lapapaiseen. Bayesiläinen taas ajattelee että tieto on tässäkin suhteessa vielä puutteellista. Eli että 30 lapapaiseista sikaa on hyvä arvio, mutta tieto on puutteellista. Ja toisaalta että lisätieto voi tarkentaa tietoa ja ennusteita. Toisaalta Bayesiläistä todennäköisyyttä voidaan käyttää lähes mihin tahansa. Jos haluat todistaa että avaruusolennot ovat käyneet maassa kerran, voit käyttää Bayesilaista todennäköisyyttä vajavaisilla tiedoilla, arvaten loput. Frekventisti ei sorru tähän virheeseen, koska hänestä et voi formuloida todennäköisyyttä ilmiölle muuta kuin toiston kautta. Eli toisaalla epävarmuus johtaa siihen että kohtaat hullujakin väitteitä, mutta toisaalta käsite juuri absoluuttisesta todennäköisyydestä on hieman hassu.

Toisin sanoen on tärkeää huomata että jos emme voi päätellä puutteellisen tiedon kohdalla, se kelpaa usein matemaattiseen todistamiseen. Siellä voimme toki olettaa että se ääretön data on saapunut, ja tietomme on valmis. Matematiikan valtakunnassa seikkaillessa ei siis väistämättä kohtaa tosielämän ongelmia, eikä se haittaa mitään. Itse asiassa empiirisellä käytännöllisyydellä tai empiirisellä todenmukaisuudella ei ole mitään merkitystä matematiikassa, koska matematiikkaan ei suoranaisesti liity se, kuinka hyvin nämä teoriat sopivat empiirisiin ilmiöihin, empiria voi olla korkeintaan apuna, matematiikka on pätevää vasta kun se on abstraktia.

Epävarmuuteen perustuvassa ajattelussa on kiistatta omat etunsa. Sillä tosielämässä "tietoja puuttuu", siksi arkielämässä ja tietysti empirian kanssa puuhastellessa, menetelmä joka vaatii ja esittää absoluuttista tietoa on helposti tai usein heikko. Silti olisi syytä muistaa että siitä että tiedon epävarmuutta on pakko hyväksyä ei tarkoita että sitä tulisi hyväksyä miten paljon tahansa. Bayesilaiseenkin todennäköisyyteen kuuluu tarkentaminen ja voi usein olla ihan hyvä miettiä, miten juuri ne todennäköisyydet on käytännössä arvioitu. Jos todennäköisyys on saatu Stetson-Harrison -menetelmällä, eli puhtaasti arvaamalla, on itse asiassa aivan sama onko se frekventistinen vai Bayesiläinen. Se on vain otettava. Tässä viestissään Mark Chu-Carroll käsittelee esimerkin, jossa todennäköisyyksiä ei ole näennäisesti arvattu, mutta askelten lukumäärälle, eikä niiden todennäköisyyksille kuitenkaan ole mitään perusteluja. Niiden johtopäätös, joka on saatu ne keskenään kerrottuna, ei tietenkään ole yhtään luotettavampi. Jos puhtaasti arvaat kaksi lukua jotka kerrotaan keskenään, et saa yhtään luotettavampaa arvausta jos puhtaasti arvaat sen lopputuloksen. Toisin sanoen Bayesilainen perustelu on ainakin esimerkkien mukaan, ja koesarjan puutteensa vuoksi, herkempi "garbage in - garbage out" -tilanteelle ; Pohjimmiltaan Chu-Carrolin esimerkissä esitetään tilanne, jossa henkilö todistaa jotain pätevällä logiikalla, mutta ei näe mitään vaivaa osoittaakseen että lähtökohta olisi mitenkään uskottava tai rationaalinen. Bayesiläisessä todennäköisyydessä todennäköisyydessä on siis empirian apuvälineenä käytettynä heikkouksia, koska se hyväksyy epämääräisemmän tiedon. Toisin sanoen tulkintojen kohdalla olisi vain aina muistettava Bayesiläisen todennäköisyyden perusasia: "Bayesian probability merely tells you how the priors are related to your posterior." Eli se kertoo vain siitä miten oletukset ovat suhteessa loppupäätelmään. Kun tämän muistaa, ei Bayesin periaatteiden soveltamisessa empiriaan pitäisi olla ongelmia.

Käytännön tasolla perustelujen hankkiminen onkin sitten empirian tehtävää, eli ollakseen tieteellinen, laskelman tulisi olla myös tieteellisesti varmistettavissa. Matemaattinen ratkaisu sen sijaan voi olla aivan pätevä ilman tätäkin. Toki matematiikan tulokset ovat kontekstiriippumattomia, eli pätevät kaikkialla. Mutta niissä tarkastellaan kuitenkin alkuolosuhteita, ja jos ne eivät vastaa "sitä tilannetta jota tutkitaan", lopputulos ei sovellu tässä tilanteessa, se on vain vahingossa tosi.

Nyt siirrytään takaisin filosofian valtakuntaan. Todennäköisyyksien tulkintatavat löytyvät osina ja sekoittuneina filosofiaa. Tärkeimmät ja selkeimmät ovat tietysti mahdollisuuden käsitettä pohtivat asiat, sekä se onko maailma luonteeltaan pakosti seuraava, vai onko se perimmäiseltä luonteeltaan myös satunnainen.

1: Determinismi: Ennaltamäärätty tapahtumien kulku. Tämä pohjautuu ajatukselle siitä, että takana on selvä lainalaisuus. Tämä pohjautuu siihen että jos luonnolla on määrätyt luonnonlait, joita se seuraa, silloin tietynlaisessa tilanteessa seuraa aina sama lopputulos, joka onkin seuraavan tapahtuman alku, josta seuraa myös sama lopputulos. Tämä ajatus taas liittyy lujasti ennustamiseen. Toki tulevaisuuden ennustaminen "mystikkotasolla" vaatisi jonkinlaista determinististä maailmaa. Mutta vielä enemmän tämä sitoutuu perinteiseen fysikaaliseen selittämiseen. Klassisen mekaniikan ideanahan on se, että samat säännönmukaisuudet koskevat kaikkea kaikkialla. Toisaalta deterministi ei väitä että hän tietäisi kaikkea. Hän voi esimerkiksi vedota vaikkapa kaaosteoriassa käytettyyn alkuarvoherkkyyteen, jossa pienet muutokset alkutilassa johtavat suuriin eroihin lopputuloksessa. Se, että maailma on deterministinen ei välttämättä tarkoita että se esiintyisi tiedoissamme deterministisenä. Esimerkiksi stoalaiset olivat deterministejä, heidän mielenrauhansa syntyi siitä että asiat olivat vääjäämättömiä. He heittäytyivät kohtalon huomaan.

2: Indeterminismi: Ei ennaltamääräytynyt tapahtumien kulku, jossa on useita vaihtoehtoja jotka voivat toteutua. Vain osa niistä toteutuu. Maailmassa on siis sen luonteista satunnaisuutta, joka ei ole pelkkää näennäistä alkuarvoherkkyyttä ja tietämättömyydestä johtuvaa epävarmuutta. Maailmassa on satunnaisuutta. Indeterministit ajattelevat esimerkiksi että brownin liike, eli pienten hitusten satunnainen liike, ei vain näytä satunnaiselta vaan se johtuu atomien aidosti vapausasteisesta liikkeestä: Ei ole vain yhtä pakotettua tapaa jolla se voi toimia, lopputulos voi siksi vaihdella, eikä maailma vain kulje vääjäämättä tietyllä tavaääa. Samoin indeterministin mielestä kvanttifysiikassa on aitoa satunnaisuutta, eli että kvanttifysiikan tasolla oleva epävarmuus on aivan oikeaa satunnaisuutta. Historiassakin ajatusta on kannatettu, eli se ei ole uusi. Esimerkiksi epikurolaiset olivat indeterministejä.

Monesti indeterminismiä perustellaan vapaalla tahdolla ja vastuulla teoistaan. Tässä ajatuksessa on taustalla sellainen ajatus, jonka mukaan moraali vaatii satunnaisuutta, koska jos kaikki vain tapahtuu, ei olisi valinnanvapautta eikä siksi vastuutakaan. Toisaalta tätä moraalisuusnäkemystä on kritisoitu sillä, että jos jokin on satunnainen, se on määritelty sellaiseksi että se ei johdu mistään. Tällöin jos maailma on säännönmukainen, et voi vaikuttaa siihen, mutta jos se on satunnainen, teon tulosta ei voi tietää, mikä voidaan katsoa sellaiseksi, että moraalisuus seuraa vain jos takana on tietoinen tavoite.

Determinismiä on yhdistetty myös keskusteluun siitä, mitä on mahdollisuus. Esimerkiksi Khrysippoksen mukaan maailmassa oli mahdollisia asioita, jotka voivat tapahtua mutta jotka eivät tapahdu. Hänestä tälläiset asiat eivät olleet ristiriitaisia, eikä niiden toteutumista oltu estetty. Toisin sanoen taustalla oli ajatus siitä, että esimerkiksi kolikkoon sidottuna tämä tarkoittaisi sitä että ennen heittoa on perusteltua sanoa että "voi tulla kruuna", vaikka jälkikäteen, heitettyä, huomattaisiin että siitä tulikin klaava. Tälle täysin vastakkaista näkemystä edusti Diodoros Kronos, jonka mukaan oli ristiriitaista väittää mahdolliseksi jotain, jota ei kuitenkaan koskaan tapahdu. Voidaan sanoa että Diodoroksella on runsauden periaatteen ankara soveltaminen. Khrysipposta arvostellut Cicero oli sitä mieltä, että ne asiat, joita tulevaisuudessa seuraa, estävät sen vastakohtien tapahtumisen, olivatpa nämä luonteeltaan mitä tahansa. Toisin sanoen jos heitän kruunan, se estää sen että klaava tapahtuisi. Mutta se ei tarkoita että klaava olisi ollut mahdotonta.

Tosin Khrysippoksen argumentin puolesta voidaan sanoa, että on mahdollista että syy tähän on:
1: episteeminen, eli tasolla oleva este jolloin kolikonheiton tulokset ovat ihmiselle tuntemattomia, eli emme esimerkiksi tiedä mikä esti juuri tuolla hetkellä klaavantulemisen.
2: eksternaalinen, jolloin kruunan tai klaavan toteutumiselle ei ole ulkoisia, inhimillisen kontrollin ulkopuolisiakaan, esteitä. Tällöin mikään määrä tietoa äärettömälläkään tarkkuudella ei voisi auttaa selvittämään kolikonheiton tulosta.

Emme tiedä kolikonheiton perimmäistä luonnetta. Alkuarvoherkkää kohinaa, josta äärettömän taitava silmänkääntäjä osaisi tietää tulokset ennalta, vaiko onko takana joko ripaus vai paljon ihan aitoa vapausasteisuutta, jossa on eri mahdollisia vaihtoehtoja. Kumpaakin tilannetta voidaan kuitenkin lähestyä ja ymmärtää. Olisi siksi tärkeää sanoa että käsitteen "satunnaisuus" käyttäminen ei välttämättä tarkoita indeterminismiä tai edes epätodennäköisyyttä Täysin deterministisessä maailmassa kolikonheitossa ei toteudu mitään epätodennäköistä, tulosta. Jokaisen heiton tulos on aina varma, se vain vaihtelee tilanteen mukaan ja näyttää tietojemme vajavaisuuden vuoksi vaikka puolelta. Yhtä tärkeää on huomata että säännönmukaisuus-todennäköisyys-satunnaisuus -akselilla olevia asioita voidaan tutkia, lähestyä ja käsitellä rationaalisesti.

Ei kommentteja: