lauantai 25. huhtikuuta 2009

Matematiikkaa ja uskottavuutta.

"Niin&Näin 1/2009" sisälsi monta mielenkiintoista juttua. Nostan esiin parissa olevan matematiikan ja siihen suhtautumisen. Tere Vadén ja Jarkko Tuusvuori kritisoivat taloustiedettä siitä, että se on vain olettanut että jos se on esitetty kaavoilla, sen on oltava totta. Virhe syntyy siitä että vaikka kaavat ovat eksakteja, se ei vielä tarkoita että ne olisivat totuudenmukaisia. Toisaalla Maija-Liisa Kakkuri-Knuuttila ja Kaisa Heinlahti muistuttivat siitä, että tilastotiede ei ole väärässä vain siksi että se on positivistista. Tilastotiede voi olla joskus hyväkin asia. Vääriä kahtiajakoja ei saisi tehdä.

Nämä väitteet eivät ole keskenään ristiriitaisia. Molemmat ovat oikeassa:

Matematiikkaa ja kaavoja käyttäviä tieteitä arvostetaan, koska matematiikka on tarkkaa. Matematiikan taustalla on tietysti sekä vanhaa rationaalista intoa siitä, että asioiden tilat voidaan tietää vain penkissä istumalla ja loogisia kaavoja pyörittäen. Tämä on vain laajennus jossa numeroita pyöritellään samalla tavalla. Toisaalta myös empirismi, rationalismin normaali vastakumppani jonka mielestä pelkkä nojatuoli ei riitä, vaan lisäksi olisi mentävä luontoon "sotkemaan käsiään" (Kokemuksieni pohjalta biologia on sotkuista, joko mullanpurentaa tai liman pyörittelyä koeputkessa. Ja tähtitieteessä palelee ja väsyttää kun paras katsomissää on talvisina pakkasöinä), on antanut matematiikalle arvostusta koska sitä ollaan sovellettu erittäin menestyksekkäästi fysiikassa.

Positivismi nostikin matemaattisen tutkimuksen ihanteeksi. Tässä on tietysti takana järkeä, koska jos ennuste on matemaattinen, ja sitä testataan, voidaan tasan tarkkaan ilman epäselvyyksiä nähdä onko ennuste eri kuin mitä tulos on ollut. Kaava voi siis olla paitsi eksaktisti oikeassa, myös eksaktisti väärässä, jolloin sitä voidaan korjata. Tietenkin myös muu empiria ajattelee näin, eikä logiikkakaan ole tämänkaltaisesta ajattelusta vapaa. Myös ihmistieteissä voidaan viitata kansantaloustieteen kaavoihin. Eksaktiuden katsotaan tekevän siitä parempaa.

Matematiikan kanssa on kuitenkin ehdottomasti oltava huolellinen: Ei saa sekoittaa kahta eksaktin määritelmää keskenään.
1: Ensimmäinen niistä koskee matematiikan sääntöä sen sisäisenä ilmiönä. Matematiikassa tiedetään tasan tarkkaan että 2*3=3*2=6. Tiedetään että mikään näistä ei ole 5. Matematiikan kaavat ovat tässä muodossa matemaattisesti tarkkoja. Nämä on tehty oikein matematiikan sääntöjen mukaan. Tämä on tärkeä kohta, koska jos on oikea kaava, mutta se lasketaan väärin, saadaan vääriä tuloksia.
2: Toinen eksakti taas koskee matematiikan ulkoista asiaa. Siinä on kaavan suhde todellisuuteen. Eli jos meillä on pöydällä viisi omenaa, emme voi millään yllä olevalla laskentatavalla sanoa että niitä olisi 6, koska siinä käytetään siistiä matematiikkaa. Tämä kohta on tärkeä, koska jos on väärä kaava ja se lasketaan oikein, saadaan ympäristöön sopimattomia tuloksia.

Lisäksi matematiikalla on jännittävi ominaisuuksia. Tässä kohden otan avukseni Kakkuri-Knuuttilan "Argumentti ja kritiikki" -kirjan. Hän käytti tilastomatematiikkaa ja sovelsi siihen skitsofreniatilastoja. Hän toi esiin kaksi elementtiä: On hypoteesi H1, joka tarkoittaa tilannetta jossa skitsofreniaa ei ole. Se oli 98%. H2 taas oli tilanne, jossa skitsofrenia on, ja se oli 2%. Lisäksi testitulos voi olla oikea ja väärä. Se oli 95% oikein kun hän on skitsofreninen ja 97% oikean tuloksen kun hän ei ole. Koe vaikuttaa luotettavalta. Oletetaan että meillä on henkilö, joka on saanut testissä tuloksen "on skitsofrenia".

Kun tähän sovelletaan Bayesin kaavaa, jolla tilastoja käsitellään jotta selvitettäisiin käänteisiä ehdollisia todennäköisyyksiä - joilla siis lasketaan sitä kuinka todennäköisesti saatu tulos tarkoittaa että henkilö todella on skitsofreninen, huomataankin että:
(0,02*0,95) / (0,02*0,95+0,98*0,03)
=
0,019/(0,090+0,0294)
=
0,393.
Kakkuri Knuuttila toi tässä esiin sen, että kun muutkin vastaavat vaihtoehdot lasketaan (eli aidosti diagnosoidut skitsofreenikot, väärin diagnosoidut skitsofreenikot, oikein diagnosoidut terveet ja väärin diagnosoidut terveet laitetaan yhteen), käykin niin että jos olisi 1000 potilasta, heistä diagnosoitaisiin 50 skitsofreenikkoa. Ja 30 heistä olisi terveitä. Tämä johtuu tietenkin siitä että skitsofrenia on harvinainen. Tätä kautta sen "perustelemiseen tarvitaan enemmän". Kun todennäköisyydet ovat suurempia, tulokset eivät ole läheskään näin erikoisia. Silti tämä erikoinen tulos viittaa siihen että pelkkää ehdollista todennäköisyyttä ei voi käyttää suoraan. Testitulos ei siis kerro että potilas olisi 95% skitsofreenikko, ja tämänlaisen oletuksen esittäminen voisi olla jopa oikeusmurha. Todennäköisemmin hänellä on ollut vain huono onni testissä. Tietenkin tämä tarkoittaa myös sitä, että jos tämä juttu voidaan selvittää matematiikan avulla, voidaan asiaa perustella matematiikalla; Saimmehan tämänkin selville kaavoilla.

Tosin tässäkin on muistettava että ehkä ne antamamme luvut olivatkin vääriä? Entä jos skitsofreenikoita onkin oikeasti enemmän tai vähemmän tai testi onkin epäluotettavampi? Jos kaavaan laitetaan eri lukuja saadaan eri tuloksia.

Ongelmana on tietysti se, että käytetään oikeaa matematiikkaa oikeassa tilanteessa, ja on oltava huolellinen niiden yhteydestä todellisuuden kanssa. Sen kanssa on oltava huolellinen. Muuten sillä voidaan jopa huijata.

Ei kommentteja: