tiistai 18. lokakuuta 2011

Puutteellisten havaintojen vallitessa (Onko meillä muka muuta?)

On joskus jopa tavallista, että kun tehdään tutkimusta, on joukossa aina jotain yksittäisiä kohtia jotka eivät onnistu. Näin mitatusta tilanteesta ei saada kaikkia havaintoja. Tämä on jotain, johon voidaan reagoida järkevästi.

Ehkä yksinkertaisin tapa on tehdä poistoja:
1: Poistetaan koko muuttuja koko kokeesta. Tämä on järkevää etenkin jos havaintoja puuttuu paljon. Jos aineistossa on muita tarkasteltuja muuttujia, se ei vielä pilaa koko tutkimusta. Tämä ratkaisu on tosin melko radikaali, sillä kokeesta jätetään pois tarkastelukulma. Kuitenkin tätä kautta otoskokoa ei välttämättä tarvitse pienentää yhtään. Ja jos mittaaminen on jonkun tietyn muuttujan kohdalta hankalaa ja siihen tulee paljon virheitä, tuntemattomat tiedot keskittyvät helposti juuri näihin muuttujiin ja silloin voi olla "välineellisistä syistä" ihan fiksua jättää koko muuttuja johonkin toiseen tutkimukseen tai toiselle tutkijalle.
2: Poistetaan koko havainto joka on puutteellinen. Tämän ongelmana on se, että otoskoko pienenee, mikä vaikuttaa tutkimukseen. Lisäksi tämä on riski otoksen satunnaistamiselle. On nimittäin mahdollista että mittausvirheet eivät jakaudukaan tasaisesti koko aineistoon vaan keskittyvät johonkin kohtaan. Tällöin rakentuu helposti huomaamatta näkymättömiin ja piiloon jäävä systemaattinen virhe. Joka on itse asiassa huolestuttava tilanne.

Kuitenkin melko usein puuttuvat havainnot eivät ole ylitsepääsemätön ongelma, vaan tarjoaa tilaa "hyville akateemisille arvauksille";
1: Puuttuva tieto voidaan olettaa muun aineiston kautta. Kun otetaan esiin kaikki tunnetut muuttujat, ja laitetaan puuttuvan tiedon kohdalle näiden keskiarvo, mittaustuloksen puute ei muuta keskiarvoa. Otoskoko ei muutu, mutta valitettavasti tämä johtaa väistämättä hajonnan pienenemiseen ja painottumiseen kohti keskiarvoa. Yleensä tämä tarkoittaa myös aineistossa olevien korrelaatioiden heikkenemistä.
___1.2: Keskiarvo voidaan toki ottaa myös ryhmän kautta. Usein aineisto voidaan jakaa eri luokkiin. Ja silloin tuntematonta ei oteta koko aineiston keskiarvosta vaan sen oman luokan keskiarvosta. Tämä ratkaisu tekee luokitelman sisällä saman minkä keskiarvon koko aineistosta teki aineistolle. Mutta samalla se korostaa eri luokitelmaryhmien välisiä eroja.
2: Toinen tapa korvata tulos on ottaa edellisen havainnon arvo tai arpoa aineiston satunnaisen yksikön arvo. Tällöin hajonta eikä keskiarvo muutu. Toisaalta tätä keinoa käyttäen puuttuvan tiedon kohdalle voidaan laittaa useitakin vaihtoehtoisia tuloksia.
3: Lisäksi koko aineisto voidaan laittaa tarkempaan tilastolliseen tarkasteluun jolloin otetaan huomioon kaikki tiedot joita kahdella muuttujalla muussa aineistossa on keskenään. Tällöin rakennetaan erilaisia korrelaatiomatriiseja. Näidenkin seurauksena aineiston otoskoko tavallisesti pienenee, koska analyysistä poistuu havaintoja "hallitusti". Kuitenkin tässä poistuu yleensä paljon vähemmän dataa kuin suoralla kädellä tehdyllä poistamisella. Menetelmä on tosin myös mutkikkaampaa ja vaatii enemmän laskentaa.

Minunkaltaiselle kokonaisvaltaiseen tieteenfilosofiaan = konsilienssin ja koherenssin merkitystä korostavaan lähestymistapaan tämä perusmetodologia tarjoaa eräänlaisen työkalun. Esimerkiksi Duhemin-Quinen teesin mukaan falsifiointitilanteessa on tehtävä muutoksia jotka muuttavat kokonaisuutta vähiten. Tämä tapahtuu aineistonkäsittelyssä monella tavalla ja on houkuttelevaa ajatella että ne toimivat konkreettisesti sovellettavana apuvälineenä, jotka itse asiassa tekevät juuri tätä. Kun aineistossa puuttuu mittaustulos, oletetaan että aineiston mittaustulos on ollut jotain, ja sitten arvataan muun aineiston kautta mitä se todennäköisesti on.

Tässä ei siis lähdetä vaikka olettamalla asian todennäköisyydeksi 50%, josta poikkeaminen vaatisi tietoa joka kumoaisi tämän tilan. Samalla korostuu että mikään valinta ei tapahdu tyhjiössä. Mikä tahansa asia voidaan joutua muuttamaan. Mittausvirheen hoitamisen kaltaiset työkalut tarjoavat mahdollisuuden selvitä epätäydellisyydessä ja epätiedossa tavalla joka ei ole vain asian todennäköisyyksien päättämiseen ennalta. Näin vapaus premissejentekoon pienenee ja jotkut oletukset muuttuvat paremmiksi kuin toiset taas eivät.

Ei kommentteja: