torstai 1. joulukuuta 2016

Jakaumista ja selityksistä

Tieteenteossa käsitellään monesti jakaumia. Jakaumat ovat monenlaisia. Niistä tutuin on varmasti suora lineaarinen suora korrelaatio. Siinä asioiden välillä on suora yhteys, joka on helposti tajuttava, havaittava ja vakion suuruinen. Korrelaation sanominen korrelaatioksi on näiden asioiden välisen suhteen kuvaus. (Jota voidaan sitten yrittää erilaisilla keinoilla jatkoargumentoida ja sitoa syy-seurausasioihin.)

On esimerkiksi hyödyllistä tiedostaa Poisson-jakauma, koska se kuvaa toisistaan riippumattomia tapahtumia joilla on vakioitu todennäköisyys. Monille tuttu Gaussin kellokäyrä/normaalikäyrä on tässä yhteydessä hyvä mainita. Samoin on syytä tunnistaa monenlaisia käppyröitä, eksponentiaalisesti kasvavia ja muita vastaavia.

Usein jakauman kuvaus onkin se mitä tehdään. Moni kokee että selityksissä olisi jotain metafyysisempää tai syvällisempää. Mutta hyvin usein kyse ei ole sen kummemmasta. Osa onkin sitä mieltä että näistä puuttuu "ymmärrys".
1: Itse taas näen että "ymmärrys" on vaikeamääritteinen asia jonka relevanttius on ylipäätään harvinaisen yliarvostettua silloinkin kun sitä on käsitteellistetty ; Usein tässä taustalla on temppuja joissa esimerkiksi ensin valitetaan että kvanttifysiikka ei ymmärrä joitain asioita, sitten niillä kuitenkin yritetään ymmärtää jotain asioita ja sitten tämä ymmärrys tarkoittaa maailmankuvallisuutta. Siksi aina kun kuulee "kvantti" sanan filosofiaan taipuvaiselta on oltava varovainen. Myös tämän blogauksen yhteydessä. Vetäkää varmistimet!

Tässä tekstissä nostan esiin tavallaan hauskan ilmiön johon liittyy mielestäni innostavan näköisiä jakaumia. (Visuaalisesti miellyttäviä omituisia käppyröitä.)

Se näyttää hyvin erikoiselta. Sitä käytetään sellaisissa tilanteissa joissa jakaumassa on paljon satunnaisuutta, mutta ne eivät kuitenkaan ole toisistaan täysin riippumattomia. Esimerkiksi tälläisistä käyvät esimerkiksi itsemurhat, jotka ovat sellaisia että ne synnyttävät matkintaa. Siksi itsemurhat ovat pääasiassa satunnaisia, mutta niissä on kuitenkin klusteroitumista. Vastaavaa jakaumaa tarvitaan myös rikosten ennustamisessa ja tulivuorenpurkausten käsittelyssä.

Hawkes process tuottaa jakaumia joissa on ehdollinen intensiteetti. Tämänlaiset asiat ovat hankalia jos pitää arvioida asioiden muuttumista lyhyellä aikavälillä. Purskaukset kasvavat ja niitä pitää syystäkin tärkeinä syy-seuraussuhteina. Mutta tosiasiassa pieni poikkeama normaalista keskivertotilasta heilauttaa tulosta lyhytaikaisesti paljon pois keskiarvosta. Tässä käytetään kaavaa
λ=μ+k0Σwe-w(t-ti)
Jossa μ kuvaa satunnaiselementtiä, k0 kertoo että tämä kasvaa asian tapahtuessa ja loppuosa sitten kuvaa sitä miten ja millä ehdoin tämä bonus säilyy (eli muutos katoaa mitä kauemmas mennään edellisen kerran tapahtumisesta). Kun luvut säädetään sopivasti saadaan tapahtumat sopimaan lukuihin. Ja tätä voidaan pitää ilmiön kuvauksena. Tässä onkin kiistatta takana jotain jota joku voisi kenties nähdä ymmärrykseksi. Esimerkiksi ymmärrykseksi siitä miten voimakkaasti ja pitkäjänteisesti itsemurhat vaikuttavat itsemurhatilastoissa. Tai rikostilastoihin. Tai terrorismitilastoihin. Tai maanjäristyksiin. Ja moneen muuhun vastaavaan asiaan...

Ei kommentteja: