perjantai 18. heinäkuuta 2014

Inhormaatiota ; Informaatiähkyn sijasta laimentamisen tielle?

Elämme maailmassa jossa on paljon informaatiota. Ja tämä informaatio tuntuu usein hyvin kaaoottiselta. Voidaan jopa nähdä että informaation tulvehtiminen, vaikka sitä tehdään maailman hallitsemiseksi ja ymmärtämiseksi ja ennustamiseksi, muuttaakin elämän yhdeksi epävarmuuden suoksi. Kenties tämä yhteys ei ole täysin satunnainen. Ja tämä on blogaus tästä "kentiestä".

On kenties hyvä aloittaa siitä mitä informaatio ylipäätään on.

On tavallista, että ajatellaan että informaatiossa on kysymys järjestyksestä. On esimerkiksi järjestys joka kertoo väitelauseita ja kuvauksia. Karkeimmillaan informaatiossa bitti kertoo "kyllä-ei" -tason tiedon yhteen asiaan. Hienostuneemmillaan se voi olla ohjelmointikieltä tai puhuttua kieltä. Kirjainten järjestys on jotain joka kuvaa asiantilan.

Tästä syntyy helposti ajatus että informaatiossa olisi kysymys säännönmukaisuudesta. On sääntö, struktuuri ja rakenne. Ajatus on hyvin intuitiivinen ja jollain tavalla tosi. Kuitenkin Shannonin informaatioteorian mukana on jännittävä lisäbonus. Hän nimittäin otti huomioon ennustettavuuden. Informaatio on jossain määrin sitä että yllättävyyttä vähennetään. Ja tällöin tilanne muuttuu oleellisesti.

Ja tässä mielessä kieli on usein hyvinkin säännönmukaista. Jotkut kirjaimet ovat paljon yleisempiä kuin toiset. Joten harvinaisemmat kirjaimet ovat informatiivisempia. Toisaalta kirjaimet eivät usein ole peräkkäin satunnaisesti vaan tietyn kirjaimen jälkeen on joitain tiettyjä kirjaimia todennäköisemmin kuin toisia taas ei. Näin esimerkiksi englannin kielen "squirrel" -sanassa q sisältää melko paljon informaatiota koska se on harvinainen kirjain. Mutta u on taas lähes turha koska englannin kielessä kun sanassa on q, sitä seuraa käytännössä aina u. Shannonin informaatiomallissa tämä tarkoittaa sitä että jos haluaa lähettää squirrel -sanan, informaatiota voi pakata. Eli lyhentää. Eikä millä tahansa tavalla, vaan häviöttömällä pakkauksella, eli lyhentämisessä ei edes katoa rakennetta koskevaa tietoa. Jos u:n jättää pois, ei tietoa edes katoa yhtään ; "squirrel" -sanan u on kirjaimena käytännössä täydellisesti redundantti. Jos kirjaimen voi ennustaa täysin ennalta, se ei sisällä yhtään informaatiota ja sen voi heittää pois.

Toki monissa muissa kirjaimissa ero ei ole näin selvä, mutta niissäkin on redundanssia. Ei vain koko kirjaimen verran. Ja tämä tarkoittaa sitä että niitäkin voidaan pakata, isommissa kokonaisuuksissa voidaan pakata kokonaisia kirjaimia. Shannon arvioi että kielessä jopa yli 75% on pakattavissa. Ja tämän avulla ihminen voi ymmärtää kieltä josta on heitetty runsaastikin aakkosia pois. Ja siksi ihmiskielisiä tekstejä pystytään pakkaamaan runsaastikin vaikkapa zip -algoritmeilla.

Tämä on yllättävää ja sen ei pitäisi olla ilmiselvää. Sillä kaikkea ei voida pakata. Itse asiassa jos katsotaan satunnaisten merkkijonojen pakattavuutta, se on yleensä pieni. Ja tämä johtuu siitä että suurin osa kaikista merkkijonoista ei ole pakattavissa. Ja tämä on se, mikä on Shannonin informaatiossa niin kovin epäintuitiivista ja erikoista. Se lähtee järjestyksestä, mutta se päätyy siihen että kun informaatio on pakattu, se lyhenee ja pakattu kokonaisuus on satunnaisempi. Kaikki toistuvuus voidaan leikata pois ja jäljelle jää se missä "ei ole mitään kuvattavaa hahmoa".

Järjestys katoaa toisteisuuden myötä. Ja koska informaatio voidaan lähettää pakattuna ilman että tietoa viestin rakenteesta katoaa mihinkään, se tarkoittaa sitä että hyvin satunnaiset järjestelmät vaativat enemmän informaatiota kuin sellaiset jotka ovat järjestyksenmukaisia. Ja järjestyksenmukaiset rakenteet ovat samanaikaisesti todennäköisyyksiä tuijottaen eisatunnaisia ; Jossain mielessä tämä tarkoittaa sitä että tietääksesi miten paljon jossain on informaatiota, joudut itse asiassa mittaamaan kuinka paljon siinä on sattumaa. Ja sattuma taas on epäjärjestyksen mitta.

Tämä ajatus on kenties erikoinen jos se viedään tieteen maailmaan.

Tietyllä tavalla tieteen ytimessä on se, että se mitä tapahtuu huomenna voidaan kuvastaa jotenkin. Klassisessa fysiikassa tämä tarkoittaa sitä että luonto ei perimmiltään ole satunnainen. Laplacen deterministisessä maailmassa ideana on se, että jos vaikka demoni voisi tietää jokaisen alkeishiukkasen paikan ja lähtötilanteen, hän voisi ennustaa maailmankaikkeuden tulevaisuuden. Ja selittää menneisyyden. Tämä Laplacen demonin maailma oli deterministinen. Siinä saattoi olla vaikeasti ennustettavia asioita. Mutta kysymys oli työläydestä. Tässä mielessä Laplacen maailma vaikuttaisi kaaosteorian maailmalta. Siellä kuvaavaa on alkuarvoherkkyys. Pieni muutos lähtötilasta johtaa suuriin muutoksiin lopputulemassa. Kuitenkaan tässä ei tarvita mitään satunnaista. Ja usein kaaos vieläpä muodostaa jännittäviä attraktoreita ja muita vastaavia piirteitä jotka kertovat sen, että niillä on rakenne. Alkuarvoherkkyys johtaa mittausvirheiden kasvamiseen. Mutta Laplacen demoni oletetaankin äärimmäisen tarkaksi mittauksissaan. Periaatteessa kaikki tiivistyy siihen että on alkutiedot ja siihen liittyvä informaatio. Ja tämä informaatio sisältää kuvauksen maailmankaikkeuden koko rakenteesta.

Mallintamisnäkökulmassa tieteellinen kaava selittää monta tapahtumaa. Lyhyt yhtälö kertoo monta asiaa. Sama kaava mallintaa miten omena tippuu puusta ja miten kuu ei tipu maahan ja miten musta aukko imee. Nykyfysiikan tiedon mukaan maailmassa on 12 tunnettua alkeishiukkasta ja ne vuorovaikuttavat toisiinsa neljällä eri tavalla. Tätä kautta voisi luulla että maailma olisi hyvinkin ennustettava. Itse asiassa Einsteinin "Jumala ei heitä noppaa" -lausunto voidaan juuri liittää siihen ajatukseen, että hän ei pitänyt kvanttifysiikan indeterministisyydestä. Jos tulevaisuutta ei voida ennusta Laplacen demoni menee rikki.

Einstein piti makrotason fysiikasta, ja selkeästi ajatus Laplacen demonista ei ole läpeensä huono. Kykenemme ennustamaan tapahtumia miljoonien vuosien päähän. Auringonpimennysten ajat eivät ole mysteereitä. Selvästi maailman yllättävyys vähenee, joten yhtälöihin on selvästi tiivistetty jotain hyvin hyvin oleellista.

Tiede ei siis ole samaa kuin sattuman kiistäminen. Mutta tietyllä tavalla informaation ideaali edellämainitsemassani muodossa tiivistää ilmiöt jotenkin yhteen. On jotenkin oleellista ymmärtää että klassinen Newtonin ideaalin mukainen fysiikka on yritys pakata universumi mahdollisimman lyhyeen yhtälöön joka selittää mahdollisimman suuren osan universumista. Tietyssä määrin ideaalinen ja täydellinen tiede siis pakkaisi universumin tapahtumat häviöttömästi ja kuvaisi tämän jossain muodossa. Tämä on ideana kieltämättä hämmentävä. Etenkin kun muistaa, että tämä tarkoittaisi sitä että universumin kaikki satunnaisuus olisi sitten lopulta se mitä edellä olisi.

Entropia, kuinka Laplacen demoni on termodynaamisesti omituinen..

Ja tämä pakottaa hieman yllättäviin seikkoihin. Jos Laplacen demonianalogia olisi hyvä, se kertoisi että universumin tietäminen minä tahansa hetkenä auttaa ennustamaan sen menneisyyden ja tulevaisuuden. Tällöin yllättävyys pysyisi samana. Voitaisiin puhua jonkinlaisesta informaatiovakiosta. Olisi kaava joka selittäisi kaiken ja tämä kaava ei muuttuisi. Kuitenkin maailmankaikkeus näyttää toimivan toisin. Tätä kuvataan termodynamiikan toisessa pääsäännössä. Tällöin puhutaan entropian lisääntymisestä. Ja entropian kasvaminen on hyvin vahva pääsääntö. Itse asiassa ideana onkin se, että jos systeemi on suljettu, sen entropia kasvaa. Jos systeemi on avoin, se voi vähentää entropiaansa mutta muu universumi sitten maksaa tämän entropian sillä että se muuttuu entistäkin entropiapitoisemmaksi.

Tämä on erikoista. Sillä jos universumin kompleksisuus kasvaa entropian myötä, informaatio ei olisikaan vakio. Tämä on hyvin erikoinen huomio. Sillä Shannonin informaatioteorian kaavalla on syvä rakenteellinen yhteys termodynamiikan ja entropian kanssa. Tämän yhteyden voisi kuvata seuraavalla tavalla ; Jos meillä on iso virta samaa merkkijonoa, se on hyvin toisteinen ja usein tämänlaisen entropiataso on matala. Tämä on johtanut siihen klassiseen ajatukseen jossa termodynamiikan toinen pääsääntö rikkoo asioita. Eli alussa on järjestys joka sitten romahtaa kun entropia hakkaa sitä satunnaisuudella. Ja moni ajattelee että tämä tarkoittaisi samaa kuin informaation tuhoutumista.

Mutta kuten muistamme, jos haluamme kuvata rakenteen jostain bittijonosta ja lähettää sen, niin tosiasiassa entropia lisää kompleksisuutta. Se kuvaus joka kohteen rakenteesta tarvitaan tuppaa kasvamaan satunnaisuuden myötä, sillä suurin osa merkkijonoista ei ole pakattavissa. Entropia itse asiassa lisää informaatiota. Entropia lisää yllättävyyttä rakenteeseen ja tämä rakenne vaatii enemmän tietoa jotta kuvaus olisi täydellinen. Eli termodynamiikan toinen pääsääntö pumppaisi koko ajan informaatiota universumiin.

Moni esittääkin että entropian kasvu kertoo siitä että kvanttifysiikka on indeterminististä. Universumi todellakin heittää noppaa. Ja tämä prosessi lisää informaatiota universumiin ikään kuin väistämättä ja koko ajan. Kvanttifysiikka on indeterminismin vuoksi propabilistinen. Toisin sanoen sattumaa ei voi poistaa pois sen yhtälöistä. Tieteellisen mallintamisen kannalta voisi sanoa että "häviötön pakkaaminen ei onnistu tuhoamatta kuvauksen tarkkuutta." Esimerkiksi kvanttilomittumiseen liittyvissä tulkinnoissa on esitetty suorastaan niin että mitään piilomuuttujaa ei ole eikä voi olla. Eli satunnaisuus ei ole epätietoisuutta joka voitaisiin selittää pois. Vaan että siellä ei todella ole enää mitään ennustettavaa. Lomittuneissa partikkeleissa Bellin epäyhtälöiden suhteen tulokset viittaavat, että asiantila tiedetään vasta kun sitä katsotaan. Kvanttitilat eivät esiole vaan ne realisoituvat kun ne mitataan ja vasta silloin.

Ja muutoinkin heisenbergin epätarkkuusperiaate vihjaa että Laplacen demoni on mahdottomuus. Tätä voi itse asiassa jokainen kokeilla kotonakin ; Kun ottaa laserpointterin ja kiinnittää sen telineeseen, se heittää seinälle pisteen. Kun tämän radalle laittaa järjestelmän jossa on rako jonka suuruutta voi muuttaa, käy siten että aluksi kun rakoa pienentää, niin myös seinällä oleva piste pienenee. Mutta sitten kun rako on riittävän ohut, niin paradoksaalisesti seinällä oleva piste alkaakin leviämään. Syynä on se, että raon ohuus on mittaustarkkuuden lisäämistä. Ja heisenbergin epätarkkuusperiaatteen mukaan tarkkuuden lisääminen yhdessä puolessa lisää epätarkkuutta toisessa puolessa. Tämä vihjaa että heisenbergin epätarkkuusperiaate on "jollain tasolla syvempää kuin sitä että emme tiedä". Se jollain tavalla kuvaa jotenkin reaalisesti todellisuutta. Joka sitten pumppaa informaatiota maailmaan.

Universumi, kuin tietokone tai ihminen. Informaation kasvattaja ja sen laskija


Ajatus siitä että universumin kvanttiprosessit lisäävät informaatiota systeemiin ei ole täysin hupsu. Ainakaan jos universumia ajatellaan jonain joka voidaan kuvata informaation avulla, vaan jonain joka prosessoi informaatiota. ; Itse asiassa universumin laskentatehoa on jopa arvioitu. Universumin kokoa arvioidessa otetaan usein esiin koko joka koskee nähtävissä olevaa universumia. Inflaatio ja valon äärellinen nopeus pakottavat ihmisen näkemään rajallisen määrän universumista. (Joka vaikeuttaa tavoitettamme Laplacen demonisuudesta entisestään.) Tässä on noin 1080 tuntemaamme alkeishiukkasta. Jos otetaan fyysisesti pienin tunnettu etäisyys, planckin pituus, universumissa jonka näemme on kokoa johon mahtuu 10183 tuon mittaista asiaa. Muut asiat ovat sitten kokoonpanoa jossa näitä partikkeleita järjestetään erilaisiin kombinaatioihin. Ja käsitteet ovat sitten näiden kokoonpanojen karkeistuksia ja niille annettuja nimiä. (Usein nämä ovat sellaisia että kokoonpano tapahtuu "riittävän usein", koska kerran tapahtuvalle asialle harvoin annetaan käsitettä. Teoriasa se olisi kyllä mahdollista. Mutta arkielämässä hemmetin vaivalloista. Toki tätä tasapainottamaan ihmiset ovat hyviä käyttämään mielikuvitustaan ja kuvailemaan nimillä myös sellaisia asioita joita ei itse asiassa ole olemassakaan.) ; Tuossa kasassa on tietty määrä energiaa. Entropia pumppaa tuota hirvittävän runsaslukuista kasaa mutkikkaammaksi ja energialla ja hiukkasilla on rajallisuuksia.  Jos valon nopeus ja epätarkkuusperiaate otetaan mukaan saadaan jonkinlainen tulos. Universumin laskentateholla on tätä kautta ehdoton maksimi ns. Bremernann's limit. Joka potentiaalisesti prosessoitavissa olevien asioiden kokonaismäärä on arvioitu sellaiseen kokoon kuin 1.458*10227. (Aktuaalinen prosessoitujen asioiden määrä on tietysti paljon pienempi ja fysikaalisesti toteutuneiden prosessoitujen on vielä tätäkin pienempi.) Universumin olemassaolo olisi siis jossain mielessä informaationprosessointia joka alkaa universumin synnystä ja päättyy sen lämpökuolemaan. Ja tällä prosessoinnin määrällä on yläraja. (Ja todellisuus on jossain mielessä vielä tätä hieman pienempi. Informaationäkökulmasta rajallisuus on läsnä.)

Loppukaneetti

Itselleni tämä kaikki kertoo perimmiltään sellaisa viestiä, että usein kun ihminen puhuu informaatiosta, hän oikeastaan puhuu merkityksestä. Ja tämä hämmentää häntä. Kun käsittää että informaatio ja merkitys ovat eri asia, voi ymmärtää miksi sattuma lisää informaatiota. Sillä informaatio perimmiltään kuvaa rakennetta kun merkitys taas on jotain aivan muuta, tähän "ikään kuin päälleliimattua". (Jotain joka vaatii vähintään ihmisen aivosolut mukaan kokonaisuuteen. Kyse ei ole enää merkkijonon rakenteesta ja kuvauksesta vaan siitä mitä tämä rakenne ja kuvaus synnyttää hermosoluissamme. Ja siksi esimerkiksi kreationistien on vaikeaa ymmärtää evoluution ja termodynamiikan suhdetta.

Kenties ihmisenä olemisen ajatus voidaankin nähdä siten että jossain mielessä merkitys on jopa informaation vastakohtaa. Järjestystä ja struktuuria. Siksi ihminen joka hakee merkityksellistä universumia ennustaa tulevia ja selittää tapahtumia mielellään. (Ja tekee tätä varsin usein ennusteiden tarkkuuden ja tosiasioiden kustannuksella.) Merkitys on kenties sitä että universumi on kompleksinen ja ihminen on niin rajallinen että hän luo järjestystä. Tuhoaa informaatiota ja laimentaa sitä voidakseen esimerkiksi keskustella muiden kanssa kieliopillisilla merkkijonoilla jotka robotti pakkaisi murto-osaansa.

Tai kenties tämäkin on illuusio. Illuusio joka johtuu siitä että ihminen on vain osa universumia. Ihminen voi olla tilastollisesti harvinaisen informaatiorikas universumin keskiarvoon nähden. Mutta jos Bremermann's limit on jotain johon universumin koko ja alkeishiukkasmäärät vaikuttavat, niin ihmisen kohdalla tämä vastaava maksimiluku on paljon pienempi. Kenties ihminen hukkaa tietoa ja laimentaa informaatiota, koska ihmisen maksimi on pienempi kuin mitä universumi yrittää tunkea päähämme. Kenties tärkeintä ei olekaan ymmärtää kaikkea vaan unohtaa oleellinen. Kenties kaikista järkevintä on lakata Jumalakompleksoimasta, ajattelemasta että Laplacen demoni tai jokin warrantin kaltainen voima tekee ihmisestä jonkun joka pystyy tiivistämään universumin tyystin ja häviöttä muutamaksi lyhyeksi yhtälöksi. Kenties tiivistämme asioita lyhyeksi yhtälöksi siksi että ilman tätä kaikki olisi liian vaikeaa.

Modernissa informaatioähkyssä tähän ajatukseen on vähintään helppoa uskoa. Kenties Nietzsche olikin tässä kohden erityisen oikeassa. Hän kun esitti että tärkeintä ei ole se, mitä muistaa vaan se mitä unohtaa.

Ei kommentteja: