∀leksanterin ℝatkaisu: Informaatiota ja hämmennystä.

lauantai 16. tammikuuta 2010

Informaatiota ja hämmennystä.

Informaatio on varsin mielenkiintoinen termi. Moni ajattelee tietävänsä mitä se tarkoittaa, siihen viitataan hyvin monenlaisissa tilanteissa. Sille on kuitenkin monia hyvin erilaisia määritelmiä, ja toisen systeemin informaatio ei välttämättä ole toisessa systeemissä informaatiota. Kreationisteista elämässä on informaatiota, ja että tätä ei voi tuottaa muuta kuin älyllä. "He eivät osaa." Tässä ei ole oikeastaan mitään uutta tai mielenkiintoista.

Mutta prosessissa voidaan kuitenkin oppia myös jotain uutta informaatiosta ja sen eri määritelmistä. Tämä on minun tämän viestin varsinainen sisältö, kreationismi on vain koristelua. Viittaan tässä kahteen eri käsittelyyn, jotka ovat informaation kannalta opettavaisia. (Jos haluat kinata kreationismista, suosittelen että kommentoit varsinaisten maestrojen luo.) Pääsyy tähän nakutteluun on se, että filosofinkin pitää hieman osata informaatiosta, koska siihen viitataan monissa eri tilanteissa. Esimerkiski teorioiden informatiivisuuden arvioinnista käydään jonin verran keskusteluja.

Otan ensin esiin Jeffrey Shallitin kritiikin, joka kohdistuu Intelligent Designin kannattaja Stephen Meyerin lähestymistapaan asiaan. Shallitista Meyer käyttää monia erilaisia informaation määritteitä, ja tätä kautta syntyy vääriä rinnastuksia. Eri asioita väitetään samaksi asiaksi. Shallit on kaivanut esiin informaation eri käsitteetä ja esittää ne seuraavalla tavalla:
1: Shannonin informaatio on sidottu todennäköisyyteen. Se tarkoittaa epävarmuuden poistamista ja se tarkoittaa entropian, hajeen, vähenemistä. I= -log₂p, jossa p on todennäköisyys. Tässä objektin syntytodennäköisyys täytyy tietää tarkasti jotta voimme laskea sen sisältävän informaation. Useissa käytännön tilanteissa on monia eri vaikutussuhteita ja todennäköisyyden arviointi on vaikeaa, ja aina se ei ole edes mahdollista. Esimerkiksi sääennusteita tai ravituloksia ei voi laskea eteen eikä taaksepäin vuosiksi eteenpäin, ja niiden arvioinnissa joudutaan rajoittumaan hyvin rajallisiin ennustusalueisiin.
2: Kolmogorovin mallissa ei taas puhuta lainkaan todennäköisyyksistä. Siinä informaatio on merkkijono joka on suhteessa johonkin universaaliin laskentamalliin. Informaation määrä on lyhimmän ohjelman P ja syötteen I pituus, joka tuottaa ulos halutun merkkijonon x, kun ohjelman P sisään laitetaan syöte I.
3: Merkitys taas on subjektiivista. Sillä ei ole mitään tekemistä kummankaan yllä olevan kanssa. Esimerkiksi sanalla "yes" on hyvin lyhyt mitta, mutta sillä on silti paljon merkitystä ihmisille. Tämä on subjektiivinen sopimus. Shannonin ja Kolmogorovin mallit ovat matemaattisesti vahvalla pohjalla, mutta esimerkiksi sanojen merkitystä on vaikeaa arvioida sen matemaattisten ominaisuuksien kautta. Shallitin mukaan sana "Uazekele" voi näyttää roskalta, mutta Lingala -kielen osaaja voisi silti vastata siihen että "Mbote", koska hänelle sen takana on tehty sopimus siitä mihin viitataan. Merkitys on kielessä, ja kieli on itse asiassa mielivaltainen sopimussuhde. Voin perustaa oman keinotekoisen kielen jossa mille tahansa merkkijonolle on tietty merkitys. Algoritmisesti kompleksinen satunnaismerkkijono voi tarkoittaa "kissaa" ja algoritmisesti matalasti kompleksinen toinen jono "koiraa". Merkin todennäköisyyttä ja entropiaa, pituutta tai muuta ominaisuutta, jopa merkistön laajuutta, voidaan valita aivan miten tahansa. Tätä kautta määritelmä on matemaattisesti subjektiivinen.

Shallit esittää että Meyer vaihtaa useita erilaisia tapoja aina tilanteen tullen. Kun informaatio tarkoittaa yhdessä yhtä ja toisessa kohdassa jotain toista, on kyseessä ekvivokaatio joka kätketään matemaattisella kielellä arki -ihmisiltä. Argument of technobabble siis piilottaa sen että sanalla tarkoitetaan eri tilanteissa aivan eri asioita ja niitä kuitenkin käytetään argumenteissa kuin ne olisivat aivan samoja. Tarkkaavainen huomaa että ne ovat hyvin erilaisia, jopa keskenään ristiriitaisia. Eri asioista tehdään sama asia kätkemällä logiikkaloikka sillä että käytetään hienoja termejä. Tämä menee jossain tapauksissa läpi jopa ammattifilosofeihin, koska he eivät ole informaatioteoreetikkoja.

Ja vielä yksi.

Tämä ei tietysti ole uutta. Esimerkiksi Mark Chu-Carroll kirjoitti toisesta hyvin vastaavasta tapauksesta. Informaation nimi ja lähestymistapa on erilainen, mutta sen takana on toinen Intelligent Designisti, William Dembski. Hänen CSI(Complex Specified Information) -käsitteeseensä liitettiin tällä kertaa keskeinen matemaattinen käsite computability. Computability liittyy tiiviisti siihen että onko olemassa algoritmi jolla jokin haettu ongelma voidaan ratkaista. (Tämä on jälleen erilainen lähestymistapa, ja otan sen siksi esiin.)

Tässäkin kikkailun takana ovat sisällöltään erilaiset - jopa keskenään ristiriitaiset - määritelmät ja niiden välillä vaihtaminen. Väite kaatui tällä kertaa asiaan, joka ei välttämättä ole ilmiselvä! Itsekin olen tehnyt tässä kohden virheitä. Laskennalliset keinot voivat helposti tuottaa non-computable -tilanteita! "The fundamental example, the first example, the most canonical example of un-computability that anyone who studies computation knows about is called the halting problem. The whole point of the halting problem is that you can easily create a program which generates non-computable results!" ... "That's also part of what Gödel did. He showed a mechanical process by which you can trick any sufficiently powerful formal system into producing problematical statements. You don't even need to understand the system. I can write a program which takes a description of a formal system as input, and generates the series of steps to produce a Gödel statement for that system. So the claim that Gödel proved that you can't generate uncomputable things by a computable mechanism is complete nonsense - in fact, it's the opposite of what Gödel proved."

Chu-Carroll viittasi että tähän liittyen käytössä oli myös paljon määritteitä jotka olivat keskenään ristiriitaisia. Kun näiden välillä vaihdetaan, saadaan mistä tahansa näyttämään informaatiolta, mutta tosiasiassa ristiriitaiset elementit tarkoittavat myös sitä että sitä ei aktuaalisesti voi olla, koska haetaan jotain joka on ikään kuin samanaikaisesti sekä vaaleanpunainen että näkymätön.

Kaiken kaikkiaan näitä lukiessa minulle tuli tietysti hyvin nostalginen olo. Sillä Elsberry ja Shallit kirjoittivat jo vuonna 2003 siitä miten erilaisia määritelmiä rinnastetaan kuin ne olisivat samoja. Ja keskenään ristiriitaisia määritelmiä sovelletaan aina sen mukaan mitä halutaan missäkin todistaa:

"Despite his insistence that his "program has a rigorous information-theoretic underpinning" [19, p. 371], CSI is used inconsistently in Dembski's own work. Sometimes CSI is a quantity that one can measure in bits: "the CSI of a flagellum far exceeds 500 bits" [17, p. 178]. Other times, CSI is treated as a threshold phenomenon: something either "exhibits" CSI or doesn't: "The Law of Conservation of Information says that if X exhibits CSI, then so does Y" [19, p. 163]. Sometimes numbers or bit strings "constitute" CSI [17, p. 159]; other times CSI refers to a pair (T:E) where E is an observed event and T is a pattern to which E conforms [19, p. 141]. Sometimes CSI refers to specified events of probability / 10^150; other times it can be contained in "the sixteen-digit number on your VISA card" or "even your phone number" [17, p. 159]. Sometimes CSI is treated as if, like Kolmogorov complexity, it is a property independent of the observer - this is the case in a faulty mathematical "proof" that functions cannot generate CSI [19, p. 153]. Other times it is made clear that computing CSI crucially depends on the background knowledge of the observer. Sometimes CSI inheres in a string regardless of its causal history (this seems always to be the case in natural language utterances); other times the causal history is essential to judging whether or not a string has CSI. CSI is indeed a measure with remarkably fluid properties! Like Blondlot's N-rays, however, the existence of CSI seems clear only to its discoverer."¹

1 "17" = Dembski, "Intelligent Design: The Bridge Between Science & Theology" (1999) & "19" = Dembski, "No Free Lunch: Why Specified Complexity Cannot Be Purchased Without Intelligence" (2002).

Ei kommentteja:

Lähetä kommentti