Usein, kun puhutaan siitä miten jossakin on informaatiota, tarkoitetaan että siinä on paljon merkitystä. Kuitenkin informaatioteoria keskittyy rakenteeseen. Tässä on itse asiassa melko suuri ero. Sillä esimerkiksi satunnainen merkkijono on sellainen, että sen koostamiseen tarvitaan pitkä merkkijono, sillä on paljon rakennetta. Sillä kuitenkaan ei välttämättä ole yhtään mitään merkitystä.
Siksi kun matematiikassa puhutaan informaatiosta, kysymyksessä on jonkinlainen kvantifikaatio : Niissä mitataan merkkijonosta sen rakenteeseen liittyvien piirteiden määrää : Tämä voi olla vaikkapa todennäköisyys sille, miten tämä saataisiin sattumalta tai miten sen voisi kuvata mahdollisimman pienesti. Tämä tarkoittaa yksinkertaisesti sitä että informaatioteoriat ovat kiinnostuneita vain siitä kuinka paljon informaatiota merkkijonossa on, ja tähän ei liity se minkälaisia asioita se tarkoittaa arkielämässä.
Ero on oikeastaan aika olennainen, ja tavallaan selvä. Esimerkiksi jos meillä on symboli, joka on rakenteeltaan ympyrä, jonka päällä on risti tai nurinpäin käännetty naaraan merkki, meillä on maan symboli (♁) Kuitenkaan ei ole mitään selvää syytä, miksi tuo merkki viittaisi yhtään mihinkään. Se, että merkki on maan symboli on sopimuskysymys. Siksi sen tarkoitusta ei voi mitata katsomalla sen sisältöä. Toisaalta sama merkkikin voi tarkoittaa eri konteksteissa eri asioita, joten se on erittäin mutkikasta ellei mahdotonta. Tämän viittauksen ja merkityksen mutkikkuudesta saa ehkä arkijärjellä käsitystä lukemalla Terry Pratchettin "Carpe Jugulum" -kirjan : Siinä vampyyrit opettelevat sietämään pyhiä symboleja analysoimalla että niissä on viivoja ja ympyröitä. Tällöin niiden pyhyys katoaa, ne ovat vain kuvioita. Lopulta ongelmaksi koituu se, että tässä opitaan tunnistamaan geometrisiä kuvioita, ja jokaisella uskonnolla on omansa. Tätä kautta vampyyrit kohtaavat valtavan määrän pyhyyttä: Analysoimalla ympäristöä he löytävät geometrisia symboleja kaikkialla. Pyhä on tässä ikään kuin placebo ja nocebo : Se toimii vaikka ei ole tottakaan, koska se nähdään niin. Merkitys, sisältö, kuten pyhyys ei ole pelkkä muodon kombinaatio vaan se on sen lisäksi sopimus- ja näkemyskysymys.
Itse asiassa melko lailla tällä tavalla Denotationaalisen semantiikan kautta haetaan merkityksen määrittelyä. Otetaan esimerkiksi symboli, joka voi olla tietenkin vaikkapa minun nimeni tai vaikka kuva stonehengestä, tai matemaattinen numero "13" on loppupeleissä merkitystä vain ja ainoastaan sopimuksen kautta. Sopimuksessa rakennetaan syntaktinen rakenne, ja merkitys syntyy sitä kautta että rakennetaan ikään kuin kartta, joka kertoo kohteet ja toiminnat joihin ollaan viittaamassa. Ja tämän jälkeen "Kissa" viittaakin johonkin nurkissa pyörivään karvaolentoon (Joka on kuvaus ja sinällään kasa samanlaisia tälläisiä saman sopimusjärjestelmän elementtejä, jotka viittaavat niiden ulkopuolelle.) Ilman sopimusta ei ole mitään absoluuttista syytä että se viittaisi juuri tuohon sisältöön. Sama sopii tietenkin lukuihinkin.
Numerojono voi toimia tietokoneessa ohjeena, tai olla toisessa kontekstissa numero (harva kuitenkaan kertoo bittikarttakuvia keskenään, se kun vaatisi sopimuskontekstin vaihtamista.) Ja eri kontekstit valiten sille saadaan erilainen määrä merkitystä. Tätä kautta se voi vaatia enemmän tai vähemmän merkitystä. Osassa merkitystä on, toisissa ei. Ja merkitykset ovat erilaisia. ("Kissa" on merkkijonona sellainen että se voidaan esittää biteissä. Mutta sen merkitys asiana on jotain muuta. On vaikeaa sanoa onko asia "kissa" enemmän merkitystä sisältävä kuin asia "maapallo" tai asia "Näkymätön vaaleanpunainen yksisarvinen".)
Merkitys on siis oikeastaan vain sitä että informaatio on jossakin juuri tietyssä kontekstissa eikä jossain muussa. Tämä taas viittaa itse merkkijonon ulkopuolelle, siihen sopimusrakenteeseen joka sen on tuottanut ja joihin se viittaa. Informaatioteoriassa taas ollaan kiinnostuneita itse merkkijonoista, eikä siitä mihin ne viittaavat.
Tästä päästäänkin hauskaan asiaan. Jos ei ole mitään kontekstia, miten arvioida sen informaation määrä? Itse asiassa ilman jotain kontekstia ei voida arvioida mitään. Ratkaisuna onkin minimaalisen kontekstin hakeminen. Ja tätä kautta algoritmisessa kompleksisuudessa arvioidaan merkkijonon informaatio. Se perustuu kuvaukseen. Informaatio joka jossain merkkijonossa on lyhin kuvaus joka uniikisti tuottaa juuri sen merkkijonon. Eli kysessä on rakenne. Mutta ei mikä tahansa rakenne, vaan lyhin rakenne joka voi tuottaa sen merkkijonon. (Mikä on eri asia kuin se, että onko jonolla merkitystä. Kuten aiemmin toistettu : Satunnainen ja mielivaltainen merkkijono vaatii pitkän ohjelman, koska siinä on paljon rakennetta.) Ymmärtämistä ei tarvita, koska se mistä ollaan kiinnostuneita on merkkijonon toisintaminen. On vain keksittävä tapa, jolla se voidaan kuvata lyhyesti : Jotta voit toistaa merkkijonon 10 ei tarvitse tietää että se viittaa lukuun kymmenen ja binaarinumeroissa lukuun 2. Kaikki mitä informaatioteoria tarvitsee on tietää että se on sarja symboleita.
Tämä määrittelytapa tuntuu vähän hassulta. "Informaation määrä" = "lyhimmän rakenteen kuvauksen pituus". Jonkun asian kuvaileminen ilman että siihen liitetään tietoa, tuntuu oudolta. Ero on komputaatiossa : Ensin määritellään tietynlainen kalkulaatioita tekevä kone (minimal universal computing device), jossa luvaus on ohjelma joka tuottaa tämän merkkijonon.1 Lyhin kuvaus on lyhin ohjelma, joka ilman ulkopuolisia väliintuloja (inputteja) tuottaa juuri tuon merkkijonon. Ongelmana tässä on tietysti se, että laskentajärjestelmiä on useita. Niiden tulokset eivät ole aivan samoja. Onneksi tässä kohden on tehty mielenkiintoinen löytö. Kun otetaan mikä tahansa pari erilaisia laskentakoneita, lyhin ohjelma joka tuottaa tietyn merkkijonon ei eroa toisistaan kovin paljoa. Eksaktin mitan sijasta saadaan siis hyviä arvioita.
Karkeasti voidaan sanoa että informaatioteoria ei käsittele ollenkaan merkitystä. Jos merkitys astuu mukaan kuvioihin, ollaan tekemisissä jonkun muun merkkijonon käsittelytavan kanssa kuin informaation.
1 Esim. minimal viittaa "tosi karkeasti" siihen että mitään "taikaesittelyjä ei asenneta". Eli jokainen kuvaus tuottaa yhden tietyn rakenteen, eli yhdellä symbolilla saadaan korkeintaan yksi kuvaus. Aihe on paljon mutkikkaampi, enkä sitä osaa niin hyvin että uskaltaisin. Eikä onneksi tarvitakaan. Tämähän ei ole mitään "rajua matikkaa". Vaan simppelisti yritelmä kuvata sanallisesti matemaattisia ilmiöitä.
Ei kommentteja:
Lähetä kommentti