∀leksanterin ℝatkaisu: Indeksi

torstai 26. helmikuuta 2009

Indeksi

Jalostamisessa pyritään valitsemaan parhaita eläimiä. Tämä taas täytyy voida arvioida jotenkin. Perinteisesti tätä on tehty siten, että on valikoitu yksilöitä, joiden jonkun ominaisuuden tulos ylittää tietyn rajan. Monen ominaisuuden kanssa on voitu toimia siten, että joko monen ominaisuuden on ylitettävä jokin raja, tai sitten on riittänyt että yksi ominaisuus on ollut riittävän hyvä. Näissä tulee tietysti erilaisia edistymisvauhteja. Samoin montaa ominaisuutta on voitu lähestyä sitä kautta, että ensin on jalostettu yhtä ominaisuutta ja sitten sen jälkeen vaihdettu keskittyminen toiseen ominaisuuteen.

Näiden lisäksi on indeksit. Ne ovat tärkeitä menettelytapoja. Ideksien periaate on se, että ominaisuuksille annetaan painoarvo. Ja kun nämä lasketaan yhteen, saadaan tulos jota käytetään arvioinnissa. Näin ominaisuuden laatu ja määrä saavat tietynlaisen kokonaisarvon:
I=b₁(X₁-μ_X1)+b₂(X₂-μ_X2)+...+b_N(X_N-μ_XN)* b = painoarvo, johon vaikuttaa (1) ominaisuuden haluttavuus, esimerkiksi sen antama taloudellinen hyöty, eli kuinka tärkeää kehittäminen on (2) ominaisuuden heritabiliteetti eli se, kuinka lujasti se on geeneihin sidottua, vähän geeneihin sidottua ei kannata kehittää yhtä lujasti vaikka se olisi muuten tärkeäkin (3) ominaisuuden arviointivarmuus, eli kuinka luotettava arvio on, mahdollisesti epäluotettavia tuloksia ei kannata pistää keskiöön (4) geneettiset korrelaatiot eli minkä geenien kanssa se kuuluu yhteen (5) fenotyyppiset ominaisuudet, eli mihin ulkoisiin ominaisuuksiin se on kytköksissä.
* X_? = Tarkasteltavan ominaisuuden nro:? mitattu tulos
* μ_X? = Miten ominaisuus X? on suhteessa verrokkipopulaatioon, eli keskiarvoon.

Toisin sanoen indeksissä korostuu tavoite, kuten politiikka ja talous, ja niiden määrittämät tavoitteet sekä genetiikka. Samalla voidaan jalostaa montaa ominaisuutta kerralla siten että edistyminen on mahdollisimman nopeaa.

Indeksien kannalta ongelmallisena on tietenkin se, että jalostus vie aikaa. Siksi esimerkiksi lyhytaikainen maatalouspolitiikan muutos tai kuluttajien muoti -ilmiö voi vaikuttaa kukkaroon, ja siihen liittyvä ominaisuus on geeneihin vahvastikin sidottu, mutta sitä ei silti jalosteta, koska kyseinen politiikan vaikutus kestää liian lyhyen aikaa. Siksi indeksien osuvuuden kannalta pitäisi voida ennustaa politiikan muutoksia. Lisäksi tässä käy sellaisia erikoisia asioita, että jos indeksin laskennassa oleva politiikka muuttuu, saman eläimen genetiikka ei muutu, mutta sen geenejen arvoa kuvaava indeksi muuttuu. Tavallaan näin pitääkin olla, mutta tavallaan se on hieman erikoista. Jos politiikan arvioinnissa ja kuluttajan kulutustottumuksien arvioinnissa onnistutaan kohtuu hyvin pitkällä tähtäimellä, ongelmia tämän suhteen ei kuitenkaan ole.

Kun arvioita tehdään vielä syntymättömille jälkeläisille (Siinä missä "I" kuvaa valmista indeksiä, ennusteiden ylle yleensä liitetään "hattu" [^], eli jos puhutaan koko indeksin ennusteesta, merkitään "î"), on tärkeää kuinka hyvin ennuste pitää paikkaansa. Tässä on kolmea vaihtoehtoa: (1) se on harhaton, jolloin siinä voi olla paljon hajontaa, mutta niiden keskiarvo on kuitenkin hyvä. (2) harhainen tulos taas on hajonnaltaan pieni. Tulokset keskittyvät, mutta niissä on kuitenkin jokin vika keskiarvon kohdalla, jolloin keskiarvo on systemaattisesti väärin. (3) täydellinen taas on hajonnaltaan pieni että keskiarvoltaan oikea.

Yleensä tulosta tarkennetaan ottamalla enemmän tuloksia, mittaamalla tarkemmin, ottamalla käyttöön sukulaisten tiedot eli sukulaismatriisien käyttö sekä parantamalla mittaamisen luotettavuutta sekä korjaamalla systemaattisia virheitä.

Kun eläinten jalostusarvoja käsitellään, siinä eläinten arvokkuutta tuotannolle täytyy voida arvioida. Melko usein tarvetta on myös tilalta toiselle siirtämiseen. Kun toimitaan yhden tilan sisällä, paremmuusjärjestys on tietenkin selvä. Riittää että halutut ominaisuudet laitetaan "kellokäyrälle", eli katsotaan miten ominaisuudet eroavat ja katsotaan myös kuinka paljon ne eroavat.

Kuitenkin, kun tilan eläimet laitetaan absoluuttisiksi poikkeamiksi ja suhteellisiksi prosenttiosuuksiksi, tilalta toiselle vertailu häiriintyy: Esimerkiksi epärehellinen tapa olisi ottaa tilalle tahallaan muutama oikein huono eläin. Niiden käyttäminen laskisi keskiarvoa, jolloin parhaimmat eläimet näyttäisivät paremmilta: Ne ovatkin nyt enemmän keskitasoa parempia, ja niiden suhteellinen paremmuuskin nousee. Toinen vanha menettely oli saada jälkeläisarvostelu näyttämään paremmalta siten, että lehmälle valittiin vain huippusonneja. Näin sen vasikat näyttivät keskivertoa paremmilta, jolloin lehmä näytti hieman paremmalta kuin mitä se oli.

Sukulaisuusmatriisin käyttö estää tämänkaltaista toimintaa: Jälkeläisten tasossa otetaan myös sonnin jälkeläisten keskiarvo huomioon, ja monet muut sukulaisuussuhteet painotettuna siinä suhteessa, miten ne ovat geneettisesti sukulaisia. Näin kaikki eläimen sukulaisuussuhteet saadaan esille. C.R. Henderson kehittikin 1972 BLP -menetelmän. Hänen mukaansa se oli paras (Best) lineaarinen (Linear) ennusteeksi (Prediction), koska se johdetaan maksimoimaan indeksin ja todellisten arvojen välinen korrelaatio. Samalla se minimoi ennustetun jalostusarvon ja saavutetun jalostusarvon välisen eron. BLP:ssä perushavaintona käytetään mittauksia, jotka ottavat huomioon monia systemaattisia häiriötekijöitä.

Lineaarinen menetelmä tarkoittaa yksinkertaisesti sitä, että havaintoja kuvaava tilastollinen malli rakennetaan siten, että se muodostuu tekijöistä, jotka yhteenlaskien saadaan lopullinen tulos.

Henderson suositteli käytännön arviointiin astetta mutkikkaampaa BLUP -menettelyä. Harhattomuus (Unbiased) merkintä tuli siitä, että havaintoja korjattiin niihin liittyvien ympäristötekijöiden suhteen. Harhattomuus BLUP:in kohdalla tarkoittaa yksinkertaisesti sitä, että indeksien odotusarvo, eli keskiarvo, on sama kuin jalostusarvojenkin. Käytännössä tämä tehdään hyödyntämällä erilaisia käsittelyjä ympäristötekijöiden suhteen. Tämä toteutuu vain jos systemaattiset tekijät voidaan selvittää. Jos tätä ei voida tehdä, ennuste ei ole harhaton, koska yksittäisen eläimen jalostusarvo riippuu myös osittain siitä ympäristöstä (karja, tila, ruokinta etc.) jossa se elää.
1: Käytännössä harhattomuus varmistetaan : Jos ajatellaan että polveutumisennusteet ovat keskimäärin samat, kuin eläimen lopullinen tuotos, voidaan ennuste - toteutuneisuus -tarkastelulla nähdä kuinka tarkasti ennusteet osuvat oikeaan. Samalla arvosteluvarmuutta voidaan tarkistaa; Siihen vaikuttavat yleensä (1) Aineiston määrä, missä suurempi määrä informaatiota antaa paremman tuloksen. (2) periytymisasteen suuruudessta ja tietorakenteista. Jälkeläisarvostelujen arvosteluvarmuus riippuu yleensä tehollisesta tytärmäärästä, eli alkuperäisestä tytärmäärästä vähennetään ympäristövaikutusten määrittämiseen vaadittavien tytärten määrä.

Se on suoran vertailun menetelmä, koska informaatio eläinten paremmuusjärjestyksestä verrataan ympäristötekijöiden kanssa vertaamalla karjojen sisällä vaikuttavia ympäristötasojen muutoksia. BLUP erosi yksinkertaisista valintaindekseistä, koska indeksi perustuu kesiarvoista laskettuihibn suhteellisiin tuotoksiin, kun siinä taas ympäristövaikutukset arvioidaan ottamalla jalostusarvojen vaikutus huomioon. Henderson kehitti arvioon sekamalliyhtälöihin perustuvan ratkaisun, joka salli suuremman aineiston käytön:
Y=Xb+Zu+eb=vektori tuntemattomista ympäristövaikutuksista.
u=vektori jalostusarvoista.
X ja Z taas ovat matriisimalleja, joiden avulla yhdistetään havainnot oikeisiin ympäristöarvoihin ja jalostusarvoihin.

Eli yksinkertaisesti sanoen BLUP:issa lasketaan jalostusarvot valintaindeksikaavalla laskemalla havainnoista, joita on korjattu ympäristötekijöillä. Tämän ymmärtämisessä on tärkeää, että jalostusarvojen kovarianssi saadaan eläinten välisen sukulaisuuden kautta. (G= A σ²_u)
Sukulaisuusmatriisin laskeminen olisi yleisesti vaikeaa, mutta laskemiseen tarvitaan vain sen käänteismatriisi, jonka laskeminen on helpompaa. Yleensä BLUP -laskennassa ikään kuin automaattisesti otetaan sukulaisuusmatriisit mukaan käsittelyyn. Kuitenkin pelkän perintisen indeksin pohjalta arvostelua voidaan tehdä. Syynä on luultavasti se, että BLUP -arvostelun yksi yleisimmistä käytännön sovelluksista on yksilö eli eläinmalli, jossa tuotoksen tehneen eläimen oma jalostusarvo on mukana arvostelussa, ja tämän käyttö on mahdollista vain jos ottaa mukaan eläinten väliset sukulaisuudet.

Tilastollinen malli on kuitenkin erikoistapaus yleisemmästä mallista, jossa havainnot voivat olla eri ominaisuuksista samoilta tai eri eläimiltä. Monen ominaisuuden mallit mahdollistavat eri ominaisuuksille erilaisten heritabiliteetit ja varianssit antavia tuloksia. MT-BLUP -mallissa on otettu huomioon myös ominaisuuksien välisiä perinnöllisiä ja ympäristöllisiä yhteyksiä. Tämä parantaa arvosteluvarmuutta, koska geenien yhteisvaikutustakin tulee otettua huomioon. Usein arvostelumenetelmien kehittelyssä yritetään kaikkien ominaisuuksien käsittely MT -BLUP -mallilla, koska valinta yhdessä ominaisuudessa voi vaikuttaa muualle, ja se johtaa arvosteluvirheeseen toisaalla. Esimerkiksi jos hyvät emakot karsitaan emakkosikalasta ensimmäisen poikimisen jälkeen, kertyisi poikimavälistä havaintoja vain niille sioille, joilla on hyvä hedelmällisyys. Kun tämä yhteys otetaan huomioon, kuten MT-BLUPissa tehdään, voidaan ottaa huomioon yhteydet ja saada oikeat arvot. Toinen menetelmän antama etu on se, että kokonaisjalostusarvon määritys on helppoa kun yhteydet on otettu huomioon jo niiden arvoa laskettaessa. Monen ominaisuuden arvostelut ovat kuitenkin laskennallisesti työläitä; Jos lasketaan kahta ominaisuutta kerralla, laskentatehoa vaaditaan jo kolminkertainen määrä. Toinen ongelma on korrelaatioiden selvittämisen puutteet. Virhe tässä arvioinnissa vie luotettavuutta lopputuloksesta.

Ei kommentteja:

Lähetä kommentti