Barrträdens gigantiska arvsmassor har länge ansetts vara för stora för att kunna avläsas och analyseras i sin helhet, men på senare år har flera parallella forskningsprojekt tagit sig an utmaningen. De största är det svenska granprojektet som främst fokuserar på svensk gran (Picea abies), ett kanadensiskt projekt som fokuserar på vitgran (Picea glauca) och ett amerikanskt projekt som främst satsar på loblollytall (Pinus taeda). Stora delar av vitgranens arvsmassa har faktiskt varit offentligt tillgängliga ett bra tag nu, men tyvärr bara i ett hopplöst opraktiskt format som man måste vara dataprogrammerare (med rejält med tillgängliga datorresurser) för att kunna utnyttja. Produktionen av den genomsekvensen publicerades officiellt den 22 maj i Bioinformatics.
Betydligt mer uppmärksamhet har publikationen av den svenska granens arvsmassa fått. Den publicerades samma dag i Nature. Svenskarnas artikel är bättre i den bemärkelsen att den innehåller en del jämförande analyser av arvsmassan. Förutom granens arvmassa har de även sekvenserat svensk tall (Pinus sylvestris), sibirisk ädelgran (Abies sibirica), en (Juniper communis), idegran (Taxus baccata) och en gnetumart (Gnetum gnemon), fast dessa sekvenser är av sämre kvalitet än gransekvenserna.
För att sammanfatta vad de kommit fram till så verkar gran ha ungefär lika många gener som andra växter. Anledningen till att barrträdsgenomen är så gigantiska verkar vara att de är fulla av så kallade transposoner. Transposoner är bitar av DNA som hoppar runt i arvsmassan, och ofta dessutom kopierar sig själva på köpet. Barrträden verkar vara sämre än många andra arter på att rensa bort dessa, med resultatet att deras arvsmassa har svällt till enorma proportioner. Transposoner kan också ställa till det för växterna när de hoppar runt. Om de hoppar in i en aktiv gen kan de i värsta fall slå sönder genen och göra den icke-funktionell. Transposoner kan vara anledningen till att många av de gener som forskarnas dataprogram identifierar i granens arvsmassa verkar ha mycket stora introner.
Tyvärr har forskarna bara lyckats sekvensera delar av granens arvsmassa, och de har faktiskt inte lyckats pussla ihop sina sekvenser till en sammanhängande DNA-sekvens. Det som finns är olika bitar av arvsmassan, avlästa var för sig. Det är alltså fortfarande i praktiken ett ”fläckvis” grangenom som nu offentliggörs. Jag testade att söka på sekvenserna från ett par opublicerade grangener jag arbetade med som doktorand. De hade lyckats identifiera snuttar av båda sekvenserna, men inte hela generna. Så det finns massor av jobb kvar att göra innan vi har ett verkligt användbart grangenom. Vill du hjälpa till? Det är bara att gå till ConGenIE-sidan och sätta igång.
Birol m.fl. (2013). Assembling the 20 Gb white spruce (Picea glauca) genome from whole-genome shotgun sequencing data. Bioinformatics. doi: 10.1093/bioinformatics/btt17 (open access)
Nystedt m.fl. (2013) The Norway spruce genome sequence and conifer genome evolution. Nature. doi:10.1038/nature12211 (open access med ”Creative Commons licence”)