Norsk «1000 genomes» prosjekt

En database over normalvariasjon i den norske befolkningA database of Norwegian normal genetic variation

I NCGCs prosjekter må vi bestemme arvestoffets struktur i pasientenes normale vev, i hovedsak hvite blodlegemer fra en blodprøve, for å kunne avgjøre hva som er mutasjoner, skader i arvestoffet, i svulstene. Den detaljerte oppbyggingen, sekvensen (av byggesteiner), i arvestoffet til hvert individ er som et genetisk fingeravtrykk, unikt for hver og en, men inneholder i tillegg mye informasjon om familien, avstamning, og risiko for fremtidig sykdom. Den informasjonen er derfor svært sensitiv, og vi lagrer den avidentifisert og kryptert i i et avansert lagringssystem.As part of the NCGC studies of tumour mutations, we determine also the normal variants in blood samples from all patients. Since the detailed genetic profiles are very sensitive information, we will only present here the summed up variant frequencies within each type of cancer. The detailed profiles are stored in a secure environment with strict access control.

Tilgang til betaversjonen av databasen her.

I mange sammenhenger trenger man kunnskap om hva som er normal genetisk variasjon i den norske befolkning, siden vi ellers bare må basere oss på slike data fra andre befolkninger. Et eksempel er når vi studerer cellekulturer etablert fra kreftsvulster for flere år siden, da disse metodene ikke var tilgjengelige, og man ikke tenkte på behovet for å kunne sammenligne med normalgenomet. I disse tilfeller finner vi titusenvis av forskjeller fra det såkalte referansegenomet, dvs den sekvensen fra et enkelt individ som alle studier sammenligner med. Vi kan filtrere bort variasjonen som er beskrevet ute i verden, men sitter igjen med mange sjeldne varianter og også vanlige norske varianter, som vi da ikke vet om er mutasjoner. Ved å samle all genetisk variasjon i NCGCs normalprøver kan vi fjerne disse, og lettere identifisere sjeldne varianter eller mutasjoner.

For dette formålet vil vi derfor slå sammen all variasjon i normalprøvene til en database, slik man har gjort internasjonalt i «The 1000 Genomes Project«, og gjøre dette tilgjengelig for andre forskere gjennom nettsiden 1000genomes.no. Fordi de enkelte variantene ikke er koblet sammen slik de ville være om vi presenterte data for enkeltpasienter, kan ingen identifisere individene eller studere sammenhengen mellom variantene. De vil derimot kunne studere om bestemte varianter er overrepresentert i pasienter med en bestemt kreftform, siden vi vil indikere dette i undergrupper.

I første omgang blir variantene begrenset til de som er i «eksomet», dvs alle gener, men dette er antagelig også de viktigste variantene, siden de inneholder de som påvirker proteinenes struktur. Etterhvert vil også andre varianter inkluderes, blant annet fra fullgenomstudier, og vi vil også inkludere data fra andre studier av norske individer.

I løpet av 2015 tar vi sikte på å ha lagt inn data fra mer enn 500 individer.

Tekniske spørsmål kan rettes til Prof Eivind Hovig ehovig<at>ifi.uio.no.

NCGC Intranett