DNA, deoksyribonukleinsyre, kjemisk stoff som finnes i alle celler og i mange virus. DNA har to grunnleggende funksjoner:

1) det bestemmer cellens egenskaper ved at det dirigerer oppbyggingen av alle proteiner, og blant disse de enzymene som formidler praktisk talt alle de kjemiske prosessene i cellen, og

2) det overfører disse egenskapene som arveanlegg til cellens avkom når cellen deler seg.

I DNA finnes alle våre gener. Først i 1952 kom det endelige beviset på at det er DNA og ikke protein som utgjør det genetiske materialet, og at bestemte arveegenskaper var knyttet til bestemte deler av dette molekylet. DNA-molekylets oppbygning ble beskrevet av den amerikanske biokjemikeren James Dewey Watson (f. 1928) og den britiske biofysikeren Francis Harry Compton Crick (1916–2004) i 1953. Disse oppdagelsene representerte starten på en lang rekke gjennombrudd innen arvelighetslæren og var begynnelsen til den moderne genetikken og genteknologien. DNA finnes i cellekjernen hos eukaryote organismer. I tillegg til dette har mitokondriene sitt eget DNA.

DNA er, slik som RNA, en nukleinsyre («kjernesyre» av lat. nucleus 'kjerne', også betegnelse på cellekjernen). Molekylet er bygd opp som lange kjeder av mindre enheter som kalles nukleotider. I et DNA-molekyl inngår det fire forskjellige nukleotider. Et nukleotid består av en fosforsyre og ett bestemt karbohydrat (deoksyribose). I tillegg inngår det en nitrogenholdig base som kan være enten adenin, cytosin, guanin eller thymin, ofte forkortet A, C, G og T. Fosforsyren i et nukleotid er knyttet til karbohydratet i det neste, slik at leddene i kjeden skiftevis består av fosforsyre og karbohydrat og danner en «sukkerfosfatryggrad». Basene er knyttet til karbohydratet. Et DNA-molekyl er normalt bygd opp av to slike kjeder, som er dreid i en høyredreiende dobbeltspiral omkring en felles akse.

I spiralens indre holdes de to kjedene sammen av såkalte hydrogenbindinger mellom baser som befinner seg overfor hverandre. Basene pares ikke tilfeldig. Ovenfor en adeninbase i den ene kjeden befinner det seg alltid en thyminbase i den andre. På den samme måten pares guanin alltid med cytosin. Dette baseparingsprinsippet danner grunnlaget for alle funksjonene i DNA.

Dobbeltspiralen – eller dobbelhelixen som den ofte kalles – kan sammenlignes med en vindeltrapp, der trinnene utgjøres av de parede basene. Basene i DNA- molekylet danner fire forskjellige «trappetrinn» i dobbeltspiralen: A-T, T-A, G-C og C-G. DNA-molekylet i én menneskecelle består av ca. tre milliarder (3×109) slike trinn, og deres rekkefølge kan variere i det uendelige.

Den delen av DNA-molekylet som inneholder informasjon om et arveanlegg, kalles et gen. Arvestoffet, eller DNA-mengden, i en menneskecelle veier 7,3×10-12 gram (0,000 000 000 0073 gram), og det måler til sammen 220 cm hvis det strekkes ut. Det må derfor pakkes svært tett for å få plass i cellekjernen. Dette skjer ved at DNA kveiler seg rundt spesielle pakkeproteiner (histoner). Funksjonene til DNA er nøye forbundet med den molekylstrukturen som er nevnt ovenfor. De fleste gener har som oppgave å bestemme sammensetningen av proteinmolekyler. Ett gen fungerer som oppskrift på ett bestemt protein. En regner med at arvestoffet hos mennesket (det humane genom) inneholder i underkant av 30 000 gener som koder for proteiner.

Proteinene er bygd opp av lange kjeder av aminosyrer (se proteiner), og det er rekkefølgen av disse ulike aminosyrene som avgjør formen på, og dermed også virkemåten til, de ulike proteinene. Det finnes fire ulike «trappetrinn» i DNA-molekylet, hvor rekkefølgen kan kombineres fritt. Når man forholder seg til en enkelt tråd av DNA-molekylet, danner de fire ulike trinnene (nukleotidene) en rekkefølge av bokstavene A, G, C og T. Informasjonen i DNA-molekylet ligger i rekkefølgen (sekvensen) av disse nukleotidene, slik rekkefølgen av bokstaver danner ord i et skriftspråk. Et stykke av DNA som har én bestemt rekkefølge (nukleotidsekvens) vil bestemme aminosyrerekkefølgen i ett bestemt protein. På denne måten vil også sekvensen av nukleotider i cellens DNA til sammen beskrive alle de proteinene som cellen kan fremstille.

Siden DNA-oppbygningen bestemmer proteinoppbygningen, må det være en direkte kobling mellom trinnene, det vil si nukleotidrekkefølgen i DNA og aminosyrerekkefølgen i proteinene. Ettersom det finnes 20 ulike aminosyrer, må dette koblingsskjemaet ha minst 20 ulike ordrer. I tillegg må det inneholde så mange ordrer som det antallet med aminosyrer som finnes i det enkelte proteinet. Siden det ikke finnes mer enn fire ulike trinn i DNA-molekylet, må en enkelt ordre bestå av mer enn ett trinn. Med to trinn i hver ordre kan en med fire ulike trinn lage 4×4=16 ulike ordrer. Det er altså heller ikke tilstrekkelig med to trinn for å lage en ordre. Hvis en ordre derimot består av tre trinn, kan man konstruere 4×4×4=64 ordrer eller kodeord. Siden det er flere kodeord enn man strengt tatt trenger, er det flere kodeord for hver aminosyre. Slike reservekoder reduserer risikoen for arvefeil. Dette koblingsskjemaet mellom kodeordene på DNA-molekylet og de ulike aminosyrene kalles den genetiske koden.

Kodeordet avleses ikke som hele trinn eller basepar, men som rekkefølgen av basene i den ene tråden i spiralen. Trinnene A-T, G-C, G-C vil f.eks. gi kodeordet AGG. Et slikt kodeord av tre nukleotider kalles et kodon.

Det meste av cellens DNA finnes i cellekjernen (nukleinsyre betyr egentlig kjernesyre). Cellen bygger opp sine proteiner på såkalte ribosomer i cytoplasmaet. DNA-instruksene må derfor overføres fra kjernen til ribosomene, der proteinsyntesen foregår. Dette skjer ved hjelp av en annen type nukleinsyre som kalles ribonukleinsyre eller RNA (av eng. ribonucleic acid).

RNA er bygd opp som DNA, men deoksyribose er erstattet med et annet karbohydrat, ribose. I tillegg er thymin (T) erstattet av en annen base, uracil (U). På den samme måten som thymin kan uracil imidlertid bare pares med adenin.

Syntesen av et protein innledes med at DNA-instruksen for dette proteinet kopieres i form av et RNA-molekyl. Denne prosessen – som kalles transkripsjon – gjennomføres ved hjelp av baseparing. Først brytes hydrogenbindingene mellom basene i den delen av DNA-spiralen som koder for proteinet, slik at dobbeltspiralen åpnes. Deretter vil enzymer sette sammen et RNA-molekyl ved å bruke rekkefølgen i den ene av trådene i DNA-molekylet som «oppskrift». RNA får uracil der DNA har adenin, cytosis der DNA har guanin osv. F.eks. blir et DNA-kodon som TTA transkribert som AAU i RNA-kopien.

Det finnes flere former for RNA. Den formen som bringer den kodede instruksen fra kjernen til et ribosom, kalles mRNA («m» står for eng. messenger, 'budbringer'). Dette er forholdsvis store molekyler, for de skal romme tre nukleotider for hver aminosyre som inngår i proteinet. Ved oppbyggingen av proteinet i ribosomet medvirker en type små RNA-molekyler som kalles tRNA («t» står for eng. transfer, 'overføring'). tRNA befinner seg i cytoplasmaet, og transporterer aminosyrer frem til ribosomet. Et gitt tRNA-molekyl kan bare bindes sammen med én type aminosyre. tRNA-molekylet er forsynt med et antikodon, en sekvens av tre nukleotider som igjen passer sammen med (er komplementær til) et kodon i mRNA-molekylet. På denne måten er det tRNA molekylene som «leser» oppskriften i mRNA, og knytter sammen nukleotidsekvens i mRNA med aminosyrerekkefølgen i proteinet. Det finnes ikke like mange forskjellige tRNA-molekyler som det finnes kodoner, da noen tRNA molekyler tolererer avvik i posisjon tre i kodonet.

Proteinsyntesen finner sted mens ribosomet beveger seg langs mRNA-molekylet. En etter en blir aminosyrene kjedet sammen i riktig rekkefølge, diktert av rekkefølgen til «kodeordene» i RNA-molekylet.

Før en celle kan dele seg, må den fremstille kopier av sine DNA-molekyler slik at de to nye cellene kan bli utstyrt med de samme kodeinstruksene og bygge opp de samme proteinene som morcellen. Denne prosessen kalles replikasjon, og også den foregår ved baseparing.

Først brytes hydrogenbindingene mellom basene. Deretter roterer dobbeltspiralen om sin akse slik at de to kjedene vikles fra hverandre og fremstår som enkeltkjeder. Ved å bruke den gamle enkeltkjeden som oppskrift kjeder enzymer sammen en ny DNA-enkeltkjede slik at det dannes to dobbeltspiraler. Hver av dem består av en gammel og en ny kjede. Nukleotidsekvensen til den nye kjeden er på grunn av baseparingen «omvendt identisk» eller komplementær til den gamle. Fordi sekvensen på den gamle tråden eksakt bestemmer sekvensen på den nye, kan cellene lage eksakte kopier av arvestoffet, slik at arveegenskapene kan videreføres fra celle til celle.

Den genetiske koden er universell, dvs. at koden er nærmest identisk hos alle levende organismer, fra det enkleste virus til mennesket. I enkelte virus er det arvebærende materialet RNA og ikke DNA, men koden er den samme. Når et RNA-virus infiserer en celle, kan det på den samme måten som et DNA-virus bruke det kjemiske apparatet i cellen, og produse sitt eget protein. Da koden sannsynligvis ikke kan være oppstått mer enn én gang i livets historie, kan en slutte at alle organismer som lever eller har levd på Jorden, har en felles opprinnelse på det molekylære plan.

Mengden av DNA i cellene varierer fra art til art, men den er den samme i alle cellene hos individer av den samme arten. (I kjønnscellene, som har halvt kromosomtall, er imidlertid DNA-mengden halvert). En kan bruke DNA-analyser til å påvise slektskap mellom arter, f.eks. mellom forskjellige bakterier.

Alle cellene hos en høyere organisme er oppstått av én befruktet eggcelle. I slike flercellede organismer finnes mange forskjellige celletyper, med svært ulik funksjon. Alle disse cellene har den samme sammensetningen av DNA (samme nukleotidsekvens), men blir forskjellige fordi de ikke aktivt leser av (transkriberer) det samme settet med gener. Ulike celler består altså av forskjellige utvalg av proteiner. Også fordelingen av ulike celletyper og måten disse celletypene bygger opp organismen, er bestemt ut fra nukleotidsekvensen i DNA.

DNA-replikasjonen er en konservativ prosess som søker å bevare det genetiske materialet uendret. Det store antallet arter som finnes, viser imidlertid at det gjennom milliarder av år har oppstått talløse «feil» når det gjelder det å bevare arvestoffet uendret. Disse feilene kalles mutasjoner. Reelt sett er mutasjonene svært nyttige ettersom de er en forutsetning for at en utvikling kan finne sted. Uten dem hadde ikke livet kunne tilpasse seg nye vilkår.

Det finnes forskjellige kategorier mutasjoner. Utskifting av enkeltnukleotider, kalles punktmutasjoner. Ved de enkleste blir et basepar endret eller skiftet ut med et annet. Dette trenger ikke å få store følger. Langt alvorligere er det hvis det innføres eller fjernes ett eller to nukleotider i en sekvens. Det resulterer i at «rytmen» i tolkningen av sekvensen forskyves, siden kodonene avleses tre og tre i gangen. Genet vil da bli avlest feil. Slike mutasjoner vil ofte være dødelige hos avkommet fordi det dannes et protein som ikke kan utføre sin funksjon f.eks. i cellenes stoffskifte.

En lang rekke arvelige sykdommer skyldes enzymdefekter som kan føres tilbake til feil i DNA-koden. Dette er feil som stammer fra den eggcellen eller den spermien som ble til det befruktede egget. En slik feil blir da nedarvet til alle cellene i kroppen. Det er grunnen til at man fremdeles bare har små muligheter til å helbrede sykdommer som skyldes enzymdefekter. Eksempler er en lang rekke stoffskiftesykdommer, f.eks. fenylketonuri (Føllings sykdom).

Mutasjoner som kommer fra kjønnsceller vil nedarves fra generasjon til generasjon. Mutasjoner kan også ramme kroppsceller, og de kalles da somatiske. Somatiske mutasjoner går ikke i arv fra generasjon til generasjon, men de brer seg til alle etterkommere etter den cellen som ble rammet av mutasjonen. Slike somatiske mutasjoner er vanlige ved kreft og den molekylære årsaken til at kreft oppstår.

Foreslå endring

Kommentarer

Har du spørsmål til artikkelen? Skriv her, så får du svar fra fagansvarlig eller redaktør.

Du må være logget inn for å kommentere.