遺傳密碼
A+醫學百科 >> 遺傳密碼 |
英文名:codon
遺傳密碼又稱密碼子、遺傳密碼子、三聯體密碼。指信使RNA(mRNA)分子上從5'端到3'端方向,由起始密碼子AUG開始,每三個核苷酸組成的三聯體。它決定肽鏈上某一個胺基酸或蛋白質合成的起始、終止信號。
遺傳密碼是一組規則,將DNA或RNA序列以三個核苷酸為一組的密碼子轉譯為蛋白質的胺基酸序列,以用於蛋白質合成。幾乎所有的生物都使用同樣的遺傳密碼,稱為標準遺傳密碼;即使是非細胞結構的病毒,它們也是使用標準遺傳密碼。但是也有少數生物使用一些稍微不同的遺傳密碼。
目錄 |
遺傳密碼-特點
1.連續性。mRNA的讀碼方向從5'端至3'端方向,兩個密碼子之間無任何核苷酸隔開。mRNA鏈上鹼基的插入、缺失和重疊,均造成框移突變。
2.簡併性。指一個胺基酸具有兩個或兩個以上的密碼子。密碼子的第三位鹼基改變往往不影響胺基酸翻譯。
3.擺動性。mRNA上的密碼子與轉移RNA(tRNA)J上的反密碼子配對辨認時,大多數情況遵守鹼基互補配對原則,但也可出現不嚴格配對,尤其是密碼子的第三位鹼基與反密碼子的第一位鹼基配對時常出現不嚴格鹼基互補,這種現象稱為擺動配對。
4.通用性。蛋白質生物合成的整套密碼,從原核生物到人類都通用。但已發現少數例外,如動物細胞的粒線體、植物細胞的葉綠體。
遺傳密碼-破解歷史
遺傳密碼的發現是20世紀50年代的一項奇妙想像和嚴密論證的偉大結晶。mRNA由四種含有不同鹼基腺嘌呤[簡稱A]、尿嘧啶(簡稱U)、胞嘧啶(簡稱C)、鳥嘌呤(簡稱G)的核苷酸組成。最初科學家猜想,一個鹼基決定一種胺基酸,那就只能決定四種胺基酸,顯然不夠決定生物體內的二十種胺基酸。那麼二個鹼基結合在一起,決定一個胺基酸,就可決定十六種胺基酸,顯然還是不夠。如果三個鹼基組合在一起決定一個胺基酸,則有六十四種組合方式,看來三個鹼基的三聯體就可以滿足二十種胺基酸的表示了,而且還有富餘。猜想畢竟是猜想,還要嚴密論證才行。
自從發現了DNA的結構,科學家便開始致力研究有關製造蛋白質的秘密。伽莫夫指出需要以三個核酸一組才能為20個胺基酸編碼。1961年,美國國家衛生院的Matthaei與馬歇爾.沃倫.尼倫伯格在無細胞系統(Cell-free system)環境下,把一條只由尿嘧啶(U)組成的RNA轉釋成一條只有苯丙氨酸(Phe)的多肽,由此破解了首個密碼子(UUU -> Phe)。隨後哈爾.葛賓.科拉納破解了其它密碼子,接著羅伯特.W.霍利發現了負責轉錄過程的tRNA。1968年,科拉納、霍利和尼倫伯格分享了諾貝爾生理學或醫學獎。
1 、閱讀方式
破譯遺傳密碼,必須了解閱讀密碼的方式。遺傳密碼的閱讀,可能有兩種方式:一種是重疊閱讀,一種是非重疊閱讀。例如mRNA上的鹼基排列是AUGCUACCG。若非重疊閱讀為AUG、CUA、CCG、;若重疊閱讀為AUG、UGC、GCU、CUA、UAC、ACC、CCG 。兩種不同的閱讀方式,會產生不同的胺基酸排列。克里克用T噬菌體為實驗材料,研究基因的鹼基增加或減少對其編碼的蛋白質會有什麼影響。克里克發現,在編碼區增加或刪除一個鹼基,便無法產生正常功能的蛋白質;增加或刪除兩個鹼基,也無法產生正常功能的蛋白質。但是當增加或刪除三個鹼基時,卻合成了具有正常功能的蛋白質。這樣克里克通過實驗證明了遺傳密碼中三個鹼基編碼一個胺基酸,閱讀密碼的方式是從一個固定的起點開始,以非重疊的方式進行,編碼之間沒有分隔符。
2 、驗證猜想
1959年聯體密碼的猜想終於被尼倫伯格(Nirenberg Marshall Warren)等人用體外無細胞體系的實驗證實。尼倫伯格等人的實驗用人工製成的只含一種核苷酸的mRNA作模板,給以適當的條件:提供核糖體、ATP、全套必要的酶系統和二十種胺基酸作為原料,接著觀察這已知的核苷酸組成的mRNA翻譯出的多肽鏈。結果發現形成一條多個胺基酸組成的肽鏈。從而表明mRNA上的鹼基決定胺基酸。此外實驗同時也證明了mRNA上的密碼是奇數的三聯體,因為只有奇數的三聯體才能形成交互的二個密碼。
3、 破譯方法
尼倫伯格等發現由三個核苷酸構成的微mRNA能促進相應的胺基酸-tRNA和核糖體結合。但微mRNA不能合成多肽,因此不一定可靠。科蘭納(Khorana,Har Gobind)用已知組成的兩個、三個或四個組的核苷酸順序人工合成mRNA,在細胞外的轉譯系統中加入放射性標記的胺基酸,然後分析合成的多肽中胺基酸的組成。
通過比較,找出實驗中三聯碼相同的部分,再找出多肽中相同的胺基酸,於是可確定該三聯碼就為該胺基酸的遺傳密碼。科蘭納用此方法破譯了全部遺傳密碼,從而和尼倫伯格分別獲得1968年諾貝爾獎金。
後來,尼倫伯格等用多種不同的人工mRNA進行實驗,觀察所得多肽鏈上的胺基酸的類別,再用統計方法推算出人工mRNA中三聯體密碼出現的頻率,分析與合成蛋白中各種胺基酸的頻率之間的相關性,以此方法也能找出20種胺基酸的全部遺傳密碼。最後,科學家們還用了由3個核苷酸組成的各種多核苷鏈來檢查相應的胺基酸,進一步證實了全部密碼子。
遺傳密碼-歷史起源
除了少數的不同之外,地球上已知生物的遺傳密碼均非常接近;因此根據演化論,遺傳密碼應在生命歷史中很早期就出現。現有的證據表明遺傳密碼的設定並非是隨機的結果,對此有以下的可能解釋:
最近一項研究顯示,一些胺基酸與它們相對應的密碼子有選擇性的化學結合力,這顯示現在複雜的蛋白質製造過程可能並非一早存在,最初的蛋白質可能是直接在核酸上形成。
原始的遺傳密碼可能比今天簡單得多,隨著生命演化製造出新的胺基酸再被利用而令遺傳密碼變得複雜。雖然不少證據證明這觀點3,但詳細的演化過程仍在探索之中。
經過自然選擇,現時的遺傳密碼減低了突變造成的不良影響。
遺傳密碼-密碼子表
此表列出了64種密碼子以及胺基酸的標準配對。
- | - | 第二位鹼基 | 第二位鹼基 | 第二位鹼基 | 第二位鹼基 |
- | - | U | C | A | G |
第
一 位 鹼 基 |
U | UUU (Phe/F)苯丙氨酸
UUC (Phe/F)苯丙氨酸 UUA (Leu/L)亮氨酸 UUG (Leu/L)亮氨酸 |
UCU (Ser/S)絲氨酸
UCC (Ser/S)絲氨酸 UCA (Ser/S)絲氨酸 UCG (Ser/S)絲氨酸 |
UAU (Tyr/Y)酪氨酸
UAC (Tyr/Y)酪氨酸 UAA (終止) UAG (終止) |
UGU (Cys/C)半胱氨酸
UGC (Cys/C)半胱氨酸 UGA (終止) UGG (Trp/W)色氨酸 |
第
一 位 鹼 基 |
C | CUU (Leu/L)亮氨酸
CUC (Leu/L)亮氨酸 CUA (Leu/L)亮氨酸 CUG (Leu/L)亮氨酸 |
CCU (Pro/P)脯氨酸
CCC (Pro/P)脯氨酸 CCA (Pro/P)脯氨酸 CCG (Pro/P)脯氨酸 |
CAU (His/H)組氨酸
CAC (His/H)組氨酸 CAA (Gln/Q)谷氨醯胺 CAG (Gln/Q)谷氨醯胺 |
CGU (Arg/R)精氨酸
CGC (Arg/R)精氨酸 CGA (Arg/R)精氨酸 CGG (Arg/R)精氨酸 |
第
一 位 鹼 基 |
A | AUU (Ile/I)異亮氨酸
AUC (Ile/I)異亮氨酸 AUA (Ile/I)異亮氨酸 AUG (Met/M)甲硫氨酸(起始) |
ACU (Thr/T)蘇氨酸
ACC (Thr/T)蘇氨酸 ACA (Thr/T)蘇氨酸 ACG (Thr/T)蘇氨酸 |
AAU (Asn/N)天冬醯胺
AAC (Asn/N)天冬醯胺 AAA (Lys/K)賴氨酸 AAG (Lys/K)賴氨酸 |
AGU (Ser/S)絲氨酸
AGC (Ser/S)絲氨酸 AGA (Arg/R)精氨酸 AGG (Arg/R)精氨酸 |
第
一 位 鹼 基 |
G | GUU (Val/V)纈氨酸
GUC (Val/V)纈氨酸 GUA (Val/V)纈氨酸 GUG (Val/V)纈氨酸 |
GCU (Ala/A)丙氨酸
GCC (Ala/A)丙氨酸 GCA (Ala/A)丙氨酸 GCG (Ala/A)丙氨酸 |
GAU (Asp/D)天冬氨酸
GAC (Asp/D)天冬氨酸 GAA (Glu/E)谷氨酸 GAG (Glu/E)谷氨酸 |
GGU (Gly/G)甘氨酸
GGC (Gly/G)甘氨酸 GGA (Gly/G)甘氨酸 GGG (Gly/G)甘氨酸 |
註:(起始)標準起始編碼,同時為甲硫氨酸編碼。mRNA中第一個AUG就是蛋白質翻譯的起始部位。
遺傳密碼-逆密碼子表
此表列出了和20種胺基酸和密碼子的標準配對。
Ala | A | GCU, GCC, GCA, GCG | Leu | L | UUA, UUG, CUU, CUC, CUA, CUG |
Arg | R | CGU, CGC, CGA, CGG, AGA, AGG | Lys | K | AAA, AAG |
Asn | N | AAU, AAC | Met | M | AUG |
Asp | D | GAU, GAC | Phe | F | UUU, UUC |
Cys | C | UGU, UGC | Pro | P | CCU, CCC, CCA, CCG |
Gln | Q | CAA, CAG | Ser | S | UCU, UCC, UCA, UCG, AGU, AGC |
Glu | E | GAA, GAG | Thr | T | ACU, ACC, ACA, ACG |
Gly | G | GGU, GGC, GGA, GGG | Trp | W | UGG |
His | H | CAU, CAC | Tyr | Y | UAU, UAC |
Ile | I | AUU, AUC, AUA | Val | V | GUU, GUC, GUA, GUG |
起始 | AUG | 終止 | UAG, UGA, UAA |
遺傳密碼-技術細節
1、起始和終止密碼子
蛋白質的轉譯從初始化密碼子(起始密碼子)開始,但亦需要適當的初始化序列和起始因子才能使mRNA和核糖體結合。最常見的起始密碼子為AUG,其同時編碼的胺基酸在細菌為甲醯甲硫氨酸,在真核生物為甲硫氨酸,但在個別情況其它一些密碼子也具有起始的功能。 在經典遺傳學中,終止密碼子各有名稱:UAG為琥珀(amber),UGA為蛋白石(opal),UAA為赭石(ochre)。這些名稱來源於最初發現到這些終止密碼子的基因的名稱。終止密碼子使核糖體和釋放因子結合,使多肽從核糖體分離而結束轉譯的程序。另外,在哺乳動物的粒線體中,AGA和AGG也充當終止密碼子。
2、簡併性
大部分密碼子具有簡併性,即兩個或者多個密碼子編碼同一胺基酸。簡併的密碼子通常只有第三位鹼基不同,例如,GAA和GAG都編碼谷氨醯胺。如果不管密碼子的第三位為哪種核苷酸,都編碼同一種胺基酸,則稱之為四重簡併;如果第三位有四種可能的核苷酸之中的兩種,而且編碼同一種胺基酸,則稱之為二重簡併,一般第三位上兩種等價的核苷酸同為嘌呤(A/G)或者嘧啶(C/T)。只有兩種胺基酸僅由一個密碼子編碼,一個是甲硫氨酸,由AUG編碼,同時也是起始密碼子;另一個是色氨酸,由UGG編碼。 遺傳密碼的這些性質可使基因更加耐受點突變。例如,四重簡併密碼子可以容忍密碼子第三位的任何變異;二重簡併密碼子使三分可能的第三位的變異不影響蛋白質序列。由於轉換變異(嘌呤變為嘌呤或者嘧啶變為嘧啶)比顛換變異(嘌呤變為嘧啶或者嘧啶變為嘌呤)的可能性更大,因此二重簡併密碼子也具有很強的對抗突變的能力。不影響胺基酸序列的突變稱為沉默突變。
簡併性的出現是由於tRNA反密碼子的第一位鹼基可以和mRNA構成擺動鹼基對,常見的情況為反密碼子上的次黃嘌呤(I),以及和密碼子形成非標準的U-G配對。
另一種有助對抗點突變的情況,是NUN (N代表任何核苷酸) 傾向於代表疏水性胺基酸,故此即使出現突變,仍有較大機會維持蛋白質的親水度,減低致命破壞的可能。
3、閱讀框
「密碼子」是由閱讀的起始位點決定的。例如,一段序列GGGAAACCC,如果由第一個位置開始讀,包括3個密碼子GGG,AAA和CCC。如果從第二位開始讀,包括GGA和AAC(忽略不完整的密碼子)。如果從第三位開始讀,則為GAA和ACC。故此每段序列都可以分為三個閱讀框,每個都能產生不同的胺基酸序列(在上例中,相應為Gly-Lys-Pro,Gly-Asp,和Glu-Thr)。而因為DNA的雙螺旋結構,每段DNA實際上有六個閱讀框。 實際的框架是由起始密碼子確定,通常是mRNA序列上第一個出現的AUG。 破壞閱讀框架的變異(例如,插入或刪除1個或2個核苷酸)稱為閱讀框變異,通常會嚴重影響到蛋白質的功能,故此並不常見,因為他們通常不能在演化中存活下來。
4、非標準的遺傳密碼
雖然遺傳密碼在不同生命之間有很強的一致性,但亦存在非標準的遺傳密碼。在有「細胞能量工廠」之稱的粒線體中,便有和標準遺傳密碼數個相異的之處,甚至不同生物的粒線體有不同的遺傳密碼。支原體會把UGA轉譯為色氨酸。纖毛蟲則把UAG(有時候還有UAA)轉譯為谷氨醯胺(一些綠藻也有同樣現象),或把UGA轉譯為半胱氨酸。一些酵母會把GUG轉譯為絲氨酸。在一些罕見情況,一些蛋白質會有AUG以外的起始密碼子。 真菌、原生生物和人以及其它動物的粒線體中的遺傳密碼與標準遺傳密碼的差異,主要變化如下:
密碼子 | 通常的作用 | 例外的作用 | 所屬的生物 |
UGA | 中止編碼 | 色氨酸編碼 | 人、牛、酵母粒線體,支原體(Mycoplasma)基因組,如Capricolum |
UGA | 中止編碼 | 半胱氨酸編碼 | 一些纖毛蟲(ciliate)細胞核基因組,如游纖蟲屬(Euplotes) |
AGR | 精氨酸編碼 | 中止編碼 | 大部分動物粒線體,脊椎動物粒線體 |
AGA | 精氨酸編碼 | 絲氨酸編碼 | 果蠅粒線體 |
AUA | 異亮氨酸編碼 | 蛋氨酸編碼 | 一些動物和酵母粒線體 |
UAA | 中止編碼 | 谷氨醯胺編碼 | 草履蟲、一些纖毛蟲(ciliate)細胞核基因組,如嗜熱四膜蟲(ThermophAilus tetrahymena) |
UAG | 中止編碼 | 谷氨酸編碼 | 草履蟲核細胞核基因組 |
GUG | 纈氨酸編碼 | 絲氨酸編碼 | 假絲酵母核基因組 |
AAA | 賴氨酸編碼 | 天冬氨酸編碼 | 一些動物的粒線體,果蠅粒線體 |
CUG | 亮氨酸編碼 | 中止編碼 | 圓柱念珠菌(Candida cylindracea)細胞核基因組 |
CUN | 亮氨酸編碼 | 蘇氨酸編碼 | 酵母粒線體 |
按信使RNA的序列,在一些蛋白質里停止密碼子會被翻譯成非標準的胺基酸,例如UGA轉譯為硒半胱氨酸和UAG轉譯為吡咯賴氨酸,隨著對基因組序列加深了解,科學家可能還會發現其它非標準的轉譯方式,以及其它未知胺基酸在生物中的應用。
遺傳密碼-基因組的表達
一個生物體攜帶的遺傳信息-即基因組-被記錄在DNA或RNA分子中,分子中每個有功能的單位被稱作基因。每個基因均是由一連串單核苷酸組成。每個單核苷酸均由鹼基,戊糖(即五碳糖,DNA中為脫氧核糖,RNA中為核糖)和磷酸三部分組成。鹼基不同構成了不同的單核苷酸。組成DNA的鹼基有腺嘌呤(A),鳥嘌呤(G),胞嘧啶(C)及胸腺嘧啶(T)。組成RNA的鹼基以尿嘧啶(U)代替了胸腺嘧啶(T)。三個單核苷酸形成一組密碼子,而每個密碼子代表一個胺基酸或停止訊號。
製造蛋白質的過程中,基因先被從DNA轉錄為對應的RNA模板,即信使RNA(mRNA)。接下來在核糖體和轉移RNA(tRNA)以及一些酶的作用下,由該RNA模板轉譯成為胺基酸組成的鏈(多肽),然後經過轉譯後修飾形成蛋白質。詳情參閱轉譯。
因為密碼子由三個核苷酸組成,故一共有43=64種密碼子。例如,RNA序列UAGCAAUCC包含了三個密碼子:UAG,CAA和UCC。這段RNA編碼了代表了長度為3個胺基酸的一段蛋白質序列。(DNA也有類似的序列,但是以T代替了U)。
|
|
關於「遺傳密碼」的留言: | 訂閱討論RSS |
目前暫無留言 | |
添加留言 |