2016年10月13日訊 最近,刊登于國際雜志Nature Genetics上的一項(xiàng)研究報(bào)告中,瑞士巴塞爾弗雷德里希米歇爾研究所的研究人員通過研究發(fā)現(xiàn),真核生物或許能夠通過特殊的途徑來保護(hù)基因組免于重排以及因重復(fù)DNA而帶來的剔除。人類的基因組就好比是某些簡單動(dòng)物的基因組,比如線蟲,其中充滿著重復(fù)的序列,而其中很多序列都是過去病毒感染的殘留物,這種重復(fù)的DNA通常都處于靜默狀態(tài)。
研究者發(fā)現(xiàn),這些重復(fù)的DNA轉(zhuǎn)錄成為RNA就能夠產(chǎn)生RNA和DNA的毒性雜交體,而這些異常的R-環(huán)(R-loop)就會(huì)導(dǎo)致缺失和插入,從而影響基因組的完整性;位于組蛋白上的甲基化基團(tuán)就能夠充當(dāng)細(xì)胞機(jī)器中的一種信使來確定是否DNA序列能夠被轉(zhuǎn)錄,而且H3賴氨酸9位上的組蛋白甲基化處于更加緊密地包裹狀態(tài),而且纏繞在其上面的DNA并不易于到達(dá)轉(zhuǎn)錄機(jī)器,當(dāng)其不能夠被表達(dá)時(shí),組蛋白甲基化就會(huì)使得基因保持沉默狀態(tài),然而組蛋白甲基轉(zhuǎn)移酶(HMTs)卻能夠參與細(xì)胞的分化以及一系列癌癥的發(fā)生,其特殊的抑制劑目前正處于臨床試驗(yàn)中。
這項(xiàng)研究中,研究者想通過研究闡明,當(dāng)從復(fù)雜有機(jī)體中消除大量組蛋白修飾后會(huì)發(fā)生什么,研究者發(fā)現(xiàn)HMTs在發(fā)育過程中是非常必要的,而且其在基因組穩(wěn)定性上扮演著重要角色。HMTs能夠?qū)M蛋白H3在賴氨酸9位上進(jìn)行甲基化(H3K9me HMTs),哺乳動(dòng)物的細(xì)胞中至少含有8種H3K9的組蛋白甲基轉(zhuǎn)移酶,研究者發(fā)現(xiàn),重復(fù)性元件中H3K9me的存在非常重要,當(dāng)H3K9甲基化缺失時(shí),這些區(qū)域就會(huì)轉(zhuǎn)錄成為RNA,而且不合適的轉(zhuǎn)錄往往和插入、缺失以及拷貝數(shù)變化直接相關(guān),缺少特殊的HMTs會(huì)直接導(dǎo)致基因組突變率水平的提高。
當(dāng)細(xì)胞中的復(fù)制機(jī)器被阻斷時(shí),不必要的DNA損傷就會(huì)產(chǎn)生,而其中一個(gè)常見的原因就是具有轉(zhuǎn)錄作用的DNA復(fù)制聚合酶的“碰撞”導(dǎo)致的,研究者假設(shè),R環(huán)狀結(jié)構(gòu)能夠產(chǎn)生在H3K9me缺失的線蟲機(jī)體中發(fā)現(xiàn)的突變。最后研究者Gasser說道,對(duì)于目的是抑制H3K9甲基轉(zhuǎn)移酶的癌癥療法而言,本文研究或許是一條重大新聞;我們并不想利用一種癌癥療法的制劑來使得健康細(xì)胞的基因組變得不穩(wěn)定,尤其是考慮到H3K9me的缺失會(huì)以驚人的速度引入缺失和插入;后期研究中研究者希望能夠闡明是否本文中對(duì)線蟲的研究結(jié)果能夠直接影響人類癌癥的靶向性療法。
該文大部分來自Nature Reviews Genetics的綜述“Structural variation in the sequencing era” 的翻譯,詳細(xì)內(nèi)容請(qǐng)閱讀 原文 。
鑒定結(jié)構(gòu)變異對(duì)于進(jìn)一步了解基因組的特征至關(guān)重要。但由于之前的基因組測序技術(shù)具有明顯的局限性,鑒定結(jié)構(gòu)變異一直是一個(gè)難題。隨著第三代單分子測序和相關(guān)鑒定算法的發(fā)展,以使數(shù)百萬SV的鑒定成為可能。研究發(fā)現(xiàn),SV與疾病和一些生物機(jī)制的調(diào)控密切相關(guān)。鑒于SV的類型和大小的多變性,以及新的基因組技術(shù)的檢測偏差,因此,解決多平臺(tái)間造成的差異,構(gòu)造較為一致的結(jié)構(gòu)變異圖譜很有必要。作者回顧了當(dāng)前鑒定SV的方法,并提出將生物學(xué)信息與SV結(jié)合起來將對(duì)全面了解SV對(duì)人類基因組的影響是很必要的。
個(gè)體間遺傳變異一般分為兩種,一類是長度<50bp的,包括單核苷酸變異( single- nucleotide variants, SNVs)和小的插入和刪除(indels);另一類是> 50 bp的結(jié)構(gòu)變異( structural variations,SVs)。進(jìn)一步可以將SV細(xì)分為非平衡的拷貝數(shù)變異(CNVs),包括插入,刪除和重復(fù);以及平衡的重排,包括倒位和染色體內(nèi)及染色體間的易位。此外,SV還包括轉(zhuǎn)座子插入,拷貝數(shù)高度可變的多等位基因CNV,片段重復(fù)和復(fù)雜重排。
相較于SNV等鑒定的準(zhǔn)確性和研究的廣泛性,SV的鑒定和分析卻遠(yuǎn)遠(yuǎn)落后,這是由于SV的鑒定不準(zhǔn)確并且對(duì)應(yīng)的參考基因組也缺乏多樣性,樣本量和測序深度。隨著新的測序技術(shù)和SV鑒定算法的發(fā)展,使得集合多個(gè)軟件來從多種測序技術(shù)的數(shù)據(jù)中鑒定SV成為可能。
SV的檢測策略一般包括4種:Read-pair,Read-depth,Split-read,Sequence assembly,關(guān)于其詳細(xì)的介紹可參考這篇文章: 一篇文章說清楚基因組結(jié)構(gòu)性變異檢測的方法 。然而,現(xiàn)有的大多數(shù)軟件采用的為單一的檢測策略,因此不能很好的全面檢測結(jié)構(gòu)變異。所以,比較好的方式就是進(jìn)行多策略多工具整合,以全面檢測結(jié)構(gòu)變異。但這樣又會(huì)帶來一個(gè)問題,多個(gè)軟件的結(jié)果如何合并和過濾,作者根據(jù)已有的研究,總結(jié)了主要的幾個(gè)標(biāo)準(zhǔn),包括斷點(diǎn)置信區(qū)間重疊情況,斷點(diǎn)距離,鑒定錯(cuò)誤率的大小,采取的鑒定策略優(yōu)先級(jí),鑒定結(jié)果的一致性等,幾乎所有的整合工具都考慮了SV的坐標(biāo)是否重疊,總結(jié)一下也就是下面這張圖:
現(xiàn)有的整合多種策略進(jìn)行SV鑒定的工具(針對(duì)二代測序數(shù)據(jù))有如下幾個(gè):
這些整合多策略的工具仍然有其局限性,主要是由二代短讀長數(shù)據(jù)導(dǎo)致,大片段的結(jié)構(gòu)變異無法準(zhǔn)確檢測到,僅能檢測重復(fù)區(qū)域之外的小片段的SV。
合成長reads測序技術(shù)有很多,包括合并克隆測序,Illumina合成長reads測序,10x Genomics reads連接測序等。這種長reads很適合用來鑒定SV,由于低錯(cuò)誤率和讀長較長(多達(dá)100kb),因此很多時(shí)候用來構(gòu)建單體型。利用這種數(shù)據(jù)鑒定SV的方法有Long Ranger,GROC- SVs,LinkedSV,NAIBR,VALOR2,ZoomX,詳細(xì)見下表:
[圖片上傳失敗...(image-d74713-1576071182641)]
[圖片上傳失敗...(image-c7bbb7-1576071182641)]
該方法僅對(duì)雙鏈中的模板鏈進(jìn)行測序,因只含一條鏈,故該方法可以用來構(gòu)建單倍型。該測序方法可以用于檢測倒位,大片段的缺失和重復(fù)等,相應(yīng)地檢測工具有BAIT和Invert.R。
[圖片上傳失敗...(image-ee6ae1-1576071182641)]
[圖片上傳失敗...(image-477986-1576071182641)]
Hi-C的reads長度可以達(dá)到Mbp級(jí)別,從而使得其適合用于檢測大片段的SV,尤其是易位,檢測出的SV片段大小一般大于2Mb。然而由于reads長度太長,Hi-C并不適合檢測小片段的SV。檢測的工具主要包括HiCNV + HiCtrans,Hi-C Breakfinder。
[圖片上傳失敗...(image-bb58a4-1576071182641)]
[圖片上傳失敗...(image-f47b6a-1576071182641)]
檢測SV的算法一般通過利用reads內(nèi)部和reads之間的特征來檢測SMRT數(shù)據(jù)中的SV。對(duì)于reads內(nèi)部的特征,可以直接用來鑒定SV,一般是序列刪除和插入。而對(duì)于reads之間的特征,可能涉及多個(gè)reads,相關(guān)檢測工具一般是通過在reads與參考基因組比對(duì)后的結(jié)果中從reads方向,位置等的異常中檢測出SV。采用這種方法的工具有CORGi,PBHoney,pbsv,Sniffles,SMRT-SV,SVIM。
[圖片上傳失敗...(image-9eb503-1576071182641)]
[圖片上傳失敗...(image-3c56dc-1576071182641)]
用于從ONT數(shù)據(jù)中檢測SV的方法與PacBio數(shù)據(jù)中的類似,工具主要包括 NanoSV, Picky, Sniffles,SVIM。有研究表明,ONT數(shù)據(jù)的檢測SV工具對(duì)于小片段的SV的檢測并不準(zhǔn)確,所以,ONT數(shù)據(jù)并不適用于檢測小片段SV(< 200bp)。
光學(xué)圖譜系統(tǒng)基于單分子光學(xué)圖譜技術(shù),通過其特有的芯片技術(shù)使完整的單一DNA分子可以在納米通道中平行排列,拍照成像,可以展示更完整的基因圖譜。通過將光學(xué)圖譜上的標(biāo)記于已酶切的參考基因組比較來鑒定SV:缺失或多余的標(biāo)記以及標(biāo)記間的距離可以用來確定是否有缺失或插入;重復(fù)的標(biāo)簽表明有序列重復(fù);非參考序列上存在獨(dú)特的切口表示有易位;切口反向表示有倒位。光學(xué)圖譜生成的片段一般長達(dá)1Mb,從而使得其適合于檢測大片段的重排和插入,也可檢測重復(fù)區(qū)域中的。由于光學(xué)圖譜產(chǎn)生的片段是酶切過的,所以檢測SV的分辨率很難達(dá)到堿基級(jí)別。由于光學(xué)圖譜的成本較低,所以在只是檢測一些大片段的SV時(shí)選光學(xué)圖譜還是一個(gè)不錯(cuò)的選擇。相應(yīng)的檢測工具主要包括 OMSV,Bionano Solve。
[圖片上傳失敗...(image-605067-1576071182641)]
利用多個(gè)平臺(tái)產(chǎn)生的數(shù)據(jù)來檢測SV,這方面的工具主要有兩個(gè):MultiBreak- SV,HySA。
[圖片上傳失敗...(image-c932f4-1576071182641)]
[圖片上傳失敗...(image-537ea1-1576071182641)]
有一些工具也可以用來檢測一些復(fù)雜的SV,列舉如下:
[圖片上傳失敗...(image-29c029-1576071182641)]
對(duì)于不同平臺(tái)的數(shù)據(jù),SV在其中的表現(xiàn)形式也不太相同,作者為此進(jìn)行了總結(jié):
SV不只是檢測完就這么簡單,還需要闡明發(fā)生SV背后的生物學(xué)機(jī)制以及造成的影響,這就需要將鑒定到的SV與現(xiàn)有的生物學(xué)信息(包括基因表達(dá),表觀遺傳和三維基因組結(jié)構(gòu))結(jié)合起來綜合分析,才能達(dá)到最終的研究目的。有研究就發(fā)現(xiàn),SV比SNV和indels對(duì)基因表達(dá)的影響要大很多。作者也進(jìn)行了相關(guān)總結(jié),以幫助理如何將SV與其他生物學(xué)數(shù)據(jù)結(jié)合分析。
[圖片上傳失敗...(image-c4d736-1576071182641)]
更多更詳細(xì)的內(nèi)容還請(qǐng)閱讀文章原文,更好的閱讀體驗(yàn)請(qǐng)移步我的博客 綜述-測序時(shí)代的結(jié)構(gòu)變異 。
Ho, S.S., Urban, A.E. & Mills, R.E. Structural variation in the sequencing era. Nat Rev Genet (2019) doi:10.1038/s41576-019-0180-9
多倍化(polyploidy)或全基因加倍/復(fù)制(whole genome duplication, WGD)事件是指基因組內(nèi)的所有序列都發(fā)生重復(fù),重復(fù)為生物進(jìn)化提供了原始的遺傳材料,使植物基因組快速重組,丟失大量基因,增加結(jié)構(gòu)變異,對(duì)植物進(jìn)化極其重要。
多倍體植物廣泛存在于自然界中,如日常生活中的馬鈴薯、小麥、棉花等。多倍化事件或全基因組復(fù)制事件直接將染色體進(jìn)行加倍,被認(rèn)為是一種物種分化的驅(qū)動(dòng)力。研究發(fā)現(xiàn)多倍化在有花植物進(jìn)化過程中十分頻繁,在現(xiàn)存的被子植物和種子植物分化之前,都分別發(fā)生過加倍事件,可能對(duì)花和種子的產(chǎn)生有重要貢獻(xiàn) (Jiao et al., 2011)?;蚪M加倍為物種提供了豐盛的演化材料(圖1)。被認(rèn)為是提升了物種多樣性、環(huán)境適應(yīng)能力等(Jiao, 2018)。多倍化后的物種需要在原植物多倍化的研究對(duì)于生物進(jìn)化、物種保護(hù)及遺傳育種等方面都具有重要的理論指導(dǎo)意義及實(shí)踐應(yīng)用價(jià)值。
鑒定全基因組復(fù)制的方法一般可以通過以下三種:
下面我們就前兩種方式進(jìn)行重點(diǎn)介紹。
基因組共線性是基因組加倍比較直接的證據(jù),通過比較兩個(gè)基因組的序列并將共線性的區(qū)域作圖展示,可以直觀發(fā)現(xiàn)全基因組加倍的痕跡,如圖2(左)蘋果基因組(Daccord et al., 2017)的circos圖中,可以明顯染色體間大片段的共線性,表明該物種近期發(fā)生了全基因組復(fù)制。在向日葵基因組(Badouin et al., 2017)中,通過基因組自身的比對(duì)展示如圖2(右),對(duì)角線為物種自身的基因和其本身的共線性。其余的點(diǎn)為基因組其他位置的旁系同源基因?qū)?。圖中紅色圓圈標(biāo)注的位置,表明這兩段之間具有一定的共性,為基因組加倍事件留下的痕跡。
如果物種經(jīng)歷過多次全基因組加倍事件,近期的加倍事件會(huì)加速早期加倍事件的基因丟失,早期的加倍事件痕跡往往越來越不明顯,共線性直觀上不明顯,這就需要我們探索其他方式來挖掘加倍事件,這就用到了4DTv和Ks的信息。下面我們對(duì)這兩種方式來進(jìn)行簡單的介紹。
同義突變指突變并不影響氨基酸序列,進(jìn)而不會(huì)影響蛋白結(jié)構(gòu)與功能。一般認(rèn)為,同義突變不受自然選擇,同義突變率(Ks)的計(jì)算為同義突變SNP數(shù)/同義位點(diǎn)數(shù)。由于同義位點(diǎn)突變不會(huì)引起氨基酸的變化,可以認(rèn)為對(duì)編碼蛋白沒有影響,那么密碼子同義位點(diǎn)的變化是完全隨機(jī)的,并隨時(shí)間推移累積。如果物種發(fā)生了全基因組加倍事件,現(xiàn)有基因組中會(huì)有一定數(shù)量的基因保留下來,這些基因在進(jìn)化過程中累積的同義突變接近,計(jì)算得到的Ks值也接近,在某一個(gè)Ks值處會(huì)形成一個(gè)峰(ks peak)。如果這處Ks值的基因數(shù)目足夠多,就會(huì)形成比較間的峰值,可以認(rèn)為在進(jìn)化過程中該處發(fā)生過全基因組加倍事件。全基因組加倍發(fā)生的時(shí)間越久遠(yuǎn),基因丟失越多,發(fā)生的變化也要越大,形成的Ks峰越扁平,影響對(duì)全基因組加倍事件的判斷。
4DTv與Ks有異曲同工之處(Tang et al., 2008),如果密碼子的某個(gè)位點(diǎn)上任何核苷酸的改變都不影響其都編碼的氨基酸,則稱這個(gè)位點(diǎn)為4倍簡并位點(diǎn)(fourfold degenerate site)是指共線性區(qū)段所包含的基因?qū)Φ?DTV值可反映物種在進(jìn)化史中的物種相對(duì)分化事件以及全基因組復(fù)制事件。4DTV指4D位點(diǎn)上發(fā)生顛換(嘌呤突變?yōu)猷奏せ蛘哙奏ね蛔優(yōu)猷堰剩┑奈稽c(diǎn)所占的比例。
以辣椒基因組文章中的4DTv和罌粟基因組文章中的Ks結(jié)果為例,解析全基因組復(fù)制事件。在辣椒基因組(Qin et al., 2014)文章中(如圖3),選取了辣椒(pepper)、葡萄(grape)、土豆(potato)、番茄(tomato)進(jìn)行4DTv分析。結(jié)果如下圖。從圖中可以看出在辣椒和葡萄分后(黃色線,4DTv值0.5處),茄科植物辣椒、土豆和番茄在分化之前共同發(fā)生了全基因組復(fù)制(圖中指示W(wǎng)GD位置,黑線、藍(lán)線和紅線在4DTv值0.3處的峰值),之后辣椒和番茄分開(圖中綠線,4DTv值0.1處)。關(guān)于4DTv如何推斷全基因組加倍時(shí)間,文章中也給出了建議:在4DTv值0.48和0.1處分別為辣椒和葡萄、辣椒和番茄的物種分化時(shí)間,對(duì)應(yīng)的時(shí)間點(diǎn)為?89和20Mya,辣椒、番茄和土豆共有的全基因組加倍事件在4DTv值約0.3處,基于此可以大致推斷該全基因組復(fù)制事件發(fā)生的時(shí)間約在55Mya。
在罌粟基因組文章(Guo et al., 2018)中,選取了罌粟(opium poppy)、耬斗菜(Aquilegia coerulea)、蓮(otus)、葡萄(grape)、擬南芥(Arabidopsis)進(jìn)行Ks分析,結(jié)果如圖4,從Ks峰圖和進(jìn)化樹可以看出,葡萄和罌粟在Ks值約1.6處(黃線)分開,葡萄在Ks值約1.4處(綠線)發(fā)生了核心雙子葉植物共有的全基因組三倍化事件,耬斗菜在Ks值約1.0-1.2處發(fā)生了單獨(dú)的全基因組復(fù)制,由于復(fù)制時(shí)間比較久遠(yuǎn),所以峰較為扁平,蓮在Ks值約0.5處發(fā)生了單獨(dú)的全基因組復(fù)制事件,罌粟在Ks值約0.1處發(fā)生了全基因組復(fù)制,這是一個(gè)較為近期的全基因組復(fù)制事件。通過公式T=Ks/2r可以計(jì)算全基因組加倍事件發(fā)生的時(shí)間,r為核苷酸替代率,在文章中使用了6.98 × 10-9,計(jì)算得到的加倍時(shí)間在7.8百萬年前。
全基因組加倍后的復(fù)制基因的命運(yùn)各有不同,其保留與丟失是否有偏向性?哪些基因傾向于保留,保留基因功能是否發(fā)生變化?保留的重復(fù)基因及其對(duì)調(diào)控網(wǎng)絡(luò)進(jìn)化的影響?基因組加倍在被子植物的適應(yīng)性進(jìn)化中發(fā)揮的作用,如何幫助植物適應(yīng)劇烈環(huán)境變化等(Wu et al., 2020),這些都是全基因組復(fù)制后續(xù)可以挖掘的內(nèi)容,在此不做過多介紹。
Badouin, H., Gouzy, J., Grassa, C.J., Murat, F., Staton, S.E., Cottret, L., Lelandais-Briere, C., Owens, G.L., Carrere, S., Mayjonade, B., et al. (2017). The sunflower genome provides insights into oil metabolism, flowering and Asterid evolution. Nature 546, 148-152.
Daccord, N., Celton, J.M., Linsmith, G., Becker, C., Choisne, N., Schijlen, E., van de Geest, H., Bianco, L., Micheletti, D., Velasco, R., et al. (2017). High-quality de novo assembly of the apple genome and methylome dynamics of early fruit development. Nat Genet 49, 1099-1106.
Guo, L., Winzer, T., Yang, X., Li, Y., Ning, Z., He, Z., Teodor, R., Lu, Y., Bowser, T.A., Graham, I.A., et al. (2018). The opium poppy genome and morphinan production. Science 362, 343-347.Jiao, Y. (2018). Double the Genome, Double the Fun: Genome Duplications in Angiosperms. Mol Plant 11, 357-358.
Jiao, Y., Wickett, N.J., Ayyampalayam, S., Chanderbali, A.S., Landherr, L., Ralph, P.E., Tomsho, L.P., Hu, Y., Liang, H., Soltis, P.S., et al. (2011). Ancestral polyploidy in seed plants and angiosperms. Nature 473, 97-100.
Qin, C., Yu, C., Shen, Y., Fang, X., Chen, L., Min, J., Cheng, J., Zhao, S., Xu, M., Luo, Y., et al. (2014). Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization. Proc Natl Acad Sci U S A 111, 5135-5140.
Tang, H., Wang, X., Bowers, J.E., Ming, R., Alam, M., and Paterson, A.H. (2008). Unraveling ancient hexaploidy through multiply-aligned angiosperm gene maps. Genome Res 18, 1944-1954.
Wu, S., Han, B., and Jiao, Y. (2020). Genetic Contribution of Paleopolyploidy to Adaptive Evolution in Angiosperms. Mol Plant 13, 59-71.
本文地址:http://www.mcys1996.com/jiankang/293833.html.
聲明: 我們致力于保護(hù)作者版權(quán),注重分享,被刊用文章因無法核實(shí)真實(shí)出處,未能及時(shí)與作者取得聯(lián)系,或有版權(quán)異議的,請(qǐng)聯(lián)系管理員,我們會(huì)立即處理,本站部分文字與圖片資源來自于網(wǎng)絡(luò),轉(zhuǎn)載是出于傳遞更多信息之目的,若有來源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益,請(qǐng)立即通知我們(管理員郵箱:douchuanxin@foxmail.com),情況屬實(shí),我們會(huì)第一時(shí)間予以刪除,并同時(shí)向您表示歉意,謝謝!