2016年08月22日訊 近日,來自MIT博德研究所和哈佛大學(xué)的研究人員通過研究解析并分析了迄今為止最大規(guī)模的人類蛋白質(zhì)編碼序列集合,作為ExAC的成員,研究者們從2014年就開始在研究團(tuán)體間進(jìn)行原始數(shù)據(jù)的公開,ExAC(Exome Aggregation Consortium)是一個(gè)由多個(gè)國家的科研機(jī)構(gòu)組成的外顯子組測序數(shù)據(jù)共享平臺(tái)。
在這項(xiàng)最新研究中,研究者對(duì)來自全世界的外顯子組數(shù)據(jù)進(jìn)行分析(其中一部分是2015年國際基因組大會(huì)上展示的相關(guān)數(shù)據(jù)),他們強(qiáng)調(diào)了利用大型數(shù)據(jù)庫的重要性,因?yàn)榛诖笮蛿?shù)據(jù)庫的數(shù)據(jù),研究者們就可以鑒別出引發(fā)罕見疾病的突變以及對(duì)突變非常敏感的基因,包括功能缺失的基因等,相關(guān)的研究成果發(fā)表在了8月17日的Nature雜志上。
來自多倫多大學(xué)的研究人員Stephen Scherer指出,這項(xiàng)工作的重要部分就是大量的外顯子組數(shù)據(jù),這些數(shù)據(jù)可以幫助研究人員和臨床研究團(tuán)隊(duì)以很多方式來利用。華盛頓大學(xué)的研究者Jay Shendure表示,這是我們對(duì)人類基因組進(jìn)行實(shí)質(zhì)性研究最為深入的一次。
博德研究所的Daniel MacArthur教授說道,蛋白質(zhì)編碼序列雖然在人類基因組中不到2%,但其卻是我們能夠進(jìn)行最好理解的基因組部分,而且這些基因組區(qū)域的信息往往和大部分突變引發(fā)的嚴(yán)重疾病直接相關(guān)。MacArthur和同事將來自20多個(gè)特殊疾病研究團(tuán)隊(duì)研究者所提供的外顯子組數(shù)據(jù)進(jìn)行混合,隨后他們創(chuàng)建了一個(gè)來自60706名個(gè)體中超過740萬個(gè)遺傳變異體的清單,該數(shù)據(jù)庫的大小是此前任何一個(gè)外顯子組數(shù)據(jù)庫的10倍,這些信息占據(jù)了幾乎一千T字節(jié)的存儲(chǔ)(a petabyte of),1 petabyte相當(dāng)于1百萬個(gè)千兆字節(jié)(gigabytes),據(jù)研究者介紹,這個(gè)數(shù)據(jù)庫的信息相當(dāng)于4000臺(tái)筆記本電腦中原始數(shù)據(jù)的集合。
研究者表示,許多研究計(jì)劃都直接研究常見的人類疾病,同時(shí)都獲得了不同的成功,但實(shí)際上除了預(yù)期的目的,這些數(shù)據(jù)或許還有其它用途。研究者M(jìn)onkol Lek就表示,在基因組區(qū)域,尤其是易于突變的基因組區(qū)域中,平均每隔8個(gè)堿基對(duì)我們都能發(fā)現(xiàn)突變的存在,通常我們都會(huì)不斷捕捉到相同的突變,而這就表明,這些數(shù)據(jù)庫足夠大,從而使得這些區(qū)域中的突變慢慢變得飽和,一旦數(shù)據(jù)庫不夠大研究者就不能看到在特殊的位點(diǎn)上看到可能性的遺傳突變,于是研究者就捕捉到了63%的幾乎所有可能性的同義突變,當(dāng)然這讓研究者非常激動(dòng)。
大量的外顯子組數(shù)據(jù)可以幫助研究人員在此前認(rèn)為具有致病性的192個(gè)等位基因突變體(ExAC數(shù)據(jù)庫中具有相對(duì)較高的頻率)中發(fā)現(xiàn)183個(gè)突變體實(shí)際上很有可能是良性的;同時(shí)研究小組還鑒別出了3230個(gè)基因和突變不耐受直接相關(guān),甚至當(dāng)基因的第二個(gè)拷貝是野生型的也是如此;研究者指出,這些基因中有72%的基因和任何一種疾病的發(fā)病都無關(guān),這就說明,利用來自表面健康人群的數(shù)據(jù)就可以發(fā)現(xiàn)一旦基因突變就會(huì)引發(fā)人類疾病的發(fā)生。
來自帝國理工學(xué)院的研究者Roddy Walsh表示,ExAC數(shù)據(jù)庫利用了來自7個(gè)不同的對(duì)照研究和常見疾病梯隊(duì)分析研究中樣本的外顯子組測序的結(jié)果,通過重新分析整個(gè)數(shù)據(jù)庫中的遺傳突變,就可以幫助產(chǎn)生一致性且具有高度準(zhǔn)確性的罕見突變數(shù)據(jù)。Walsh指出,利用收集的遺傳信息我們就可以評(píng)估參與多基因遺傳性疾病發(fā)生的基因的表達(dá)情況,如今研究小組已經(jīng)將ExAC的數(shù)據(jù)同7855名臨床心肌病患者的數(shù)據(jù)進(jìn)行對(duì)比分析,研究者們發(fā)現(xiàn),許多和心肌病假設(shè)相關(guān)的基因似乎都不太可能會(huì)引發(fā)心肌病的發(fā)生;通過重點(diǎn)關(guān)注已經(jīng)證實(shí)的基因,研究者希望可以通過減少不確定和假陽性結(jié)果的出現(xiàn)數(shù)量,來改善對(duì)心肌病的臨床遺傳檢測。
在一項(xiàng)研究報(bào)告中,來自美國西奈山伊坎醫(yī)學(xué)院(Icahn School of Medicine)的研究者Douglas Ruderfer及其同事通過對(duì)ExAC數(shù)據(jù)庫中發(fā)現(xiàn)的拷貝數(shù)目變異(CNVs)的模式和頻率進(jìn)行分析,研究者發(fā)現(xiàn),至少在長度為1000個(gè)堿基對(duì)的序列中,CNVs序列的缺失或獲得都非常罕見,而且相比單核苷酸的改變或插入、缺失突變而言,CNVs都很難檢測,研究者認(rèn)為,平均而言單個(gè)外顯子組都會(huì)包含0.81個(gè)刪除的基因和1.75個(gè)重復(fù)的基因。
當(dāng)前ExAc數(shù)據(jù)庫代表了來自非洲/非洲裔美國人、拉丁美洲、東亞、歐洲及東南亞后裔個(gè)體的信息,對(duì)于研究者M(jìn)acArthur而言,將來的研究目標(biāo)就是填補(bǔ)被忽視人群的相關(guān)數(shù)據(jù)信息,其中包括來自中東和非洲部分地區(qū)人群的信息等。最后研究者說道,進(jìn)行這項(xiàng)計(jì)劃的目的就是在今年10月份舉辦的美國人類遺傳學(xué)會(huì)年會(huì)上發(fā)布幾乎兩倍數(shù)量的人群外顯子組的最新數(shù)據(jù)。
本文地址:http://www.mcys1996.com/jiankang/303758.html.
聲明: 我們致力于保護(hù)作者版權(quán),注重分享,被刊用文章因無法核實(shí)真實(shí)出處,未能及時(shí)與作者取得聯(lián)系,或有版權(quán)異議的,請(qǐng)聯(lián)系管理員,我們會(huì)立即處理,本站部分文字與圖片資源來自于網(wǎng)絡(luò),轉(zhuǎn)載是出于傳遞更多信息之目的,若有來源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益,請(qǐng)立即通知我們(管理員郵箱:douchuanxin@foxmail.com),情況屬實(shí),我們會(huì)第一時(shí)間予以刪除,并同時(shí)向您表示歉意,謝謝!