2016年09月03日訊 大型基因組數(shù)據(jù)庫(kù)對(duì)于科學(xué)家尋找同疾病相關(guān)的遺傳變異來(lái)說(shuō)是必不可少的。不過(guò),對(duì)于貢獻(xiàn)了DNA的人來(lái)說(shuō),這會(huì)帶來(lái)隱私風(fēng)險(xiǎn)。一項(xiàng)2013年的研究顯示,黑客能利用網(wǎng)絡(luò)上公開(kāi)可用的信息,從被匿名的基因組數(shù)據(jù)中辨別出人們的身份。
為解決這些擔(dān)憂,一個(gè)由美國(guó)麻省理工學(xué)院計(jì)算機(jī)科學(xué)家Bonnie Berger和Sean Simmons研發(fā)的系統(tǒng)利用了被稱為差分隱私的方法。它通過(guò)向用戶查詢結(jié)果中添加少量噪音或者隨機(jī)變異,模糊捐贈(zèng)者的身份。研究人員在最新一期的《細(xì)胞系統(tǒng)》雜志上發(fā)表了他們的成果。
該系統(tǒng)會(huì)計(jì)算研究人員想要的統(tǒng)計(jì)數(shù)值,比如一個(gè)遺傳變異同某種特定疾病存在關(guān)聯(lián)的幾率,或者同一種疾病最相關(guān)的5個(gè)遺傳變異。然后,它向結(jié)果中添加隨機(jī)變異,并且返回本質(zhì)上帶有輕微錯(cuò)誤的信息。比如,在對(duì)同某種疾病相關(guān)的前5個(gè)遺傳變異的查詢中,系統(tǒng)可能會(huì)產(chǎn)生前4個(gè)遺傳變異以及第6個(gè)或第7個(gè)變異。
用戶并不知道哪個(gè)查詢結(jié)果更正確,但仍能利用這些信息。只是對(duì)于想弄清楚數(shù)據(jù)背后的患者信息的人來(lái)說(shuō),變得更加困難了而已。
“當(dāng)你在系統(tǒng)中加入一點(diǎn)點(diǎn)噪音,從很多方面來(lái)說(shuō),它同數(shù)據(jù)開(kāi)始自帶的噪音并沒(méi)有太大的不同?!碧锛{西州范德堡大學(xué)計(jì)算機(jī)專家Bradley Malin表示,“在一定程度上,它仍然是可靠的?!睅资陙?lái),美國(guó)人口普查局和勞工部一直通過(guò)這種方式向它們的數(shù)據(jù)中添加噪音。
只要數(shù)據(jù)庫(kù)足夠大--含有來(lái)自幾千或更多人的信息,同時(shí)研究人員保持在限制其能詢問(wèn)問(wèn)題數(shù)量的“隱私預(yù)算”之內(nèi),利用此項(xiàng)技術(shù)的數(shù)據(jù)集中的個(gè)人隱私便不會(huì)受到侵害。用戶將無(wú)法詢問(wèn)一個(gè)基因組中的幾百個(gè)或上千個(gè)位置。
受該技術(shù)保護(hù)的數(shù)據(jù)庫(kù)可被立即搜索到,而目前要獲準(zhǔn)調(diào)用由包括美國(guó)國(guó)立衛(wèi)生研究院在內(nèi)的各機(jī)構(gòu)管理的數(shù)據(jù)庫(kù)可能需要數(shù)月。
Simmons和Berger表示,即便帶有噪音,在詢問(wèn)一些有針對(duì)性的問(wèn)題時(shí),該系統(tǒng)提供的答案仍然足夠有用?!八饕挥糜讷@取通過(guò)其他途徑可能無(wú)法接觸到的數(shù)據(jù)集?!盨immons介紹說(shuō)。
比如,如果分析一個(gè)小型數(shù)據(jù)集的研究人員發(fā)現(xiàn)了同某種疾病存在關(guān)聯(lián)的遺傳變異,該系統(tǒng)能讓他們利用規(guī)模大很多且通過(guò)其他方式無(wú)法獲取到的數(shù)據(jù)集證實(shí)這一關(guān)聯(lián)。它還能讓研究人員預(yù)覽某個(gè)數(shù)據(jù)集,從而在進(jìn)行耗費(fèi)時(shí)間的完整獲取申請(qǐng)流程前判定其有用程度。
“我認(rèn)為,這是一項(xiàng)極其卓越的數(shù)學(xué)工作。”哥倫比亞大學(xué)計(jì)算生物學(xué)家Yaniv Erlich表示,“理論上講,它很不錯(cuò)。不過(guò),從實(shí)際的角度來(lái)說(shuō),我并不確定它會(huì)派上用場(chǎng)?!?/p>
Erlich的一個(gè)擔(dān)憂來(lái)自該系統(tǒng)的問(wèn)題限制。在他看來(lái),現(xiàn)在研究人員想要的是分析同某種疾病存在關(guān)聯(lián)的前10個(gè)或100個(gè)遺傳變異,而不是前5個(gè)。
與此同時(shí),Erlich 表示,“人們并不喜歡在其數(shù)據(jù)中加入噪音”,因?yàn)楫a(chǎn)生這些信息需要經(jīng)過(guò)很多艱苦的工作。噪音問(wèn)題還會(huì)對(duì)基于此類信息的臨床決策產(chǎn)生令人不安的影響。
Malin認(rèn)為,該系統(tǒng)會(huì)在查詢結(jié)果中添加大量噪音的可能性非常小?!斑@讓人們感到有點(diǎn)不自在。”
不過(guò),Simmons正試圖改進(jìn)這一系統(tǒng),在實(shí)現(xiàn)相同的隱私保護(hù)效果的同時(shí)盡量添加較少的噪音。Berger則同哈佛大學(xué)-麻省理工學(xué)院博德研究所合作,確定減少隱私風(fēng)險(xiǎn)的方法。這或許可通過(guò)利用差分隱私技術(shù)實(shí)現(xiàn)。如果該研究所決定在更大范圍內(nèi)釋放來(lái)自其數(shù)據(jù)庫(kù)的基因組數(shù)據(jù),這將會(huì)派上用場(chǎng)。
“最終,這就是我們真正關(guān)心的事情?!盨immons表示,“讓這些數(shù)據(jù)盡可能被更加廣泛地獲取到?!?/p>
本文地址:http://www.mcys1996.com/jiankang/300876.html.
聲明: 我們致力于保護(hù)作者版權(quán),注重分享,被刊用文章因無(wú)法核實(shí)真實(shí)出處,未能及時(shí)與作者取得聯(lián)系,或有版權(quán)異議的,請(qǐng)聯(lián)系管理員,我們會(huì)立即處理,本站部分文字與圖片資源來(lái)自于網(wǎng)絡(luò),轉(zhuǎn)載是出于傳遞更多信息之目的,若有來(lái)源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益,請(qǐng)立即通知我們(管理員郵箱:douchuanxin@foxmail.com),情況屬實(shí),我們會(huì)第一時(shí)間予以刪除,并同時(shí)向您表示歉意,謝謝!