大數(shù)據(jù)與精準(zhǔn)醫(yī)學(xué)
- 來源:中國(guó)信息化周報(bào) smarty:if $article.tag?>
- 關(guān)鍵字:大數(shù)據(jù),精準(zhǔn)醫(yī)學(xué) smarty:/if?>
- 發(fā)布時(shí)間:2017-11-16 10:16
人工智能和大數(shù)據(jù)等技術(shù)應(yīng)用于醫(yī)學(xué)領(lǐng)域?qū)?huì)推動(dòng)精準(zhǔn)醫(yī)學(xué)的發(fā)展,在疾病發(fā)生之前進(jìn)行采取針對(duì)性的措施,從而改變醫(yī)療健康的概念。同時(shí),人工智能和大數(shù)據(jù)也對(duì)研究我們遺傳信息中97%的、我們尚未了解的“暗物質(zhì)信息”起到關(guān)鍵作用??傮w來看,精準(zhǔn)醫(yī)學(xué)才剛剛上路,還存在很多的機(jī)會(huì)。
精準(zhǔn)醫(yī)學(xué)是組學(xué)大數(shù)據(jù)跟臨床醫(yī)學(xué)的結(jié)合
第一個(gè)問題,精準(zhǔn)醫(yī)學(xué)的本質(zhì)是什么,核心是什么?我看到國(guó)內(nèi)有各種各樣的評(píng)論,關(guān)于討論精準(zhǔn)醫(yī)學(xué)的內(nèi)涵,各種觀點(diǎn)都有,我自己覺得,精準(zhǔn)醫(yī)學(xué)的核心其實(shí)就是一點(diǎn),非常明確,就是組學(xué)大數(shù)據(jù)跟醫(yī)學(xué)的結(jié)合,說得更具體一點(diǎn),就是組學(xué)大數(shù)據(jù)跟臨床醫(yī)學(xué)的結(jié)合。也就是說,把組學(xué)大數(shù)據(jù)用到臨床的醫(yī)學(xué)當(dāng)中來,提高醫(yī)療診斷的準(zhǔn)確度,提高治療的效果。這里又包括兩層含義,一個(gè)含義是組學(xué)大數(shù)據(jù),另外一個(gè)含義是醫(yī)學(xué)。那么組學(xué)大數(shù)據(jù)又包括兩層含義,一個(gè)是組學(xué),一個(gè)是大數(shù)據(jù)。我們知道,近年來,隨著臨床研究的發(fā)展,我們獲得了越來越以基因組為代表的分子水平的人類信息,這個(gè)是前所未有的。那么,隨著以基因組為代表的組學(xué)數(shù)據(jù)的發(fā)展,人們?cè)絹碓蕉嗟胤e累了以遺傳密碼為代表的不僅僅是基因的信息,也包括蛋白的信息。后來,人們發(fā)現(xiàn),挖掘這些信息會(huì)得到很多人類健康和疾病的信息。所以有人提出,如果把這些信息應(yīng)用到臨床當(dāng)中,一定會(huì)提高臨床的效果,這就是所謂精準(zhǔn)醫(yī)學(xué)的本質(zhì)含義。但是,只獲得這些遺傳密碼的信息是不夠的。
大家知道,所有遺傳密碼的信息都是非常多的大數(shù)據(jù),這個(gè)大數(shù)據(jù)大家是很容易測(cè)得的,包括我們現(xiàn)在知道,在國(guó)內(nèi),一個(gè)人花一萬元就可以得到自己的遺傳密碼,但是你即使得到你的遺傳密碼,你仍舊是一點(diǎn)都不懂,因?yàn)槊艽a只有四個(gè)字(A、C、G、T),所以要讀懂他,你就要發(fā)展大數(shù)據(jù)分析的理論方法和技術(shù)。要把這些組學(xué)數(shù)據(jù)運(yùn)用到大臨床當(dāng)中,也就是組學(xué)數(shù)據(jù)和大數(shù)據(jù)分析方法的結(jié)合。所以一部分涉及到組學(xué)大數(shù)據(jù),一部分是醫(yī)學(xué),兩個(gè)領(lǐng)域結(jié)合起來,就構(gòu)成了現(xiàn)在精準(zhǔn)醫(yī)學(xué)的本質(zhì)和核心,這是第一個(gè)問題。關(guān)于精準(zhǔn)醫(yī)學(xué),是自上世紀(jì)90年代由于組學(xué)數(shù)據(jù)用到臨床當(dāng)中,發(fā)展轉(zhuǎn)化成轉(zhuǎn)化醫(yī)學(xué),個(gè)體化醫(yī)學(xué),從2011年又出了精準(zhǔn)醫(yī)學(xué)的名稱,但不管怎么說,精準(zhǔn)醫(yī)學(xué)他的本質(zhì)是清楚的,就是組學(xué)大數(shù)據(jù)在臨床醫(yī)學(xué)當(dāng)中的應(yīng)用。
精準(zhǔn)醫(yī)學(xué)有可能改變醫(yī)療健康的基本概念
精準(zhǔn)醫(yī)學(xué)能夠給醫(yī)學(xué)帶來哪些本質(zhì)的變化?精準(zhǔn)醫(yī)學(xué)的內(nèi)涵,一定會(huì)引起一些本質(zhì)上的變化,用一句話來說,精準(zhǔn)醫(yī)學(xué)本質(zhì)上之所以能引起各國(guó)領(lǐng)導(dǎo)人的重視,是精準(zhǔn)醫(yī)學(xué)有可能改變醫(yī)療健康的基本概念,也就是說,促使醫(yī)療的基本概念從當(dāng)前的診斷治療轉(zhuǎn)變成健康保證。未來因?yàn)榫珳?zhǔn)醫(yī)學(xué)的發(fā)展,由于組學(xué)大數(shù)據(jù)的介入,使得健康這一問題,不僅僅是病人要關(guān)注的,而是全民都要關(guān)注的。對(duì)任何人,我們可以在他沒有得病的時(shí)候測(cè)量他的組學(xué)數(shù)據(jù)。分析組學(xué)大數(shù)據(jù),那么就可以對(duì)他未來健康發(fā)展的危險(xiǎn)因素做出評(píng)估,根據(jù)評(píng)估進(jìn)行適當(dāng)干預(yù),這樣有些疾病就不會(huì)發(fā)展,提高他的生活質(zhì)量,把整個(gè)醫(yī)療健康體系的關(guān)口前移,在沒有病之前就提出評(píng)估與保證。
未來醫(yī)學(xué)的趨勢(shì)
根本性概念的轉(zhuǎn)變,可能導(dǎo)致一些新興產(chǎn)業(yè)的出現(xiàn),有人預(yù)估,跟所謂精準(zhǔn)醫(yī)學(xué)相關(guān)的這個(gè)概念轉(zhuǎn)變導(dǎo)致的新興產(chǎn)業(yè),也許到2018年將有2000億美元的規(guī)模,也就相當(dāng)于2萬億元人民幣,對(duì)GDP就有影響。這種由精準(zhǔn)醫(yī)學(xué)帶來的本性概念的改變由此促使的產(chǎn)業(yè)的發(fā)展當(dāng)然會(huì)引起各國(guó)領(lǐng)導(dǎo)人的注意,這是第二個(gè)方面,關(guān)于精整醫(yī)學(xué)他可能帶來的一些本質(zhì)變化的估量。
精準(zhǔn)醫(yī)學(xué)研究已成為新一輪國(guó)家科技競(jìng)爭(zhēng)與引領(lǐng)國(guó)際戰(zhàn)略的制高點(diǎn)。大家知道美國(guó)要測(cè)量100萬自然人的遺傳密碼,歐盟也在積極推動(dòng)所謂精準(zhǔn)醫(yī)學(xué)的研究,包括英國(guó)、法國(guó)等等,日本也在進(jìn)行精準(zhǔn)醫(yī)學(xué)相關(guān)的投入和計(jì)劃。那么精準(zhǔn)醫(yī)學(xué)可能在哪些方面促使產(chǎn)業(yè)的變革和發(fā)展呢?
我想至少在四個(gè)方面:第一,可以促進(jìn)海量的生物樣本庫(kù)和數(shù)據(jù)庫(kù)的發(fā)展。由于精準(zhǔn)醫(yī)學(xué)的推動(dòng),需要測(cè)量百萬人量級(jí)的組學(xué)信息,首先涉及到這百萬人生物樣品的獲取、保管、提取和提供給這些人使用,這當(dāng)然是一個(gè)很大的產(chǎn)業(yè)。同時(shí),這些樣本數(shù)據(jù)是百萬人數(shù)量級(jí)的,一定要促進(jìn)相應(yīng)的大規(guī)模數(shù)據(jù)庫(kù)的發(fā)展,有人估計(jì),這個(gè)產(chǎn)業(yè)的規(guī)??赡苁前賰|數(shù)量級(jí)。
第二,有了這些樣品,就要測(cè)以基因組為代表的這些組學(xué)數(shù)據(jù),所以就要測(cè)基因組、蛋白組、轉(zhuǎn)錄組,這些測(cè)序的數(shù)據(jù),到2018年,就可以達(dá)到117億美元的規(guī)模。
第三,在這些海量數(shù)據(jù)挖掘的基礎(chǔ)上,就可以促進(jìn)產(chǎn)生大量的、新的分子診斷指標(biāo),就會(huì)增加很多跟疾病相關(guān)的信息,有很多就可以作為新的疾病的標(biāo)記。同時(shí),也可以發(fā)現(xiàn)很多新的藥物設(shè)計(jì)的靶點(diǎn),這就促進(jìn)了第三個(gè)產(chǎn)業(yè),也就是所謂分子診斷和藥物設(shè)計(jì)靶點(diǎn)的相關(guān)產(chǎn)業(yè)。
第四,伴隨著精準(zhǔn)醫(yī)學(xué)概念而產(chǎn)生的新的醫(yī)療設(shè)施,比如說要成立一些健康源,需要一些健康師,這些產(chǎn)業(yè)大概是千億數(shù)量,精準(zhǔn)醫(yī)學(xué)將帶動(dòng)基因測(cè)序、分子診斷、個(gè)體化治療等市場(chǎng)規(guī)模的擴(kuò)大。
實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué)我覺得至少要具備兩個(gè)條件,第一個(gè),要具備組學(xué)大數(shù)據(jù)的基礎(chǔ),我們知道,精準(zhǔn)醫(yī)學(xué)就是把組大數(shù)據(jù)用到臨床當(dāng)中來,所以第一個(gè)你要獲取組學(xué)大數(shù)據(jù),第二步就是組學(xué)數(shù)據(jù)的挖掘,用到大數(shù)據(jù)分析、人工智能、深度學(xué)習(xí)等等,以知識(shí)為基礎(chǔ)的方法用來挖掘這些組學(xué),以獲得在分子水平上跟疾病相關(guān)的知識(shí),這是第一個(gè)基礎(chǔ)。
第二個(gè)基礎(chǔ),就是搭建分子水平的以基因型為代表的信息核,有效地把分子水平的信息轉(zhuǎn)化應(yīng)用到疾病的診斷和治療當(dāng)中,這就是要建立所謂生物信息學(xué)、生物網(wǎng)絡(luò)、系統(tǒng)生物學(xué)等等。有了這兩個(gè)基礎(chǔ)就可以更好地實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué),當(dāng)然一個(gè)非常重要的條件就是精準(zhǔn)醫(yī)學(xué)的發(fā)展,應(yīng)當(dāng)和當(dāng)前的臨床影象學(xué)、生化檢驗(yàn)等臨床知識(shí)很好地融合,精準(zhǔn)醫(yī)學(xué)只是把新的數(shù)據(jù)應(yīng)用在原有的數(shù)據(jù)上。
精準(zhǔn)醫(yī)學(xué)才剛剛上路
精準(zhǔn)醫(yī)學(xué)雖然本質(zhì)上可能帶來變革,可能引導(dǎo)新的產(chǎn)業(yè)的發(fā)展,但是才剛剛上路。我們的創(chuàng)新和機(jī)遇在哪里,我們迎接的挑戰(zhàn)是什么?我拿組學(xué)舉一個(gè)例子,在我們的臨床密碼當(dāng)中,在組學(xué)當(dāng)中,目前,還存在著大量的暗信息,所謂我們自己的遺傳密碼,目前能夠從規(guī)律上分析的只有一小部分,其他還不能分析的就是基因組當(dāng)中的所謂暗信息。我們一個(gè)人的遺傳密碼信息如果裝訂成冊(cè),每3000個(gè)字符一頁(yè),100頁(yè)裝訂成一冊(cè),那就是一萬冊(cè)。每一冊(cè)一厘米,我們自己的基因密碼書就是一百米,大家可以想像,你自己的遺傳密碼,從地面往上排,要排到四十層樓房那么高,如果你全部讀懂了,你就精準(zhǔn)了。我相信沒有誰能精準(zhǔn),集全世界科學(xué)家的智慧,包括生物醫(yī)學(xué)家的智慧也做不到。這本天書能夠從規(guī)律上了解的部分只達(dá)到遺傳密碼的3%,另外的97%實(shí)際上集目前全世界的智慧也還讀不懂。迄今為止我們的遺傳密碼97%是暗的。它是否在活動(dòng),在行使功能呢?結(jié)果100%是肯定的,這些非編碼序列和我們制造蛋白的那些基因一樣,每時(shí)每刻都在表達(dá),每時(shí)每刻都在起作用,所以他們也是真正地完成生物學(xué)功能,而97%的密碼還不知道的情況下我們?nèi)绾巫龅骄珳?zhǔn)呢?所以離精準(zhǔn)還差了很大的距離。
?。ǜ鶕?jù)陳潤(rùn)生院士在首屆“中國(guó)智谷大會(huì)人工智能與產(chǎn)業(yè)創(chuàng)新高峰論壇”上的演講整理而成,未經(jīng)本人確認(rèn)。)
中科院院士 陳潤(rùn)生
