大數(shù)據(jù)不能全部開放
- 來源:中國信息化周報 smarty:if $article.tag?>
- 關(guān)鍵字:大數(shù)據(jù),醫(yī)療行業(yè),IP,十三五 smarty:/if?>
- 發(fā)布時間:2016-06-23 10:31
2015年和2016年全世界新產(chǎn)生的數(shù)據(jù)量等于人類有歷史以來一直累計到2014年全球數(shù)據(jù)總量的總和,近兩年,我們國家正在加速進(jìn)入大數(shù)據(jù)時代。
大數(shù)據(jù)是數(shù)據(jù)的一部分,不是所有數(shù)據(jù)都能開放,而是按照分類部分開放。
大數(shù)據(jù)是多來源的,包括社會空間數(shù)據(jù)、物理空間數(shù)據(jù)以及信息空間數(shù)據(jù)。
按網(wǎng)絡(luò)層面劃分則包括自媒體數(shù)據(jù)、日志數(shù)據(jù)、富媒體數(shù)據(jù)、基礎(chǔ)網(wǎng)絡(luò)數(shù)據(jù)。也可以分為國家安全數(shù)據(jù)、商業(yè)秘密數(shù)據(jù)、個人隱私數(shù)據(jù),這三方面的數(shù)據(jù)都不能開放,開放的是其他的數(shù)據(jù)。
大數(shù)據(jù)的多重性質(zhì)特點
大數(shù)據(jù)具有增長性、顆粒性、異構(gòu)性、移動性、多維性、語義性、隱私性等特點。
以醫(yī)療大數(shù)據(jù)為例,中國一個千萬人口的城市50年所累計的醫(yī)療數(shù)據(jù)量就會達(dá)到10PB級。每天都會有大量的數(shù)據(jù)導(dǎo)入?yún)^(qū)域醫(yī)療數(shù)據(jù)中心。
數(shù)據(jù)是長期性的,按照醫(yī)療行業(yè)的相關(guān)規(guī)定,門急診患者的數(shù)據(jù)保存不得少于15年,疏遠(yuǎn)數(shù)據(jù)保存30年,影像數(shù)據(jù)無限期保存。從另一方面來看,醫(yī)療數(shù)據(jù)多樣性和碎片化,顆粒性大小差別很大。而且通常也都需要帶有時間、位置、環(huán)境和含著病史及家族史等信息。
與此同時,醫(yī)療數(shù)據(jù)把患者、醫(yī)生、醫(yī)療機構(gòu)在不同層次上關(guān)聯(lián)。而不同的醫(yī)療信息廢物更需要從不同的視覺來觀察這些數(shù)據(jù)。
此外,存儲需要加入語義標(biāo)簽,對影像的理解需要有更專業(yè)的經(jīng)驗。當(dāng)然,如果醫(yī)療數(shù)據(jù)涉及患者隱私就需要加以保護(hù),也需要對醫(yī)療糾紛進(jìn)行保護(hù)。
網(wǎng)絡(luò)視頻已經(jīng)成為IP流量主導(dǎo)
網(wǎng)絡(luò)視頻已成為IP流量主導(dǎo)。全球消費者互聯(lián)網(wǎng)視頻從2014~2019年年均增長33%,2019年消費互聯(lián)網(wǎng)視頻每年將增加33%。動視頻流量2015—2020年年均增長將達(dá)62%,移動視頻占移動流量數(shù)據(jù)的比例從2015年的55%增加到2020年的75%。
到2020年,數(shù)據(jù)量會達(dá)到40ZB,裝到光盤上,重量可以等于現(xiàn)在美國的“尼克茲航母”,可以裝幾十艘。我們需要將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)來處理,包括政務(wù)大數(shù)據(jù),消費者大數(shù)據(jù),企業(yè)級大數(shù)據(jù),醫(yī)療大數(shù)據(jù)等。
以政務(wù)大數(shù)據(jù)為例,一個8M攝像頭每小時產(chǎn)生3.6GB數(shù)據(jù),很多城市的攝像頭多達(dá)幾十萬個,一個月的數(shù)據(jù)量達(dá)到數(shù)百PB,若需保存3個月則存儲量達(dá)到EB量級。
大數(shù)據(jù)在于精
大數(shù)據(jù)不能以大蓋全,大數(shù)據(jù)追求數(shù)據(jù)精準(zhǔn)但強調(diào)規(guī)律。這可以理解為對于一個大數(shù)據(jù)集而言,我們很難要求所有的數(shù)據(jù)都精準(zhǔn),只要大多數(shù)數(shù)據(jù)有代表性,并不妨礙數(shù)據(jù)集合得到較為準(zhǔn)確的結(jié)果。
此外,大數(shù)據(jù)可以提高分析精度??的螤柎髮W(xué)教授用同心的思維來解決語音識別,語音識別率從70%提高到90%以上。最近十年,語音識別錯誤率和機器翻譯的準(zhǔn)確性都成倍改進(jìn),其中20%的貢獻(xiàn)來自方法的改進(jìn),80%則在于數(shù)據(jù)量的提升。
我國的大數(shù)據(jù)安全領(lǐng)域仍然存在短板
現(xiàn)在大數(shù)據(jù)產(chǎn)業(yè)90%以上基本都是外國公司,在大數(shù)據(jù)產(chǎn)業(yè)里面,我國現(xiàn)在仍存在短板。
大數(shù)據(jù)的安全問題至關(guān)重要,大數(shù)據(jù)意味著海量數(shù)據(jù)的匯集,會引來更多潛在供給者。黑客在大數(shù)據(jù)時代有多維的數(shù)據(jù),把它關(guān)聯(lián)起來很容易就破解了這些關(guān)系,可以入侵企業(yè)的網(wǎng)絡(luò)。
在國家的“十三五”規(guī)劃里面,著重有一節(jié)提到了大數(shù)據(jù)安全技術(shù),提出要加快海量數(shù)據(jù)的采集、存儲、清洗、分析發(fā)覺、可視化、安全與隱私保護(hù)等關(guān)鍵技術(shù)攻關(guān)。其中也提到了集中力量突破信息管理、信息保護(hù)、安全檢查和基礎(chǔ)支撐等關(guān)鍵技術(shù),提高自主保障能力,加強關(guān)鍵信息基礎(chǔ)等方面的建設(shè)。
大數(shù)據(jù)本身是一個產(chǎn)業(yè),現(xiàn)在全世界的大數(shù)據(jù)市場是由硬件和軟件服務(wù)構(gòu)成,我們沒有像微軟、英特爾那樣的骨干企業(yè),在大數(shù)據(jù)安全上面我們確實是短板。
國產(chǎn)的設(shè)備雖然是自主研發(fā),但未必是安全可控。
自主不等于可控,只要有漏洞就可能成為非法獲取信息的來源。據(jù)有關(guān)安全機構(gòu)的統(tǒng)計,我國高達(dá)16%的網(wǎng)站存在安全漏洞和后門,可以說網(wǎng)站和應(yīng)用系統(tǒng)的漏洞是大數(shù)據(jù)平臺面臨的最大危險。
大數(shù)據(jù)已經(jīng)成為信息社會的熱點,也是信息安全博弈的焦點,大數(shù)據(jù)的安全需要從技術(shù)、產(chǎn)業(yè)與管理多維度來保障,還需要人才法規(guī)來支撐,大數(shù)據(jù)本身既是安全方面的重點,也是保障網(wǎng)絡(luò)與信息安全有力的手段。
?。ㄒ陨蟽?nèi)容根據(jù)中國工程院院士鄔賀銓在“第一屆大數(shù)據(jù)科學(xué)與工程國際會議(2016)——大數(shù)據(jù)科學(xué)認(rèn)識與理解”以及“2016中國大數(shù)據(jù)產(chǎn)業(yè)峰會暨中國電子商務(wù)創(chuàng)新發(fā)展峰會”上的演講整理而成,未經(jīng)本人確認(rèn)。)
相關(guān)鏈接
2016年大數(shù)據(jù)發(fā)展七大趨勢
■算法的崛起
2016年,人們更加關(guān)注對已接觸數(shù)據(jù)采取什么行動。算法能夠定義行為,能夠很好地執(zhí)行專業(yè)的指令,遠(yuǎn)比人類做得要好。這些算法是非常專業(yè)的人工智能。但是,非常專業(yè)的AI已經(jīng)存在,2016年我們將見證算法商務(wù)的崛起。
■數(shù)據(jù)湖服務(wù)作為一種解決方案
越來越多的大數(shù)據(jù)供應(yīng)商會提供這樣的解決方案:給企業(yè)提供一個完整的、易于使用的、可擴展的解決方案,省去企業(yè)自建數(shù)據(jù)湖的麻煩。
■區(qū)塊鏈將被各行各業(yè)所接受
不同行業(yè)的多個應(yīng)用程序使用區(qū)塊鏈?;旧先魏未嬖跀?shù)字化交易的行業(yè)都將受益于區(qū)塊鏈技術(shù),從金融業(yè),法律行業(yè),房地產(chǎn),公證員,賭博,發(fā)布到數(shù)據(jù)存儲。未來一年,更廣泛的采用區(qū)塊鏈將迫在眉睫。
■人力資源分析
在一個過熱的市場,對人才的爭奪戰(zhàn)愈演愈烈,對于一個組織而言,了解員工的驅(qū)動因素,并且很好的激勵他們變得越來越重要。在2016年,更多的組織將致力于人力資源分析,這些領(lǐng)域的初創(chuàng)企業(yè)數(shù)量將迅猛增長。
■智能政府致力于提高社會和公民體驗
對于那些大的商業(yè)組織而言,大數(shù)據(jù)已經(jīng)成為通用語言。在適應(yīng)新趨勢方面,政府是緩慢的,但是在2016年,我們會看到更多的國家、地區(qū)和地方政府會采用大數(shù)據(jù)技術(shù)來提高社會和公民的體驗。
■增強大數(shù)據(jù)的安全,并防止數(shù)據(jù)泄露
伴隨著數(shù)字化進(jìn)程,物聯(lián)網(wǎng)將物物連接為網(wǎng)絡(luò),大數(shù)據(jù)的安全變得越來越重要。2016年,我們將看到組織是如何管理他們的數(shù)據(jù)保證數(shù)據(jù)安全的。
■智能機器帶來的霧分析以改變他們的行業(yè)
組織將轉(zhuǎn)向人力資源分析,以更好地激勵員工,爭奪稀缺人才。政府終將看到大數(shù)據(jù)的益處,并向智能化方向轉(zhuǎn)變,但是組織和政府將不得不警惕黑客攻擊,并采取適當(dāng)措施。由于智能機器將出現(xiàn)在各行各業(yè),霧分析時代正式開啟。
■中國工程院院士 鄔賀銓
