如何擁抱大數(shù)據(jù)時代
- 來源:中國信息化周報 smarty:if $article.tag?>
- 關(guān)鍵字:大數(shù)據(jù),英特爾,阿里巴巴 smarty:/if?>
- 發(fā)布時間:2015-10-13 11:41
在上世紀(jì)80年代初,就已經(jīng)有了大數(shù)據(jù)的概念和相關(guān)應(yīng)用,但是它深入社會和百姓的視野,則是最近幾年的事情。2012年,美國政府由白宮牽頭,啟動了一個“大數(shù)據(jù)發(fā)展計劃”,這個計劃的推出被視為進(jìn)入大數(shù)據(jù)時代的標(biāo)志性事件,其重要性堪比1992年美國政府推出的“信息高速公路計劃”。在相似的時間,歐盟各國陸續(xù)開放了很多政府?dāng)?shù)據(jù),日本也啟動了一個大數(shù)據(jù)項(xiàng)目,聯(lián)合國2012年發(fā)布大數(shù)據(jù)報告,全球掀起了大數(shù)據(jù)研究和應(yīng)用的熱潮。
大數(shù)據(jù)的發(fā)展,是以網(wǎng)絡(luò)和計算機(jī)技術(shù)的高速發(fā)展為依托的。1965年英特爾創(chuàng)始人之一的摩爾先生提出,未來的網(wǎng)絡(luò)計算機(jī)發(fā)展,大體上每隔1年到2年,等面積集成電路中的晶體管數(shù)量將會增加一倍,即計算速度會提高一倍,同等的計算,成本會降低一半。經(jīng)過近50年的實(shí)踐,驗(yàn)證了摩爾先生的預(yù)測,也就是人們常說的“摩爾定律”。計算機(jī)和網(wǎng)絡(luò)科技的高速發(fā)展,使得大量網(wǎng)絡(luò)數(shù)據(jù),包括音頻的、視頻的、圖片的、文本的各種各樣的數(shù)據(jù),得以保存,并轉(zhuǎn)化為我們可以深入分析的數(shù)據(jù)。于是,大數(shù)據(jù)的研究和應(yīng)用也就水到渠成了。
上世紀(jì)八九十年代,我們在很多科技領(lǐng)域和國外差距很大,但是進(jìn)入互聯(lián)網(wǎng)時代以后,這種狀況逐漸改觀。進(jìn)入大數(shù)據(jù)時代,我們可進(jìn)一步縮小與美國等科技發(fā)達(dá)國家的差距,甚至具有后發(fā)優(yōu)勢,在某些領(lǐng)域甚至可以達(dá)到國際先進(jìn)水平。
大數(shù)據(jù)影響統(tǒng)計學(xué)發(fā)展
統(tǒng)計學(xué)就是數(shù)據(jù)科學(xué),大數(shù)據(jù)對統(tǒng)計學(xué)的發(fā)展影響巨大。大數(shù)據(jù)對于統(tǒng)計學(xué)的發(fā)展,既是機(jī)遇又是挑戰(zhàn)。說它是機(jī)遇,是因?yàn)榇髷?shù)據(jù)研究和應(yīng)用會帶來大量人才需求,這對統(tǒng)計學(xué)的發(fā)展是一個巨大的利好,可以說,目前統(tǒng)計學(xué)發(fā)展正處于歷史上最好的時期。這幾年,從全國范圍看,統(tǒng)計學(xué)專業(yè)畢業(yè)生就業(yè)狀況都不錯,今后會更好。說它是挑戰(zhàn),是因?yàn)榇髷?shù)據(jù)可能部分顛覆傳統(tǒng)的統(tǒng)計方法。
大數(shù)據(jù)對統(tǒng)計學(xué)帶來的上述挑戰(zhàn)確實(shí)存在,但是不會導(dǎo)致傳統(tǒng)抽樣調(diào)查的需求減少。因?yàn)榇髷?shù)據(jù)雖然數(shù)據(jù)量很大,但絕大多數(shù)情況下這些大樣本都不是隨機(jī)的,推斷總體都有系統(tǒng)偏差,因而抽樣調(diào)查等統(tǒng)計方法仍然是不可取代的。此外,在很多時候,科研和商業(yè)應(yīng)用、科學(xué)決策還是需要進(jìn)行準(zhǔn)確的統(tǒng)計分析的。
從人才培養(yǎng)的角度看,統(tǒng)計學(xué)在教學(xué)內(nèi)容、教學(xué)方法、人才培養(yǎng)模式等方面需要進(jìn)行變革,以適應(yīng)大數(shù)據(jù)時代的人才素質(zhì)要求,這是統(tǒng)計學(xué)科發(fā)展面臨的另一挑戰(zhàn)。
大數(shù)據(jù)應(yīng)用是把雙刃劍
大數(shù)據(jù)將對教育產(chǎn)生非常深遠(yuǎn)的影響。目前可以預(yù)見的主要有兩個方面:一是通過大數(shù)據(jù),分析學(xué)生成長環(huán)境、興趣愛好、能力特長等,有利于教育者對學(xué)生加深了解,有利于因材施教,使得根據(jù)學(xué)生個人興趣、特長、能力進(jìn)行個性化教育成為可能;二是帶來教學(xué)內(nèi)容、教學(xué)方式方法上的改變,立體化教學(xué)、案例教學(xué)、互動教學(xué)等方式的運(yùn)用使得教學(xué)更加生動,MOOCs就是大數(shù)據(jù)時代教學(xué)變革的一個例子。大數(shù)據(jù)可以促進(jìn)全世界優(yōu)質(zhì)教育資源共享,發(fā)揮每個教師的優(yōu)勢特長。大數(shù)據(jù)將對教育產(chǎn)生一系列的深遠(yuǎn)影響,不可低估。
在大數(shù)據(jù)時代,個人的相關(guān)數(shù)據(jù)信息輕易可得,個人隱私越來越不安全。其實(shí)不僅僅是個人隱私,包括國家安全和企業(yè)的商業(yè)機(jī)密,也受到很大的威脅。對于國家而言,一方面要積極推進(jìn)數(shù)據(jù)對外開放,凡是不涉及個人隱私、國家安全和商業(yè)機(jī)密的數(shù)據(jù),都應(yīng)該公開,這樣才能避免形成數(shù)據(jù)孤島,充分發(fā)掘和利用數(shù)據(jù)資源;另一方面,在開放數(shù)據(jù)的同時要加強(qiáng)相關(guān)立法,這兩個方面是互相補(bǔ)充的,只有這樣,才能趕上時代發(fā)展的步伐,充分發(fā)揮我們這個人口大國、經(jīng)濟(jì)大國的數(shù)據(jù)資源優(yōu)勢。
從個人的角度講,要加強(qiáng)個人信息防護(hù)意識,在上網(wǎng)發(fā)布相關(guān)信息時,要了解哪些是可以發(fā)的,哪些是不能發(fā)的,以免給自己帶來困擾。
采用協(xié)同創(chuàng)新、5校合作的培養(yǎng)模式
采用種協(xié)同創(chuàng)新、5校合作的培養(yǎng)模式,完全是由大數(shù)據(jù)人才的特點(diǎn)決定的。第一,大數(shù)據(jù)人才是多學(xué)科交叉型人才,不是某一個學(xué)科可以單獨(dú)培養(yǎng)的?,F(xiàn)在進(jìn)行數(shù)據(jù)分析,要有數(shù)據(jù)庫和軟件等計算機(jī)方面的知識,還要有數(shù)學(xué)和統(tǒng)計方面的知識和能力。這就涉及到中國學(xué)科體系中“統(tǒng)計學(xué)”和“計算機(jī)科學(xué)與技術(shù)”兩個一級學(xué)科。培養(yǎng)出的畢業(yè)生到了單位,可能還需要財經(jīng)、新聞、生物醫(yī)學(xué)和管理等方面的知識。
第二,這是一類應(yīng)用型人才,必須重視實(shí)踐環(huán)節(jié)。他們畢業(yè)后不是去做研究,而是投身業(yè)界,要能很快上手。因此,這個協(xié)同創(chuàng)新平臺,不僅有5所高校參與,還有人民日報、新華社、中央電視臺等十余家媒體,中國移動、中國電信、中國聯(lián)通、百度、阿里巴巴、騰訊等大數(shù)據(jù)公司和用人單位,包括云計算的一些基地共同參與,是一個“政、企、產(chǎn)、學(xué)、研”一體的人才培養(yǎng)平臺,也就是說,人才培養(yǎng)環(huán)節(jié)是交叉的。
為什么把人才培養(yǎng)的層次定位于碩士?目前全國有200多所本科院校開設(shè)統(tǒng)計學(xué)專業(yè),75所高校設(shè)有統(tǒng)計學(xué)博士點(diǎn),78所高校開辦“應(yīng)用統(tǒng)計碩士”專業(yè)學(xué)位。在大數(shù)據(jù)時代,改革最急需的人才是碩士層次的,正好我們有“應(yīng)用統(tǒng)計專業(yè)碩士”這樣一個新的專業(yè)學(xué)位,利用這個協(xié)同創(chuàng)新平臺來培養(yǎng)大數(shù)據(jù)人才,也與專業(yè)學(xué)位的改革精神相一致。
5所學(xué)校參與培養(yǎng),就是出于學(xué)科交叉的考慮。中國人民大學(xué)統(tǒng)計學(xué)院的學(xué)科、專業(yè)設(shè)置是綜合的、應(yīng)用的,理論和應(yīng)用兼而有之,應(yīng)用領(lǐng)域涉及衛(wèi)生、健康、經(jīng)濟(jì)、社會、管理等,總體實(shí)力較強(qiáng)。而北京大學(xué)和中國科學(xué)院大學(xué)在計算機(jī)、數(shù)學(xué)和統(tǒng)計理論研究方面相當(dāng)強(qiáng),掌握大數(shù)據(jù)分析技術(shù)的前沿。中央財經(jīng)大學(xué)和首都經(jīng)貿(mào)大學(xué)是財經(jīng)類為主的院校,這兩所學(xué)校側(cè)重于應(yīng)用人才的培養(yǎng),特別是面向經(jīng)濟(jì)、管理、社會這樣的領(lǐng)域。他們和很多行業(yè)企業(yè)、金融機(jī)構(gòu)有著密切聯(lián)系。這5所高校分別屬于教育部直屬高校、中國科學(xué)院的高校和地方高校3種類型,各有特色,優(yōu)勢互補(bǔ),能夠建成一個很好的、學(xué)科交叉的人才培養(yǎng)協(xié)同體。
培養(yǎng)環(huán)節(jié)的交叉,主要體現(xiàn)在企業(yè)、用人單位的參與上。
我們經(jīng)過多次研討,并參考了美國頂尖的20所大學(xué)大數(shù)據(jù)人才培養(yǎng)的方案和課程,確定了“大數(shù)據(jù)分析計算機(jī)基礎(chǔ)”、“大數(shù)據(jù)分析統(tǒng)計基礎(chǔ)”、“大數(shù)據(jù)分布式計算”、“大數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)”、“非結(jié)構(gòu)化大數(shù)據(jù)分析”和“大數(shù)據(jù)建模案例研究”6門必修核心課程。每門課程由一個教學(xué)團(tuán)隊(duì),5所學(xué)校各選一名最優(yōu)秀的教師,然后5位老師一起研究一門課程、同上一門課程,而且還有大數(shù)據(jù)企業(yè)的專家參與。我們還采取雙導(dǎo)師制,采取個性化的教學(xué)方式,從生源來看,首批學(xué)生主要來源于計算機(jī)和統(tǒng)計兩個學(xué)科,計算機(jī)專業(yè)背景的本科生進(jìn)來以后,將會重點(diǎn)加強(qiáng)統(tǒng)計分析能力的培養(yǎng),而統(tǒng)計、數(shù)學(xué)、物理等專業(yè)背景的本科生進(jìn)來以后,將重點(diǎn)加強(qiáng)計算機(jī)、大數(shù)據(jù)軟件等方面的學(xué)習(xí)。
?。ㄒ陨蟽?nèi)容系根據(jù)對袁衛(wèi)在“2015中國兩化融合大會”后的訪談?wù)矶桑唇?jīng)本人確認(rèn))
中國人民大學(xué)中國調(diào)查與數(shù)據(jù)中心主任 袁衛(wèi)
