大數(shù)據(jù)技術(shù)在鄉(xiāng)村畫像中的應(yīng)用
- 來源:中國(guó)信息化周報(bào) smarty:if $article.tag?>
- 關(guān)鍵字:大數(shù)據(jù),技術(shù),科研 smarty:/if?>
- 發(fā)布時(shí)間:2020-07-11 19:07
隨著國(guó)家大數(shù)據(jù)戰(zhàn)略的實(shí)施推進(jìn),大數(shù)據(jù)技術(shù)蓬勃發(fā)展,正加速成為發(fā)現(xiàn)新知識(shí)、創(chuàng)造新價(jià)值的新一代生產(chǎn)力,其應(yīng)用已滲入經(jīng)濟(jì)社會(huì)的各個(gè)微觀單元,并逐漸成為各行各業(yè)尋求突破、創(chuàng)新發(fā)展的關(guān)鍵力量。
大數(shù)據(jù)技術(shù)同樣已經(jīng)滲入鄉(xiāng)村發(fā)展的某些領(lǐng)域,其中,應(yīng)用比較廣泛的是農(nóng)業(yè)領(lǐng)域。通過對(duì)氣候、土壤、農(nóng)作物基因庫、農(nóng)業(yè)傳感器返回的數(shù)據(jù)等農(nóng)業(yè)大數(shù)據(jù)進(jìn)行挖掘、分析發(fā)現(xiàn),大數(shù)據(jù)技術(shù)在推動(dòng)精準(zhǔn)農(nóng)業(yè)實(shí)施建設(shè)方面做出了重要貢獻(xiàn),在農(nóng)業(yè)產(chǎn)量預(yù)測(cè)、農(nóng)業(yè)自然災(zāi)害的監(jiān)測(cè)預(yù)警、農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)、農(nóng)產(chǎn)品營(yíng)銷等方面的應(yīng)用也取得了良好的效果。但到目前為止,無論是理論層面,還是實(shí)踐層面,尚未有文獻(xiàn)對(duì)大數(shù)據(jù)技術(shù)在鄉(xiāng)村層面的系統(tǒng)性應(yīng)用進(jìn)行研究。
鄉(xiāng)村大數(shù)據(jù)源
鄉(xiāng)村大數(shù)據(jù)源是大數(shù)據(jù)技術(shù)開展鄉(xiāng)村畫像的基礎(chǔ)。在對(duì)現(xiàn)有文獻(xiàn)進(jìn)行檢索研究時(shí),并未發(fā)現(xiàn)有關(guān)“鄉(xiāng)村大數(shù)據(jù)”“農(nóng)村大數(shù)據(jù)”的研究,但近兩年關(guān)于“農(nóng)業(yè)大數(shù)據(jù)”的研究逐漸增加,有學(xué)者從數(shù)據(jù)來源上梳理了國(guó)內(nèi)外在農(nóng)業(yè)科技活動(dòng)中長(zhǎng)期積累和整編的海量科學(xué)數(shù)據(jù),即農(nóng)業(yè)科學(xué)大數(shù)據(jù),通過對(duì)其列出的數(shù)據(jù)源進(jìn)行梳理發(fā)現(xiàn),數(shù)量上匯集了12個(gè)國(guó)外數(shù)據(jù)源和30個(gè)國(guó)內(nèi)數(shù)據(jù)源(包括6個(gè)地方政府門戶開放數(shù)據(jù)),內(nèi)容上大致可分為4類:自然條件與資源數(shù)據(jù),如氣象數(shù)據(jù)、地質(zhì)數(shù)據(jù)、再生資源數(shù)據(jù)、空間數(shù)據(jù)等;農(nóng)業(yè)經(jīng)濟(jì)數(shù)據(jù),如宏觀農(nóng)業(yè)數(shù)據(jù)、生態(tài)農(nóng)業(yè)、中國(guó)飼料數(shù)據(jù)庫等;生命科學(xué)數(shù)據(jù),如生物信息數(shù)據(jù)、細(xì)胞數(shù)據(jù)、微生物病毒數(shù)據(jù)、基因數(shù)據(jù)等;農(nóng)業(yè)行政機(jī)構(gòu)數(shù)據(jù),主要來自于政府部門開放門戶。
也有學(xué)者從農(nóng)業(yè)大數(shù)據(jù)產(chǎn)生的角度,提出了農(nóng)業(yè)物聯(lián)網(wǎng)數(shù)據(jù)、農(nóng)業(yè)遙感和農(nóng)業(yè)無人機(jī)數(shù)據(jù)、農(nóng)業(yè)網(wǎng)絡(luò)數(shù)據(jù)、科研及農(nóng)戶生產(chǎn)經(jīng)驗(yàn)數(shù)據(jù)4類農(nóng)業(yè)大數(shù)據(jù),設(shè)計(jì)了農(nóng)業(yè)大數(shù)據(jù)平臺(tái)整體架構(gòu),并對(duì)農(nóng)業(yè)大數(shù)據(jù)的應(yīng)用方向進(jìn)行了論述。
農(nóng)業(yè)大數(shù)據(jù)是鄉(xiāng)村大數(shù)據(jù)的一部分。其中,省、市級(jí)別的鄉(xiāng)村數(shù)據(jù)可在《中國(guó)農(nóng)村統(tǒng)計(jì)年鑒》《中國(guó)農(nóng)業(yè)機(jī)械工業(yè)年鑒》《中國(guó)環(huán)境統(tǒng)計(jì)年鑒》等公開年鑒中獲取,而微觀數(shù)據(jù)由各部門保存,一般不對(duì)外公開,外部組織機(jī)構(gòu)也無法通過網(wǎng)絡(luò)爬取獲得。在國(guó)家或地方各部門擁有的鄉(xiāng)村數(shù)據(jù)中,以農(nóng)業(yè)普查數(shù)據(jù)中包含的農(nóng)村信息最為全面,普查表中的行政村綜合表和鄉(xiāng)鎮(zhèn)綜合表囊括了鄉(xiāng)村基本信息和特征信息;普查表中的農(nóng)戶基層表包括了村內(nèi)農(nóng)戶生活、生產(chǎn)經(jīng)營(yíng)活動(dòng)的方方面面,進(jìn)一步豐富了鄉(xiāng)村數(shù)據(jù)。農(nóng)業(yè)普查數(shù)據(jù)可提供全面的鄉(xiāng)村數(shù)據(jù)信息,局限性為每十年開展一次,最近一次是2016年開展的第三次全國(guó)農(nóng)業(yè)普查。但隨著近兩年地方鄉(xiāng)村振興戰(zhàn)略統(tǒng)計(jì)工作的開展,鄉(xiāng)村振興戰(zhàn)略統(tǒng)計(jì)的調(diào)查指標(biāo)與普查指標(biāo)具有較高的相似度,可對(duì)相同的指標(biāo)進(jìn)行不同年度的連續(xù)分析。除農(nóng)業(yè)普查數(shù)據(jù)外,鄉(xiāng)村層面還存在著數(shù)量可觀的非傳統(tǒng)數(shù)據(jù)。
大數(shù)據(jù)畫像技術(shù)
大數(shù)據(jù)畫像技術(shù)是大數(shù)據(jù)鄉(xiāng)村畫像的核心技術(shù)手段。大數(shù)據(jù)畫像的概念來源于用戶畫像,用戶畫像的英文概念“user persona”最早由艾倫·庫珀提出,其認(rèn)為user persona是真實(shí)用戶的虛擬代表,根據(jù)用戶行為、動(dòng)機(jī)等將用戶分為不同的類型,從中抽取每類用戶的社會(huì)屬性、生活習(xí)慣、消費(fèi)行為和興趣偏好等信息的共同特征,并設(shè)定名字、照片、場(chǎng)景等要素對(duì)其進(jìn)行描述。
用戶畫像又稱為人群畫像,是根據(jù)用戶信息抽象出的一個(gè)標(biāo)簽化的用戶模型,即用高度精練的特征描述一類人,例如年齡、性別、職業(yè)、興趣偏好等。
大數(shù)據(jù)畫像技術(shù)是用戶畫像在大數(shù)據(jù)環(huán)境下的延伸和發(fā)展,是基于大量傳統(tǒng)數(shù)據(jù)和非傳統(tǒng)數(shù)據(jù)、靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),使用統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)和人工智能等算法,構(gòu)建模型、挖掘數(shù)據(jù)、提取特征并進(jìn)行動(dòng)態(tài)可視化展示的一門數(shù)據(jù)分析與展示技術(shù)。
在中國(guó)知網(wǎng)文獻(xiàn)數(shù)據(jù)庫中,以“大數(shù)據(jù)畫像”“鄉(xiāng)村畫像”“畫像”等關(guān)鍵詞進(jìn)行檢索,對(duì)現(xiàn)有文獻(xiàn)從畫像對(duì)象、畫像技術(shù)方法兩個(gè)方面進(jìn)行歸納總結(jié)。從畫像對(duì)象來看,當(dāng)前文獻(xiàn)庫中可檢索到以“用戶畫像”“產(chǎn)品畫像”“企業(yè)畫像”“城市畫像”為標(biāo)題的研究,其中,“用戶畫像”作為畫像技術(shù)的初始應(yīng)用領(lǐng)域,研究的文獻(xiàn)最多,應(yīng)用也最為廣泛,尤其是在互聯(lián)網(wǎng)電商等,主要的大數(shù)據(jù)關(guān)聯(lián)規(guī)則方法有APRORI算法、FPGrowth關(guān)聯(lián)規(guī)則算法,這些方法主要應(yīng)用于電商、金融等行業(yè)的用戶畫像。雖然當(dāng)前關(guān)于特征值提取的方法很多,但是特征值挖掘和提取的準(zhǔn)確性仍是要持續(xù)攻克的難點(diǎn)。
鄉(xiāng)村振興領(lǐng)域研究
鄉(xiāng)村振興領(lǐng)域的熱點(diǎn)、重點(diǎn)及難點(diǎn)問題是大數(shù)據(jù)鄉(xiāng)村畫像的重要應(yīng)用方向。學(xué)術(shù)界關(guān)于鄉(xiāng)村振興領(lǐng)域研究的熱點(diǎn)、重點(diǎn)及難點(diǎn)問題的研究大多圍繞著鄉(xiāng)村振興發(fā)展而開展,或是聚焦鄉(xiāng)村振興發(fā)展的產(chǎn)業(yè)興旺、生態(tài)宜居、鄉(xiāng)村文明、治理有效、生活富裕5個(gè)維度整體,或是聚焦某一個(gè)局部展開研究。
通過對(duì)鄉(xiāng)村領(lǐng)域相關(guān)文獻(xiàn)進(jìn)行研究和分析,可以總結(jié)為:鄉(xiāng)村振興領(lǐng)域研究的熱點(diǎn)是鄉(xiāng)村振興實(shí)施效果評(píng)價(jià),文獻(xiàn)以鄉(xiāng)村振興評(píng)價(jià)指標(biāo)體系構(gòu)建為主,部分文獻(xiàn)選取對(duì)象進(jìn)行實(shí)證分析;鄉(xiāng)村振興領(lǐng)域研究的重點(diǎn)是鄉(xiāng)村振興實(shí)施路徑,當(dāng)前文獻(xiàn)大多對(duì)鄉(xiāng)村振興的某一方面進(jìn)行重點(diǎn)研究,從問題導(dǎo)向給出鄉(xiāng)村振興的實(shí)施路徑;鄉(xiāng)村振興領(lǐng)域研究的難點(diǎn)是鄉(xiāng)村振興差異化的前期規(guī)劃,如黃祖輝提出要從區(qū)域新型城鎮(zhèn)化戰(zhàn)略和鄉(xiāng)村差異化發(fā)展的實(shí)際出發(fā),落實(shí)鄉(xiāng)村振興戰(zhàn)略。其中,除鄉(xiāng)村振興的實(shí)施效果可以進(jìn)行定量分析外,其他研究大多為定性分析。
大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)的成果可以為鄉(xiāng)村振興領(lǐng)域熱點(diǎn)、重點(diǎn)及難點(diǎn)問題的研究提供科學(xué)有力的支撐,在實(shí)際應(yīng)用過程中,大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)主要有三大作用。第一,充分了解鄉(xiāng)村全貌。傳統(tǒng)的鄉(xiāng)村發(fā)展評(píng)價(jià)模型一般使用年鑒數(shù)據(jù)和調(diào)查數(shù)據(jù),對(duì)互聯(lián)網(wǎng)上大量可用數(shù)據(jù)的利用率不高,維度通常也局限于年鑒數(shù)據(jù)提供的信息,無法全面刻畫鄉(xiāng)村面貌。大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可以充分利用年鑒數(shù)據(jù)、政府網(wǎng)站公開數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù),同時(shí)也可以利用地理位置信息、氣候信息、政策文件信息等非結(jié)構(gòu)化數(shù)據(jù),多維度、全方位、立體化地對(duì)鄉(xiāng)村發(fā)展情況進(jìn)行描述,幫助政府根據(jù)鄉(xiāng)村存在的現(xiàn)實(shí)問題,有針對(duì)性地制定政策。第二,尋找差異,為因地制宜發(fā)展鄉(xiāng)村振興提供理論支持。利用大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng),可以對(duì)省份層面、地市層面、縣域?qū)用?、鄉(xiāng)鎮(zhèn)層面以及行政村層面等各級(jí)行政區(qū)劃的鄉(xiāng)村振興發(fā)展情況進(jìn)行分析,應(yīng)用范圍廣泛。通過對(duì)比,可以發(fā)現(xiàn)研究主體的優(yōu)勢(shì)和劣勢(shì),幫助當(dāng)?shù)卣虻刂埔?,開展“千村千面”個(gè)性化、特色化規(guī)劃,解決規(guī)劃的同質(zhì)性和落地難等問題。同時(shí),大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可智能化匹配生產(chǎn)條件、自然條件或者社會(huì)條件相似的標(biāo)桿性鄉(xiāng)村,幫助落后鄉(xiāng)村找到適合當(dāng)?shù)氐泥l(xiāng)村振興發(fā)展路徑和實(shí)施路徑。第三,監(jiān)測(cè)鄉(xiāng)村振興政策實(shí)施效果。大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可以對(duì)鄉(xiāng)村振興發(fā)展情況進(jìn)行連續(xù)時(shí)間的監(jiān)測(cè),通過對(duì)多年的數(shù)據(jù)和信息進(jìn)行對(duì)比,系統(tǒng)可使用標(biāo)簽對(duì)分析結(jié)果進(jìn)行展示,例如,某省份人均農(nóng)林牧漁產(chǎn)值連續(xù)5年增加,鄉(xiāng)村畫像標(biāo)簽可展示為“連續(xù)5年人均農(nóng)林牧漁產(chǎn)值增加”。
同時(shí),大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)也可設(shè)置預(yù)警機(jī)制,在指標(biāo)值出現(xiàn)異常波動(dòng)或者下降趨勢(shì)時(shí)(針對(duì)正向指標(biāo)),發(fā)出預(yù)警信號(hào),幫助政府部門及時(shí)做出應(yīng)對(duì)。
李望月 劉瑾等
