電信運(yùn)營(yíng)商大數(shù)據(jù)變現(xiàn)之關(guān)鍵技術(shù)
- 來(lái)源:中國(guó)信息化周報(bào) smarty:if $article.tag?>
- 關(guān)鍵字:大數(shù)據(jù)變現(xiàn),電信,B域數(shù)據(jù) smarty:/if?>
- 發(fā)布時(shí)間:2016-01-28 14:51
所謂大數(shù)據(jù)變現(xiàn),就是通過(guò)構(gòu)筑大數(shù)據(jù)能力解決提高流程效率與降低成本、提升客戶體驗(yàn)與價(jià)值以及產(chǎn)品創(chuàng)新等關(guān)鍵業(yè)務(wù)問(wèn)題,將數(shù)據(jù)分析能力轉(zhuǎn)化為競(jìng)爭(zhēng)力。對(duì)運(yùn)營(yíng)商而言,其數(shù)據(jù)資產(chǎn)具有用戶量大、數(shù)據(jù)量大、數(shù)據(jù)與業(yè)務(wù)強(qiáng)相關(guān)、時(shí)效性強(qiáng)、精確性高、數(shù)據(jù)價(jià)值高等特點(diǎn),實(shí)現(xiàn)大數(shù)據(jù)資產(chǎn)的運(yùn)營(yíng)和變現(xiàn),對(duì)內(nèi)可以服務(wù)于業(yè)務(wù)運(yùn)營(yíng)決策與超細(xì)分精準(zhǔn)營(yíng)銷(xiāo),對(duì)外可以開(kāi)拓包括廣告投放、店面經(jīng)營(yíng)、企業(yè)選址、O2O位置營(yíng)銷(xiāo)、互聯(lián)網(wǎng)精確營(yíng)銷(xiāo)等在內(nèi)的產(chǎn)品化數(shù)據(jù)咨詢藍(lán)海,是實(shí)現(xiàn)從“電信網(wǎng)絡(luò)運(yùn)營(yíng)商”到“信息運(yùn)營(yíng)商”轉(zhuǎn)型的重要支點(diǎn)。
當(dāng)前從管理到技術(shù)層面,運(yùn)營(yíng)商要實(shí)現(xiàn)從“管理驅(qū)動(dòng)運(yùn)營(yíng)”到“數(shù)據(jù)驅(qū)動(dòng)運(yùn)營(yíng)”的轉(zhuǎn)變都存在許多困難,包括O域(網(wǎng)絡(luò))/B域(計(jì)費(fèi)營(yíng)賬)/M域(ERP)等各域數(shù)據(jù)的割裂、數(shù)據(jù)標(biāo)準(zhǔn)化程度低、管理流程長(zhǎng)、傳統(tǒng)IT架構(gòu)及數(shù)據(jù)策略不適應(yīng)大數(shù)據(jù)要求等。
跨域數(shù)據(jù)采集與整合
傳統(tǒng)的電信經(jīng)營(yíng)分析系統(tǒng)主要處理計(jì)費(fèi)清單、客戶業(yè)務(wù)訂購(gòu)關(guān)系以及業(yè)務(wù)平臺(tái)使用數(shù)據(jù),采用文件批處理的方式進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的ETL處理,不能適應(yīng)整合接入毫秒級(jí)的網(wǎng)絡(luò)側(cè)海量信令與位置數(shù)據(jù)的要求。因此,需采用“分布式文件存儲(chǔ)+分布式計(jì)算”技術(shù),以Hadoop為基礎(chǔ)構(gòu)建端到端的云數(shù)據(jù)處理平臺(tái),基于通用X86平臺(tái)端到端支撐ETL和主庫(kù)外匯總計(jì)算,直接對(duì)開(kāi)源Hadoop平臺(tái)進(jìn)行底層優(yōu)化,支持?jǐn)?shù)據(jù)迅猛增長(zhǎng)。
在傳統(tǒng)的B域數(shù)據(jù)(從BSS、CRM等采集)和M域數(shù)據(jù)(從ERP采集)采集平臺(tái)基礎(chǔ)上,還需實(shí)現(xiàn)對(duì)OMC/設(shè)備、參數(shù)、信令、撥測(cè)等數(shù)據(jù)的統(tǒng)一采集與管控,通過(guò)Gn口采集數(shù)據(jù)業(yè)務(wù)信令合成xDR詳單,對(duì)語(yǔ)音行為、位置分析則通過(guò)采集A口或MC口信令實(shí)現(xiàn)。
“平臺(tái)+MPP數(shù)據(jù)庫(kù)”等傳統(tǒng)電信架構(gòu)具有實(shí)時(shí)性高、研發(fā)成本低、可以實(shí)現(xiàn)復(fù)雜業(yè)務(wù)邏輯等優(yōu)點(diǎn),但關(guān)系數(shù)據(jù)模型固有的不能直接處理非結(jié)構(gòu)化數(shù)據(jù)的缺點(diǎn)導(dǎo)致其不適用于大數(shù)據(jù)環(huán)境。
“高性能硬件+SMP數(shù)據(jù)庫(kù)”因成本昂貴和線性擴(kuò)展能力差已較少在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境下采用,“X86平臺(tái)+MPP數(shù)據(jù)庫(kù)”則可與Hadoop分布式系統(tǒng)(X86平臺(tái)+HDFS分布式文件系統(tǒng))組成混搭方案,利用非關(guān)系模型編程靈活和分布式系統(tǒng)擴(kuò)展能力強(qiáng)的優(yōu)勢(shì)支持高效低成本的系統(tǒng)搭建。
No SQL數(shù)據(jù)庫(kù)拋棄了關(guān)系數(shù)據(jù)庫(kù)復(fù)雜的關(guān)聯(lián)操作、事務(wù)處理等功能,僅提供簡(jiǎn)單的鍵值對(duì)(Key,Value)數(shù)據(jù)的存儲(chǔ)與查詢,換取高擴(kuò)展性和高性能??梢隢o SQL技術(shù),把以寫(xiě)為主數(shù)據(jù)集中在RDBS里,以讀為主的數(shù)據(jù)集中在No SQL數(shù)據(jù)庫(kù)中,主數(shù)據(jù)庫(kù)負(fù)責(zé)寫(xiě)操作,從數(shù)據(jù)庫(kù)負(fù)責(zé)讀操作,通過(guò)“讀寫(xiě)分離”提高海量數(shù)據(jù)處理效率。
實(shí)時(shí)數(shù)據(jù)處理
從捕捉客戶網(wǎng)絡(luò)行為數(shù)據(jù)到觸發(fā)營(yíng)銷(xiāo)推薦這一過(guò)程的時(shí)效性,運(yùn)營(yíng)商除了在采集、存儲(chǔ)與處理環(huán)節(jié)運(yùn)用分布式技術(shù)減少時(shí)延外,還可引入流計(jì)算技術(shù)和內(nèi)存數(shù)據(jù)庫(kù),通過(guò)流處理和快速緩存將行為識(shí)別與營(yíng)銷(xiāo)推送時(shí)延縮短至分鐘級(jí)。
Storm是一種開(kāi)源的分布式實(shí)時(shí)計(jì)算系統(tǒng),可簡(jiǎn)單、高效、可靠地處理大量數(shù)據(jù)流。Spark Streaming是基于Spark衍生的開(kāi)源流處理工具,以類(lèi)似批處理方式來(lái)處理這部分小數(shù)據(jù)。內(nèi)存數(shù)據(jù)庫(kù)是將數(shù)據(jù)存儲(chǔ)在內(nèi)存RAM中并進(jìn)行計(jì)算和查詢,充分發(fā)揮多核CPU能力的數(shù)據(jù)庫(kù)管理系統(tǒng),其和流計(jì)算配合用于狀態(tài)和規(guī)則的存儲(chǔ),可優(yōu)化客戶群體的體驗(yàn)。
運(yùn)營(yíng)商大數(shù)據(jù)資產(chǎn)變現(xiàn)還需解決數(shù)據(jù)安全管控、應(yīng)用私有加密內(nèi)容識(shí)別等問(wèn)題,任何一種單一技術(shù)都難以適應(yīng)運(yùn)營(yíng)商全部需求,Hadoop、MPP、流計(jì)算、No SQL和內(nèi)存數(shù)據(jù)庫(kù)等多種技術(shù)并存才是發(fā)展趨勢(shì)。
鄧逸斌 張曉川
