數(shù)據(jù)優(yōu)化運(yùn)營
- 來源:中國信息化周報(bào) smarty:if $article.tag?>
- 關(guān)鍵字:聯(lián)想,Hadoop技術(shù),互聯(lián)網(wǎng),大數(shù)據(jù) smarty:/if?>
- 發(fā)布時(shí)間:2016-10-25 10:19
聯(lián)想電商數(shù)據(jù)內(nèi)循環(huán)優(yōu)化到分鐘級,中國航天衛(wèi)星數(shù)據(jù)傳輸提速十幾分鐘,企業(yè)數(shù)據(jù)“循環(huán)、優(yōu)化、流轉(zhuǎn)”,一氣呵成;敏捷BI與數(shù)據(jù)探索式分析完美結(jié)合,大顯神通;新形勢下,利用Hadoop新技術(shù)、數(shù)據(jù)優(yōu)化商業(yè)運(yùn)營等手段,完成產(chǎn)業(yè)的創(chuàng)新與提升。
如今,亞馬遜可以做到顧客還沒有下單,就可以知道顧客想買什么東西,并且已經(jīng)開始準(zhǔn)備出貨。眾所周知,亞馬遜是美國做得最好的電子商務(wù)平臺,它是怎么做到的呢?主要由于亞馬遜充分利用了各個(gè)消費(fèi)者在網(wǎng)站上購買的消費(fèi)記錄,用大數(shù)據(jù)分析的方法進(jìn)行預(yù)測。大數(shù)據(jù)可以給企業(yè)帶來很大好處、很多便利?;蛟S這就是數(shù)據(jù)優(yōu)化商業(yè)運(yùn)營的奧秘……
如果現(xiàn)在買游戲,你只會(huì)到實(shí)體店購買,那就真的落伍了,這就好像如今買手機(jī)只會(huì)用來發(fā)短信、打電話一樣。
幾年前BT下載發(fā)明者親自開發(fā)設(shè)計(jì)Steam游戲平臺,到現(xiàn)在用戶已經(jīng)超過2億,如果說移動(dòng)市場的游戲平臺老大是AppStore,那么PC市場游戲的老大就是Steam平臺,它的存在讓其他的游戲平臺只有抬頭仰望的資格。相關(guān)數(shù)據(jù)顯示,截止到2016年9月底,國內(nèi)Steam激活用戶已經(jīng)超過1000萬人。
這對于國內(nèi)游戲行業(yè)有什么可以借鑒的地方?答案很簡單,平臺技術(shù)足夠成熟,市場運(yùn)營足夠潮流就能做到。其實(shí),大數(shù)據(jù)的“新命門”也在于此,讓我們看看幾方面的案例。
目前,以Hadoop為代表的一系列開源軟件是大數(shù)據(jù)技術(shù)快速發(fā)展的核心推動(dòng)力,其發(fā)展空間更是驚人。據(jù)Technavio報(bào)告:2015至2019年間,全球Hadoop市場布局將以年復(fù)合增長率超過53%的速度擴(kuò)張,Hadoop市場和其相關(guān)的硬件、軟件以及服務(wù)將在2020年創(chuàng)下502億美元的效益。
盡管Hadoop的安全問題有待提高,但它一方面解決了傳統(tǒng)數(shù)據(jù)庫無法勝任海量數(shù)據(jù)處理的問題,另一方面基于該平臺的一系列更具深度的智能分析技術(shù)和工具得以不斷發(fā)展的現(xiàn)實(shí)也是不容忽視的,是大數(shù)據(jù)技術(shù)邁向成熟的必經(jīng)階段。
例如,Google公司曾經(jīng)成功預(yù)測了流感的發(fā)生,現(xiàn)在我們知道流感要來了,是通過疾病預(yù)防中心或者是各個(gè)醫(yī)院的報(bào)道,因?yàn)楹芏嗷颊叨紒泶筢t(yī)院就醫(yī),并且發(fā)燒、感冒,這往往是在兩周時(shí)間以后我們才能知道流感要來了。
但是Google公司通過大量的用戶使用數(shù)據(jù),歷史的搜索記錄在流感爆發(fā)之前,在很多人搜索感冒發(fā)燒應(yīng)該吃什么藥的時(shí)候進(jìn)行數(shù)據(jù)總結(jié),成功預(yù)測流感即將發(fā)生,這是大數(shù)據(jù)技術(shù)基于Hadoop,通過深度分析帶來的生活便利……
近年來,“大數(shù)據(jù)”日益成為國家基礎(chǔ)性戰(zhàn)略資源,其所蘊(yùn)藏的巨大潛力和能量在各行各業(yè)不斷積蓄的同時(shí),整個(gè)數(shù)據(jù)行業(yè)的技術(shù)基礎(chǔ)和實(shí)踐能力也獲得了長足的提升,對于數(shù)據(jù)分析和應(yīng)用能力在不少行業(yè)案例中都得到了良好的展現(xiàn)。
單就運(yùn)營而論,數(shù)據(jù)作為一種度量方式,能夠真實(shí)地反映運(yùn)營狀況,幫助我們進(jìn)一步了解產(chǎn)品、了解用戶、了解渠道進(jìn)而優(yōu)化運(yùn)營策略是其快速發(fā)展的根本動(dòng)因。
通過數(shù)據(jù)分析的結(jié)果來驅(qū)動(dòng)運(yùn)營方式,最終幫助運(yùn)營者乃至企業(yè)決策者憑借數(shù)據(jù)敏感性和邏輯分析能力指導(dǎo)業(yè)務(wù)實(shí)踐十分重要。
卓越集團(tuán)戰(zhàn)略與運(yùn)營管理部針對深圳數(shù)據(jù)中心項(xiàng)目商業(yè)場景進(jìn)行了更精準(zhǔn)的分析:寫字樓下面的商場,周一到周五人流量非常大,周六周日流量非常少。周一到周五,有多少人沒來這里而去了別的地方,把周邊競品拉出來看去了哪些品牌,然后進(jìn)行分析調(diào)整;關(guān)于節(jié)假日引流問題,節(jié)假日在周邊小區(qū)的客戶沒有挖掘,相關(guān)的觸達(dá)和流動(dòng)非常差,進(jìn)而從招商和運(yùn)營兩個(gè)環(huán)節(jié)做了一些運(yùn)營優(yōu)化,可見數(shù)據(jù)指導(dǎo)運(yùn)營實(shí)踐的可行性。
至此,《中國信息化周報(bào)》記者就大數(shù)據(jù)Hadoop以及數(shù)據(jù)優(yōu)化運(yùn)營等方面展開了新一輪的探索。
技術(shù)篇:企業(yè)數(shù)據(jù)也可以循環(huán)利用
眾所周知,數(shù)據(jù)只有流動(dòng)起來才能產(chǎn)生價(jià)值……企業(yè)的數(shù)據(jù)可以總結(jié)為兩個(gè)方面,第一個(gè)方面被稱之為“企業(yè)內(nèi)循環(huán)”,主要涉及到所從事的工作有助于加速企業(yè)提高經(jīng)營效率,完成開源節(jié)流;另一方面叫做“企業(yè)外循環(huán)”,可以理解為通過企業(yè)產(chǎn)品讓用戶形成互動(dòng),進(jìn)而產(chǎn)生海量數(shù)據(jù)。“如果將整個(gè)企業(yè)的外循環(huán)與內(nèi)循環(huán)有機(jī)結(jié)合起來,就形成了企業(yè)的數(shù)據(jù)循環(huán)的一個(gè)體系。”紅象云騰創(chuàng)始人童小軍對《中國信息化周報(bào)》記者表示。
循環(huán)、優(yōu)化、流轉(zhuǎn)一氣呵成
具體來說,對于數(shù)據(jù)分析的基本理念可以理解為“循環(huán)、優(yōu)化、流轉(zhuǎn)”,這是來自對于數(shù)據(jù)統(tǒng)計(jì)分析的一個(gè)理解。童小軍說:“我覺得一個(gè)企業(yè)可以被看作一個(gè)生命體,具有自調(diào)整能力,將下層的產(chǎn)品統(tǒng)計(jì)、運(yùn)維測試等統(tǒng)籌起來實(shí)現(xiàn)了一個(gè)在測的內(nèi)循環(huán),這是來自互聯(lián)網(wǎng)公司的內(nèi)循環(huán)。在外部,我們的產(chǎn)品與用戶形成了企業(yè)的外循環(huán)。例如如果要優(yōu)化產(chǎn)品,我們會(huì)記錄用戶數(shù)、活躍度等,這些數(shù)據(jù)會(huì)源源不斷地更新到我們的產(chǎn)品中,或者我們的系統(tǒng)如果給一個(gè)用戶發(fā)出一個(gè)搜索引擎或者一個(gè)需求,這時(shí)候企業(yè)給他們一個(gè)適時(shí)推薦,這個(gè)也可以稱之為外循環(huán)。”
同樣類似的案例在企業(yè)的質(zhì)量管理中也存在,例如我們經(jīng)常提到的戴明環(huán)等,其中也提到了循環(huán)質(zhì)量優(yōu)化的觀點(diǎn);還有一個(gè)自動(dòng)控制領(lǐng)域也涉及到閉環(huán)控制理論。
在我們的理解中,其實(shí)大數(shù)據(jù)所起到的作用在反饋這個(gè)層面,只有整個(gè)的大數(shù)據(jù)體系形成閉環(huán)的模式才能更好地服務(wù)企業(yè)。
“我們所理解的智能應(yīng)該是一種結(jié)構(gòu),很簡單地被認(rèn)為是一種閉環(huán)的反饋結(jié)構(gòu),而這種結(jié)構(gòu)本身具備了一系列的制度。我們企業(yè)數(shù)據(jù)循環(huán)系統(tǒng)可以釋放整個(gè)數(shù)據(jù)的想象力,關(guān)鍵大數(shù)據(jù)系統(tǒng)要打開關(guān)于數(shù)據(jù)的釋放響應(yīng)空間。其中數(shù)據(jù)循環(huán)、持續(xù)優(yōu)化,高速流轉(zhuǎn),系統(tǒng)穩(wěn)定、開源開放等都是客戶所提出的需求。”童小軍補(bǔ)充道。
如今大家經(jīng)常提起大數(shù)據(jù)Hadoop,分別涉及到化整為零、分片存儲、移動(dòng)計(jì)算、分片處理。因?yàn)榉制鎯σ约盎麨榱愕募夹g(shù),每臺機(jī)器都可以用,這樣就形成了移動(dòng)計(jì)算分塊處理。因?yàn)閿?shù)據(jù)分散的動(dòng)能,就可以將其移動(dòng)到機(jī)器的本地化處理,所以整個(gè)系統(tǒng)會(huì)表現(xiàn)得非常高效。
另外本地化處理與并行可以極大地解決IO問題,帶寬問題以及計(jì)算問題,在集中式機(jī)構(gòu)時(shí)就會(huì)面臨這樣的問題。因?yàn)樽鳛榧惺郊軜?gòu)根本性的一個(gè)性能缺陷在于無法移動(dòng)計(jì)算,就需要把數(shù)據(jù)從集中式的存儲拖拽到擁有計(jì)算的資源中進(jìn)行再次計(jì)算,從而產(chǎn)生了一個(gè)IO瓶頸、帶寬瓶頸以及磁盤瓶頸等。
童小軍在分析大數(shù)據(jù)Hadoop時(shí)說:“通過對分布式計(jì)算的移動(dòng)計(jì)算、化整為零等體系的全面了解,逐漸形成了一整套基于開源的系統(tǒng),這是我們以前基于gedis架構(gòu)的系統(tǒng)。我們可以看到Hadoop生態(tài)圈就像原始森林一樣,從底層的Hadoop等出發(fā),我們可以把它總結(jié)成幾個(gè)層面。
首先是平臺層,其次是結(jié)構(gòu)層、計(jì)算層、展現(xiàn)層以及管理層。其實(shí)開源大數(shù)據(jù)到底是大數(shù)據(jù)推動(dòng)了Hadoop發(fā)展,還是Hadoop推動(dòng)了大數(shù)據(jù)發(fā)展并沒有一致的絕對性,其中都是互相推動(dòng)的過程。我們可以看到整個(gè)Hadoop生態(tài)圈已經(jīng)龐大,其實(shí)開源本身也產(chǎn)生了標(biāo)準(zhǔn)的力量,對大數(shù)據(jù)標(biāo)準(zhǔn)產(chǎn)生帶來了助力。”
極致性能生態(tài)化才是王牌
商務(wù)方面,紅象云騰提出了生態(tài)化的戰(zhàn)略,其中+Hadoop是公司提出的觀點(diǎn),目標(biāo)是服務(wù)更多的集成商,成為生態(tài)一部分。以“+Hadoop”為核心形成整個(gè)生態(tài)圈,進(jìn)而達(dá)到服務(wù)器、各種中間鍵以及相應(yīng)的多角度、全方位服務(wù)。
在大數(shù)據(jù)領(lǐng)域,通過軟硬件一體化,企業(yè)更需要打造極致的性能,紅象云騰在這方面有很多合作伙伴,第一個(gè)是紅旗,另一個(gè)是中太服務(wù)器,組成了紅色數(shù)據(jù)高鐵的紅象。“這個(gè)項(xiàng)目我們完成了將近幾萬億數(shù)據(jù)的快速檢索,當(dāng)然這里還有其他的核心作用,我們叫做chinaRedoop,紅象的超級數(shù)據(jù),形成了整個(gè)優(yōu)化的產(chǎn)品站、128線程,紅象云騰今后的目標(biāo)是對更多的CPU進(jìn)行更進(jìn)一步的加速,進(jìn)而形成打造極致的性能。”童小軍展望生態(tài)化戰(zhàn)略時(shí)表示。
企業(yè)通過與硬件廠商的合作,可以提煉成一個(gè)庫,叫做Hadoop處理加速庫,同時(shí)加速庫也可以提煉為一個(gè)觀點(diǎn),叫做HPU。
其關(guān)鍵的作用主要是實(shí)現(xiàn)在Hadoop框架下多種項(xiàng)目的加速,例如EC、SORT等都可以通過這個(gè)方式來完成加速。其中涉及幾個(gè)性能指標(biāo),通過與Java、X86、IBM相比,提速將近有30倍以上。
童小軍認(rèn)為在加速庫的角度,紅象云騰早已進(jìn)行了極致的分析,目前通過全面合作的策略,已與兩款國內(nèi)的大數(shù)據(jù)軟件,分別是YDB和kylin完成合作,哪怕是在kylin檢索上千億數(shù)據(jù)也是可以完成的。這個(gè)打破了Hadoop在高速檢索速度慢的怪圈,原因在于這其中所有的數(shù)據(jù)庫并不是直接拷貝到硬盤上。
應(yīng)用案例不勝枚舉
說到數(shù)據(jù)循環(huán)的成功案例,也是不勝枚舉。例如,聯(lián)想電商,這套系統(tǒng)其實(shí)非常符合數(shù)據(jù)循環(huán)系統(tǒng)的理念。在聯(lián)想主要包含兩套循環(huán),一個(gè)是內(nèi)循環(huán),一個(gè)是外循環(huán)。特別的是,內(nèi)循環(huán)已經(jīng)優(yōu)化到分鐘級,在進(jìn)行關(guān)鍵業(yè)務(wù)的廣告投放時(shí),或者進(jìn)行關(guān)鍵活動(dòng)的決策時(shí),都依賴這個(gè)系統(tǒng),另外在穩(wěn)定性,系統(tǒng)穩(wěn)定性檢測也依賴這個(gè)系統(tǒng)。
另外,中國航天如今已經(jīng)有5個(gè)PB的上線,這也是紅象云騰提供的機(jī)房整套建設(shè),一百多個(gè)節(jié)點(diǎn)的部署情況的展現(xiàn)。整個(gè)平臺性能指標(biāo)主要在IO密度上需要衛(wèi)星的數(shù)據(jù)傳輸過來,通過Hadoop可以做什么呢?對于簡單的做圖,以前第一期投入就需要八千多萬,這套系統(tǒng)投入才兩千多萬,而且數(shù)據(jù)提速到十幾分鐘就可以得到,效率大大提升。
另外,目前紅象云騰正在跟蹤包含交通部門、公安部門等在內(nèi)的相關(guān)數(shù)據(jù),其中涉及大量數(shù)據(jù)分析場景。例如公安部門有一整套關(guān)于快速結(jié)合算法,快速計(jì)算同行和同住人員以及大情報(bào)的數(shù)據(jù)分析架構(gòu)收效顯著。
對于“大數(shù)據(jù)+交通”的理解,核心的需求是這樣的。審計(jì)交通部門需要路面的數(shù)據(jù),以及GPS信息數(shù)據(jù)甚至包括橋梁數(shù)據(jù)。
在這個(gè)過程中需要檢測某些大型車輛是否進(jìn)入安全區(qū),對于橋梁的承載載重問題,是否需要設(shè)置車輛靠近時(shí)進(jìn)行報(bào)警,提示是否需要進(jìn)入該區(qū),或者已經(jīng)進(jìn)入危險(xiǎn)區(qū)域等。
另外基于橋梁的數(shù)據(jù),橋梁的各種各樣傳感器,包括溫度傳感器、壓力傳感器來識別這個(gè)橋梁是不是正常等情況,這其實(shí)是一種創(chuàng)新。
面對未來的大數(shù)據(jù)發(fā)展以及企業(yè)數(shù)據(jù)循環(huán),童小軍說:“我們在設(shè)想將虛擬世界中的某些嘗試?yán)氍F(xiàn)實(shí)世界,在大數(shù)據(jù)平臺上是不是可以增加虛擬因素?將以前用的三維、多維引擎植入數(shù)據(jù)中,形成對大數(shù)據(jù)系統(tǒng)的三維后臺式模擬。這也是我們提出來的一套關(guān)于大數(shù)據(jù)的基礎(chǔ)架構(gòu),更是基于內(nèi)循環(huán)、外循環(huán)、高速數(shù)據(jù)交換的理念。”
在人才的戰(zhàn)略部署方面,紅象云騰有一個(gè)極致人才戰(zhàn)略,叫做“百校千企”。具體內(nèi)容是面向一百所高校提供大數(shù)據(jù)的課程以及平臺,同時(shí)面向Hadoop,面向有關(guān)企業(yè)提供大數(shù)據(jù)人才,并做到運(yùn)營開放實(shí)驗(yàn)室。借此希望把開源技術(shù)、開放技術(shù)推向更多的大數(shù)據(jù)系統(tǒng),進(jìn)而完成各種方面的加速工作。
運(yùn)營篇:大數(shù)據(jù)運(yùn)營商們的“絕活兒”
如今基本上所有人都達(dá)成了共識,大數(shù)據(jù)給運(yùn)營商帶來了革命性的影響,而數(shù)據(jù)資產(chǎn)在運(yùn)營商的運(yùn)營中扮演著越來越重要的角色。隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)慢慢變成企業(yè)最重要的、最高價(jià)值的資產(chǎn)之一,所有業(yè)務(wù)的升級轉(zhuǎn)型都離不開數(shù)據(jù)的支持,所以IT部門在數(shù)據(jù)時(shí)代慢慢從成本中心向利潤中心轉(zhuǎn)變。在這個(gè)過程中同時(shí)也幫助了運(yùn)營商與相關(guān)企業(yè)完成自己的業(yè)務(wù)形態(tài)轉(zhuǎn)型。
北京永洪商智科技發(fā)展公司高級副總裁王桐表示,通過數(shù)據(jù)都能做出怎樣的事情,產(chǎn)生怎樣的價(jià)值,同時(shí)應(yīng)該怎樣更好地去運(yùn)用數(shù)據(jù)……成為關(guān)鍵的幾個(gè)問題。除此之外,通過數(shù)據(jù)化的運(yùn)營,將改變以往決定戰(zhàn)略和決策的思維模式。以前經(jīng)常是通過業(yè)務(wù)經(jīng)驗(yàn)來做相應(yīng)的決策,不管是宏觀的、戰(zhàn)略的,還是和具體的某些執(zhí)行相關(guān)。
數(shù)據(jù)本身通過這種客觀,如實(shí)的證據(jù)幫我們提供了一個(gè)量化決策支持的基礎(chǔ)。通過這樣的基礎(chǔ)支持,幫助更好地完成決策的事情。所以,對于企業(yè)戰(zhàn)略的定義,還是未來的走向,具備數(shù)據(jù)的支撐是非常重要的。在存量的時(shí)代,數(shù)據(jù)資產(chǎn)化、決策數(shù)據(jù)化才是整體的趨勢。
運(yùn)營數(shù)據(jù)難題多
過去幾年大數(shù)據(jù)領(lǐng)域的熱門話題多是集中在基礎(chǔ)架構(gòu)方面,近年來伴隨著相關(guān)底層技術(shù)的逐漸成熟與豐富,在數(shù)據(jù)的底層的基礎(chǔ)建設(shè)的問題上不再困難。“如今大家都不約而同地思考更進(jìn)一步的問題,這些保存下來的數(shù)據(jù),其價(jià)值產(chǎn)出如何,怎么在業(yè)務(wù)場景中體現(xiàn)價(jià)值,如何對外輸出和變現(xiàn)……這些都成了用戶乃至企業(yè)的管理者們共同思考的問題。”王桐對《中國信息化周報(bào)》記者說。在這個(gè)過程中,同樣產(chǎn)生了很多有創(chuàng)意的業(yè)務(wù)形態(tài)與想法,現(xiàn)在數(shù)據(jù)的價(jià)值在于如何通過數(shù)據(jù)達(dá)到更精準(zhǔn)的運(yùn)營、更有效的管理以及更加全面的集團(tuán)企業(yè)監(jiān)控,才是數(shù)據(jù)價(jià)值所主要遵循的三個(gè)方向。
在每一個(gè)方向中,實(shí)際有很多具體的細(xì)分場景。例如更精準(zhǔn)的運(yùn)營,可能會(huì)與用戶畫像、用戶活躍度等密切相關(guān),其中更有效的管理可能偏向內(nèi)部執(zhí)行層面,更全面的監(jiān)控是指偏財(cái)務(wù)審計(jì)與管理層面。在這些不同的業(yè)務(wù)層面,其實(shí)數(shù)據(jù)都能夠切入每一個(gè)具體的業(yè)務(wù)場景中,通過數(shù)據(jù)化的指標(biāo)幫助完成監(jiān)控。不管是運(yùn)營還是管理,還是業(yè)務(wù),成效如何主要通過數(shù)據(jù)化的KPI來監(jiān)控。很多時(shí)候,業(yè)務(wù)本身就是通過數(shù)據(jù)進(jìn)行包裝組合的利用,最后構(gòu)成了服務(wù)的一部分,甚至是產(chǎn)品的一部分。
但在今天,所有的運(yùn)營商,包括所有的行業(yè)企業(yè)都會(huì)在運(yùn)營方面遇到各種各樣的難題。例如,我們經(jīng)常會(huì)發(fā)現(xiàn)運(yùn)營商的報(bào)告,在內(nèi)容和數(shù)據(jù)分析等菜單項(xiàng),實(shí)際上存在大量的重復(fù)??磾?shù)據(jù)的過程其實(shí)是感知業(yè)務(wù)、發(fā)現(xiàn)問題,并且思考邏輯、找到答案、采取行動(dòng)的過程。如果所看的分析內(nèi)容,實(shí)際有很多冗余,這就會(huì)對分析與思考的過程帶來很糟糕的用戶體驗(yàn),耽誤效率的同時(shí)還造成成本的浪費(fèi)。
在探討運(yùn)營難題時(shí),王桐說:“現(xiàn)在絕大部分的數(shù)據(jù)分析系統(tǒng),或者是VI系統(tǒng),底層還是上一代的傳統(tǒng)架構(gòu),是基于立方體的技術(shù)底層,它的特點(diǎn)是相對比較零散和固定,往往是一個(gè)需求對應(yīng)一個(gè)數(shù)據(jù)模型,模型中的分析和計(jì)算方式只滿足了一次的需求的實(shí)現(xiàn)。和客戶交流的過程中,會(huì)發(fā)現(xiàn)有的客戶的數(shù)據(jù)倉庫中有幾百個(gè)模型,甚至多達(dá)上萬個(gè),后果是數(shù)據(jù)倉庫復(fù)雜到不可維護(hù),性能的損耗相當(dāng)嚴(yán)重,不但帶來了不可維護(hù)性,而且也給用戶非常差的體驗(yàn)。”
通過觀察多家企業(yè)的數(shù)據(jù)分析系統(tǒng),我們總結(jié)出其中的統(tǒng)計(jì)數(shù)據(jù)依然占比很高,明晰偏少。實(shí)際上,對于數(shù)據(jù)分析的操作過程相對比較復(fù)雜,而且數(shù)據(jù)的目錄結(jié)構(gòu)也很難梳理,最終表現(xiàn)出來的問題看起來很零散,問題表現(xiàn)的背后實(shí)際上還是過去做數(shù)據(jù)分析的思路與邏輯的詬病。
探究其問題的本質(zhì),IT資源往往是有限的,如果負(fù)擔(dān)過重,資源會(huì)變成瓶頸。數(shù)據(jù)分析雖然只是一個(gè)詞,但實(shí)際上卻涉及了一個(gè)完整的鏈條,從數(shù)據(jù)的整合、清洗、加工、建模、分析、展現(xiàn),輸出,還有挖掘和深度分析,整個(gè)鏈條涉及到了很多方面,管理難度非常大。目前很多場景對大數(shù)據(jù)的應(yīng)用還不夠靈活高效,往往以固定報(bào)表為主,數(shù)據(jù)的展示只是起點(diǎn),而不是終點(diǎn),所以對數(shù)據(jù)的分析和利用絕對不是做一個(gè)靜態(tài)報(bào)告就結(jié)束了,后續(xù)還有很多工作要做。
如今大多數(shù)情況下大數(shù)據(jù)的價(jià)值產(chǎn)出與預(yù)期可能并不匹配。如何讓數(shù)據(jù)真正促進(jìn)業(yè)務(wù),真正產(chǎn)生價(jià)值的變現(xiàn),并且讓產(chǎn)生價(jià)值的過程高效,是值得探討的問題。
敏捷BI+探索式分析大顯神通
業(yè)界權(quán)威的IT機(jī)構(gòu)Gartner撰寫了商業(yè)報(bào)告,證明敏捷型BI以及探索式的分析已成為大勢所趨。許多企業(yè)中,無論是信息部門,還是業(yè)務(wù)部門,兩者都在呼吁能不能成為數(shù)據(jù)分析過程中的協(xié)作角色,使IT部門可以充分完成底層的數(shù)據(jù)模型建設(shè)后,將剩下90%的常用需求讓業(yè)務(wù)部門“上手”,這樣可以讓業(yè)務(wù)部門自己進(jìn)行服務(wù)分析。
“無論是國外還是國內(nèi),實(shí)際上越來越多傳統(tǒng)的、完全以IT為中心的BI平臺正在逐漸被新型平臺所補(bǔ)充,甚至被取代。最新的BI的報(bào)告中,這種敏捷型,探索式的BI也是不夠的。眾所周知,數(shù)據(jù)分析是一個(gè)完整的鏈條,必須要移動(dòng)到一站式的大數(shù)據(jù)平臺,這將會(huì)是未來各個(gè)企業(yè)的標(biāo)配。”王桐補(bǔ)充道。
探索式分析可以讓業(yè)務(wù)部門也能輕松做數(shù)據(jù)分析,實(shí)際上只做BI類偏描述型的分析也是不夠的。如果需要做用戶畫像,收入預(yù)測,或者是電子商城商品的關(guān)聯(lián)交易分析,以及其它機(jī)器學(xué)習(xí)等相關(guān)分析的話,還是需要深度分析的,所以深度分析與企業(yè)級的管控等四部分有機(jī)融合在一起就構(gòu)成了一站式的大數(shù)據(jù)分析平臺。敏捷型數(shù)據(jù)分析,會(huì)進(jìn)一步釋放數(shù)據(jù)價(jià)值。數(shù)據(jù)分析做到更敏捷,需要提供更好的洞察力,如今很多行業(yè)的客戶已經(jīng)開始采用一站式大數(shù)據(jù)平臺來完善、提升大數(shù)據(jù)運(yùn)營能力。
王桐在交談中提出:“現(xiàn)在是存量的競爭時(shí)代,以用戶畫像舉例。用戶畫像歸根結(jié)底是要對用戶有更深刻的了解,因?yàn)榇蠖鄷r(shí)候電子商城也有第三方的產(chǎn)品和自由服務(wù),邏輯過程比較類似。做用戶畫像,更深地了解用戶和C端的消費(fèi)者,對研發(fā)設(shè)計(jì)人員,或者電子商城的選品,以及產(chǎn)品和服務(wù)的設(shè)計(jì)人員來講,會(huì)有很關(guān)鍵的指向作用。以前是基于自己的經(jīng)驗(yàn)去設(shè)計(jì)新產(chǎn)品和服務(wù),設(shè)計(jì)好后,再推銷出去,這是過去閉門造車的做法;好的做法是先調(diào)查用戶的需求與喜好,再結(jié)合需求與喜好來設(shè)計(jì)套餐和選品。”
另外針對營銷人員,面對產(chǎn)品和服務(wù),明確針對不同的用戶賣什么產(chǎn)品,才能更有效達(dá)成交易,這個(gè)精準(zhǔn)營銷的過程,對于營銷人員比較關(guān)鍵。例如,想生產(chǎn)將年輕女性作為用戶群的電視,需要做的事情是要先了解年輕女性對電視的需求和喜好是什么,進(jìn)而指導(dǎo)設(shè)計(jì)。一方面去計(jì)算過去有多少年輕用戶購買了這種功能的電視,另外在輿情調(diào)查上又有多少人討論與電視相關(guān)的問題,盡管這部分權(quán)重比較低,但也會(huì)綜合考慮,最后將兩者數(shù)據(jù)結(jié)合在一起。如果除了功能訴求外,像顏色、尺寸、價(jià)格都有數(shù)據(jù)統(tǒng)計(jì),就會(huì)在發(fā)現(xiàn)消費(fèi)者需求的時(shí)候,迅速滿足客戶需要。
總結(jié)來講,如今對于數(shù)據(jù)分析,人們已經(jīng)不再停留在初期的摸索階段,實(shí)際上很多的問題都已經(jīng)得到了有效解決,現(xiàn)在面對的是如何做有價(jià)值的利用,并且讓這個(gè)利用的過程變得更加容易和高效。
記者手記
借用《雙城記》那段經(jīng)典的開場白:這是一個(gè)最好的時(shí)代,這是一個(gè)最壞的時(shí)代。對于運(yùn)營商這樣天生依靠人口紅利、規(guī)模紅利的企業(yè),未來在大數(shù)據(jù)的浪潮中或許并不容易翻云覆雨,真的需要數(shù)據(jù)優(yōu)化運(yùn)營的種種“絕活兒”才可以始終立于不敗之地。數(shù)字化運(yùn)營,至少有三件事可以做,分別是盤點(diǎn)數(shù)據(jù)資產(chǎn),建立計(jì)算能力,開放數(shù)據(jù)平臺。
談及大數(shù)據(jù)Hadoop,今天Hadoop主要應(yīng)用場景集中在技術(shù)處理上,但是已經(jīng)有一部分的應(yīng)用開始偏向機(jī)器學(xué)習(xí)。例如有的IT廠商與合作伙伴開始嘗鮮,利用Hadoop技術(shù)來處理數(shù)據(jù)的高級分析,從大數(shù)據(jù)中挖掘出有價(jià)值的數(shù)據(jù),相信未來Hadoop生態(tài)系統(tǒng)的發(fā)展會(huì)卓有成績。
■本報(bào)記者 劉晶晶
