亚洲,欧美,中文字幕,小婕子伦流澡到高潮视频,无码成人aaaaa毛片,性少妇japanesexxxx,山外人精品影院

融合開源 讓大數(shù)據(jù)分析更具價值

  • 來源:中國信息化周報
  • 關(guān)鍵字:大數(shù)據(jù)分析,Think Big,Hadoop,Spark
  • 發(fā)布時間:2016-06-23 11:05

  當(dāng)前,Hadoop、Spark、Kafka等開源技術(shù)被廣泛用于數(shù)據(jù)湖的建立。例如,數(shù)據(jù)湖能捕獲大量復(fù)雜的數(shù)據(jù),這些數(shù)據(jù)能夠記錄互相關(guān)聯(lián)的商品和制造流程,并跨不同的渠道記錄消費者行為。如此一來,企業(yè)可以對消費者行為做出近實時地響應(yīng),這也是Hadoop一種令人激動的應(yīng)用領(lǐng)域。那么,企業(yè)該如何有效利用開源技術(shù)呢?在近日舉辦的“2016 Teradata大數(shù)據(jù)峰會”上,《中國信息化周報》記者就此采訪了Teradata天睿公司旗下大數(shù)據(jù)服務(wù)公司Think Big的創(chuàng)始人兼總裁Ron Bodkin。

  Think Big公司成立于2010年,致力于提供數(shù)據(jù)科學(xué)與工程服務(wù),是業(yè)內(nèi)首家專注于大數(shù)據(jù)咨詢服務(wù)的公司,支持廣泛的開源解決方案,如Hadoop、HBase、Kafka、Elasticsearch、Cassandra、Hive、Spark和Storm等多種開源技術(shù)。2014年9月,Teradata收購Think Big后,意在借助Think Big專業(yè)的咨詢服務(wù),向客戶提供咨詢建議,幫助他們利用各種開源大數(shù)據(jù)技術(shù),推動業(yè)務(wù)增長。

  “Think Big創(chuàng)立的初衷是要幫助企業(yè)從大數(shù)據(jù)中獲取價值。”Bodkin向記者介紹說,“我們通過把數(shù)據(jù)科學(xué)應(yīng)用于預(yù)測性模型來開展近實時的個性化活動,積極地響應(yīng)問題,結(jié)合新型數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)來獲取信息洞察。”

  Bodkin畢業(yè)于加拿大麥吉爾大學(xué),擁有數(shù)學(xué)和計算機科學(xué)學(xué)士學(xué)位;之后又獲得麻省理工(MIT)的計算機科學(xué)碩士學(xué)位。他曾創(chuàng)立NewAspects公司,向企業(yè)提供面向編程方面的咨詢服務(wù),也曾是B2B應(yīng)用供應(yīng)商C-Bridge的聯(lián)合創(chuàng)始人兼CTO,帶領(lǐng)900人團(tuán)隊成功完成公司上市,后來在Quantcast公司任工程部副總裁,帶領(lǐng)一支數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師團(tuán)隊,利用Hadoop和NoSQL進(jìn)行批處理、支持近實時決策。

  “加入Teradata之后,Think Big的咨詢服務(wù)與Teradata數(shù)據(jù)倉庫、Teradata Aster大數(shù)據(jù)探索以及Hadoop數(shù)據(jù)存儲的技術(shù)產(chǎn)品形成整體優(yōu)勢,強化融合開放的統(tǒng)一數(shù)據(jù)架構(gòu)(UDA),提供整體的大數(shù)據(jù)分析解決方案和服務(wù)。”Bodkin說。

  Think Big通過累積數(shù)年的成功部署經(jīng)驗,積累了豐富的專業(yè)技能,在全球范圍內(nèi),已經(jīng)擁有銀行業(yè)、保險公司、零售業(yè)、汽車業(yè)等客戶,例如樂高集團(tuán)、制造業(yè)的Arena及高科技行業(yè)的西部數(shù)據(jù)等。

  在實際部署中,Bodkin也發(fā)現(xiàn)了許多問題。他看到一些用戶僅僅用Hadoop來替代原有的數(shù)據(jù)庫,也發(fā)現(xiàn)一些客戶把技術(shù)應(yīng)用在錯誤的場景。還有一些客戶猶豫反復(fù),導(dǎo)致未能做好規(guī)劃,造成數(shù)據(jù)冗余,形成數(shù)據(jù)沼澤,一些客戶因為沒有接受過良好的培訓(xùn),而不能完成最佳實踐,更有客戶不知道如何使用這些工具。

  而這些問題Think Big可以給他們提供幫助,Think Big的優(yōu)勢是對眾多開源技術(shù)十分熟悉。Bodkin介紹目前Spark和Hadoop是成熟并且很常用的技術(shù),Cassandra和Kafka也已有一些應(yīng)用場景。

  那么Think Big是如何掌握多種多樣又日新月異的開源技術(shù)呢?“為了保持技術(shù)優(yōu)勢,我們采取很多措施,我們在開源社區(qū)非常活躍,并通過參加一些相關(guān)的會議,跟相應(yīng)技術(shù)人員和同行進(jìn)行互動。當(dāng)重點領(lǐng)域出現(xiàn)新的技術(shù),我們會對這些重點領(lǐng)域的技術(shù)進(jìn)行相關(guān)測試,和社區(qū)以及合作伙伴一起,對新技術(shù)的可行性及價值進(jìn)行判斷。”Bodkin補充說。

  ■本報記者 霍娜

關(guān)注讀覽天下微信, 100萬篇深度好文, 等你來看……