張勝:人工智能服務(wù)聚“核”
- 來源:中國(guó)信息化周報(bào) smarty:if $article.tag?>
- 關(guān)鍵字:創(chuàng)業(yè),機(jī)床,結(jié)論 smarty:/if?>
- 發(fā)布時(shí)間:2015-04-24 09:18
幾個(gè)月前,一條流行于網(wǎng)絡(luò)的山東司機(jī)大哥與其車載智能語音的爆笑對(duì)話視頻,將人們的關(guān)注點(diǎn)再度聚焦至人工智能領(lǐng)域。隨著Magic和Operator國(guó)外走紅,擁有一個(gè)萬能的人工智能助理,只需一條語音就能獲得相應(yīng)服務(wù),是人們夢(mèng)寐以求的場(chǎng)景。依托人工智能技術(shù),“阿拉丁神燈”的故事已演變?yōu)楝F(xiàn)實(shí)。
互聯(lián)時(shí)代和懶人經(jīng)濟(jì)是推動(dòng)人工智能發(fā)展的催化劑,而真實(shí)的用戶體驗(yàn)可以是如山東司機(jī)的惱羞成怒,也可以是完美無縫的“上帝”感受,其背后核心是人工智能交互技術(shù)的儲(chǔ)備實(shí)力。正如靈聚科技創(chuàng)始人張勝所言:“深度語義識(shí)別是每個(gè)智能應(yīng)用必須具備的基礎(chǔ)功能,因技術(shù)不同而效果不同?!?/p>
做機(jī)器人的“大腦”
在人工智能領(lǐng)域,微軟Cortana、蘋果Siri、Google Now備受矚目,一部分源于其“東家”的光環(huán)。而拿技術(shù)說事的張勝帶領(lǐng)著靈聚科技,憑何與其抗衡?
張勝的法寶是“靈聚人工大腦”。這一智能引擎整合了幾十項(xiàng)國(guó)內(nèi)外最先進(jìn)的技術(shù)和學(xué)術(shù)研究成果,并貫通語言學(xué)、心理學(xué)、哲學(xué)等多學(xué)科知識(shí),將算法、數(shù)據(jù)處理技術(shù)與中文語言學(xué)融合,支持自動(dòng)造句,將機(jī)器人主動(dòng)服務(wù)、與人會(huì)話的能力提升至新的高度。
在一個(gè)典型的應(yīng)用場(chǎng)景中,“你知道從廣州到北京的火車有哪些么?”“你知道杜海濤的年齡有多大么?”“你知道湖南有多大么?”針對(duì)第一條語音提問,在其中識(shí)別出關(guān)鍵詞、理解含義、搜索結(jié)果,必須依托智能語音交互技術(shù)。后兩條語音提問同樣問“多大”,一個(gè)是年齡,一個(gè)是面積,如果沒有較強(qiáng)的智能語音技術(shù)支撐,展現(xiàn)的搜索結(jié)果往往是前言不搭后語。
在上下文識(shí)別方面,張勝認(rèn)為靈聚也有獨(dú)到優(yōu)勢(shì)?!办`聚人工大腦”可以通過記憶上文出現(xiàn)的關(guān)鍵詞,來識(shí)別當(dāng)前討論的話題是否是同一話題,或當(dāng)前缺省的關(guān)鍵詞是否是上文關(guān)鍵詞。
此外,“靈聚人工大腦”還可以根據(jù)程序構(gòu)建的關(guān)系網(wǎng)來推導(dǎo)兩個(gè)元素的關(guān)系、進(jìn)行多個(gè)元素屬性的對(duì)比、對(duì)已有數(shù)據(jù)進(jìn)行關(guān)系的判斷等,通過技術(shù)可以拓展到日常更多的應(yīng)用場(chǎng)景,如可通過對(duì)話操控硬件設(shè)備,可通過對(duì)話完成購(gòu)物訂票流程,可通過對(duì)話完成記錄分享等互聯(lián)網(wǎng)體驗(yàn)等,完成機(jī)器與人之間更流暢的對(duì)話。
抓住移動(dòng)終端入口
2014年,靈聚科技推出APP靈聚音樂,以此示范通用的靈聚智能引擎如何通過優(yōu)化支持特定應(yīng)用的。
“它不是一個(gè)完整和完美的產(chǎn)品,只是一個(gè)演示作品?!睆垊?gòu)?qiáng)調(diào),“該版本僅針對(duì)點(diǎn)播音樂和點(diǎn)讀新聞做了功能優(yōu)化,還有很多應(yīng)用場(chǎng)景和功能需求有待發(fā)掘、完善?!蹦壳埃`聚音樂這款A(yù)PP只在騰訊應(yīng)用寶中發(fā)布了體驗(yàn)版。
在智能語音交互這個(gè)領(lǐng)域,市場(chǎng)一度魚龍混雜,一些企業(yè)或自我標(biāo)榜在做大數(shù)據(jù)、云計(jì)算、“互聯(lián)網(wǎng)+”等,但實(shí)際更多停留在概念炒作階段。只有耐得住寂寞,經(jīng)得起誘惑的公司才能成為大浪淘沙之后的金子。
同樣是做語音助手,張勝在分析現(xiàn)有市場(chǎng)及各家產(chǎn)品特點(diǎn)后,得出結(jié)論:“當(dāng)前基于搜索技術(shù)返回結(jié)果,這種方式已趨于成熟,接下來應(yīng)該要基于移動(dòng)互聯(lián)網(wǎng)的特點(diǎn)去做產(chǎn)品?!?/p>
這也是靈聚科技未來研發(fā)的方向。基于移動(dòng)互聯(lián)網(wǎng)時(shí)代特點(diǎn),靈聚科技首先一定是做精準(zhǔn)搜索;其次,未來智能時(shí)代,人機(jī)交互未必要依賴屏幕,更多的應(yīng)該是解放人們的眼睛。因而靈聚科技會(huì)做無屏化智能交互?!拔覀冏畲蟮膬?yōu)勢(shì)就是為目前和可以預(yù)見的未來數(shù)年做實(shí)用性的技術(shù)研發(fā),那些無助于解決實(shí)際問題的思路或者學(xué)術(shù)研究,我們都只是膜拜,而不會(huì)去跟著走?!睆垊俦硎?。
人工智能的科幻未來
在一家光伏企業(yè)的廠房中,工人“悠閑”地操作數(shù)臺(tái)智能機(jī)床。機(jī)床上的機(jī)械手忙碌不停,重復(fù)著抓起電池板放到自動(dòng)流水線上焊接的動(dòng)作。解放人力,替代工人去做危險(xiǎn)或重復(fù)性工作,是現(xiàn)階段人工智能應(yīng)用的典型場(chǎng)景之一。這樣人的智慧將得以解放,用于閱讀、發(fā)想、創(chuàng)新,去做更有創(chuàng)意的事。
鞋子可以成為終端接聽電話,牙齒嵌入芯片就能實(shí)現(xiàn)語音傳輸。這未必是007電影中才有的場(chǎng)景,而是未來人工智能發(fā)展的影子。
“大部分人認(rèn)為手機(jī)是未來各項(xiàng)應(yīng)用的入口?!睆垊俦硎?,“但這種格局有可能被打破。新的信息交互方式可依托全息影像技術(shù),可基于手表、眼鏡這些終端實(shí)現(xiàn),或者像科幻片中的太空飛船操控界面一樣?!?/p>
張勝介紹,靈聚智能助理將是他們即將發(fā)布的新品,是其布局靈聚家用機(jī)器人市場(chǎng)的“熱身戰(zhàn)”。
這款A(yù)PP新品能夠?qū)崿F(xiàn)這些功能:一句話提醒、一句話記賬、不依賴屏幕撥打電話等?!拔磥?,我們還會(huì)加入更多的主動(dòng)服務(wù),不需要用戶開口命令才被動(dòng)響應(yīng),而是依據(jù)用戶的狀態(tài)主動(dòng)提供服務(wù)。目前,我們的產(chǎn)品內(nèi)置程序,可每天主動(dòng)為用戶制作一期音樂專輯?!?/p>
“或許有人認(rèn)為人的作用逐步被機(jī)器替代,而實(shí)際上,在機(jī)器人時(shí)代,人的價(jià)值會(huì)越大,懶蟲除外……”張勝笑談。
創(chuàng)業(yè)語錄
凡走過的必留下痕跡。從媒體到投入游戲行業(yè),再轉(zhuǎn)身鉆研人工智能,張勝在這一過程不斷總結(jié)教訓(xùn)、收獲經(jīng)驗(yàn)。
■十幾年前那會(huì)兒,就有人說,在中關(guān)村,聽說過叫認(rèn)識(shí),見過一面叫做熟悉,吃過一頓飯叫做鐵哥們。
■在信息量過大和機(jī)會(huì)過多的時(shí)候,我們反過來要學(xué)會(huì)尋找到一個(gè)對(duì)自己來講真正是機(jī)會(huì)的方面,去抓住它聚焦它,然后沉下心去做去研究。
■幾乎每天都會(huì)有炒股的朋友告訴我可以買這只可以買那只,其實(shí)我想,買哪只也許現(xiàn)在都可以,但也可能買哪只都不行,因?yàn)槟闳ベI什么,什么有可能就該跌了。
■創(chuàng)業(yè)需要耐得住寂寞,只有做出成績(jī)了,這些別人嘴上的談資才會(huì)自動(dòng)出現(xiàn)在你面前。資源和人脈只能在你做好基礎(chǔ)后,才會(huì)發(fā)芽、開花。
■其實(shí)機(jī)器人時(shí)代,人的價(jià)值會(huì)越大,懶蟲除外……
■北京創(chuàng)業(yè)氛圍非常熱烈,但是同時(shí),我也覺得這種熱烈的氛圍對(duì)年輕人既是一種激勵(lì),也可能會(huì)過猶不及。
■很多時(shí)候我們可能需要得到一些思想,但更多的是要去落實(shí)。
相關(guān)鏈接
Siri背后的機(jī)遇和機(jī)會(huì)
說到智能聊天機(jī)器人,大家的第一反映是Siri。在她誕生的年代,背后還沒有太多可供在線連接的服務(wù)。而今天,你除了跟她閑聊,也終于可以對(duì)Siri說:“給我派個(gè)美甲師來?!?/p>
Siri的成功彰顯了喬布斯當(dāng)年的遠(yuǎn)見卓識(shí)。即便是現(xiàn)在的Magic和Operatory也未能跳脫喬布斯最初的布局。唯一的區(qū)別是,今天我們要的不僅僅是蘋果的Siri,而是每個(gè)APP都要有自己的Siri。并且,未來每個(gè)APP都可以輕松集成自己的Siri。
而對(duì)于那些緊隨Siri腳步的后來者,未來在三個(gè)領(lǐng)域會(huì)有機(jī)會(huì)。一是即時(shí)通訊管道,二是客服后臺(tái)軟件,三是智能聊天機(jī)器人。
本報(bào)記者 洪蕾
