人工智能第三次發(fā)展浪潮來(lái)襲
- 來(lái)源:中國(guó)信息化周報(bào) smarty:if $article.tag?>
- 關(guān)鍵字:科大訊飛,人工智能 smarty:/if?>
- 發(fā)布時(shí)間:2016-12-15 16:31
——科大訊飛2016年度發(fā)布會(huì)在京舉辦
“人工智能在將來(lái)的5到10年,就像我們現(xiàn)在的水、電和互聯(lián)網(wǎng)一樣,在我們的生活中成為我們的必需品。以語(yǔ)音為主、鍵盤觸摸為輔的人機(jī)交互正逐漸成為剛需,人工智能產(chǎn)業(yè)迎來(lái)第三次發(fā)展浪潮”。11月23日,在人工智能學(xué)科誕生60周年之際,以“人工智能+共創(chuàng)新世界”為主題的科大訊飛2016年度發(fā)布會(huì)在北京國(guó)家會(huì)議中心隆重舉行,科大訊飛董事長(zhǎng)劉慶峰暢談人工智能。
語(yǔ)音識(shí)別與合成
去年,科大訊飛推出的訊飛聽(tīng)見(jiàn)產(chǎn)品,實(shí)時(shí)將語(yǔ)音轉(zhuǎn)寫成文字,速度和準(zhǔn)確率遠(yuǎn)超人工速記,現(xiàn)場(chǎng)識(shí)別正確率達(dá)到99%以上。今年的發(fā)布會(huì)上,訊飛聽(tīng)見(jiàn)進(jìn)行實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫,并以字幕形式呈現(xiàn),再次將這一剛需產(chǎn)品進(jìn)行了推廣。
另外,訊飛聽(tīng)見(jiàn)在實(shí)時(shí)中文語(yǔ)音轉(zhuǎn)寫的基礎(chǔ)上,融合全新的多語(yǔ)種翻譯技術(shù),實(shí)時(shí)將中文演講翻譯成英語(yǔ)、日語(yǔ)、韓語(yǔ)以及維吾爾語(yǔ)并同步展示在大屏幕上,引發(fā)現(xiàn)場(chǎng)的一個(gè)高潮,這也是全球首次基于人工智能技術(shù)的實(shí)時(shí)機(jī)器多語(yǔ)種翻譯技術(shù)在大型活動(dòng)上的展示,準(zhǔn)確率比肩同傳翻譯。
會(huì)上,科大訊飛推出了兩款語(yǔ)音合成技術(shù)相關(guān)的產(chǎn)品——訊飛快聽(tīng)和配音閣。訊飛快聽(tīng)APP,通過(guò)打造個(gè)性化音庫(kù),為用戶提供個(gè)性化語(yǔ)音合成服務(wù),能隨時(shí)隨地朗讀任何文章,并有每日好文推薦,解放雙眼,想聽(tīng)就聽(tīng),滿足用戶個(gè)性化需求,特別是在老人、戀人、兒童等人群有著廣泛的應(yīng)用空間。比如,空巢老人可以每天聽(tīng)到使用自己兒女的聲音播報(bào)的新聞以及生活提醒,拉近時(shí)空距離,增進(jìn)親情。配音閣,致力于為用戶提供智能語(yǔ)音合成、真人配音及各種特色化、個(gè)性化配音服務(wù)。
科大訊飛還發(fā)布了中英互譯神器——“曉譯翻譯機(jī)”和完全自主產(chǎn)權(quán)的智能客服機(jī)器人——曉曼。曉曼機(jī)器人是一款專用于銀行業(yè)務(wù)的接待機(jī)器人,集成了AIUI人工智能技術(shù),以及人臉、聲紋、遠(yuǎn)場(chǎng)識(shí)別等科技,可以識(shí)別已登記過(guò)的顧客、提供個(gè)性化的推薦。目前,已有20多臺(tái)曉曼機(jī)器人在徽商銀行、建設(shè)銀行等地試點(diǎn)上崗,可以獨(dú)立辦理超過(guò)70%的業(yè)務(wù)。
發(fā)布會(huì)上,科大訊飛也展示了訊飛輸入法的新功能:可直接將紙上的文字轉(zhuǎn)錄,并支持手勢(shì)修改。臺(tái)上演示人員先是在一張白紙上手寫了一段“我現(xiàn)在有點(diǎn)緊張,發(fā)布會(huì)結(jié)束后,我晚上請(qǐng)大家吃飯”的文字,然后他舉著這張紙正對(duì)著機(jī)器人說(shuō)“啟動(dòng)拍攝”,機(jī)器在進(jìn)行掃描后迅速將紙上的文字錄入了進(jìn)去。此時(shí)響起了由衷的掌聲。
他接下來(lái)演示如何在這段文字里添加文字。他用手勢(shì)的體感交互在這段文字上進(jìn)行光標(biāo)定位,嵌入了“六點(diǎn)”倆字。然后他手輕輕一劃,屏幕上的文字就被清理干凈。然后他用語(yǔ)音輸入了一長(zhǎng)段文字,先是發(fā)出口令“開(kāi)始聽(tīng)寫”,然后輸入“請(qǐng)慶峰幫我訂好火車票,把慶峰修改成慶豐包子鋪的慶豐,另外請(qǐng)慶峰幫我?guī)б槐緞?chuàng)新者的窘境,把創(chuàng)新者的窘境翻譯成英文,并加上書名號(hào)。”此時(shí),屏幕上根據(jù)口令,將“創(chuàng)新者的窘境”瞬間改成《The Innovator’s Dilemma》,場(chǎng)下頓時(shí)響起如雷掌聲。它不僅能識(shí)別“慶峰”和“慶豐”,還能從一長(zhǎng)串語(yǔ)音中精準(zhǔn)找到書名并根據(jù)指令進(jìn)行修改,著實(shí)讓人吃驚。
科大訊飛輪值總裁胡郁透露了這套輸入法的奧秘:“首先得益于我們領(lǐng)先的離線手寫輸入的引擎,可以讓各種各樣的智能設(shè)備識(shí)別手寫文字。同時(shí),我們知道要完成輸入,必須有一個(gè)確定性內(nèi)容、確定性的功能保證,而語(yǔ)音在達(dá)到99.99%以后,剩下的0.01很難達(dá)到,我們看到,在沒(méi)有觸摸屏的情況下,用上帝賜給我們的自然的雙手(解決了這個(gè)問(wèn)題)。”智能家居
在智能家居方面,科大訊飛推出了新款家庭智能盒子超腦魔盒,想要打造一個(gè)通過(guò)語(yǔ)音控制整個(gè)家具的智能生活。這款超腦魔盒涵蓋了影音、家居、英語(yǔ)學(xué)習(xí)、生活百科等多方面的功能,使之使用的場(chǎng)景基本覆蓋了家居生活的方方面面。而根據(jù)現(xiàn)場(chǎng)的演示情形來(lái)看,超腦魔盒可以通過(guò)語(yǔ)音操控來(lái)支持切換、快進(jìn)等設(shè)置,而且沒(méi)有反應(yīng)與操作的延遲。
當(dāng)然,智能家居并不是一個(gè)新潮的概念,而近年來(lái)也出現(xiàn)了越來(lái)越多的智能家居產(chǎn)品。比如谷歌在今年的年度I/O開(kāi)發(fā)者大會(huì)上,推出了能通過(guò)語(yǔ)音助理“聲控”的Google Home。谷歌是希望用Google Home來(lái)建立一個(gè)生態(tài)系統(tǒng),畢竟在它龐大的系統(tǒng)下,有著YouTube,有著Google Play這樣可以融入到生活中的產(chǎn)品。
智能駕駛
至于智能駕駛領(lǐng)域,科大訊飛則是對(duì)智能車載系統(tǒng)進(jìn)行了升級(jí),推出了全新的飛魚(yú)助理。通過(guò)將遠(yuǎn)場(chǎng)識(shí)別、方言識(shí)別等技術(shù)應(yīng)用于汽車,駕駛者則可以通過(guò)語(yǔ)音進(jìn)行通訊、導(dǎo)航的操作,也可以對(duì)車身進(jìn)行控制和信息查詢。據(jù)透露,科大訊飛目前已與30多個(gè)汽車廠商建立了長(zhǎng)期合作,并已在100多款量產(chǎn)車型中搭載產(chǎn)品。
這套語(yǔ)音識(shí)別系統(tǒng)最大特點(diǎn)是訊飛人工智能在上下文理解方面的表現(xiàn),尤其在汽車?yán)锏恼Z(yǔ)音助手演示,很多時(shí)候,老司機(jī)并沒(méi)有給它明確的指令,但它會(huì)給出一些你想要的結(jié)果。
比如說(shuō)去長(zhǎng)城,它會(huì)問(wèn)你去八達(dá)嶺還是慕田峪長(zhǎng)城;比如你問(wèn)附近有什么酒店,它會(huì)自動(dòng)搜索八達(dá)嶺長(zhǎng)城附近的酒店并給出不同的價(jià)位段;比如你想在車?yán)锫?tīng)一首《甜蜜蜜》,它能夠調(diào)出鄧麗君的,你想聽(tīng)鹿晗版的,它立馬切換,當(dāng)你想聽(tīng)“他和陶喆合唱的”,它會(huì)理解這個(gè)“他”指的是鹿晗,并且調(diào)出鹿晗和陶喆合唱的《請(qǐng)到長(zhǎng)城來(lái)滑雪》;比如你晚上想去“中央財(cái)大”附近吃東西,它會(huì)搜索“中央財(cái)經(jīng)大學(xué)”附近的參觀,你說(shuō)想吃火鍋還想看電影,它就鎖定了大鐘寺的海底撈。
在汽車領(lǐng)域,有著太多的巨頭裹挾著資本與人才融入進(jìn)來(lái),正如今年一直處在輿論浪尖的無(wú)人駕駛。像是特斯拉選擇拋開(kāi)一直合作的無(wú)人駕駛技術(shù)公司,自己投入巨大的人力物力,開(kāi)發(fā)擁有“第5級(jí)自動(dòng)駕駛的能力”的Autopilot2.0;百度從載狗參加駕校測(cè)試,到在烏鎮(zhèn)的互聯(lián)網(wǎng)大會(huì)期間,高調(diào)宣傳“云驍”無(wú)人駕駛汽車,在無(wú)人駕駛領(lǐng)域也力圖謀得一方天下;更有谷歌無(wú)人駕駛汽車,行程已經(jīng)突破了200萬(wàn)英里;Uber的無(wú)人駕駛汽車,也已經(jīng)在美國(guó)上路測(cè)試。
總的來(lái)說(shuō),智能化是汽車領(lǐng)域未來(lái)的方向,而力圖在車載環(huán)境下,通過(guò)語(yǔ)音實(shí)現(xiàn)多種控制的飛魚(yú)助理,也是一種變相的解放駕駛員的智能方式。
科大訊飛的遠(yuǎn)景是人工智能,并且也提出了“訊飛超腦”計(jì)劃,直接對(duì)谷歌大腦和百度大腦發(fā)起挑戰(zhàn)。但更可以明確的是,科大訊飛在發(fā)展人工智能遠(yuǎn)景的同時(shí),把握住了人工智能的落地入口,這就是語(yǔ)音交互,這是比無(wú)人車、機(jī)器人更能呈現(xiàn)人工智能的剛需入口。
谷歌和百度在人工智能、腦科技方面發(fā)力已久,科大訊飛憑什么能挑戰(zhàn)巨頭?劉慶峰認(rèn)為,科大訊飛最大的優(yōu)勢(shì)在于專注,專注于語(yǔ)音交互技術(shù)、專注于語(yǔ)音技術(shù)與智能家居硬件的結(jié)合。
正如劉慶峰所認(rèn)為,人工智能的發(fā)展不會(huì)是一蹴而就的,創(chuàng)業(yè)者要有堅(jiān)守的心態(tài)、毅力和恒心。這一領(lǐng)域未來(lái)的趨勢(shì),是通過(guò)人機(jī)協(xié)同技術(shù),聚焦人類智慧,提高各行業(yè)工作效率。
■本報(bào)記者 霍娜
