技術(shù)普適,關(guān)鍵在于如何將其優(yōu)化成好產(chǎn)品
- 來源:《第一財(cái)經(jīng)》YiMagazine smarty:if $article.tag?>
- 關(guān)鍵字:優(yōu)化,產(chǎn)品,技術(shù) smarty:/if?>
- 發(fā)布時(shí)間:2024-03-01 19:06
記者/張司鈺編輯/倪妮美編/車玲玲
2023年,ChatGPT掀起了全球AI技術(shù)浪潮。這一輪技術(shù)創(chuàng)新不僅激發(fā)起創(chuàng)投圈的新熱情,還讓硅谷重新成為全球創(chuàng)新的焦點(diǎn),同時(shí)也促使人們更加認(rèn)真地思考技術(shù)與人類的關(guān)系。生成式AI領(lǐng)域逐漸形成了模型層和應(yīng)用層的上下游結(jié)構(gòu)。模型的發(fā)展和應(yīng)用推動(dòng)了整個(gè)行業(yè)的前進(jìn),改變了人們與技術(shù)的互動(dòng)方式。
技術(shù)變革帶來新機(jī)遇,大模型及其落地應(yīng)用的賽道中不乏野心勃勃的創(chuàng)業(yè)者,獵豹移動(dòng)的董事長兼CEO傅盛就是其中一位。2014年獵豹移動(dòng)上市,兩年后,傅盛創(chuàng)辦獵戶星空,專注于服務(wù)機(jī)器人的創(chuàng)新和發(fā)展。在二次創(chuàng)業(yè)的過程中,傅盛對大模型技術(shù)的潛力也有了越來越深刻的理解。Yi 2016年以來,AI技術(shù),尤其是深度學(xué)習(xí)和大模型等領(lǐng)域經(jīng)歷了巨大變革。在獵戶星空創(chuàng)立后這7年中,你的初衷和公司的發(fā)展方向是否發(fā)生過改變?
F我們的初衷始終是創(chuàng)新驅(qū)動(dòng),開發(fā)前沿產(chǎn)品。獵戶星空的產(chǎn)品面臨的挑戰(zhàn)不小,尤其是在產(chǎn)品標(biāo)準(zhǔn)化、場景落地和市場認(rèn)可方面。
去年我才感到市場開始慢慢接受這個(gè)產(chǎn)品,這一年,出現(xiàn)了兩個(gè)重要的變化信號。首先,中小企業(yè)主開始為機(jī)器人買單,特別是經(jīng)濟(jì)型餐廳和酒店。考慮到餐廳的現(xiàn)金流通常很緊張,他們愿意為機(jī)器人投資,說明機(jī)器人的實(shí)用性和經(jīng)濟(jì)效益正在被認(rèn)可。其次,海外市場開始開放,日本和韓國兩個(gè)市場的發(fā)展最為顯著,歐洲和美國也有許多代理商推廣機(jī)器人的銷售。海外市場的主要應(yīng)用場景包括餐廳送餐服務(wù),以及韓國一些教育局推行的小學(xué)機(jī)器人教育項(xiàng)目,日本還在養(yǎng)老院等場景中應(yīng)用機(jī)器人。這些變化表明,機(jī)器人技術(shù)正在從依賴政府支持轉(zhuǎn)向真正的市場化應(yīng)用,且應(yīng)用領(lǐng)域正在不斷拓展。
Yi服務(wù)機(jī)器人是否一定要依賴大模型?還是說針對特定場景的中小型專用模型就足夠了?
F大模型的定義實(shí)際上是技術(shù)局面的一個(gè)概念,指的是使用前所未有的參數(shù)數(shù)量和數(shù)據(jù)量來訓(xùn)練模型。從技術(shù)創(chuàng)新的角度來看,這樣的模型結(jié)構(gòu)是必要的,因?yàn)樗軐?shí)現(xiàn)以往模型無法實(shí)現(xiàn)的功能,如對語義、邏輯的理解和推理能力。但在大模型的范疇內(nèi),究竟機(jī)器人是否需要千億參數(shù)的大模型,這取決于具體應(yīng)用場景和所需的技術(shù)能力。
我們也在訓(xùn)練行業(yè)特定的大模型,但并未投入到千億參數(shù)級別的模型中。大模型的開發(fā)就像是企業(yè)試圖創(chuàng)造一個(gè)愛因斯坦,涉及巨大的成本,包括訓(xùn)練和推理成本。在許多情況下,我們并不需要如愛因斯坦般聰明的復(fù)雜模型,有時(shí)一個(gè)本科生或?qū)?粕墑e的模型就足夠了,這正是百億參數(shù)模型的機(jī)會所在。在機(jī)器人領(lǐng)域,幾十億參數(shù)的模型可能就足夠應(yīng)對陪伴、健康知識科普等特定任務(wù)。
我們確實(shí)需要大模型技術(shù),但是我們正朝著使用垂直領(lǐng)域和小參數(shù)量的大模型的方向發(fā)展,以便使機(jī)器人能夠真正高效地運(yùn)行。
Yi大模型服務(wù)與過去公司為降本增效而投入的數(shù)字化、智能化應(yīng)用有何區(qū)別?
F過去的數(shù)字化主要涉及建立各種系統(tǒng),這些系統(tǒng)雖能展示大量信息,但每次業(yè)務(wù)變更都需要重寫代碼和重新適配,導(dǎo)致了大量工作和所謂的“數(shù)字孤島”。業(yè)務(wù)變化意味著不斷地調(diào)整系統(tǒng)效率提升并不顯著。
有了大模型后,情況發(fā)生了變化。模型能夠理解數(shù)據(jù),當(dāng)業(yè)務(wù)發(fā)生變化時(shí),僅需調(diào)整提問或需求,模型就能自動(dòng)適應(yīng),大大減少了適配工作量。就像從手動(dòng)操作轉(zhuǎn)變?yōu)閾碛幸粋€(gè)聰明的助理,他能根據(jù)業(yè)務(wù)變化自動(dòng)調(diào)整數(shù)據(jù),關(guān)注今天和明天的不同重點(diǎn)。這是大模型時(shí)代的一個(gè)重大進(jìn)步。
Yi你怎么定義數(shù)字員工?
F員工的工作正在發(fā)生變化,人工智能和機(jī)器人不僅替代體力勞動(dòng),現(xiàn)在看來它們也能替代大量重復(fù)的腦力勞動(dòng)。比如整理會議紀(jì)要、制作PPT,甚至編寫部分代碼,這些本不需要過于復(fù)雜的思考的任務(wù),現(xiàn)在都能由機(jī)器完成。數(shù)字員工逐漸成為企業(yè)的標(biāo)準(zhǔn)配置,未來企業(yè)中一半以上的員工可能都是數(shù)字化的。
在硅谷,這種變化已經(jīng)顯現(xiàn)。以前硅谷的創(chuàng)業(yè)公司在獲得投資后會用這些資金去聘請頂尖人才,而現(xiàn)在他們可能將一半的資金用于聘請人才,另一半用于購買專利和提高內(nèi)部流程的效率。
Yi數(shù)字員工這個(gè)賽道已經(jīng)有不少老玩家了,作為較晚切入這個(gè)賽道的公司,你認(rèn)為如今數(shù)字員工前景如何?
F每次技術(shù)變革都可能使之前的積累變得不那么重要。例如,大模型技術(shù)的出現(xiàn)讓所有人回到了同一起跑線,這就是顛覆式創(chuàng)新。
數(shù)字員工是一個(gè)廣泛的概念,不同職位有不同需求,像GPT這樣的模型并不能完全滿足特定崗位比如法務(wù)或財(cái)務(wù)的需求。正如人類員工通過不同的教育和實(shí)踐經(jīng)驗(yàn)逐漸變得成熟一樣,大模型也需要針對特定崗位調(diào)整和適配。未來,數(shù)字員工不僅僅是單一崗位,而是多個(gè)垂直領(lǐng)域的聚合。我們專注于做好幾個(gè)擅長的領(lǐng)域,如云服務(wù)、實(shí)體機(jī)器人的講解,以及服務(wù)領(lǐng)域的人機(jī)溝通。而在養(yǎng)老領(lǐng)域,與老年人的溝通就是一個(gè)巨大的市場機(jī)會。
Yi一些科學(xué)家認(rèn)為,以GPT為代表的自然語言處理大模型并非人工智能的最終形態(tài),最終目標(biāo)可能是具身智能。你同意這種觀點(diǎn)嗎?所謂的多模態(tài)具身智能具體指什么?
F大模型目前只能聽和說,未來,它應(yīng)能看、能感知(比如溫度和物理界限),并具備行走能力,可以在物理空間中自主活動(dòng),這將使它們產(chǎn)生更豐富的思維能力,類似于人類的感官體驗(yàn)。這種全面的具身智能,不僅僅限于文本處理,還包括視覺和其他感官信息的綜合處理,背后模型的智能程度也將遠(yuǎn)超單一語言處理。
雖然大模型技術(shù)已經(jīng)火熱一整年了,但在自動(dòng)駕駛等領(lǐng)域其進(jìn)展并不顯著,技術(shù)原理要在特定領(lǐng)域?qū)崿F(xiàn)存在諸多挑戰(zhàn),如算力成本、使用成本和延時(shí)問題。現(xiàn)有的機(jī)器人在室內(nèi)環(huán)境下表現(xiàn)良好,但將它們應(yīng)用于更復(fù)雜的外部環(huán)境時(shí),技術(shù)實(shí)現(xiàn)將更為復(fù)雜。因此,盡管具身智能的理念已明確,要實(shí)現(xiàn)這一目標(biāo)仍需數(shù)年時(shí)間。
