讓機器人通過身體認知世界
- 來源:中國報道 smarty:if $article.tag?>
- 關鍵字:機器人,認知,世界 smarty:/if?>
- 發(fā)布時間:2025-03-29 19:30
當前,全球主要經濟體、企業(yè)和研究機構均高度重視具身智能發(fā)展,不斷加大對相關技術領域的研究和對商業(yè)化應用前景的探索。
文 | 《中國報道》記者 王焱
2023年5月,在ITF World 2023半導體大會上,英偉達(NVIDIA)創(chuàng)始人兼首席執(zhí)行官黃仁勛在演講中預測下一個科技浪潮時,提到了一種新型人工智能——“具身智能”。
在2025年央視春晚的舞臺上,十幾個人形機器人身著秧歌服、手持紅手帕登上舞臺,與舞蹈演員們默契配合,上演了一場創(chuàng)意融合舞蹈《秧BOT》。它們動作精準流暢,機械臂靈活揮舞著手帕,步伐與鼓點完美契合,每一個舞步都充滿科技感,贏得了全國觀眾的喝彩。這些人形機器人之所以能夠完成如此復雜精彩的動作,正是得益于具身智能技術。
什么是“具身智能”?
什么是“具身智能”?一般認為,具身智能(Embodied Artificial Intelligence,簡稱“EAI”)是指通過機器人等物理實體與環(huán)境交互,能進行環(huán)境感知、信息認知、自主決策和采取行動,并能夠從經驗反饋中實現(xiàn)智能增長和行動自適應的智能系統(tǒng)。
“具身”是具身智能的必要前提,但“具身”一詞并不只是“具有身體”,而是指身體會參與認知,并影響邏輯判斷的過程。
北京工業(yè)大學教授、北京智同精密傳動科技有限責任公司首席科學家張躍明在接受《中國報道》記者專訪時舉例說,現(xiàn)在的工業(yè)機器人具有身體,但它的身體行動完全是由事先編好的程序控制,一步一步去執(zhí)行,只有簡單的邏輯、判斷能力,不能算是具身智能。
與“具身”相對的概念是“離身”,即認知與身體分離。ChatGPT就是典型的離身智能。離身智能沒有可以感知世界并與之交互的身體,雖然通過采集的海量數據來標記世間萬物,卻無法理解這些文本、圖片在物理交互中真實的意義。當需要處理復雜現(xiàn)實任務時,由于缺少對真實環(huán)境的感知和交互能力,傳統(tǒng)人工智能就很容易發(fā)生誤判。
2021年7月,國外一社交網站用戶分享了一則視頻:他駕駛某款電動車開到一條高速公路時,自動駕駛系統(tǒng)將天空中的滿月錯誤地識別為交通信號燈的黃燈信號,并試圖使原本在高速巡航行駛中的車輛保持減速。
而具身智能則打破了傳統(tǒng)人工智能中“身體”與“大腦”分離的模式,彌補了傳統(tǒng)人工智能對環(huán)境感知和交互能力的不足,使機器能夠像自然生物體一樣,通過其身體與環(huán)境的互動,實現(xiàn)多模態(tài)、多尺度的環(huán)境適應,從而在復雜環(huán)境中自主決策,完成任務。
張躍明認為,具身智能的發(fā)展方向是使其具有類似人類的主觀判斷能力和邏輯推理能力,不僅可以獨立完成以往人類才能勝任的任務,還要能與人協(xié)作共同完成任務。要實現(xiàn)這種智能,不僅靠算法和計算,還需要大數據的支持和具有學習能力。
具身智能機器人在未知的環(huán)境中執(zhí)行物理任務時,更多依賴“感知—行動回路”,即先主動感知環(huán)境、對環(huán)境建模,進而采取行動、進行驗證,并根據結果不斷調整和優(yōu)化自身的行動,從而更高效地完成任務。這個過程很類似人類兒童的學習過程。古人講“知行合一”,具身智能的“知”建立在“行”之上,在具身本體與環(huán)境的交互中實現(xiàn)可持續(xù)的智能進化。
被視作未來實現(xiàn)通用人工智能的
關鍵路徑
具身智能的概念可以上溯到英國科學家艾倫·圖靈于1950年發(fā)表的論文《計算機器與智能》(Computing Machinery and Intelligence)。此時,距離世界上第一臺通用計算機“ENIAC”在美國賓夕法尼亞大學誕生僅過去4年。當時的機器單純依賴預設程序行事,并不具有智能,但圖靈卻在論文中就“機器能否思考”進行了大膽探討。為此,他構想了著名的“圖靈測試”,以驗證一臺機器是否具備能模擬人類的智能。
為了讓機器能夠通過“圖靈測試”,圖靈提出了“學習機器”的概念。他寫道:“與其試圖編程模擬成人大腦,不如模擬兒童大腦。”圖靈提出,通過對“兒童機器”的教育,讓機器最終獲得“成人大腦”。
在論文結尾,圖靈展望了兩條可能的發(fā)展道路:一條是聚焦發(fā)展抽象計算(比如國際象棋)所需的智能;另一條是購買最先進的傳感器,然后教機器聽說,就像教正常的孩子一樣。后來,前一條道路發(fā)展出了離身智能,而后一條道路被認為是具身智能的思想萌芽。
1956年,在美國舉行的達特茅斯會議正式確立“人工智能”這一術語。在人工智能發(fā)展初期,研究主要聚焦于抽象的符號處理和邏輯推理,試圖讓計算機通過程序模擬人類的智能行為,但這種方式在處理實際物理世界的復雜問題時遭遇了困境。
隨著對智能本質研究的深入,一些研究者逐漸意識到,在過去的數億年里,地球上包括人類在內的所有動物都是通過身體體驗逐步產生智能。因此,身體與環(huán)境的交互在智能發(fā)展中起到了關鍵作用,具身智能的理念由此逐漸形成。
20世紀80年代,著名機器人制造專家羅德尼·布魯克斯提出了行為式機器人概念,強調智能是具身化和情境化的,主張應當以“行為”為核心發(fā)展人工智能,為具身智能概念奠定了理論基礎。羅德尼·布魯克斯還親自設計了一個六足步行機器人,通過簡單的行為模塊組合實現(xiàn)了穩(wěn)定的行走,展示了具身智能的可行性,引發(fā)了學界對具身智能的廣泛關注。此后,有更多學者進一步闡明“具身性”對理解智能本質的意義,不斷完善和發(fā)展相關理論。
進入21世紀后,機器人技術、傳感器技術以及機器學習算法迎來快速發(fā)展,為具身智能帶來新的發(fā)展機遇。
在機器人硬件方面,各種類型的機器人不斷涌現(xiàn),從用于工業(yè)生產的固定基座機器人,到適應復雜地形的四足和履帶式機器人,再到模仿人類形態(tài)和行為的人形機器人,機器人的性能和功能得到了極大提升。同時,傳感器技術的進步使得機器人能夠更精確地感知周圍環(huán)境,為其智能決策提供了豐富的數據支持。
在軟件算法層面,機器學習尤其是深度神經網絡(深度學習)的興起,為具身智能的發(fā)展注入了強大動力。深度神經網絡在圖像識別、語音處理等領域取得的巨大成功,被廣泛應用于具身智能系統(tǒng)中,提升了機器人的感知、學習和決策能力。例如,在視覺導航任務中,基于深度學習的算法能夠讓機器人更準確地識別環(huán)境特征,規(guī)劃出合理的行動路徑。
近年來,各種大模型的出現(xiàn),進一步推動了具身智能的發(fā)展。多模態(tài)大模型能夠融合多種感知信息,使機器人具備更強大的感知和理解能力;世界模型則幫助機器人更好地模擬和預測環(huán)境變化,從而作出更具前瞻性的決策。
目前,具身智能機器人已經能夠根據動態(tài)變化的環(huán)境進行自適應決策,并向著能夠完全自主執(zhí)行任務的技術方向發(fā)展。具身智能也被視作未來實現(xiàn)通用人工智能的關鍵路徑。
具身智能時代到來?
當前,全球主要經濟體、企業(yè)和研究機構均高度重視具身智能發(fā)展,不斷加大對相關技術領域的研究和對商業(yè)化應用前景的探索。
2024年4月,美國高校聯(lián)合發(fā)布2024版《美國機器人路線圖:機器人讓明天更美好》,旨在重振美國在機器人技術上的領先地位。該路線圖預測,機器人有可能在未來10年內變得無處不在,并可能在未來數十年內徹底改變全球經濟、社會、政治、環(huán)境和技術格局。
2024年2月,日本豐田研究所公布了一款人形機器人Punyo。該機器人的定位是“幫助人們在家中和其他地方完成日常任務”。因為要進入復雜多變的家庭環(huán)境,因此配備了內置傳感器的柔軟肢體。
2025年2月,特斯拉首席執(zhí)行官埃隆·馬斯克透露,特斯拉將致力于在2025年生產10000部“擎天柱”人形機器人。未來其產量還將進一步提高。預計從2026年開始向第三方售賣。
有消息稱,蘋果公司也正在為其未來的智能家居生態(tài)系統(tǒng)探索人形和非人形機器人。目前這些產品處于早期概念驗證階段,最快可能在2028年或更晚一些實現(xiàn)量產。
中國已經走在具身智能機器人領域的研發(fā)和應用前沿。2025年春晚上人形機器人的舞蹈,不僅展示了中國在機器人領域的技術突破,也標志著具身智能進入應用創(chuàng)新的新階段。這些機器人走紅的同時,全國各地積極布局具身智能產業(yè)。
2025年1月,北京市發(fā)布《北京具身智能科技創(chuàng)新與產業(yè)培育行動計劃(2025—2027年)(征求意見稿)》,計劃培育一批具身智能領域獨角獸企業(yè)、科技型領軍企業(yè)、國家高新技術企業(yè)和專精特新“小巨人”企業(yè)。
北京、山東、重慶等十余個省市將具身智能/人形機器人寫入2025年政府工作報告,并將其作為推動經濟高質量發(fā)展和產業(yè)升級的重要抓手。
據市場監(jiān)管總局數據顯示,截至2024年12月底,全國共有45.17萬家智能機器人產業(yè)企業(yè),注冊資本共計64445.57億元,企業(yè)數量較2020年底增長206.73%,較2023年底增長19.39%,呈穩(wěn)健上揚態(tài)勢。
人形機器人:具身智能的最佳載體
位于北京經濟技術開發(fā)區(qū)的國家地方共建具身智能機器人創(chuàng)新中心(以下簡稱“國創(chuàng)中心”),是中國國內最早聚焦于具身智能機器人核心技術、產品研發(fā)和應用落地的科技企業(yè)之一。
國創(chuàng)中心品牌公關負責人魏嘉星告訴《中國報道》記者,具身智能機器人涵蓋多種類型,可以是人形機器人、固定基座機器人、輪式機器人,也可以是履帶式機器人或者四足機器人。其中,人形機器人是具身智能的最佳載體。不同類型具身智能機器人可以對應不同的應用場景。比如固定基座機器人活動范圍受限但操作精度高,適合用于實驗室和工業(yè)制造;履帶式機器人越野能力強,可適用于野外復雜地形作業(yè);輪式機器人移動效率高,可以用于巡檢。
國創(chuàng)中心2024年8月發(fā)布的具身智能機器人“天軼”,就是一款輪式機器人。“天軼”身高163cm,體重72.5kg,擁有輪式全向移動能力,腿部具備升降功能,可智能適配服務對象的身高和狀態(tài),配合完整雙臂和胸口大屏,能夠實現(xiàn)定位導航、平穩(wěn)移動、自然對話和精細手臂操作,可應用于接待、導覽、咨詢問答、場館介紹等多種場景。通過觀察對象面部動作表情,“天軼”能夠實現(xiàn)精確識別人類情感與情緒,進行更深層次的智能交互。
目前,國創(chuàng)中心還是將人形機器人作為具身智能的重點研發(fā)載體。魏嘉星告訴記者,一個原因是人形機器人能更好地適應人類現(xiàn)有的工作和居住場景;另一個原因是,人形機器人對人類而言更具親和力。
2023年10月20日,工業(yè)和信息化部印發(fā)《人形機器人創(chuàng)新發(fā)展指導意見》,該意見對人形機器人的發(fā)展作出了全面的戰(zhàn)略部署。如今,作為衡量國家科技創(chuàng)新和高端制造業(yè)水平的重要標志,人形機器人已經成為科技競爭的新高地、未來產業(yè)的新賽道。
2024年4月,國創(chuàng)中心發(fā)布了全國首個通用機器人母平臺“天工1.0 LITE”,實現(xiàn)了全球首例純電驅全尺寸人形機器人的擬人奔跑。同年8月,國創(chuàng)中心發(fā)布了“天工1.1 PRO”。“天工1.1 PRO”擁有完整的手臂功能,身高163cm,體重56kg,具有42個自由度,內置多個視覺感知傳感器及六維力傳感器,配備慣性測量單元(IMU)和3D視覺傳感器,每秒可進行550萬億次計算,具有更強的智能交互和任務執(zhí)行能力。
日前,具身智能機器人“天工”已在亦莊供電公司10千伏實訓基地高基配電室展開實地操作。“天工”可在臺階、窄道等地形自如穿梭,手持溫度檢測設備,對高基配電室的多臺電柜進行多點位測溫,執(zhí)行巡檢任務?;陟`巧的上肢能力,“天工”還可操作復雜的245母聯(lián)柜,嚴格按照電力操作規(guī)程操作旋鈕、按鈕,順利完成合閘、分閘等倒閘操作任務。
魏嘉星表示,作為通用機器人母平臺,“天工”將持續(xù)進行技術迭代和功能升級,以適應更多復雜場景,服務于工業(yè)、制造業(yè)、商業(yè)、家庭等多個領域,更好地助力新質生產力的發(fā)展。
