生成式人工智能將如何改變視頻會(huì)議
- 來源:信息化視聽 smarty:if $article.tag?>
- 關(guān)鍵字:人工智能,視頻,會(huì)議 smarty:/if?>
- 發(fā)布時(shí)間:2024-07-19 21:43
雖然視頻會(huì)議已成為主流,但仍未能復(fù)制面對(duì)面互動(dòng)的真實(shí)社交體驗(yàn)。然而生成式人工智能(GenAI)技術(shù)取得的長(zhǎng)足進(jìn)展,為迄今困擾視頻混合會(huì)議的許多問題提供了解決方案。
毫無疑問,GenAI會(huì)使視頻會(huì)議更具效率和吸引力,能夠虛擬模仿現(xiàn)實(shí)生活中的體驗(yàn)。但為了實(shí)現(xiàn)這一目標(biāo),這些功能需要以最小的延遲和實(shí)惠的價(jià)格實(shí)時(shí)提供。這意味著其中一些AI功能必須在連接的端點(diǎn)上可用。
幸運(yùn)的是, 解決方案提供商正在迅速將GenAI集成到視頻會(huì)議平臺(tái)和計(jì)算機(jī)中,以實(shí)現(xiàn)實(shí)時(shí)優(yōu)化、虛擬增強(qiáng)和自動(dòng)化會(huì)議管理。這些發(fā)展為顯著增強(qiáng)客戶混合和虛擬會(huì)議體驗(yàn)鋪平了道路。
面對(duì)面會(huì)議體驗(yàn)
GenAI可以顯著增強(qiáng)虛擬會(huì)議的視頻、音頻和文本體驗(yàn)。在面對(duì)面和遠(yuǎn)程參與者的混合會(huì)議中,由AI提供支持的智能視頻處理可以讓遠(yuǎn)程參與者放大演講者,復(fù)制面對(duì)面會(huì)議的體驗(yàn),而不只是播放整個(gè)會(huì)議室的鏡頭畫面。
神經(jīng)輻射場(chǎng)(NeRF)或類似技術(shù)可以幫助創(chuàng)建遠(yuǎn)程參與者側(cè)面的視圖,動(dòng)態(tài)改變每個(gè)端點(diǎn)的視角。然后,GenAI將其轉(zhuǎn)換為一致的視圖,以統(tǒng)一的尺寸、姿勢(shì)或風(fēng)格顯示所有參與者,以形成身臨其境的體驗(yàn)。此外,如果會(huì)議室中有白板,人工智能可以自動(dòng)檢測(cè)到它,并且書面文本可以轉(zhuǎn)換為可編輯的格式。此外,也可以創(chuàng)建個(gè)人版本用于記筆記。
GenAI 還可以通過音頻和文本為每位會(huì)議參與者(無論是遠(yuǎn)程的還是面對(duì)面的)提供幫助,以最大限度地提高他們的工作效率。該助手可將音頻轉(zhuǎn)換為文本,以創(chuàng)建會(huì)議摘要,甚至?xí)ㄗh參會(huì)者做出相關(guān)響應(yīng)。對(duì)于多語(yǔ)言團(tuán)隊(duì)來說,在這樣一個(gè)可以提供即時(shí)音頻翻譯的助手的幫助下,語(yǔ)言障礙可以得到緩解。
盡管存在幾乎無限的可能性,但當(dāng)今的GenAI受到實(shí)現(xiàn)它的技術(shù)的限制,如果只是通過云端進(jìn)行服務(wù),則不足以發(fā)揮它的強(qiáng)大作用。
擴(kuò)展能力
為了讓 GenAI 充分發(fā)揮其在視頻會(huì)議中的潛力,視頻會(huì)議系統(tǒng)應(yīng)該能夠在端點(diǎn)本身(無論是在個(gè)人計(jì)算機(jī)還是會(huì)議網(wǎng)關(guān)設(shè)備上)執(zhí)行 GenAI 處理,而無需返回云端進(jìn)行處理。
會(huì)議系統(tǒng)是否強(qiáng)大的關(guān)鍵指標(biāo)之一是其擴(kuò)展能力。當(dāng)談到可擴(kuò)展性時(shí),需要明確區(qū)分哪些情況適合集中處理,哪些情況適合邊緣處理,這很重要。
在以下三種情況下,在中心點(diǎn)進(jìn)行集中處理是適合的:
1.分時(shí)
當(dāng)需要輕量級(jí)服務(wù)時(shí),可以交由中央計(jì)算機(jī)處理。中央計(jì)算機(jī)只需其性能容量的一小部分即可輕松處理完畢,例如參與者進(jìn)入房間或取消麥克風(fēng)靜音時(shí)發(fā)出警報(bào),中央計(jì)算機(jī)可以為所有端點(diǎn)提供這些服務(wù),不會(huì)對(duì)使用體驗(yàn)產(chǎn)生影響。
2.資源共享
當(dāng)具有所有端點(diǎn)通用的處理功能時(shí),例如在共享數(shù)據(jù)庫(kù)上搜索。這種情況下,集中共享處理可重復(fù)用于許多或所有端點(diǎn)。
3.信息共享
當(dāng)所有參與者需要共享相同的信息時(shí)。例如,共享白板。
這三種情況適合集中處理,此外的絕大多數(shù)情況更適合邊緣處理。因此為了構(gòu)建可擴(kuò)展的視頻會(huì)議系統(tǒng),使所有參與者都可以使用這些功能,需要將AI功能分布到下游,為不同的節(jié)點(diǎn)配備適當(dāng)?shù)腁I計(jì)算能力。
這將帶來多種好處,例如:
● 延遲——在虛擬會(huì)議中,無論是實(shí)時(shí)翻譯、內(nèi)容創(chuàng)建還是視頻調(diào)整,即時(shí)結(jié)果對(duì)于流暢的交互都是必不可少的。在邊緣設(shè)備上利用GenAI減少延遲,確保流暢的討論和無縫的用戶體驗(yàn),而不會(huì)出現(xiàn)延遲。
● 費(fèi)用—— 對(duì)于許多組織來說,每月訂閱基于云的GenAI工具的成本可能令人生畏。借助滿足各種用戶需求(如聊天、搜索引擎和圖像/視頻創(chuàng)建)的眾多工具,每個(gè)用戶每月的成本可能會(huì)迅速增加數(shù)百美元,從而進(jìn)一步增加預(yù)算。通過將GenAI遷移到用戶的個(gè)人計(jì)算機(jī)或會(huì)議設(shè)備,用戶無需每月訂閱或長(zhǎng)期承諾即可成為工具的所有者,從而提供更可行的解決方案。
● 帶寬和連接性—— 虛擬會(huì)議經(jīng)常受到帶寬短缺的影響,尤其是當(dāng)參與者的互聯(lián)網(wǎng)連接有限時(shí),例如在旅行期間或在偏遠(yuǎn)地區(qū)。基于邊緣的GenAI可以在本地去除不相關(guān)的信息,保證只傳輸相關(guān)和重要的數(shù)據(jù),并實(shí)現(xiàn)不間斷和富有成效的會(huì)議。
● 環(huán)境影響—— 基于云的人工智能處理的影響不容小覷,在此過程中會(huì)產(chǎn)生大量的能源消耗和污染??▋?nèi)基梅隆大學(xué)(Carnegie Mellon University)和Hugging Face公司的研究人員測(cè)量了不同機(jī)器學(xué)習(xí)任務(wù)的碳足跡。他們的研究結(jié)果表明,涉及生成新內(nèi)容的人工智能任務(wù),如文本生成、摘要、圖像標(biāo)題和圖像生成,是最耗能的。研究結(jié)果表明,最耗能的人工智能模型,如Stability AI的StableDiffusion XL,每次產(chǎn)生近1,600克二氧化碳,這與駕駛汽油動(dòng)力汽車行駛四英里對(duì)環(huán)境的影響大致相同。
邊緣設(shè)備為GenAI提供了更可持續(xù)的選擇,消耗更少的功耗,最大限度地減少冷卻要求,并減少碳足跡,從而有助于實(shí)現(xiàn)更環(huán)保的 AI 會(huì)議方式。
GenAI時(shí)代的視頻會(huì)議
今后,AV集成商和設(shè)計(jì)人員將能夠安裝具備越來越強(qiáng)大GenAI功能的視頻會(huì)議系統(tǒng)。這些在邊緣設(shè)備上進(jìn)行人工智能處理的視頻會(huì)議系統(tǒng),可以在云中完成部分工作,同時(shí)在筆記本電腦、會(huì)議室設(shè)備和攝像頭等設(shè)備上實(shí)現(xiàn)更為豐富的各項(xiàng)功能和體驗(yàn),確保會(huì)議以可承受的成本順利進(jìn)行,生成的內(nèi)容(如自動(dòng)摘要或動(dòng)態(tài)演示)更加安全??傊?,GenAI會(huì)讓視頻會(huì)議更加真實(shí)、高效、安全、可靠。
