AR眼鏡AI用例盤點:從單薄的功能一窺廣闊的生命力

0 評論 1005 瀏覽 3 收藏 16 分鐘

AI與各類產品的融合速度正在加快,對于AR或者其他設備而言,AI功能的加入也成為了一個不小的賣點。那么,目前AR眼鏡上有哪些主流AI功能?未來的眼鏡終端還將如何發展?本文做了一定的盤點和分析,一起來看一下。

今年Connect大會上,扎克伯格拋出了一個有意思的話題:“讓我特別感興趣的一個領域是,如何將AI的進步與下一代計算平臺相結合?!?/p>

伴隨著因ChatGPT爆火而引發的新一輪熱潮,AI開始加速與千行百業融合,如今年三月微軟宣布將GPT接入Office辦公套件,谷歌將其AI助手Bard集成到谷歌日歷等應用全家桶中等。

同樣,對于AR或者是其他可穿戴式設備而言,AI也成為了其不可或缺的賣點之一。本文將對目前AR眼鏡上的主流AI功能進行盤點,一窺技術發展趨勢。

以AI驅動的可穿戴式設備,圖源:Humane

一、Meta AI引入智能眼鏡;ARKnovv A1支持AI三件套

早在GPT爆火之前,VR、AR產品中已經出現了很多有關AI的用例,如結合了AI算法的手勢識別、基于AI預測用戶的全身追蹤等。不過這些功能多停留在用戶無法直接感知的隱性層面?,F如今隨著LLM、AIGC等技術的發展,AI進一步走到了臺前。

以Meta最近發布的新一代智能眼鏡產品Ray-Ban Meta為例,它與老款產品比較重要的差異點在于,產品正式實現了對Meta AI的支持。

Meta官網指出,Meta AI由Llama 2大模型驅動,并與微軟Bing搜索引擎達成了合作,目前已經可以通過Instagram、WhatsApp等Meta社交平臺進行訪問。

今年Meta Connect期間,扎克伯格對于Meta AI進行了演示(基于其社交APP),Meta AI具備很強的上下文理解能力,可以快速響應用戶的各種提問。此外,它還集成了Meta的AI圖像生成工具Emu,可以基于用戶的需求生成相應的圖片。

圖源:Meta

除應用于自家社交平臺,Meta AI還搭載到了自家的硬件產品Ray-Ban Meta中。由于Ray-Ban Meta并沒有配備屏幕,所以只能以語音的方式輸出,這使得它并不能承擔太多復雜的工作?;诎l布會演示,Meta AI的作用主要體現在兩方面:一是偏向于功能交互的場景,如通過語音命令拍攝照片,通過語音將圖片視頻分享到Messenger等;二是充當一個類似于ChatGPT式的AI助手的角色,用戶可以與之進行閑聊、詢問出行建議等。

除Meta AI外,扎克伯格透露明年將會為Ray-Ban Meta新增更多AI的能力,如用戶在旅游時可以通過AI詢問眼前建筑的具體信息;協助翻譯外語廣告牌上面的內容、詢問水龍頭的一些維修建議等。

Ray-Ban Meta AI功能的落地離不開新處理器驍龍AR1 Gen1的應用,據了解,該處理器可實現眼鏡側AI,這使得硬件廠商可以在眼鏡中接入系列AI模型。高通官網指出,驍龍AR1 Gen1搭載了第三代Hexagon NPU和用于視覺分析的AR級引擎,可用于增強圖像和音頻質量、視覺搜索、實時翻譯等。

近日,雷鳥創新官宣了其下一代AR眼鏡新品雷鳥 X2 Lite,產品同樣搭載驍龍AR1 Gen1,具備更強的AI能力也是產品的重要賣點之一,產品可實現實時翻譯、智能出行建議等AI功能。

圖源:Meta

除Ray-Ban Meta以及雷鳥X2 Lite,今年以來發布的大多數AR眼鏡產品均配備了AI相關能力,比較典型的是致敬未知于今年7月發布的ARKnovv A1。致敬未知創始人吳德周曾表示,“AI和AR的結合一定是方向,我們希望能夠深度結合AI,讓AR眼鏡真正能夠成為更有效率、更好玩的工具?!?/p>

產品定位方面,ARKnovv A1與Ray-Ban Meta有較大不同,前者采用分體式設計,但是補充了雙目Micro-OLED屏幕。此外,前者配備了單目攝像頭,但并不聚焦于拍照攝影,而是用于實現SLAM等相關玩法。

在AI功能方面,ARKnovv A1分為了三大塊:基于AI大模型驅動的語音助手、借助攝像頭以及CV實現的現實大爆炸(可識別建筑物、植物、餐廳等)以及基于開源繪圖大模型Stable Diffution打造的AI圖生圖功能。

圖源:致敬未知

近日,李未可CEO茹憶公布了其下一代AR眼鏡李未可Meta Lens S3。茹憶認為,當下AI在交互計算平臺領域的重要性越來越突出,AI交互能力將成為AR眼鏡的核心能力。

產品方面,李未可團隊正在將AI大模型深度整合到AR眼鏡中,AI模型采用“重云輕端 云端一體”的搭建模式,云端構建以認知、推理、服務、任務等模型為基礎的AI大腦,并實時響應AR終端的用戶需求。

二、除增強現實、AI如何賦能產品構建更前沿的生活方式

可以發現,如何結合AI為用戶提供更加高頻更加有趣的玩法已經變成了如今AR/智能眼鏡產品所探討的重要議題。不過由于產品多聚焦于大眾消費市場,使得功能也相對趨同,當然也有廠商試圖從中挖掘更加垂直化的用例。

如海外企業Envision專門面向視障群體開發了一款眼鏡產品Envision Glasses。該產品基于Google Glass Enterprise 2開發而來,產品搭載驍龍XR1,配備800萬像素攝像頭。由于產品面向視障群體,它更依賴于AI所支撐的環境感知以及理解能力,而屏幕或者AR反倒成為了無關緊要的功能。

以下是Envision Glasses所對外展示的一系列用例:

  • 可以掃描書籍、信件等手寫或印刷文本信息并通過語音的方式向用戶播報,它可識別超過60種語言;
  • 借助攝像頭進行第一視角的通話;
  • 從一堆白色的衣服中挑出紅色的襪子,判斷室內的燈是否亮著;
  • 識別親人朋友等,提醒用戶打招呼。

圖源:Envision

值得一提的是,Envision的前身是一家OCR和物體識別應用開發商,2017年,企業上線《Envision AI》APP,該APP同樣瞄準了視障群體。Envision Glasses需要搭配其手機APP使用,官網指出眼鏡在正常情況下可提供約5-6小時的使用時長。

圖源:Envision

扎克伯格曾表示眼鏡將會是AI最佳的硬件載體之一,因為眼鏡能夠見你所見、聽你所聽,很好洞悉用戶的一切。不過,這并不只是當前的唯一解。

今年9月底,The Information爆料稱,OpenAI CEO Sam Altman、軟銀集團CEO孫正義與前蘋果首席設計師Jony Ive進行了洽談,三方或將成立一家專注于研發新一代AI硬件的新公司,不過對于AI時代下的新硬件究竟會是什么樣子,目前他們仍沒有達成共識。

10月中旬的WSJ公開采訪中,Altman曾表示AI 時代下計算機可以獨立思考,所以什么樣的硬件都有可能,它或許是新一代手機、或許是智能音箱、甚至有可能是某種AI驅動的機器人。不過外界猜測稱,關于前沿AI硬件最佳實踐或許正是Altman曾多次投資的科技企業Humane。

Humane團隊打造了一款AI投影設備AI Pin,設備體積小巧,可像一枚胸針一樣掛于胸前。該產品集成了無喚醒詞的AI助手,除此之外,AI Pin內置了一個投影模組,它可將一些來電聯系人等簡單的信息投射于手掌中。

據了解,Ai Pin將會搭載專用系統,甚至有可能會結合OpenAI的GPT-4,基于過往的一些案例,用戶可以向設備發送撥號指令、詢問就餐建議、旅行安排、檢測食物卡路里等。此外,Ai Pin的AI助手還將具備一定的上下文聯系能力。

其他方面,Ai Pin售價可能會高達1000美元,配備高通驍龍芯片,性能可以比肩智能手機。此前該產品已經在9月底的巴黎時裝秀上有所亮相,并即將于11月9日召開新品發布會。更多信息可查看VR陀螺過往文章《iPhone核心團隊成員創業,融資2.3億美元,要做“另類”下一代計算平臺》。

圖源:Humane

三、AI持續進化,未來眼鏡終端還將如何發展?

目前AR眼鏡/智能穿戴仍處于探索期,而AI如何與新一代計算終端所結合也同樣如此?;谇懊娴囊恍┯布K端其實也不難發現,各家廠商對于AI的理解以及側重點會有一定差異,但是共識是AI將會在新一代計算設備革命中發揮重要用途。

對此,茹憶則提出了一個簡單明了的觀點,如果AR眼鏡是iPhone,那么AI就是iOS,即AI將成為硬件驅動的核心。

從當前來看,眼鏡產品上的AI用例仍多集中于基于LLM的語音助手、簡單的識圖功能等,目前體驗仍相對單薄。此外,由于隱私以及設備續航所限,設備的AI能力很多時候只能處于被動觸發狀態,如只有按下按鈕或者呼出特定語音指令才能有所響應(這有點類似于搜索與信息推送的差異)。這種單項互動在一定程度上阻礙了AI功能的黏性。

此外,根據海外平臺SparkToro調查數據,聊天機器人模型ChatGPT的用戶會話中,編程協助以及教育用途最為廣泛,分別達到了29.1%和11.9%,而聊天互動等私人用途占比反而并不算高。未來,如何實現大語言模型與眼鏡終端更為有機的結合也是一個值得持續思考的問題。

圖源:SparkToro

其他方面,AR眼鏡的算力薄弱,目前仍以云端側AI為主。高通今年發布《混合AI是AI的未來》白皮書里面提到,云端和終端協同處理的混合AI是AI的未來,這樣才能高效推動AI規?;涞?,并發揮其最大潛能。隨著端側AI能力的增強,未來設備可以構建更加個性化以及安全的AI助手,可以在離線狀態下工作,并且響應速度也會更快。

而AGI(通用人工智能)是AI的下一個發展階段,AGI具備更強的感知、推理與學習能力,未來當AGI引入AR眼鏡之后,它的能力將得到更為廣泛的提升。彼時,AR眼鏡將會成為一個更加無感以及智能的設備。

高通技術公司產品管理高級副總裁兼AI負責人Ziad Asghar采訪中曾提到,在未來5年內,AI將會成為一個更加智能的個人助理,比如當告知設備會議要遲到了,它將能自動給相關成員發送消息。

圖源:高通

關于這一點,或許我們能在發布的Ai Pin上面看到相關解法。Humane的一份專利文件中指出設備可以結合用戶的體溫、心率等數據來估算用戶的感情狀態以及當前環境的重要性,然后會選擇是否激活麥克風攝像頭等。它有點類似于iPhone的相冊“回憶”功能,但是設備會替用戶完成很多隱形的決策工作。

而美國未來學家Devin Liddell則認為,在AI技術的加持下,AR眼鏡將能獲得遠超普通人類的超級感官,比如眼鏡可以洞悉用戶的真實情緒、是否在撒謊等。

比爾蓋茨曾提到,人工智能革命重要程度不亞于手機和互聯網的誕生,這是其一生中唯二的革命性技術進步。而未來AR眼鏡/智能眼鏡在AI的加持之下,也將迸發出我們難以想象得到的創作力以及生命力。

參考資料:

https://mp.weixin.qq.com/s/npZduUT7FYhlqAdp3SsAiQ

https://mp.weixin.qq.com/s/XMzMACpCwjanMpyba73QVQ

作者:萬里

來源公眾號:VR陀螺(ID:vrtuoluo),XR行業垂直媒體,關注VR/AR的頭部產業服務平臺。

本文由人人都是產品經理合作媒體 @VR陀螺 授權發布,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!