復(fù)聯(lián) 3《無(wú)限戰(zhàn)爭(zhēng)》里有這樣一幕,鋼鐵俠離開(kāi)圣所上街查看情況,人群四散,他戴上黑框眼鏡問(wèn)助手「星期五」:「我在看什么?」 當(dāng)他的右手將眼鏡取下并變裝,眼鏡又能自然地融入納米戰(zhàn)甲之中。 這承載著我們對(duì)智能眼鏡的一種期待,它應(yīng)當(dāng)成為洞若觀火的「眼睛」,提供周?chē)h(huán)境的信息并實(shí)時(shí)應(yīng)答,以融入日常穿搭的形態(tài)低調(diào)存在。 鋼鐵俠的鈔能力復(fù)制不了,但我們正在一步步向超級(jí)英雄電影的尋常場(chǎng)景靠近。 10 多年前的 Google 頂流,可能要換種方式「復(fù)活」了 剛過(guò)去不久的 Google I/O,最受關(guān)注的當(dāng)屬基于多模態(tài)大模型 Gemini 的 AI 助手 Astra。 合理懷疑,OpenAI 比 Google 提前一天開(kāi)發(fā)布會(huì),就是因?yàn)橄㈧`通,且要針對(duì) Astra。果不其然,大家記不住 Astra 的本名,只當(dāng)它是 GPT-4o 的「莞莞類(lèi)卿」。 其實(shí)單看 Astra 的演示,也做得很有意思,和 OpenAI 一樣走日常生活向,至少在冗長(zhǎng)的發(fā)布會(huì)里終于讓人不困了。 視頻里的 Astra,能看、能聽(tīng)、能說(shuō),低延遲,與用戶(hù)實(shí)時(shí)對(duì)話和視頻聊天,開(kāi)得了腦洞,解讀得了代碼,識(shí)別周?chē)h(huán)境,還能幫你回憶剛才鏡頭一掃而過(guò)的眼鏡在哪里。 不過(guò),舉著手機(jī),用鏡頭對(duì)準(zhǔn)身邊的物品問(wèn)來(lái)問(wèn)去,多少也有些累人和刻意。 Google 顯然考慮到了這種情況,在讓 Astra 幫忙找到眼鏡后,演示者戴上了眼鏡,然后通過(guò)眼鏡繼續(xù)使用 Astra,讓它解決白板上的題目。 Google 并沒(méi)有透露這副眼鏡的更多信息,僅從視頻中看,它帶有攝像頭和視覺(jué)界面,但外表樸素,辨識(shí)度不高,屬于放在眼鏡堆里容易找不著的路人甲。 不久的未來(lái),這副眼鏡可能戴在更多人的臉上。 Google 的官方博客解釋了,演示分為兩段,每段都是一次性實(shí)時(shí)拍攝的,前半段用的是 Pixel 手機(jī),后半段用的是一款原型眼鏡設(shè)備。 為了讓 Astra 的回答速度接近人類(lèi),他們連續(xù)編碼視頻幀,將視頻和語(yǔ)音輸入組合到事件時(shí)間線,并緩存這些信息,讓 AI 處理信息的速度變得更快。 接受彭博社采訪的時(shí)候,Google DeepMind 首席執(zhí)行官德米斯·哈薩比斯和 Google 聯(lián)合創(chuàng)始人謝爾蓋·布林也確認(rèn),Astra 在手機(jī)上的效果已經(jīng)很好,正在考慮為 Astra 制造眼鏡。 雖然沒(méi)打包票一定推出眼鏡,但布林特意 cue 了一下,Google 在十年前已經(jīng)入局了。 說(shuō)到這里,就要把 Google 技驚四座的 2012 年 Google I/O 大會(huì)搬出來(lái)了。 當(dāng)時(shí)這場(chǎng)發(fā)布會(huì)可不像現(xiàn)在這么無(wú)聊,戴著一副不對(duì)稱(chēng)眼鏡框的布林在尾聲登場(chǎng),請(qǐng)了一群跳傘運(yùn)動(dòng)員,發(fā)布了一款讓人過(guò)目難忘的產(chǎn)品——Google Glass。 這些跳傘運(yùn)動(dòng)員也戴著 Google Glass,在高空接通了和布林的視頻通話,然后一躍而下,騎山地自行車(chē)來(lái)到現(xiàn)場(chǎng),現(xiàn)場(chǎng)觀眾從大屏幕欣賞第一視角,如同體驗(yàn)了一次極限運(yùn)動(dòng)。 視覺(jué)沖擊在前,無(wú)需更多言語(yǔ),觀眾相信了,這副眼鏡就是布林口中「很酷的東西」。 至今,仍然有人在當(dāng)年這場(chǎng)發(fā)布會(huì)的切片下留言:「這款產(chǎn)品遠(yuǎn)遠(yuǎn)領(lǐng)先于時(shí)代! 生不逢時(shí)的「美麗廢物」 超前有時(shí)候等于不合時(shí)宜。在當(dāng)時(shí),Google Glass 只能算包裝華麗的失敗品。 Google 也清楚這款產(chǎn)品不成熟,先推出了 8000 個(gè)名額的「探索版」(Explorer Edition),換句話說(shuō)就是半成品,但價(jià)格毫不手軟,高達(dá) 1500 美元。 走下神壇,拿在手中,人們很快發(fā)現(xiàn)了它的問(wèn)題:比手機(jī)貴,又沒(méi)有手機(jī)好用。聽(tīng)起來(lái)是不是有些耳熟?就像 Rabbit R1 等 AI 硬件評(píng)價(jià)的翻版。 總體來(lái)說(shuō),Google Glass 有 7 個(gè)基礎(chǔ)功能——搜索、導(dǎo)航、拍照、錄視頻、發(fā)消息、打電話、視頻聊天,它也支持一些第三方服務(wù),包括顯示和播報(bào)推送到設(shè)備上的新聞?wù)?/p> 這些功能手機(jī)都有,除了必須解放雙手的時(shí)候,大多數(shù)情況下,手機(jī)比 Google Glass 更好用。 并且,使用 Google Glass 的完整功能,還得把手機(jī)帶在身邊用來(lái)聯(lián)網(wǎng),離線情況下,Google Glass 只能拍照片和視頻。 Google Glass 最為人詬病的,其實(shí)是隱私問(wèn)題,讓它拍照很簡(jiǎn)單,用語(yǔ)音命令,或者按住頂部的按鈕,但沒(méi)有 LED 等亮眼的標(biāo)志,提示他人正處在拍攝狀態(tài)。 所以,從路人的角度看,Google Glass 就是個(gè)不講武德的「偷拍神器」,甚至曾有用戶(hù)在電影院被保安趕出來(lái)。 另外,Google Glass 還有一些體驗(yàn)過(guò)才知道的短板。 當(dāng)你用語(yǔ)音回復(fù)消息,讓眼鏡轉(zhuǎn)化成文字,可能會(huì)出現(xiàn)錯(cuò)誤導(dǎo)致「社死」。 續(xù)航普遍在 5 小時(shí)左右,但如果拍多了照片和視頻,可能就只有 2 小時(shí)了。 Google Glass「漂浮」在現(xiàn)實(shí)世界的第二塊屏幕,用來(lái)固然導(dǎo)航很方便,讓你像使用高德一樣,直觀看到箭頭的指向,但路人可能會(huì)覺(jué)得,眼睛總往右上瞥的你很奇怪,然后避而遠(yuǎn)之。 當(dāng)時(shí)有人開(kāi)玩笑,Google Glass 的最大用處,是讓英國(guó)王室的查爾斯王子記住每個(gè)人的名字。 Google Glass 在 2015 年停產(chǎn),之后被定位到 B 端,用到工廠車(chē)間、醫(yī)療教學(xué)等場(chǎng)景。 不過(guò)在去年 3 月,Google 也停止銷(xiāo)售了 Google Glass 的企業(yè)版;厥走^(guò)往,Google Glass 當(dāng)然沒(méi)法替代手機(jī),作為一款智能眼鏡也沒(méi)能成功,但理念超前,提供了一些可穿戴設(shè)備的可能性。 不如手機(jī)是事實(shí),但換個(gè)角度,Google Glass 提取出了手機(jī)比較重要的幾項(xiàng)功能,比如相機(jī)、地圖、聯(lián)絡(luò)信息,并且不像手機(jī)那么打擾,適合在行走等場(chǎng)景使用,拯救低頭黨。 這不就是 Ai Pin 創(chuàng)始人說(shuō)的,活在當(dāng)下,為智能手機(jī)成癮問(wèn)題贖罪嗎? Ai Pin 投影在手上 如果不是價(jià)格太過(guò)喪心病狂,Google Glass 作為輔助還是不錯(cuò)的。 所以,也有人將 Google Glass 稱(chēng)為「手機(jī)的一個(gè)方便的顯示器」,或者「一個(gè)藍(lán)牙耳機(jī),但有顯示屏和攝像頭」。 暫時(shí)不考慮隱私問(wèn)題,Google Glass 拍攝的第一視角也很好,就像把廣角鏡頭戴在臉上,真正做到眼睛看到什么就能立刻拍攝下來(lái),很適合用來(lái)記錄生活。 Spectacles 拍攝效果2016 年,Snapchat 的 Spectacles 一推出就賣(mài)瘋了,它其實(shí)就是一個(gè)會(huì)拍攝的墨鏡,故意用了 115 度的廣角鏡頭,畫(huà)質(zhì)比不過(guò)手機(jī),但拍著很有趣味,同時(shí)也彌補(bǔ)了 Google Glass 的錯(cuò)誤,會(huì)用 LED 提醒他人正在拍攝。 更為重要的是,Google Glass 展現(xiàn)了一種生活方式:把傳感器戴在臉上,它可以為你收集環(huán)境信息,提供額外信息,和你語(yǔ)音溝通,讓你不用雙手也能完成很多事情。 這個(gè)理念從未過(guò)時(shí),但我們可能從未像今天這樣,有望將它變?yōu)楝F(xiàn)實(shí)。 AI 的進(jìn)擊,不用掏出手機(jī)的可能 當(dāng)造型奇怪的 Google Glass 面世,路人最好奇的問(wèn)題主要有三個(gè):你臉上戴的東西是什么?這個(gè)東西有什么用?你戴著它時(shí)看到了什么? 現(xiàn)在這些問(wèn)題又拋給了奇形怪狀的 AI 硬件,只不過(guò)第一個(gè)問(wèn)題可能換成了,你別在胸口上的是什么?你脖子上戴的是什么? 至少眼鏡的形態(tài)看著比一些 AI 硬件靠譜多了,不反人類(lèi),不挑戰(zhàn)用戶(hù)原有的習(xí)慣。 「免提」是眼鏡生來(lái)就有的優(yōu)勢(shì)之一,如果我們?cè)谧鲲埢蛘哌\(yùn)動(dòng),還需要讓設(shè)備輔助的話,手機(jī)往往是被 pass 的那一個(gè)。不用掏出手機(jī),不等于就能代替手機(jī),但確實(shí)是一個(gè)實(shí)打?qū)嵉膬?yōu)點(diǎn)。 WSJ 記者用 Vision Pro 為做飯計(jì)時(shí) 同時(shí),智能眼鏡的功能也并不少,打電話有耳機(jī)和麥克風(fēng),拍照有攝像頭,當(dāng)你需要屏幕,AR 讓你的眼前呈現(xiàn)信息。 Google 在 2022 年 I/O 推出了一款可以實(shí)時(shí)翻譯的 AR 眼鏡,字幕就在對(duì)話人旁邊,不過(guò)也只是原型演示。 十多年前 Google Glass 已有的功能,后來(lái)者或多或少地承襲和改進(jìn)了。 然而,如何讓生成式 AI 融入,是目前大廠們還在探索的問(wèn)題。從用戶(hù)的角度來(lái)說(shuō),買(mǎi)智能眼鏡究竟有什么用,希望戴著時(shí)能看到什么,答案也可能和最初的 Google Glass 不同了。 眼下有一個(gè)比較成功的例子:Meta 雷朋眼鏡第二代。 它的市場(chǎng)反響不錯(cuò),原因主要有以下幾個(gè):保留雷朋的時(shí)尚外觀,質(zhì)量控制在普通眼鏡的水平,升級(jí)了攝像頭、揚(yáng)聲器、續(xù)航等基礎(chǔ)功能,用戶(hù)甚至可以通過(guò)它開(kāi)啟直播。 有人評(píng)價(jià)說(shuō),這是為網(wǎng)紅準(zhǔn)備的 Go Pro。 與此同時(shí),Meta 雷朋增加了前代沒(méi)有的功能——多模態(tài) AI 語(yǔ)音助手 Meta AI。 去年 12 月,扎克伯格在 Instagram 發(fā)了一段視頻,親自展示了 Meta AI。 視頻之中,扎克伯格用「Hey Meta」的指令呼喚出 AI,讓眼鏡識(shí)別水果、把西班牙文本翻譯成英語(yǔ)、給萌寵圖片配上解說(shuō)文字,以及從衣架拿下條紋襯衫,讓眼鏡參謀搭配什么褲子。 Meta 雷朋眼鏡內(nèi)置的大模型為 Llama 2,除了以上功能,還支持查詢(xún)體育賽事比分、當(dāng)?shù)氐貥?biāo)、餐館、股票等實(shí)時(shí)信息。 這些 AI 功能真的是剛需嗎?可能要打個(gè)問(wèn)號(hào),還不如當(dāng)初召喚 Google Glass,問(wèn)今天天氣怎么樣,某個(gè)地方怎么去。 而且,Meta AI 的反應(yīng)速度并不快,每次語(yǔ)音請(qǐng)求都會(huì)觸發(fā)一次快門(mén)捕捉,也就是說(shuō)先拍照,延遲幾秒,然后 AI 才能讀取和分析用戶(hù)所看到的內(nèi)容。和 Meta AI 對(duì)話仍然是回合制,不能像 GPT-4o 演示的那樣隨時(shí)打斷。 但不那么苛刻地看,AI 功能用來(lái)錦上添花挺好,讓一款能拍視頻、拍照片、語(yǔ)音通話的眼鏡更加有用,看到和聽(tīng)到周?chē)l(fā)生的事情,并以聲音或文本形式提供反饋。 基于 Google Glass 和 ChatGPT,幫助視障人士「看見(jiàn)」周?chē)?/u> 就像 10 多年前的半成品 Google 眼鏡,Meta AI 這樣的 AI 功能也需要時(shí)間進(jìn)化。 我們對(duì)于 AI 助手的想象往往從電影等科幻作品而來(lái),它們最好和我們一樣,可以理解和響應(yīng)復(fù)雜的世界,但又要比我們記性好,記住所有看到和聽(tīng)到的內(nèi)容,我們和它們交談的時(shí)候,應(yīng)當(dāng)像面對(duì)另一個(gè)人類(lèi)那樣沒(méi)有延遲。 事實(shí)上,光是將 AI 的應(yīng)答時(shí)間縮短為人類(lèi)對(duì)話的水平,已經(jīng)是一項(xiàng)巨大的挑戰(zhàn)了,兌現(xiàn)在 Astra 和 GPT-4o 身上,已經(jīng)足夠讓我們驚奇。通過(guò)它們,我們可以脫離文學(xué)想象,一個(gè)完全形態(tài)的 AI 助手可能是什么樣子。 就像 Google Glass 之前,已經(jīng)有了很多臉上的可穿戴設(shè)備,但是它讓人們覺(jué)得,智能眼鏡是可能的。而在它之后,有了越來(lái)越多更精致、功能更多、領(lǐng)域更垂直的智能眼鏡。 Engadget 在 11 年前的測(cè)評(píng)說(shuō)道,Google Glass 很有意思,但不值 1500 美元,應(yīng)該等待它的第二代或者第三代。 現(xiàn)在的智能眼鏡,仿佛就是 Google Glass 的第二代或者第三代,就連 Google 自己,也在有意無(wú)意地召喚 Google Glass 的亡魂。 一款產(chǎn)品世俗意義地失敗了,可能因?yàn)楣δ茈u肋,也可能因?yàn)橄敕ê馨,但技術(shù)所限,沒(méi)能落地成良好產(chǎn)品;蛟S我們可以換個(gè)角度看,它們中的佼佼者,可能只是未來(lái)產(chǎn)品的未完成形態(tài)。 文章來(lái)源:APPSO |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選