首頁 > 科技要聞 > 科技> 正文

蘋果今年最大的更新要來了,AI Siri 的終極形態(tài)比 GPT-4o 更科幻

appso 整合編輯:太平洋科技 發(fā)布于:2024-06-05 16:01

Siri 已經(jīng)落后了。

據(jù)《紐約報(bào)道》,這就是去年蘋果軟件主管 Craig Federighi 和機(jī)器學(xué)習(xí)高管 John Giannandrea 花了幾周測試 ChatGPT 后的想法,因此,他們決定對這個(gè) 13 歲的語音助手進(jìn)行大改造。

離 WWDC 開發(fā)者大會還有不到半個(gè)月的時(shí)間,科技記者 Mark Gurman 帶來了 AI 版 Siri 的最新進(jìn)展爆料,看起來,這個(gè)總是被吐槽「人工智障」的語音助手確實(shí)將迎來大更新。

一個(gè)壞消息:里面一些重磅功能可能不會在今年到來。

盡管如此, Mark Gurman 稱蘋果內(nèi)部依然將 iOS 18 視為有史以來最重要的升級。蘋果 WWDC24 將于北京時(shí)間 6 月 11 日凌晨 1 點(diǎn)舉辦,屆時(shí) APPSO 將在 Apple Park 現(xiàn)場給大家?guī)碜钚聢?bào)道,敬請關(guān)注。

姍姍來遲又未來可期的「掌控應(yīng)用」功能

據(jù)報(bào)道,在 AI 的加持下,Siri 將能夠進(jìn)一步「掌控應(yīng)用」,實(shí)現(xiàn)應(yīng)用功能的精準(zhǔn)控制。

比如說,讓 Siri 把文件從一個(gè)文件夾轉(zhuǎn)移到另一個(gè)文件夾,或者讓 Siri 打開特定的新聞文章,甚至可以讓 Siri 給出一個(gè)文章摘要。

雖然現(xiàn)在已經(jīng)能夠使用 Siri 來發(fā)短信甚至發(fā)微信,但是基于 AI 大改造的 Siri 將走得更遠(yuǎn),能夠分析人們?nèi)绾问褂米约旱脑O(shè)備,并學(xué)會越來越多的自動操作。蘋果計(jì)劃,將在其開發(fā)的 app 中支持「數(shù)百個(gè)」的命令。

iOS 10 就已經(jīng)能實(shí)現(xiàn)的 Siri 發(fā)微信功能

聽著確實(shí)不錯,不過 Gurman 表示,這個(gè)功能一開始僅限于蘋果自己開發(fā)的 app,而且不會在今年推出,可能最早要等到明年的 iOS 18 后續(xù)更新。

并且也有消息稱,舊型號或許僅有搭載 A17 Pro 處理器的 iPhone 15 Pro,以及 M1 以上的 Mac 能夠支持更多本地 AI 功能。

新的 Siri 一開始可能一次只能聽懂并執(zhí)行一個(gè)命令,但有望在未來支持一串的命令,比如說將錄制好的會議錄音生成一個(gè)總結(jié)(也是 iOS 18 有望推出的功能),然后用郵件發(fā)給同事,還能直接補(bǔ)充一點(diǎn)文字說明,一套操作一句話就能交給 Siri 完成。

新的 Siri 也預(yù)計(jì)會和 iOS 18 的其他 AI 功能一樣,存在一個(gè)判斷系統(tǒng),根據(jù)所需算力大小,判斷 AI 任務(wù)是否可以在設(shè)備本地完成,還是需要在云端運(yùn)行。

如果要去總結(jié) Siri 目前這 13 年的發(fā)展,「管生不管養(yǎng)」恐怕是最貼切的一個(gè)。

在 2011 年的 iPhone 4s 發(fā)布會上,Siri 壓軸登場,給在場觀眾和世人不小震撼。當(dāng)時(shí)對 Siri 的演示是這樣的:可以問它某城市天氣如何,或者某股票表現(xiàn)如何,而一句話就能設(shè)定一個(gè)離開公司自動彈出的提醒事項(xiàng),在當(dāng)時(shí)也是一個(gè)非?岱浅N磥淼墓δ堋

結(jié)果,13 年過去,上面的功能似乎還是 Siri 使用最多的幾個(gè)場景,就算是后來支持的家居操控,和快捷指令,總體上還是一些打開關(guān)閉的功能,其實(shí) Siri 一直沒迎來質(zhì)的飛躍。

即使在面對 Google Assistant、微軟 Cortana、三星 Bixby 等其他后來居上的語音助手挑戰(zhàn),甚至國內(nèi)小米「小愛同學(xué)」也越來越好用的情況下,蘋果依然不思進(jìn)取,直到 ChatGPT 橫空出世才意識到 Siri 已經(jīng)落后時(shí)代。

小愛同學(xué)已經(jīng)在去年接入了大模型

雖然蘋果好像隔三差五就在發(fā)布會上介紹,Siri 又變強(qiáng)了,能理解更多指令了,能干更多事情了,但很多時(shí)候,能理解不代表能做到,能做到不代表能做好。

比如告訴 Siri,我想自拍,Siri 二話不說幫你打開相機(jī)和前置攝像頭,然后就沒有然后了,用戶還需要伸手去點(diǎn)擊快門。甚至有的時(shí)候,Siri 只會自動跳轉(zhuǎn)相機(jī)應(yīng)用,而不會跳轉(zhuǎn)到前置模式。

如果是三星的 Bixby 助手,會自動進(jìn)入自拍的倒計(jì)時(shí),全程真正做到不需要用戶動手操作。

蘋果默認(rèn)的相機(jī)應(yīng)用本身自帶倒計(jì)時(shí)功能,因此這種流程在實(shí)現(xiàn)上根本不需要太多 AI 因素加持,但蘋果就是沒有把體驗(yàn)做好。

Siri 的對手是快捷指令

不知道你有沒有使用過「快捷指令」這個(gè)功能呢?

蘋果收購 Workflow 公司后,在 iOS 12 中將其產(chǎn)品作為「快捷指令」整合入 iPhone,也在 macOS 12 時(shí)在 Mac 平臺上推出。

快捷指令已經(jīng)整合進(jìn)入了蘋果生態(tài)鏈中

這個(gè)功能能夠?qū)崿F(xiàn)很多 iOS 的進(jìn)階玩法,比如說一鍵實(shí)現(xiàn)釘釘打卡,一鍵將 LivePhoto 和視頻制作成 GIF,甚至還能自動化運(yùn)行,實(shí)現(xiàn)「節(jié)假日自動關(guān)鬧鐘」。

但這個(gè)功能對小白用戶并不友好。想要新建一個(gè)快捷指令,用戶要在一個(gè)類似腳本編程的界面中選擇各種操作模塊,并用各種諸如「如果..那么」「只要...就」的邏輯將其串聯(lián)起來,像是「節(jié)假日鬧鐘」這種包含多種邏輯判斷和自動化運(yùn)行的快捷指令,用戶即使是對著教程設(shè)置,也很容易出錯。

蘋果雖然提供一個(gè)可以直接獲取現(xiàn)成腳本的「快捷指令中心」,但是里面提供的快捷指令效果簡單,很少有切中用戶痛點(diǎn)的功能。

這個(gè)功能類似三星 Galaxy 手機(jī)的「Good Lock」模塊,提供效果非常強(qiáng)大的自定義功能,但是門檻相對應(yīng)也不低。

而 AI 大模型最重要的能力之一,就是自然語言的理解和邏輯思維能力。也就是說,用戶對大模型 AI 說一句「我下班了,幫我打卡」,AI 就會知道你的意思是執(zhí)行「打開釘釘」-「進(jìn)行打卡」的操作,而不是表示自己「沒聽明白」。

現(xiàn)在的 Siri 也不是完全不具備這種能力。讓 Siri 在你離開公司時(shí)提醒你給家人買個(gè)生日蛋糕,是 iPhone 4s 發(fā)布會上就被演示的功能,背后同樣是理解用戶語言并轉(zhuǎn)化成相關(guān)操作的一個(gè)過程。

Siri 發(fā)布會上介紹的很多功能依舊是現(xiàn)在 Siri 的主要能力

而 AI 大模型加持后的 Siri 能做到的應(yīng)該遠(yuǎn)遠(yuǎn)不僅如此。用戶用自然語言描述自己的復(fù)雜需求,Siri 聽懂后,轉(zhuǎn)化成腳本的邏輯,并自己執(zhí)行相應(yīng)的步驟,不用讓用戶面對復(fù)雜的編程,這才是真正的「快捷」指令。

ChatGPT 教我如何用 iOS 快捷指令設(shè)置節(jié)假日鬧鐘,雖然邏輯清晰,但似乎不太可用

除了讓用戶更自然自定義操作,還可以去期待 Siri 成為一個(gè)更「主動」的助理。

如果你使用 iPhone 時(shí)間夠長,會發(fā)現(xiàn)在有時(shí)候,iPhone 會自動彈出建議。比如說,用戶戴好藍(lán)牙耳機(jī),就推薦你打開網(wǎng)易云音樂,因?yàn)檫@就是你的使用規(guī)律;或者在深夜充電時(shí),手機(jī)自動降低了充電功率,以保養(yǎng)電池,但又能在你醒來前充好,也是因?yàn)榘l(fā)現(xiàn)你有在睡前長時(shí)間充電的習(xí)慣。

這些就是機(jī)器學(xué)習(xí)的結(jié)果,也是蘋果一直以來致力的 AI 功能,F(xiàn)代人一天要花不少時(shí)間在手機(jī)上,用手機(jī)買買買、吃飯、辦公已經(jīng)很普遍,手機(jī)自然成為比肚里的蛔蟲更懂你的存在。

想象一下蘋果強(qiáng)大的情景感知,加上更強(qiáng)大的手機(jī)自動操作能力,AI 版的 Siri 或許真的能化身成一個(gè)真正的「私人助理」,在你把事情交給它完成之前,就預(yù)判好你的需求,把一切安排妥當(dāng)。

比如說,通過你訂的機(jī)票,自動幫你查詢好目的地到達(dá)后的天氣,還提前設(shè)好鬧鐘,根據(jù)你的出行習(xí)慣和實(shí)時(shí)交通狀況,預(yù)計(jì)好出行的時(shí)間提前幫你叫車,到了機(jī)場自動彈出機(jī)票和自行使用應(yīng)用值機(jī),到了當(dāng)?shù)亟o你打開大眾點(diǎn)評推薦餐廳,簡直是私人助理+導(dǎo)游。

想要實(shí)現(xiàn)這一套行云流水的操作,我們當(dāng)然會去想,這需要也開發(fā)者和蘋果的雙向奔赴。不過,AI 發(fā)展的速度已經(jīng)超出了我們的想象,也許未來,AI 能夠直接模仿人類的操作。

我們能看懂的 UI,AI 也在學(xué)習(xí)中

雖然新的 Siri 的智能操作初期只支持蘋果自己的應(yīng)用,但我更愿意相信這只是蘋果 AI Siri 路線的起點(diǎn)或者中段,而并非終點(diǎn)。

我相信蘋果 AI 最終的目標(biāo)是實(shí)現(xiàn)這樣的場景:早上起床,用一句「Siri」喚醒 Siri,再讓它打開微信公眾號「愛范兒」,朗讀最新的文章,就這樣在完全不用動手的情況下,聽取愛范兒的早報(bào)。

一個(gè)許多年前的 iPhone 概念手機(jī)殼,想法是「Siri」擬人化和語音解放雙手

「快捷指令」能夠支持第三方 app 的操作,主要是因?yàn)樘O果開放了 API,第三方應(yīng)用廠商也可以將應(yīng)用內(nèi)的操作拆分成快捷指令能夠執(zhí)行的模塊。

但這還要看應(yīng)用廠商是否愿意提供相關(guān)的模塊和操作,比如說,如果菜鳥 app 不開放顯示取件碼的操作,就算 Siri 再聰明,也無法自行打開菜鳥顯示取件碼。

如果再進(jìn)一步,讓 AI 直接能理解什么是取件碼,以及取件碼在 app 的哪個(gè)位置,并在接到指令后自己打開呢?

這聽起來好像有點(diǎn)太科幻,不過,行業(yè)已經(jīng)在進(jìn)行相關(guān)嘗試了。

在上星期的微軟 Build 2024 開發(fā)者大會上,微軟整了個(gè)活:GPT-4o 支持的 Copliot,能夠?qū)崟r(shí)查看屏幕上的內(nèi)容,引導(dǎo)玩家一起玩《我的世界》。

演示中,Copilot 用非常流暢自然、甚至還帶有一絲情緒的語言,引導(dǎo)玩家在游戲中制作一把劍。在這個(gè)過程中,Copilot 能夠識別游戲背包內(nèi)的物品,還能告知玩家缺少的材料,完全就像一個(gè)帶你玩游戲的「大神」。

這表明,AI 助手已經(jīng)不僅僅是「你問我答」的文字機(jī)器人,或者只能夠在后臺編程處理數(shù)據(jù),而是真正能開始理解我們?nèi)祟惪匆姷?UI 界面,還能知曉我們?nèi)绾尾僮鳌?/span>

而今年火了一段時(shí)間的「AI 硬件」Rabbit R1,基本拋棄了操作界面,完全通過 AI 語音助手完成各種服務(wù)的使用。Rabbit 公司宣稱,他們使用了一種名為「大動作模型」(LAM)的 AI 模型技術(shù),能夠在理解了用戶的指令后,在服務(wù)器模仿人類的操作,直接在相關(guān)網(wǎng)頁和應(yīng)用中完成用戶的指令。

Rabbit R1 號稱用語音來實(shí)現(xiàn)跨應(yīng)用跨平臺的操作

雖然 Rabbit R1 的表現(xiàn)與他們所描繪的場景相差甚遠(yuǎn),但是這個(gè)愿景本身非常美好,GPT-4o 等機(jī)器人在視覺理解的優(yōu)秀表現(xiàn),也讓人感覺讓 AI 代替人類實(shí)現(xiàn)操作的未來確實(shí)不遠(yuǎn)了。

蘋果作為一家在開發(fā)者中極具號召力的公司,完全可以不用模仿初創(chuàng)公司 Rabbit 全盤使用「LAM」的做法,可以通過開放相關(guān)接口和提供 SDK 的做法,讓各大第三方開發(fā)商在應(yīng)用中原生支持 AI 操作,帶來更加成熟穩(wěn)定的語音操作體驗(yàn)。

蘋果相關(guān)的研究顯示,他們確實(shí)有這種想法,配套蘋果的應(yīng)用 UI 設(shè)計(jì)標(biāo)準(zhǔn),Siri 能夠更容易理解 iPhone 屏幕上的一切。

蘋果也在研究怎么讓大模型看懂 UI

雖然技術(shù)不如人,但蘋果在用戶數(shù)量和生態(tài)構(gòu)建上的領(lǐng)先,能成為一種非常強(qiáng)大的優(yōu)勢。

9to5Mac 這樣預(yù)測和評價(jià)蘋果即將到來的 Siri 和 AI 更新:

在 WWDC 上。我們或許不會看到任何特別革命性的東西,但 AI 融入數(shù)百萬人每天使用的系統(tǒng)和應(yīng)用本身就是一場革命。

比起 Rabbit R1 這種新潮硬件,人人都有的智能手機(jī)或許才是 AI 的最佳載體。

用戶不需要知道自己在用的是 AI 功能,但是當(dāng)他讓 Siri 幫忙規(guī)劃一個(gè)旅游計(jì)劃、幫訂機(jī)票的時(shí)候,AI 已經(jīng)在開始深刻改變他的生活。

本文來源:Appso

Siri    AI
appso

網(wǎng)友評論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部