2024 開(kāi)年,去年全球最暢銷的智能手機(jī) iPhone,在中國(guó)的銷量就經(jīng)歷了罕見(jiàn)大跌。 研究公司 Counterpoint 的數(shù)據(jù)顯示,2024 年的前六周,蘋果 iPhone 在中國(guó)的銷量出現(xiàn)大幅下滑,同比下降 24%。華為的復(fù)蘇是其中一個(gè)原因,華為同期的銷量暴漲 64%。 天風(fēng)證券分析師郭明錤此前表示,蘋果下調(diào) 2024 年 iPhone 出貨預(yù)估量至約 2 億部,較上一年下降了 15%,這可能是全球主要手機(jī)品牌中降幅最大的。 郭明錤進(jìn)一步預(yù)測(cè),iPhone 15 系列與新款 iPhone 16 系列的出貨量預(yù)計(jì)將分別在 2024 年上半年和 2024 年下半年同比降低 10-15%。 他認(rèn)為,iPhone「滯銷」的原因可能與高端手機(jī)需求逐漸轉(zhuǎn)向 AI 和折疊屏有關(guān)。郭明錤甚至認(rèn)為,如果蘋果今年無(wú)法推出超出預(yù)期的 GenAI服務(wù),英偉達(dá)的市值很有可能超過(guò)蘋果。 前不久,蘋果最強(qiáng)勁對(duì)手的三星,便是把 AI 功能作為全新旗艦 Galaxy S24 系列手機(jī)的最大賣點(diǎn),兜售「AI 手機(jī)」概念。 在此之前,Google、微軟已高調(diào)宣布自己要在手機(jī)端部署 AI 大語(yǔ)言模型的計(jì)劃,而華為、OPPO、vivo、小米等國(guó)產(chǎn)手機(jī)廠商也先后公布了自己 AI 化的戰(zhàn)略,OPPO 更是直接宣布進(jìn)入 AI 手機(jī)時(shí)代。 手機(jī)廠商們?cè)凇窤I 會(huì)給智能手機(jī)帶來(lái)新鮮感」這個(gè)觀點(diǎn)上達(dá)成了高度一致的共識(shí),而上一次出現(xiàn)這樣步伐一致的局面,可能要追溯到七年前的全面屏浪潮。 不過(guò)到了 2024 年,蘋果不打算再繼續(xù)當(dāng)「局外人」。 最近,庫(kù)克罕見(jiàn)地多次透露蘋果在 AI 方面的雄心。庫(kù)克表示,公司將在 2024年在生成式人工智能領(lǐng)域「開(kāi)天辟地」 我們堅(jiān)信,這將為我們的用戶帶來(lái)革命性的機(jī)會(huì)。 蘋果決定取消長(zhǎng)達(dá)十年的造車計(jì)劃的同時(shí),也將更多資源投入到 AI 項(xiàng)目,造車項(xiàng)目組里的部分員工將被調(diào)到由 John Giannandrea 領(lǐng)導(dǎo)的機(jī)器學(xué)習(xí)和 AI 部門,轉(zhuǎn)向生成式 AI 項(xiàng)目。 在這周發(fā)布新款 MacBook Air 的官方新聞稿,蘋果更是直接用了「全球最佳的 AI 消費(fèi)級(jí)筆記本電腦」(World’s Best Consumer Laptop for AI)這樣的表述。 結(jié)合此前彭博社記者 Mark Gurman 的爆料,蘋果的 AIGC 新功能這很可能會(huì)出現(xiàn)在 6 月份公布的 iOS 18 上。并表示 iOS 18 很有可能會(huì)是 iPhone 歷史上「最重磅」的軟件更新。 目前消費(fèi)者對(duì) AI 手機(jī)還沒(méi)完全接受,小米品牌總經(jīng)理盧偉冰最近還表示「AI 手機(jī)是噱頭」,引發(fā)了不少討論。 可以肯定是,AIGC 與硬件設(shè)備的結(jié)合也會(huì)越來(lái)越快,智能手機(jī)這幾年被認(rèn)為只有擠牙膏式的微創(chuàng)新,未來(lái)幾年內(nèi)可能改變這一局面的變量,可能也只有 AI 了。 iOS 18 要把 Siri 變成 ChatGPT? 關(guān)于 iOS 18 的最有力的爆料并非出自我們熟悉的科技記者們,而是來(lái)自庫(kù)克。 在最近一次財(cái)報(bào)電話會(huì)議中,庫(kù)克在接受采訪時(shí)透露,蘋果一直在密切關(guān)注生成性 AI 技術(shù),并在團(tuán)隊(duì)內(nèi)部進(jìn)行了大量的探索與實(shí)踐。 他強(qiáng)調(diào),蘋果一貫的做法是先確保工作達(dá)到一定標(biāo)準(zhǔn)后,再公開(kāi)討論相關(guān)成果。庫(kù)克還提到,蘋果將在今年晚些時(shí)候分享一些讓人興奮的新進(jìn)展。 此前有報(bào)道指出,蘋果正在自主研發(fā)大語(yǔ)言模型,并已在內(nèi)部使用它作為人工智能助手進(jìn)行回答。結(jié)合這些信息,蘋果有可能會(huì)在 iOS 18 中集成大語(yǔ)言模型,以提升 Siri 的性能并引入新的功能。 蘋果的機(jī)器學(xué)習(xí)團(tuán)隊(duì)最近發(fā)表的一篇論文《LLM in a flash : Efficient Large Language Model Inference with Limited Memory》也在側(cè)面印證了這個(gè)消息的真實(shí)性。。在這篇論文中,研究團(tuán)隊(duì)討論了手機(jī)和平板等設(shè)備上內(nèi)存限制對(duì)運(yùn)行大型語(yǔ)言模型的影響,并提出了兩種解決計(jì)算瓶頸的方法,為將來(lái)部署大型語(yǔ)言模型鋪平了道路。 繼續(xù)翻閱這一年來(lái)蘋果機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)發(fā)表的論文,你會(huì)發(fā)現(xiàn)蘋果團(tuán)隊(duì)尤其關(guān)注如何把大語(yǔ)言模型與自然語(yǔ)言處理結(jié)合。 例如,一篇發(fā)表于 12 月的論文《Federated Learning for Speech Recognition: Revisiting Current Trends Towards Large-Scale ASR》指出,雖然大型語(yǔ)言模型在多項(xiàng)自然語(yǔ)言處理任務(wù)中表現(xiàn)出色,但在口語(yǔ)理解任務(wù)上的性能還依賴于準(zhǔn)確的自動(dòng)語(yǔ)音識(shí)別轉(zhuǎn)錄(ASR)或內(nèi)置理解模塊。 因此,研究團(tuán)隊(duì)提出了新的解決方案,以提高模型在理解自然語(yǔ)言識(shí)別內(nèi)容方面的準(zhǔn)確性。 而在另一篇論文《Leveraging Large Language Models for Exploiting ASR Uncertainty》中,蘋果團(tuán)隊(duì)則在研究如何將大語(yǔ)言模型與網(wǎng)絡(luò)搜索、機(jī)器翻譯結(jié)合,以提高生成內(nèi)容的準(zhǔn)確性和質(zhì)量。 盡管這些研究成果不一定直接應(yīng)用于產(chǎn)品設(shè)計(jì)中,但足以顯示蘋果在結(jié)合大型語(yǔ)言模型和 Siri 投入了大量精力。 在 Siri 問(wèn)世之前,iPhone 的人機(jī)交互主要依賴于觸控操作。Siri 的加入為交互方式增加了新的維度,但精確的語(yǔ)音識(shí)別一直是個(gè)挑戰(zhàn)。 彼時(shí),不夠成熟的語(yǔ)音識(shí)別技術(shù)難以給用戶帶來(lái)自然流暢的交互體驗(yàn),號(hào)稱「革命性產(chǎn)品」的錘子 TNT 便是前車之鑒。 現(xiàn)在,大語(yǔ)言模型的出現(xiàn)或許能解決掉一些「技術(shù)障礙」。 也許你已經(jīng)在社交平臺(tái)上刷到過(guò)人與 ChatGPT 手機(jī)端 app 語(yǔ)音聊天的視頻。在這些視頻里,對(duì)答如流的 ChatGPT不僅顯示出其強(qiáng)大的思考和回答能力,還能模仿人類語(yǔ)氣和口音的能力,幾乎可以通過(guò)圖靈測(cè)試,展現(xiàn)了語(yǔ)音助手真正的潛力。 ChatGPT 強(qiáng)大的理解能力給了人們進(jìn)一步的想象空間。近期,北京交通大學(xué)和阿里巴巴的研究團(tuán)隊(duì)發(fā)表的論文《Mobile-Agent: Autonomous Multi-Modal Mobile Device Agent with Visual Perception》開(kāi)始探討使用 AI 實(shí)現(xiàn)手機(jī)操作的可能性。 他們基于 GPT-4V 設(shè)計(jì)了一個(gè)名為 Mobile-Agent 的多模態(tài)代理,能夠通過(guò)自然語(yǔ)言指令自動(dòng)執(zhí)行像搜索視頻、評(píng)論,甚至斗地主等操作。 Mobile-Agent 的操作依賴 GPT-4V 的視覺(jué)識(shí)別作定位,因此經(jīng)常會(huì)有識(shí)別出錯(cuò)導(dǎo)致操作失敗,如果把這個(gè)這個(gè)過(guò)程替換為自動(dòng)化機(jī)制,成功率將大幅提升,而這正是蘋果在研究的應(yīng)用方向。 據(jù) Mark Gurman 透露,蘋果正在考慮將 Siri 與快捷方式結(jié)合,以提供更靈活的自動(dòng)化操作。這表明蘋果不僅想要打造一個(gè)更智能的語(yǔ)音助手,而且可能改變語(yǔ)音交互模式,為用戶帶來(lái)全新的交互體驗(yàn)。 如果以上爆料成真,那么 iOS 18 很可能就是蘋果自 2018 年重組 Siri 團(tuán)隊(duì)以來(lái)一直在憋的大招。 用 AI 再次改變改變?nèi)藱C(jī)交互 再來(lái)看看對(duì)手,AI 優(yōu)等生 Google 已經(jīng)在一年時(shí)間內(nèi)完成了在 Android 上的 AI 布局。 自 Google 去年發(fā)布其自研大模型 Gemini 以來(lái),他們就一直在想方設(shè)法把最新的 AI 技術(shù)應(yīng)用到所有產(chǎn)品陣列上,手機(jī)自然也不例外。 首個(gè)用上 Gemini 大模型的產(chǎn)品是親兒子 Pixel 8 系列,基于 Gemini Nano 模型,Google 帶來(lái)了許多創(chuàng)新功能。 例如輸入法可以根據(jù)當(dāng)前對(duì)話內(nèi)容的自動(dòng)回復(fù)消息功能,或者能夠?qū)崟r(shí)轉(zhuǎn)錄錄音為文字并自動(dòng)總結(jié)錄音內(nèi)容的功能等等。 最近,隨著三星最新的旗艦手機(jī) Galaxy S24 系列的發(fā)布,三星和 Google 宣布合作,共同打造 Galaxy AI 體驗(yàn),再次展示了 Google 自研模型的強(qiáng)大。 現(xiàn)在,這些功能不僅限于錄音轉(zhuǎn)文字,甚至在電話通話中的對(duì)話也能實(shí)時(shí)轉(zhuǎn)換為文字,并進(jìn)一步翻譯。如果你在與外國(guó)人通話,系統(tǒng)還能將對(duì)話翻譯成你所使用的語(yǔ)言。 Google 擅長(zhǎng)的 AI 圖像編輯功能也被引入到三星設(shè)備中。當(dāng)用戶拍攝的圖片需要重新構(gòu)圖時(shí),AI 可以自動(dòng)生成畫面中未捕捉到的內(nèi)容,提供一個(gè)全新的視角和比例,完善圖片。 你還可以抹去圖片中的路人或重新調(diào)整物體的位置,AI 將根據(jù)選定的內(nèi)容重新填充圖片。 Google 還推出了一個(gè)強(qiáng)大新功能「畫圈搜索」。當(dāng)你對(duì)圖片中的某個(gè)物品或文本句子感興趣時(shí),只需長(zhǎng)按 Home 鍵激活畫圈界面,在圖片上圈出物體,系統(tǒng)便會(huì)自動(dòng)執(zhí)行搜索,提供相關(guān)信息和購(gòu)買鏈接。 這徹底改變了以往繁瑣的圖像搜索和在線購(gòu)物體驗(yàn)。搜索是 Google 的核心業(yè)務(wù),而「畫圈搜索」的引入實(shí)際上是 AI 能力和 Google 的搜索技術(shù)的結(jié)合,是一次自我革新的嘗試。 過(guò)去,搜索依賴于輸入框,現(xiàn)在,用戶可以通過(guò)簡(jiǎn)單地在手機(jī)屏幕上畫一個(gè)圈來(lái)進(jìn)行搜索,無(wú)需復(fù)雜的關(guān)鍵詞輸入和篩選過(guò)程。 這不僅縮短了用戶與服務(wù)體驗(yàn)之間的距離,而且標(biāo)志著搜索領(lǐng)域的一次革命,并且這種革命是 AI 與設(shè)備硬件結(jié)合帶來(lái)的,是互聯(lián)網(wǎng)時(shí)代無(wú)法實(shí)現(xiàn)的。 這同時(shí)也意味著,雖然現(xiàn)階段 AI 能力可能僅被視為一個(gè)添頭功能,但隨著越來(lái)越多的應(yīng)用程序?qū)?nbsp;AI 開(kāi)放接口,結(jié)合 AI 的強(qiáng)大理解和圖像識(shí)別能力,實(shí)現(xiàn)自動(dòng)化操作,AI 很可能在未來(lái)某個(gè)時(shí)刻爆發(fā),為人們帶來(lái)創(chuàng)新的體驗(yàn),實(shí)現(xiàn)更便捷、更快速的交互。 這是手機(jī)上 AI 應(yīng)用的真正潛力,也為 AI 時(shí)代提供了新的人機(jī)交互模式的思路。 AI 終將成為智能手機(jī)的「新基建」 AI 的突然爆火給了手機(jī)行業(yè)很大的想象空間,高通、聯(lián)發(fā)科等硬件廠商將 AI 算力作為新的角力點(diǎn),開(kāi)始新的算力競(jìng)賽;軟件開(kāi)發(fā)商集思廣益,爭(zhēng)取復(fù)刻 ChatGPT 和妙鴨相機(jī)的破圈傳播。 2024 年,無(wú)疑會(huì)成為手機(jī)系統(tǒng)的大年。 但回歸「AI 到底能給用戶帶來(lái)什么」這個(gè)靈魂拷問(wèn)上,少有廠商能給出讓人信服的答案。用戶真的需要在手機(jī)上每天跟機(jī)器人聊天、用 AI 生成不一樣自拍照嗎?把過(guò)往火爆經(jīng)驗(yàn)硬套在手機(jī)圈的敘事模式上不一定行得通。 蘋果和 Google 給出的答案是回歸用戶體驗(yàn),只有當(dāng) AI 手機(jī)讓智能手機(jī)變得更好用,AI 的加入才有意義。 在 ChatGPT 引領(lǐng) AI 浪潮和各大手機(jī)制造商紛紛宣布 AI 戰(zhàn)略之前,AI 技術(shù)已經(jīng)悄無(wú)聲息地融入到我們?nèi)粘J褂檬謾C(jī)的各個(gè)方面。每當(dāng)你解鎖手機(jī)、使用人臉支付,甚至每次拿起手機(jī)拍照時(shí),AI 技術(shù)都在其中發(fā)揮著作用。 在華為 Mate 60 系列剛發(fā)布時(shí),其可以直接刷碼的智感支付功能在短視頻平臺(tái)上迅速走紅,引起了用戶之間的熱烈分享。 這一功能實(shí)際上是調(diào)用了華為麒麟芯片的 NPU 模塊,通過(guò)專門用于識(shí)別物品并實(shí)現(xiàn)快速跳轉(zhuǎn)。 這種自發(fā)分享行為恰恰說(shuō)明,用戶更關(guān)注的是 AI 技術(shù)帶來(lái)的直接體驗(yàn)提升,而非 AI 計(jì)算過(guò)程本身,AI 不僅背后的重點(diǎn)在于系統(tǒng)體驗(yàn)的潛在提升。 隨著手機(jī)制造商在屏幕和相機(jī)硬件上達(dá)到瓶頸,智能手機(jī)競(jìng)爭(zhēng)很快將會(huì)從硬件層面轉(zhuǎn)向系統(tǒng)層面,廠商們通過(guò)創(chuàng)新交互和提升用戶體驗(yàn)作為其核心競(jìng)爭(zhēng)力。 智能手機(jī)在經(jīng)歷了智能化升級(jí)之后,下一步的體驗(yàn)革命可能會(huì)是更加人性化的升級(jí)。這種理解能力將與圖形計(jì)算一樣重要,并有望成為智能設(shè)備的新標(biāo)配。而這一切的核心,可能正是我們目前正在經(jīng)歷的大語(yǔ)言模型的爆發(fā)。 華為在 8 月宣布 HarmonyOS 4系統(tǒng)全面接入盤古大模型,兩個(gè)月后,小米宣布澎湃 OS 接入「MiLM-6B」模型;vivo 宣布 vivo X100 內(nèi)置藍(lán)心大模型,OPPO 隨后官宣 Find X7 系列內(nèi)置 AndesGPT。 過(guò)去,相冊(cè)識(shí)圖、摳圖功能還是少數(shù)廠商的「獨(dú)門絕技」,而現(xiàn)在有了大模型加持后,這類 AI 功能已經(jīng)成了旗艦手機(jī)標(biāo)配。而隨著大模型應(yīng)用的普及和深度整合,會(huì)促成更高效的計(jì)算硬件、優(yōu)化的算法涌現(xiàn),提高算力利用率和性能,從而降低單位計(jì)算成本。 在接下來(lái)的時(shí)間里,高通、聯(lián)發(fā)科等硬件廠商不斷提高芯片算力,而手機(jī)廠商持續(xù)精進(jìn)模型壓縮和量化技術(shù),以減少模型的大小和運(yùn)行時(shí)資源需求。通過(guò)軟硬件協(xié)同進(jìn)化,手機(jī)端側(cè)大模型有望突破智能拐點(diǎn),實(shí)現(xiàn)算力爆發(fā)。 屆時(shí),語(yǔ)音助手可能成為擬真人類助手,拍攝照片變成一鍵掃描 3D 空間映像,識(shí)圖就能實(shí)現(xiàn)全網(wǎng)比價(jià)……AI 終將和移動(dòng)通信、LBS 服務(wù)一樣,成為我們生活不可割舍的一部分。AI 作為營(yíng)銷熱詞總有一天會(huì)冷卻,但 AI 帶來(lái)的體驗(yàn)革新,將會(huì)深刻改變?nèi)藗兪褂檬謾C(jī)的方式。 文章來(lái)源:APPSO |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選