首頁(yè) > 科技要聞 > 科技> 正文

如何讓用戶(hù)獲得最佳AI體驗(yàn)?高通認(rèn)為這三點(diǎn)尤為重要

騰訊科技 整合編輯:黃安莉 發(fā)布于:2024-02-05 17:03

2023年是大模型狂飆的一年,各種研究日新月異,但它和大多數(shù)普通人的關(guān)聯(lián)還遠(yuǎn)未建立。一方面是由于缺乏有效和多樣的用例,大模型在一般人的手中能發(fā)揮出的作用很難超越搜索引擎。另一方面是體驗(yàn)上的限制。

當(dāng)下主流的大模型應(yīng)用,如ChatGPT, Charater.AI等,都是以App形式承載的云端應(yīng)用,用戶(hù)量一度達(dá)到數(shù)億。但高通高級(jí)副總裁Ziad Asghar認(rèn)為,只有當(dāng)智能設(shè)備有更好的AI體驗(yàn)的時(shí)候,AI應(yīng)用才能真正做到普及。因?yàn)樵O(shè)備端的能力能給用戶(hù)帶來(lái)更快的響應(yīng),更好的個(gè)性化配置和更便宜的價(jià)格。這三個(gè)因素對(duì)于消費(fèi)者最終接受新興產(chǎn)品來(lái)講至關(guān)重要。

這種認(rèn)知也來(lái)自于科技產(chǎn)業(yè)的歷史經(jīng)驗(yàn)。Ziad 認(rèn)為新科技的擴(kuò)散路徑就是從云到端,過(guò)往的互聯(lián)網(wǎng)等技術(shù)變革都是在服務(wù)器中,通過(guò)PC或移動(dòng)端覆蓋到更大的用戶(hù)技術(shù)的。因此AI也會(huì)溯源這一路徑,以設(shè)備為節(jié)點(diǎn)鏈接終端用戶(hù)。

除了AI硬件能力的提升之外,高通對(duì)AI時(shí)代的應(yīng)用和設(shè)備發(fā)展方向也有自己的預(yù)判。Ziad Asghar表示,AI在未來(lái)可能會(huì)成為一切應(yīng)用的入口。這意味著過(guò)往要開(kāi)啟數(shù)個(gè)App才能完成的流程,在未來(lái)只需向AI助手提起單個(gè)需求即可完成。在這一應(yīng)用程序范式轉(zhuǎn)變的過(guò)程中,除了智能手機(jī),AR、VR產(chǎn)品也有可能會(huì)成為AI應(yīng)用的優(yōu)質(zhì)載體。

以下為騰訊科技對(duì)高通高級(jí)副總裁Ziad Asghar訪(fǎng)談全文:

高通現(xiàn)在是一家AI公司

騰訊科技:高通在2023驍龍峰會(huì)上著重強(qiáng)調(diào)了AI能力,在高通的定位中AI是一個(gè)怎樣的game changer?

Ziad Asghar:高通實(shí)際上已經(jīng)在人工智能上投入了超過(guò)15年。2022年底ChatGPT出現(xiàn)之后,人們開(kāi)始每天利用它工作,并尋找在日常中如何更好使用它們的方法。風(fēng)潮過(guò)后,我們思考的是從產(chǎn)品方面,如何讓AI能夠?yàn)橄M(fèi)者做更多的事情。

在過(guò)去,電腦只是一臺(tái)電腦,但現(xiàn)在它可以利用AI為你做很多事情。它能讓你以更高效的方式工作,包括內(nèi)容創(chuàng)作,為你寫(xiě)郵件,完成比以前更多的任務(wù)。

而且在過(guò)去,人工智能是在背后默默工作的。它在幕后幫助你改進(jìn)照片、音頻、語(yǔ)音或視頻質(zhì)量。但隨著生成式人工智能的出現(xiàn),出現(xiàn)了基礎(chǔ)模型和用例,它創(chuàng)造出了新的機(jī)會(huì)。我們每天都可以看到行業(yè)中出現(xiàn)新的模型,這些模型具有更多的功能,能夠?yàn)槲覀儙?lái)新用途。

因此,從智能手機(jī)到PC、從AR/VR到汽車(chē)和IoT,我們的產(chǎn)品都在充分利用我們對(duì)人工智能的長(zhǎng)期投入。這就是我們認(rèn)為AI是行業(yè)真正轉(zhuǎn)折點(diǎn)的原因。它或許會(huì)開(kāi)啟一個(gè)新的周期,人們要買(mǎi)新手機(jī),會(huì)想要一部AI智能手機(jī);他們想買(mǎi)的下一臺(tái)PC,會(huì)是一臺(tái)AIPC。我認(rèn)為這就是我們能夠?yàn)橄M(fèi)者帶來(lái)更多價(jià)值的地方。

騰訊科技:你提到了高通已經(jīng)投入人工智能領(lǐng)域超過(guò)15年,所以它能算一家AI公司了嗎?

Ziad Asghar:我們絕對(duì)是一家人工智能公司,如今大家更能明顯的感知到我們的這一身份。

騰訊科技:高通作為一家硬件公司是如何認(rèn)知自己的AI價(jià)值的呢?

Ziad Asghar:所有的技術(shù)創(chuàng)新都會(huì)從云端開(kāi)始,然后隨著時(shí)間的推移,逐漸過(guò)渡到邊緣設(shè)備上。這正是我們?cè)谌斯ぶ悄茴I(lǐng)域所看到的:生成式AI模型非常龐大,如果你考慮模型和推理所需的工作量,就會(huì)發(fā)現(xiàn)端側(cè)計(jì)算的重要性,F(xiàn)在,我們可以在智能手機(jī)、PC和XR產(chǎn)品上以非?斓乃俣冗\(yùn)行70億、100億和130億參數(shù)的像百川或Llama這樣的大語(yǔ)言模型。在智能手機(jī)上,我們可以以每秒生成20個(gè)token的速度運(yùn)行70億參數(shù)的大語(yǔ)言模型,在電腦上這個(gè)速度達(dá)到了每秒30個(gè)token。因此,我們?cè)诮K端側(cè)已經(jīng)擁有了強(qiáng)大的AI計(jì)算能力。

人工智能的應(yīng)用主要有兩個(gè)部分:訓(xùn)練和推理。模型訓(xùn)練主要發(fā)生在云端,只要給模型提供大量信息,模型只需要訓(xùn)練一次。但訓(xùn)練好的模型需要進(jìn)行推理時(shí),計(jì)算會(huì)多次重復(fù)發(fā)生,這很可能要發(fā)生在終端側(cè)。這其實(shí)顯而易見(jiàn):在2005年,大約有10億人口能夠使用互聯(lián)網(wǎng);但如今,全球有50億人能夠使用互聯(lián)網(wǎng)。這一增長(zhǎng)中的很大部分要?dú)w功于智能手機(jī)對(duì)網(wǎng)絡(luò)的接入。

你完全可以想象人工智能的應(yīng)用發(fā)展也會(huì)是同樣的情況。如今,生成式人工智能基本上是在云端進(jìn)行的,但隨著技術(shù)進(jìn)一步發(fā)展,它會(huì)更多地出現(xiàn)在終端側(cè)。當(dāng)然,終端側(cè)可以與云端協(xié)同工作。這將大大推動(dòng)AI體驗(yàn)的普及。

騰訊科技:在今年,我們看到所有的芯片公司都在強(qiáng)調(diào)人工智能。他們都在打造AI芯片以增強(qiáng)人工智能體驗(yàn)。那么,高通對(duì)AI芯片的定位和相對(duì)優(yōu)勢(shì)是什么?

Ziad Asghar:誰(shuí)能更好地在終端側(cè)運(yùn)行生成式AI,誰(shuí)就將成為人工智能的領(lǐng)導(dǎo)者。這就是為什么我們大力投入于進(jìn)行模型優(yōu)化,以及打造硬件解決方案,讓終端側(cè)能夠在既定功耗下實(shí)現(xiàn)更多的AI能力,我們的硬件AI引擎在既定功耗下有著領(lǐng)先的AI推理性能,這使得我們能夠以盡可能低的功耗,在終端上支持更高參數(shù)規(guī)模的模型,進(jìn)行更多的推理操作。這一點(diǎn)至關(guān)重要。

從硬件角度,我們已經(jīng)開(kāi)發(fā)了模型量化、壓縮和提煉技術(shù)。很多公司在云端訓(xùn)練模型時(shí),是以浮點(diǎn)運(yùn)算方式進(jìn)行訓(xùn)練的。而高通能夠支持整數(shù)運(yùn)算,使得模型規(guī)模更小,功耗也更低。大語(yǔ)言模型的終端側(cè)運(yùn)行帶來(lái)了許多挑戰(zhàn)。要運(yùn)行一個(gè)非常大的模型,需要將其存儲(chǔ)在終端,在處理時(shí)需要占用DRAM內(nèi)存,通過(guò)芯片進(jìn)行推理。如果使用16位浮點(diǎn)運(yùn)算推理像百川這樣參數(shù)達(dá)到70億的大模型,模型會(huì)占用終端大量的DRAM內(nèi)存,許多手機(jī)甚至沒(méi)有那么大的內(nèi)存容量。但是如果使用4位整數(shù)運(yùn)算,內(nèi)存的問(wèn)題就解決了。我們?cè)谶@方面有著豐富的經(jīng)驗(yàn)。同時(shí),我們一直在打造軟件工具,結(jié)合我們領(lǐng)先的硬件平臺(tái),我們能夠非常高效地進(jìn)行模型處理。因此,我覺(jué)得我們非常有優(yōu)勢(shì),可以在AI邊緣側(cè)真正取得領(lǐng)導(dǎo)地位。

得益于我們長(zhǎng)期的AI投入,我們打造了業(yè)界領(lǐng)先的硬件AI能力。以PC為例,我們剛剛發(fā)布了驍龍X Elite,它的高通AI引擎擁有45TOPS的AI性能,而整個(gè)芯片的AI性能達(dá)到了75TOPS。在PC領(lǐng)域,我們的AI引擎,包括CPU、GPU和NPU的性能非常領(lǐng)先。

因此我們可以支持在終端側(cè)運(yùn)行Microsoft Copilot,以低成本打造豐富體驗(yàn),不需要接入云端。這為我們帶來(lái)了巨大的優(yōu)勢(shì),我們能夠賦能PC廠(chǎng)商打造出領(lǐng)先的AIPC產(chǎn)品。當(dāng)然,在智能手機(jī)、汽車(chē)、XR等領(lǐng)域也是如此。

騰訊科技:您剛才提到了軟件。目前英偉達(dá)在AI服務(wù)器中的壟斷地位,在很大程度上是由CUDA toolkit的便利性帶來(lái)的。高通在配套開(kāi)發(fā)軟件這方面有什么舉措嗎?

Ziad Asghar:2022年,我們推出了高通AI軟件棧(Qualcomm AI Stack)這一AI軟件產(chǎn)品組合,它支持所有的AI開(kāi)發(fā)框架,包括TensorFlow Lite,PyTorch,百度飛槳等等,以及所有AI庫(kù)、編譯器等開(kāi)發(fā)工具,讓開(kāi)發(fā)者能夠基于任何引擎(包括CPU、GPU、NPU)進(jìn)行應(yīng)用開(kāi)發(fā)。同時(shí),我們還推出了高通AI引擎Direct的框架,它能允許開(kāi)發(fā)者在非常接近硬件的位置進(jìn)行編碼,這使得他們能夠充分發(fā)揮高通AI引擎的性能。

此外,你將看到我們將通過(guò)在世界移動(dòng)通信大會(huì)等活動(dòng)上推出更多新工具,在開(kāi)發(fā)者支持方面做出更多努力。

(Qualcomm AI Stack 架構(gòu))

從歷史上看,新技術(shù)的擴(kuò)散都是從云到端

騰訊科技:為什么高通選擇了端云混合AI作為你們的主要發(fā)展方向?

Ziad Asghar:這是我們研究了眾多不同的生成式人工智能模態(tài)得出的結(jié)論。首先,對(duì)于不論是大語(yǔ)言模型、視覺(jué)模型(如Stable Diffusion)、還是多模態(tài)模型,大部分模型的運(yùn)算規(guī)模都不超過(guò)150到200億參數(shù)。另一個(gè)趨勢(shì)是模型參數(shù)規(guī)模在不斷縮小,同時(shí)功能越來(lái)越強(qiáng)大。像Llama 2或者是百川這種規(guī)模的模型,他們相比于ChatGPT這樣規(guī)模更大、需要在云端運(yùn)行的模型來(lái)說(shuō),能力也非常強(qiáng)大。所以,當(dāng)你把這兩個(gè)趨勢(shì)結(jié)合起來(lái)思考時(shí),就能明白終端也能夠做更多事情。而且在未來(lái),我們的AI能力會(huì)持續(xù)提升。

但仍然會(huì)有非常龐大的模型,比如推薦模型無(wú)法被壓縮。因此,我們認(rèn)為它們可以繼續(xù)在云端運(yùn)行,在混合AI模式下,模型可以在端側(cè)處理一部分內(nèi)容,這可以保證消費(fèi)者的數(shù)據(jù)隱私,這對(duì)他們來(lái)說(shuō)這非常重要。系統(tǒng)會(huì)將其他推理任務(wù)傳遞到云端進(jìn)行處理。通過(guò)混合AI,模型能夠同時(shí)利用終端和云端優(yōu)勢(shì),給消費(fèi)者提供最佳體驗(yàn)。

假設(shè),你正在利用AI對(duì)電腦上的文件進(jìn)行摘要,如果這個(gè)文件有一定版權(quán)性質(zhì),你肯定希望處理工作能在本地進(jìn)行,那么系統(tǒng)就會(huì)在端側(cè)將這個(gè)任務(wù)完成。但假設(shè)你需要一個(gè)必須在云端處理的推薦模型,我們也可以利用在終端和云端進(jìn)行分布式處理的技術(shù)。AI處理可以擁有一個(gè)云端和終端之間的協(xié)調(diào)層,實(shí)現(xiàn)非常出色,統(tǒng)一的跨終端體驗(yàn)。

騰訊科技:除了隱私保護(hù)外,終端側(cè)AI還會(huì)帶來(lái)什么云端無(wú)法帶來(lái)的用戶(hù)體驗(yàn)?

Ziad Asghar:首先,假設(shè)你在飛機(jī)上無(wú)法連接網(wǎng)絡(luò),這時(shí)候你就無(wú)法使用任何云端大語(yǔ)言模型或其他類(lèi)似的功能。而如果你在終端側(cè)運(yùn)行AI,雖然斷了網(wǎng),但你仍然可以獲得完全相同的體驗(yàn)。在汽車(chē)數(shù)字座艙中也是如此,當(dāng)用戶(hù)駕駛到?jīng)]有網(wǎng)絡(luò)覆蓋的地方,也可以利用終端側(cè)AI。

第二點(diǎn),端側(cè)模型可以實(shí)現(xiàn)非?焖俚捻憫(yīng)。消費(fèi)者的耐心有限,如果不能夠迅速地回答他們的問(wèn)題,他們就會(huì)去其他地方尋找答案。因此,我認(rèn)為即時(shí)性是非常重要的。

第三點(diǎn)是成本。成本是非常重要的因素。如果你不是在終端側(cè),而是在云端運(yùn)行生成式AI,那就會(huì)用到高算力的GPU,耗費(fèi)大量的電力。這些GPU會(huì)消耗數(shù)百瓦的電力,而你的設(shè)備只需要幾毫瓦。因此,當(dāng)有更多的生成式人工智能用例出現(xiàn),有更多的人使用生成式AI時(shí),云端計(jì)算規(guī)模也會(huì)對(duì)應(yīng)增長(zhǎng),成本就會(huì)增加。而在終端側(cè)運(yùn)行則基本解決了這個(gè)問(wèn)題:基本可以說(shuō)是免費(fèi)的。

最后的一個(gè)非常重要的優(yōu)勢(shì)是,智能手機(jī)會(huì)知道現(xiàn)在的時(shí)間,你在美國(guó)還是在中國(guó);智能手機(jī)知道你是在行走,還是在交談,還是在開(kāi)車(chē)。如果我在云端大語(yǔ)言模型上提問(wèn)尋求幫助,它給我的答案和它給我11歲的女兒的答案不會(huì)有任何差別。但如果我們能夠利用終端側(cè)可用的信息,使得查詢(xún)更加精準(zhǔn),AI就可以給我一個(gè)更優(yōu)化的答案,比如一個(gè)根據(jù)我所處位置不同的答案。所以,終端側(cè)AI對(duì)實(shí)現(xiàn)個(gè)性化體驗(yàn)非常重要。甚至可以想象,隨著時(shí)間的推移,手機(jī)或電腦上的模型會(huì)基于用戶(hù)特征進(jìn)行持續(xù)的個(gè)性化優(yōu)化,這是云端模型難以做到的。

訊科技:前幾年流行的“全部上云”風(fēng)潮,包括蘋(píng)果的云游戲策略等,都是通過(guò)云技術(shù)的發(fā)展,延遲的降低,在很大程度上也降低了游戲機(jī)等設(shè)備的端側(cè)能力需求。這一發(fā)展潮流是否會(huì)在AI 模型方面出現(xiàn)?所以端云混合是否只是一個(gè)階段性的解決方法?

Ziad Asghar:云游戲是很多公司嘗試過(guò)的東西。但如果你仔細(xì)觀(guān)察,會(huì)注意到能夠在云上運(yùn)行的游戲類(lèi)型很有限,只有那些對(duì)時(shí)延不敏感的游戲才行,比如策略游戲。但如果是像多人聯(lián)網(wǎng)動(dòng)作游戲這種對(duì)時(shí)延要求很高的游戲類(lèi)型,就不適用于在云端進(jìn)行。在AI用例方面,比如車(chē)機(jī)系統(tǒng)中的ADAS應(yīng)用(高級(jí)輔助駕駛),它必須支持在終端側(cè)進(jìn)行操作,因?yàn)樗鼘?duì)即時(shí)性的要求會(huì)非常嚴(yán)格。所以云系統(tǒng)在很多方面是非常受限的。

另外,這些服務(wù)許多都是需要付費(fèi)的。我認(rèn)為這也是云端和終端的區(qū)別所在。我們?cè)诮K端側(cè)所做的,你可以隨時(shí)進(jìn)行,而且不會(huì)產(chǎn)生費(fèi)用。放在云端的所有東西,都會(huì)持續(xù)收取費(fèi)用。

AI未來(lái)就是一切應(yīng)用的入口

騰訊科技:在目前,AI大模型還主要是以App的形式出現(xiàn)在智能設(shè)備之中的。您覺(jué)得后續(xù)隨著AI能力的加強(qiáng),應(yīng)用程序生態(tài)會(huì)發(fā)生怎樣的變化?

Ziad Asghar:實(shí)際上,這正是我們目前所設(shè)想的情況。假設(shè)你要預(yù)訂一張去中國(guó)的機(jī)票,現(xiàn)在你要做的第一件事是打開(kāi)一個(gè)應(yīng)用,然后找到里面價(jià)格最便宜的航班,把它添加到另一個(gè)日歷應(yīng)用里,然后再查看你的日歷確認(rèn)你什么時(shí)候出發(fā)。這是現(xiàn)在你定航班的流程。

那如果你的虛擬AI助手就是你所使用的終端上的唯一交互對(duì)象,你就只需要和它交互,而它再在幕后啟動(dòng)三、四個(gè)應(yīng)用,為你直接返回結(jié)果,找到最優(yōu)的航班,提供你可以選擇的時(shí)間,F(xiàn)在即使在家里使用一些智能家居應(yīng)用,我也必須打開(kāi)三四個(gè)不同的應(yīng)用才能弄清楚該怎么操作。但有了AI你就不再需要這樣做。

這同樣也適用于汽車(chē)。今天它的交互非常機(jī)械化,但在未來(lái)你可以跟它說(shuō),“我還有大概三個(gè)小時(shí)就要去機(jī)場(chǎng),你能給我找家好吃的日料店嗎?”汽車(chē)就能夠在不耽誤航班的情況下滿(mǎn)足你的需求。這是一種全新的體驗(yàn),就像《霹靂游俠(Knight Rider)》里那樣,我就是看著《霹靂游俠》長(zhǎng)大的。所以我們現(xiàn)在有了這樣的技術(shù),可以改變過(guò)往的用戶(hù)交互界面。

(美劇《霹靂游俠》,1982年開(kāi)播,其中的智慧汽車(chē)K.I.T.T.由AI驅(qū)動(dòng),可以對(duì)話(huà)和自動(dòng)駕駛)

騰訊科技:所以在你看來(lái),AI會(huì)成為一個(gè)萬(wàn)能應(yīng)用嗎?

Ziad Asghar:我認(rèn)為這正是未來(lái)的發(fā)展方向:你不用再打開(kāi)4-5個(gè)應(yīng)用去完成一件事,而只需要和AI虛擬助手交互即可。它會(huì)搜集需要的信息并直接給你答案。這就是人工智能幫助我們節(jié)省時(shí)間的方式。我們不需要再進(jìn)行這些繁瑣的工作了,生活也會(huì)更加輕松。

騰訊科技:那在這樣一種萬(wàn)能應(yīng)用的背景下,電子設(shè)備本身會(huì)發(fā)生什么改變呢?新型的AI設(shè)備會(huì)是什么樣的?

Ziad Asghar:智能手機(jī)當(dāng)然會(huì)從中受益,因?yàn)檫@是人們最常用的終端。但是我們做了更多準(zhǔn)備,我們有AR/VR產(chǎn)品,未來(lái)可能會(huì)有虛擬助手出現(xiàn)在你的AR眼鏡上,它也可以出現(xiàn)在AI Pin上。高通致力于賦能廣泛的邊緣側(cè)智能網(wǎng)聯(lián)終端,我們認(rèn)為其他終端類(lèi)型也將不斷發(fā)展,AI設(shè)備的形態(tài)創(chuàng)新還有很大空間,我認(rèn)為這就是初創(chuàng)公司能盡力進(jìn)行創(chuàng)新的地方。

騰訊科技:你提到了VR、AR。這些XR設(shè)備之所以不流行很大程度上是因?yàn)闆](méi)有合適的交互方式。AI的出現(xiàn)會(huì)改變這種情況嗎?

Ziad Asghar:絕對(duì)會(huì)。比如AR眼鏡,你不能像智能手機(jī)那樣在上面輸入文字,所以最好通過(guò)語(yǔ)音進(jìn)行交互,或者你要指著某樣?xùn)|西,那這個(gè)設(shè)備需要有出色的手部追蹤技術(shù)。它需要不同種類(lèi)的互動(dòng)方式,而人工智能非常適合將這些交互形式變?yōu)楝F(xiàn)實(shí)。

本文來(lái)源:騰訊科技

AI   大模型   高通
騰訊科技

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
二維碼 回到頂部