玉林实硕医疗科技有限公司

賽道Hyper | 華為和蘋(píng)果入局端側AI大模型

端側AI大模型新賽道最近又迎來(lái)兩個(gè)重量級玩家——蘋(píng)果和華為,這為智能終端(主要是手機)走出低迷狀態(tài)提供了新的希望和動(dòng)力。

Apple GPT是蘋(píng)果公司基于其自研的Ajax框架開(kāi)發(fā)的AI工具,目前在蘋(píng)果公司內部展開(kāi)小范圍內測;華為則通過(guò)在8月4日下午舉行的HDC 2023開(kāi)發(fā)者大會(huì )上發(fā)布的HarmonyOS 4的智能助手“小藝”,展示了端側AI大模型在應用層面的能力。


(資料圖片)

此前,Meta、OpenAI、高通、谷歌、騰訊和百度等,已經(jīng)或即將推出支持端側AI大模型的應用或技術(shù)框架,正在快速勾勒這個(gè)全新方向的技術(shù)和市場(chǎng)前景。

HarmonyOS 4:有何端側AI大模型能力

8月4日,華為正式發(fā)布HarmonyOS 4。華為HarmonyOS是面向萬(wàn)物互聯(lián)的全場(chǎng)景分布式操作系統,支持手機、平板、智能穿戴和智慧屏等多種終端設備運行。

在華為這個(gè)著(zhù)名的IoT操作系統的第四版中,端側AI大模型(即在手機側運行大模型)的能力成為關(guān)鍵核心。

“今天我們已進(jìn)入大模型時(shí)代,華為盤(pán)古大模型將助力鴻蒙生態(tài)?!比A為常務(wù)董事、終端BG CEO、智能汽車(chē)解決方案BU CEO余承東說(shuō),“通過(guò)盤(pán)古的底層能力加持,華為將為用戶(hù)帶來(lái)智慧終端交互、高階生產(chǎn)力效率、個(gè)性化服務(wù)的全新AI體驗變革?!?/p>

基于A(yíng)I大模型的文本生成是HarmonyOS 4的一部分。隨著(zhù)大模型的日益發(fā)展,小藝獲得全新升級,增強了交互、生產(chǎn)力和個(gè)性化服務(wù)三個(gè)方面的能力。

文本生成和總結能力,這是各家推出大模型應用的標準能力,HarmonyOS 4也不例外。通過(guò)小藝,可識別圖片中的內容和文字,能朗讀文字內容并接入更多服務(wù)。

高通產(chǎn)品管理高級副總裁兼AI負責人Ziad Asghar認為,大模型將迅速重塑人機交互方式。

HarmonyOS 4的交互變化看上去并不顯著(zhù)。在語(yǔ)音交互基礎上,擴展了文字、圖片和文檔等多種形式的輸入。比如,用日常說(shuō)話(huà)的方式自然地與AI交流,小藝可自動(dòng)完成指定任務(wù)。這一點(diǎn)在iPhone通過(guò)Siri早已能達成。

但是,作為首個(gè)具備AI大模型能力的智能助手,小藝對自然語(yǔ)義的理解更深。

舉個(gè)例子,iPhone的AI助手Siri需要C端用戶(hù)輸入的語(yǔ)音指令語(yǔ)義清晰而精確,而HarmonyOS 4則能理解相對含義不太明顯的語(yǔ)音指令,因而搭載HarmonyOS 4的智能手機,能更精準、更迅速地完成任務(wù)。

此外,由于小藝具有的大模型AI泛化能力和手機智能助手連接了多種服務(wù)和特殊場(chǎng)景,因此也能比之前更快地獲取服務(wù)。

比如,若收到一張活動(dòng)海報圖片,C端用戶(hù)對小藝下達指令,AI能自動(dòng)識別圖片上的地址,給出導航按鈕或保存海報電話(huà)作為聯(lián)系方式。

若瀏覽一篇數千字的英文新聞,小藝可直接速讀文章、做翻譯并完成摘要,也能回答與該篇新聞?dòng)嘘P(guān)的問(wèn)題。

HarmonyOS 4還有生成能力。比如自動(dòng)生成各類(lèi)商業(yè)電子郵件內容或生成圖像;也能用終端保存的個(gè)性化照片,小藝調用AI畫(huà)圖功能生成各種風(fēng)格的圖片。

隨著(zhù)C端用戶(hù)和小藝的持續交流,小藝會(huì )持續提升AI能力。這些交互數據會(huì )保留在端側,以保護用戶(hù)隱私。

個(gè)性化是智能手機應用的特征。小藝具備的記憶能力會(huì )隨著(zhù)長(cháng)時(shí)間使用,越來(lái)越懂“主人”,給出的建議更貼心:比如出行,在出行前提供完備而豐富的出行信息,落地后又能提供本地信息,并根據用戶(hù)習慣,實(shí)現個(gè)性化推薦。

據華為透露,小藝這些新的能力,將在8月下旬開(kāi)啟公開(kāi)測試體驗。

這不是華為首次嘗試將AI大模型接入移動(dòng)終端。今年3月,華為發(fā)布的P60手機,自帶智慧搜圖功能。這項功能基于多模態(tài)大模型技術(shù),通過(guò)在手機端側對模型做小型化處理,實(shí)現了手機側的大模型運行。

蘋(píng)果動(dòng)作緩慢,高通熱情高漲

瞄上端側AI大模型能力的智能終端商不只有華為,還有蘋(píng)果。

蘋(píng)果正在秘密研發(fā)的GPT軟件叫做Apple GPT,基于蘋(píng)果自研的Ajax框架開(kāi)發(fā)。

但目前,Apple GPT缺乏更多細節,外界難以知曉其技術(shù)或應用能力究竟有哪些亮點(diǎn)。對此,蘋(píng)果明確表示,目前尚未決定Apple GPT未來(lái)的開(kāi)發(fā)方向。

此前,在第二財季財報電話(huà)會(huì )議中,蘋(píng)果CEO庫克承認,Al潛力巨大,但如何使用AI技術(shù),仍需要深入思考。庫克說(shuō),蘋(píng)果已將AI技術(shù)整合進(jìn)產(chǎn)品和服務(wù),未來(lái)也將繼續這一進(jìn)程。

全球首個(gè)面向消費級市場(chǎng)、大規模落地、應用NLP技術(shù)的智能助手,iPhone Siri,今年已經(jīng)12歲。與剛剛全新升級的華為小藝、小米小愛(ài)、百度小度一眾“晚輩”相比,Siri非但不智能,還顯得有點(diǎn)“智障”。

外界認為,蘋(píng)果落地GPT能力的載體很可能是這個(gè)呈現“暮年”狀態(tài)的Siri,但這未能得到蘋(píng)果的證實(shí)。

盡管如此,蘋(píng)果入局端側AI大模型的跡象非常多。比如,今年1月,蘋(píng)果啟動(dòng)一項新計劃,為Apple Books添加數字旁白功能,以從書(shū)面文本中自動(dòng)生成高質(zhì)量的AI旁白音頻;在iOS17更新版,蘋(píng)果用Transformer語(yǔ)言模型完善輸入法的預測和拼寫(xiě)糾正功能。

還有,新款AirPods Pro通過(guò)機器學(xué)習(ML)實(shí)現自適應音頻模式,可通過(guò)識別外部環(huán)境自動(dòng)調節音量;iPadOS 17用機器學(xué)習模型實(shí)現對PDF字段的識別;Vision Pro使用機器學(xué)習技術(shù)“編碼器-解碼器”神經(jīng)網(wǎng)絡(luò )為用戶(hù)構建數字化身。

蘋(píng)果如何布局AI賽道,這是一個(gè)系統大問(wèn)題,很難用數百字說(shuō)明白。但Siri開(kāi)發(fā)團隊的技術(shù)工程師對改變Siri的“蠢笨”看起來(lái)缺乏真正的動(dòng)力,背后折射了“組織功能障礙和缺乏雄心”的現實(shí),很可能會(huì )影響蘋(píng)果在端側落地AI大模型的效率。

但蘋(píng)果的低效,不能改變端側AI大模型在智能終端的部署規模,這是無(wú)可存疑的事實(shí)。因為包括高通、Meta、OpenAI、谷歌、亞馬遜、騰訊和百度,都在等都致力于實(shí)現AI大模型在移動(dòng)終端的輕量化部署。

OpenAI團隊在7月第四周推出覆蓋iOS/安卓系統的移動(dòng)端ChatGPT應用;Meta將與高通合作,從2024年起,其開(kāi)源大模型Llama 2將能在旗艦智能手機和PC上運行;高通表示正在將更多生成式AI用例向邊緣側遷移,目前,參數超過(guò)10億的AI模型已經(jīng)能夠在手機上運行,且性能和精度達到與云端相似的水平。

谷歌、騰訊、百度等已將模型壓縮技術(shù)緊密結合移動(dòng)端模型部署框架/工具。

其中,高通對此熱情高漲。高通首席執行官克里斯蒂亞諾·阿蒙在一份聲明中強調,高通能在手機上而不是云服務(wù)器上運行AI模型,這為高通提供了實(shí)現“拐點(diǎn)”的機會(huì ),從而推動(dòng)未來(lái)的增長(cháng)。

“總之,我們處于獨特的地位,可以幫助塑造和利用即將到來(lái)的設備上的Gen AI機會(huì )?!卑⒚烧f(shuō)。

智能手機整體市場(chǎng)下滑態(tài)勢何時(shí)能停止,目前仍無(wú)法確定;但是,端側AI大模型賽道迎來(lái)的這波眾多B端參與者,是重塑這個(gè)日漸低迷的電子消費品類(lèi)的應用和市場(chǎng)格局的新希望所在。

風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。

關(guān)鍵詞: