為什么說邊緣計算有望成就高通的“算力夢” 即時焦點
6月2日,邊緣計算概念股持續活躍,美格智能強勢漲停。
此前高通公司高級副總裁表示,高通正在從一家通信公司過渡到一家邊緣計算公司。
【資料圖】
國盛證券指出,與英偉達在計算能力相對應,高通在全球通信領域處于霸主地位,無論是從決定無線通信能力的基帶產品,亦或是決定手機性能的手機芯片,高通都擁有絕對的全球領先地位。而隨著“算力”成為AI時代的最寶貴資源,高通不滿足于“通信”能力的領先,而是希望依靠通信能力和終端設備布局,從邊緣側進軍被英偉達覆蓋的算力領域。
國盛證券認為,隨著AI刺激下,算力加速走向“泛在”,高通有望憑借其手機芯片,物聯網芯片、通信芯片三大能力,成為邊緣算力的“英偉達”。
國信證券還提到,目前具備運行優化模型能力的終端僅限頭部品牌旗艦手機,隨著AI大模型在邊緣端落地,有望推動新一輪換機潮。
邊緣算力優勢
邊緣算力,通常指部署在設備本地的算力或者離用戶距離較近的數據中心中的算力,邊緣算力相較于云端算力,擁有低成本、低時延、高隱私三大特性。
1)低成本:當前主流的邊緣算力平臺主要采用高通主導下的ARM架構,相比于英偉達的復雜架構,ARM架構在小算力時擁有極低的單位成本,是降低開發與用戶成本的必然選擇。
2)低時延:邊緣算力一般搭載在本地,無需將數據發送至云端并等待回傳的時間,可以滿足如自動駕駛,快速對話等對時延要求高的場景。
3)高隱私:邊緣算力依靠設備本身搭載的算力或在用戶自有服務器上的算力進行推理,可以實現數據不出用戶管轄范圍,對隱私的保護更好。
當下邊緣算力主要有兩種存在模式,一種是設備本身搭載的算力,這類算力通常依托邊緣處理芯片存在,邊緣處理芯片包括了手機終端上的驍龍與蘋果M平臺,面向IOT設備的如高通8155芯片或者專為AI優化的QCM8550芯片。通常,大單品采用直采芯片+定制PCB的形式進行開發,而中小廠商與細分垂直領域往往采購模組來滿足算力需求。
第二種算力存在形式是邊緣資源池,通常由離用戶較近的核心城市內的數據中心構成,或者由廠區,道路旁的小機柜、算力盒子提供算力。
AI生態中最重要的組成部分之一
國盛證券指出,當前市場普遍聚焦于云端算力發展,忽視了邊緣算力在AI乃至社會數字化發展中的重要地位。隨著AI大模型應用逐漸滲透進入千行百業和各類垂直細分場景,單純的大規模計算中心提供的算力將不能滿足多樣化的AI運算需求,其認為邊緣算力具備不可或缺性:
第一,未來隨著計算芯片加速發展,單位算力成本中,電費與土地費用占比將愈發提升,算力成本將取決于智算中心的地理位置,以我國舉例,未來算力成本較低的西部將是云端算力主要部署地。因此,大算力與低時延需求將出現錯配。
第二,AI模型推理Token費用較貴,如果需要成熟商用,邊緣預處理將是必須選項。通過邊緣部署的算力,將用戶的多樣化需求進行本地的預處理,簡單的需求直接利用本地模型和算力推理,復雜需求通過邊緣算力預處理后,精簡成最少的TOKEN發送至云端,從而能夠最低成本的實現應用功能,加速商業化。
最后,無論是對用戶個人敏感數據進行推理,還是推理設計商業敏感數據,完全與云端隔絕的邊緣算力,能為用戶提供最好的數據安全保護。
國盛證券表示,在生成式AI爆發前,邊緣算力已經逐漸滲透進了部分商用場景,如手機云游戲、無人設備駕駛、自動視頻識別等。如今隨著MLC-LLM,谷歌模型體系等軟件基建加速,特斯拉機器人為具身智能完成物理基建,在終端設備上推理生成式模型,甚至讓智能設備同物理世界自主交互的條件已經具備,未來隨著應用加速滲透、預處理模型需求爆發,以及邊緣小模型推理,智能設備物理交互需求爆發。
邊緣端落地有望推動新一輪換機潮
國信證券還提到,AI部署本地化具有必要性,優勢包括更低的延遲、更小的帶寬、提高數據安全、保護數據隱私、高可靠性等。完整的大模型僅參數權重就占滿一張80G的GPU,但是通過量化、知識蒸餾、剪枝等優化,大模型可以在手機本地實現推理。
其指出,不過目前具備運行優化模型能力的終端僅限頭部品牌旗艦手機。
根據目前各家公司對于邊緣端部署的情況推測,即使經過量化、剪枝、蒸餾等方式優化大模型后,仍然需要旗艦版的手機芯片可以勉強承載運行。
假設旗艦機型主處理器頻率應在2.8GHz以上,或是價格在1000美金以上,根據IDC數據,1Q23全球手機銷量中主處理器頻率超過2.8GHz的占比36%,銷售價格在1000美金以上的手機銷量占比13%。
國信證券,隨著AI大模型在邊緣端落地,有望推動新一輪換機潮。
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。關鍵詞: