大語言模型或推動“換機潮”產業鏈公司望集體受益
(資料圖片)
■機會挖掘
■國信證券
大模型參數量級飛漲,相應訓練集需同比提升。李開復定義AI2.0時代的特征是通過海量數據,無需標注自監督學習,訓練一個基礎大模型,并在各領域將其專業化。據相關論文,當模型的參數量大于某閾值,會展現出類似推理、無監督學習等未曾出現的能力,這種現象被稱為“涌現”,因此目前大語言模型參數均在十億量級以上。同時,Deepmind研究表明,模型參數的上漲需要配合等比例上升的優質數據集來達到最佳訓練效果。因此,大模型參數在十億級以上發展并受限于優質數據集的增速是AI發展的必然趨勢。
大模型增長挑戰芯片算力和內存,無法實現完整端側部署。大模型訓練和推理的三大瓶頸是算力、顯存和通信,根據我們的測算,算力方面GPT-3 訓練所需算力為121528TFLOPS,若30天內完成,需要1558顆A100。內存角度,GPT-3訓練至少需要3.2T內存,至少44張A100,推理任務則主要受顯存限制,需要4至8張A100,因此完整的模型無法在終端上離線運行。
優化后大模型可在旗艦機型芯片上運行,AI落地有望推動新一輪換機潮。AI部署本地化具有必要性,優勢包括更低的延遲、更小的帶寬、提高數據安全、保護數據隱私、高可靠性等。完整的大模型僅參數權重就占滿一張80G的GPU,但是通過量化、知識蒸餾、剪枝等優化,大模型可以在手機本地實現推理。高通團隊使用驍龍8Gen2部署StableDiffusion,實現本地運營15秒出圖,證明了大模型本地化運行的可能,也體現出目前手機芯片的局限性。根據IDC數據,1Q23全球手機銷量中主處理器頻率超過2.8GHz的占比36%,價格在1000美金以上的占比13%,即旗艦機型占比較低,隨著AI大模型在邊緣端落地,有望推動新一輪換機潮。
以大語言模型為核心,以語言為接口,控制多AI模型系統,構建“賈維斯”式智能管家。我們認為大語言模型不僅可以實現對話、創意,未來也有望作為眾多復雜AI模型的控制中心,同時也是接受用戶指令的交互窗口,實現《鋼鐵俠》電影中“賈維斯”式綜合智能管家。23年5月,Google推出PaLM2輕量版Gecko,其可在最新的旗艦機型上離線運行。同月,OpenAI首次推出ChatGPT移動端應用,各家大廠正式進入AI模型移動端創新、競爭時期。智能音箱、全屋智能中控屏、手機、MR等均有望成為這一時代的交互入口。
產業鏈相關公司:半導體:晶晨股份、瑞芯微、全志科技、北京君正、兆易創新;消費電子:傳音控股、歌爾股份、福立旺、聞泰科技、創維數字。
(文章來源:金融投資報)
關鍵詞: