今日播報!賽道Hyper | 誰能阻擋AI GPU霸主英偉達的腳步
盡管英偉達僅在5月30日盤中突破萬億美元市值,短暫進入高光時刻便再次跌回萬億美元以下市值,但由ChatGPT引發的“英偉達”旋風,在AI業界卻越刮越猛。
6月1日,多個獨立信源告訴華爾街見聞,英偉達CEO黃仁勛將于6月5日至6月11日期間抵達中國大陸。但英偉達沒有向華爾街見聞正面確認此則消息。
眼下,A股但凡和“英偉達”或“黃仁勛”三字沾邊,個股都受到市場熱捧。5月29日,黃仁勛在參加COMPUTEX 2023中國臺北國際電腦展會時,演示英偉達新平臺Isaac AMR(自主移動機器人)。這個平臺的底盤采用了科創板公司的RMP系列產品,該公司盤中立即漲停。
(資料圖)
在“超級AI應用”ChatGPT的指引下,英偉達第二季度營收預測值超出市場預期竟高達驚人的50%,至110億美元。
誰還能阻擋英偉達稱霸AI賽道?
英偉達的AI GPU強在何處?
英特爾已不再是當年那家占據統治地位的科技公司。
原本CPU是PC或服務器最重要的核心部件。但是現在,加速計算芯片通過殺手級應用ChatGPT正在加速取代CPU的地位。算力成為以IDC為基礎條件的AI應用發展核心驅動力,GPU成為關鍵部件。
“生成式人工智能將是(英偉達業績)引爆點。”黃仁勛說,“與CPU相比,未來IDC更需要GPU,因為數據都將通過生成式LLM自動生成,而非主要用于數據檢索?!鄙蓴祿枰嗟腉PU,而檢索數據,只需要CPU。
目前,性能愈發強悍的PC系統配置了超過8個服務器GPU和1個CPU的算力硬件,英偉達占據了全球超過八成(84%)的服務器(IDC:數據中心)GPU市場份額。
比如,英偉達DGX系統,這是用于數據訓練的IDC核心算力來源,搭載了8顆英偉達高端H100 GPU,還有兩顆CPU;谷歌的A3超級計算機,同樣用了8顆英偉達H100 GPU,但只用了1顆英特爾制造的高端至強處理器。
據英偉達公示的技術資料顯示,H100于2022年三季度發布,訓練速度比A100快9倍,推理速度比上代產品A100快30倍。5月29日,黃仁勛發布了GH200超級芯片,這是英偉達開發的基于Arm架構的CPU+GPU集成方案,用于開發聊天機器人、互聯網推薦系統算法等大模型AI應用。
這個趨勢隨著AGI在產業的持續落地,產生的影響日益顯著。英偉達IDC業務在第一季度增長了14%,但英特爾的AI和IDC業務部門業績下降了39%。
另一項因素也在加強英偉達超越英特爾的優勢。英偉達服務器GPU售價極高,單顆英偉達H100售價高達4萬美元(eBay平臺加急售價),而英特爾最新一代至強CPU的單顆標價雖然也很高,但“只有”1.7萬美元。
當然英偉達也不是全無對手,當年英特爾的上游合作伙伴AMD,也在發力服務器GPU,包括高通、蘋果、谷歌和亞馬遜在內的眾多巨頭,都在設計開發移動AI算力芯片,而非服務器GPU;甚至是英特爾,在游戲領域的GPU技術實力,同樣不容小覷。
但是在眼下,英偉達確實一家獨大。但凡提及AGI算力,無不將英偉達服務器GPU列為首選。這主要是因為AGI目前對算力極為渴求,要處理處理TB級數據,訓練性能要求極高,而在需要“推理”的過程中使用模型生成文本、圖像或預測,也不是移動AI GPU能達成的。
更重要的還不在于英偉達的GPU硬件性能,而是——英偉達的AI軟件系統:英偉達的AI專有軟件,能輕松聚合GPU的硬件功能用于AI應用程序。
黃仁勛在英偉達財報電話會議上也說,“我們的軟件不易復制,(競對)必須設計所有的軟件、庫和算法,將它們集成到框架中并做持續優化;同時,軟件架構也同樣需要優化迭代?!?/p>
也就是說,要做到和英偉達一樣,實現GPU與AI應用的無縫銜接,要做的不僅僅是優化芯片的設計和性能,還需要對軟硬件的技術架構和整體框架做同步優化,這是一項系統工程。要超越單品性能雖然不易,但并非全無可能,但面對系統級能力,談超越,難度不言而喻。
英偉達也在持續增加對IDC的資本投入。據英偉達最新財報顯示,其整體收入中,IDC資本支出的份額占比已增至8.4%,而之前根據其上一年的固定比率預測為6.5%。
初創公司和巨頭的現實威脅
看上去似乎無人能阻擋英偉達在AI技術領域的統治地位,但AI前景的無限空間,仍在吸引無數挑戰者。
除了上文提及的多家巨頭,初創AI公司成為英偉達AI挑戰者大軍不容忽視的一部分。當然,這種技術要求的初創公司很難出自無名之輩。
有一則極具戲劇性的傳聞,出自在前沿技術和應用領域極為活躍的特斯拉公司首席執行官埃隆·馬斯克(Elon Musk)之口。這位持續讓世人驚嘆的科技巨子說,“就連狗都在搶GPU”。
有鑒于此,所以馬斯克雖然在口頭上叫停研究AI技術,但他的身體卻很誠實:這位老兄在今年3月9日建立了一家取名為“X.AI”的AI公司,還偷偷摸摸買了10000顆英偉達GPU。
想分英偉達一杯羹的還有來自英特爾公司架構、圖形和軟件(IAGS)部門的副總裁、首席架構師Raja Koduri,這位技術大拿已于今年3月底離職。接下來,Raja Koduri將創辦一家AI技術公司,主要研發新一代生成式AI工具,目的是削弱英偉達對數字電影和視頻游戲市場的控制力。
與馬斯克的X.AI公司不知道要干嘛相比,Raja Koduri的計劃更清晰。他這家尚未命名的AI初創公司,第一個項目,是要創建一套AI工具,以便讓包括電影和游戲藝術家在內的消費群體,無論用PC、Mac、iPad還是其他設備,都無需深入研究軟件代碼而直接生成自己想要的工作結果。
盡管這些AI賽道新手看上去很想大干一場,但真正對英偉達有現實挑戰能力的還是AMD、微軟和谷歌此類巨頭。其中,AMD在游戲領域的GPU對英偉達有些許威脅,但IDC需要的服務器專用GPU性能無法望其項背。
至于微軟、谷歌甚至云服務商比如亞馬遜,都一面和英偉達保持良好的業務合作,一面又在下大本錢研發自己的AI專用GPU。
比如微軟,這個桌面PC時代的超級霸主,正是OpenAI的背后金主(2019年微軟給OpenAI投了10億美元),同時也是英偉達H100芯片最大的采購方。今年3月,微軟用數萬顆英偉達GPU幫OpenAI組裝了一臺AI超級計算機。
但微軟也在推進自己的AI芯片研發計劃,代號“雅典娜”。這項計劃始于2019年,目標是為訓練LLM(大語言模型)等軟件而設計,同時可支持推理,能為ChatGPT背后的所有AI軟件提供算力支持,初代雅典娜GPU量產時間表被定于2024年。
與微軟相比,谷歌對英偉達的威脅可能更顯著。目前谷歌的AI處理芯片是專為AI研究開發機器學習(Machine Learning)的專屬芯片TPU(張量處理單元),能同時處理“云上”訓練和推理,并設計了基準測試工具MLPerf。
谷歌TPU如今已迭代到V4版。據谷歌4月6日披露,得益于互連技術和領域特定加速器(DSA)方面的關鍵創新,谷歌云TPU v4在擴展機器學習系統性能方面比其前代版本有了近10倍的飛躍。
TPU v4是谷歌于2021年推出的、專門用于執行機器學習的AI芯片,是谷歌第5代特殊領域加速器(DSA:Domain Specific Accelerator)及第3代用于ML模型的超級計算機平臺,其性能與英偉達A100相比,速度快1.2-1.7倍,功耗低1.3-1.9倍。
盡管如此,就眼下看,對英偉達具有商業層面現實威脅的公司,還不存在。這些威脅,現在還處于水面之下。
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。關鍵詞: