玉林实硕医疗科技有限公司

字節的野心:做大模型時代的“軍火商”

字節跳動謹慎邁出了跨入大模型賽道的第一步。

6 月 28 日下午,字節旗下的火山引擎召開發布會,首次正式公布在大模型領域的研發布局和合作進展,并發布大模型服務平臺火山方舟,提供模型訓練、推理、評測、精調等全方位功能與服務。


【資料圖】

此前,百度、阿里、騰訊、商湯、360 等國內大廠已經相繼宣布入局,大部分的做法都是發布一個通用大模型或者數個行業大模型底座,行業客戶可以基于這些基礎模型和自身擁有的行業數據精調,打造一個服務自身業務的 AI 應用。

但字節的切入方式與其他大廠有明顯的不同。火山沒有發布自己的通用大模型或者行業大模型,火山方舟聚合了一批第三方生產商開發的大模型底座。

火山引擎向大模型生產商提供構建、訓練大模型基座所必須的算力和工具體系,并將這些生產商的大模型聚集到自己的 MaaS 平臺,供應給企業使用。這與微軟投資算力供給 OpenAI,并基于后者開發的 GPT 模型向企業提供 Azure AI 云服務,有相似之處。

因此,火山引擎介紹的合作案例也與其他大廠有所差異。這場發布會上登臺的合作伙伴,包括英偉達這樣的上游顯卡供應商,以及智譜 AI、百川智能、IDEA 等當下國內第一梯隊的大模型開發商。而其他大廠的發布會,介紹的往往主要是金融、文旅、企服等各行各業的合作伙伴。

火山引擎總裁 譚待

截至今年 5 月,國內已公開披露的大模型數量達到 79 個。按照火山引擎總裁譚待的說法,未來大模型市場一定不會是一家或者幾個寡頭壟斷,而是一個百花齊放的多模型市場,會有少數幾個超級大模型,多個通用大模型,和更多行業/垂直大模型。

企業使用大模型,未來也會呈現「1+N」的模式,除了通過自研或深度合作,形成 1 個主力模型;由于成本和場景復雜多元等原因,在這個主力模型之外,還會有 N 個模型同時應用。

大模型開啟了新一輪行業變革,在這個淘金時代,OpenAI、谷歌、MiniMax、百川智能等大模型生產商是時代浪尖的淘金者。而火山引擎要做的,就是要在大模型時代「賣鏟子」。

01?火山引擎大模型?服務平臺——火山方舟

會上,火山引擎發布了自己的 MaaS 平臺——火山方舟。

火山引擎總裁譚待在會后接受媒體采訪時強調:火山方舟最終服務的是模型的應用方;火山引擎是跟大模型的生產方合作,一部分被精選的大模型廠商在火山方舟上部署,然后對外提供服務。

想讓企業用戶和大模型生產商加入到火山方舟的生態體系,首先要解決的是數據安全的問題。

火山引擎總裁譚待認為,企業使用大模型,最擔心的是數據泄露;如果將大模型私有化部署,企業將承擔更高的成本,模型生產方也會擔心知識資產安全?!富鹕椒街邸沟氖滓蝿眨褪亲龊么竽P褪褂谜?、提供者和云平臺可以互相信任的安全保障。

據火山引擎智能算法負責人吳迪介紹,「火山方舟」已上線了基于安全沙箱的大模型安全互信計算方案,利用計算隔離、存儲隔離、網絡隔離、流量審計等方式,實現了模型的機密性、完整性和可用性保證,適用于對訓練和推理延時要求較低的客戶。

安全沙箱示意圖

此外,「火山方舟」還在探索基于 NVIDIA 新一代硬件支持的可信計算環境、基于聯邦學習的數據資產分離等多種方式的安全互信計算方案,更全面地滿足大模型在不同業務場景的數據安全要求。

第二,想要讓企業可以更高效地打造AI 大模型應用。一方面要降低企業用戶使用大模型打造應用的門檻,另一方面也要降低用戶使用大模型服務的成本。

上文提到,火山引擎認為未來企業使用大模型會呈現「1+N」的模式,也就是 1 個自研主力模型+N 個小模型同時應用。比如一個對話式的 AI 服務產品,對話功能的基礎是源自企業自研的大模型,但提供文生圖、文生視頻、特定語種翻譯,或者回答醫療、金融等專業領域的問題時,卻可以調用其他的小模型。

這樣做最大的好處是降低模型的推理成本。吳迪稱,訓練大模型很昂貴,但是從長期來看,模型的推理開銷會超過訓練開銷。效果和成本的矛盾永遠存在,降低推理成本會是大模型應用落地的重要因素,「一個經過良好精調的中小規格模型,在特定工作上的表現可能不亞于通用的、巨大的基座模型,而推理成本可以降低到原來的十分之一。」

舉例來說,微軟以醫學文章數據精調了生物領域的 BioGPT-Large 模型,僅有 15 億參數,其在 PubMedQA 基準測試中的準確率卻優于有著上千億乃至數千億參數的大型通用語言模型。

但對企業來說,「1+N」模式的一大痛點就在于開發應用的過程中,需要調用各種不同的大模型。而火山方舟提供的第一個功能就是模型廣場,不僅集成了大量的第三方大模型,企業自身開發的大模型也可以通過這個平臺進行管理。

吳迪介紹,企業可以用統一的工作流對接多家大模型,對于復雜需求可設置高級參數、驗證集、測試集等功能,再通過自動化和人工評估直觀對比模型精調效果,在不同業務場景里還可靈活切換不同的模型,實現最具性價比的模型組合。這些自定義指標和評估數據的積累,將成為企業在大模型時代寶貴的數據資產。

02火山引擎的大模型「朋友圈」

火山引擎暢想的前景非常理想,但要做到有一個前提,就是大大小小的大模型開發商需要聚集到火山引擎。數據安全是他們愿意接入火山引擎的必要條件,但顯然不會是充分條件。火山引擎吸引大模型開發商合作的基礎,在于其掌握的算力資源,也就是過去囤積的大量GPU。

去年 ChatGPT 發布后,國內 AI 算力緊張已經算是行業半公開的秘密,而字節跳動擁有國內最豐富的算力資源。

據《晚點 LatePost》報道,字節今年向英偉達訂購了超過 10 億美元的 GPU(約合 70 億元人民幣),到貨和沒到貨的 A100 與 H800 總計有 10 萬塊。而 2022 年全年,英偉達數據中心 GPU 在中國的銷售總額大約為 100 億元,也就是說,僅字節一家公司今年的訂單可能已接近英偉達去年在中國銷售的商用 GPU 總和。

大部分團隊沒有條件購買大量 GPU 訓練大模型,從火山引擎采購算力也就不足為奇。而對火山引擎來說,大模型生產商發展越好,業務量越大,反過來就需要購買更多的算力。所以在這方面,大模型生產商和火山引擎有著相同的訴求。

今年 4 月,火山引擎宣布與國內 70% 的大模型生產商達成合作,原因也在于此。

「火山方舟」首批大模型合作伙伴

會上,火山引擎重點介紹了第一批加入火山方舟的大模型,包括百川智能、出門問問、復旦大學 MOSS、IDEA 研究院、瀾舟科技、MiniMax、智譜等多家 AI 科技公司及科研院所的大模型,并已啟動邀測。

而首批邀測的企業,則包括金融、汽車、消費等眾多行業的客戶。北京銀行 CIO 龔偉華表示,大模型與客戶營銷、辦公協同、數據智能的結合,在金融應用場景有巨大潛力。北京銀行將與「火山方舟」合作,在算力優化、模型精調等方面展開研究,共同推動金融風控、營銷等模型應用落地。

除了第三方的客戶,吳迪介紹,在火山方舟平臺推向市場之前,已經利用眾多的內部產品打磨和改進平臺。字節跳動有10 余個業務線正在探索接入和試用,在代碼糾錯等研發提效場景,文本分類、總結摘要等知識管理場景,以及數據標注、歸因分析等方面探索,利用大模型能力促進降本增效。

但是,對于這些內部嘗試何時面向用戶,吳迪向極客公園表示:還需要一些時間,把大模型應用好是一個需要長周期打磨的事。

火山引擎總裁譚待進一步補充:有一些應用對用戶是無感知的,因為它是在已有的環境中去提升效率,而不是像 ChatGPT 這種大模型原生應用,用戶能明顯感知到是一個大模型來做這個事情。比如客服這個場景,回答時需要檢索知識庫,但現在通過大模型去給它一些提示,但跟你對話的還是那個對應的客服,只是它的效率高了。

03?字節跳動的下一步

目前來看,字節/火山布局大模型第一階段的思路已經非常清晰。

從商業上看,火山引擎就是賣水賣鏟子的思路。憑借火山引擎的技術體系,加上此前算力資源的積累,做管道和前期的底層服務應該是沒有任何問題,所以在這個階段把基礎工具開放出來,幫助大家做好大模型,或者更直接說,從收益上的考量,這個階段發布技術體系工具比發布大模型的收益值更高。

但有一個很重要的問題是:今天賣鏟子的字節,未來會不會下場淘金?

答案是肯定的。譚待告訴極客公園,其內部也有團隊在研發大模型。如果做好了,也會上到方舟平臺對外提供。此前字節副總裁楊震原也曾向財新回應:字節跳動對大模型也在做一些學習和研究,現在還沒有什么結果,也沒有大模型產品落地時間表。

但這存在一個問題,就是如何平衡自家大模型和其他第三方的關系。對此,譚待表示,自家的模型只會是眾多模型中的一個,其余的是客戶自己的選擇,不需要火山來平衡,一個企業未來一定會在多個場景用多個模型,因為每個模型在不同場景的性價比是不一樣的,這會是一個開放的市場。

正式入局后,不少行業人士看好火山引擎在大模型領域的市場份額會在接下來一段時間快速飆升,原因主要有三個:

第一是因為基礎需求。字節本身在云服務這個層面是國內用量排在前三的公司,就算火山引擎,最終只是為了服務字節這一個生意而建,它的收益和投入產出比都是相當可觀的。第二是產品能力。字節這套體系迭代出來的產品工具向外傳遞,在云服務里的積累和產品化的能力會非常的強,從這個維度來說,對于很多中小開發者,甚至有體系的開發者是很有吸引力的。第三是因為生態系統成熟。字節本身在云服務這套體系并不是只做了火山引擎,字節在上下游的廣告分發、基礎設施建設,開發工具等維度都有完善和成熟的生態鏈,甚至早幾年還收購了開發者社區。有著可靠的基礎體系,完整的工作鏈條和生態社區。

過去字節布局國內云服務市場的痛點,在于起步較晚,飛書要挑戰已經成熟的釘釘、企業微信,而云服務的特點就是前期獲客難,但獲客后由于用戶遷移成本太高,所以輕易不會更換。

今天的大模型是一條全新的賽道,所有云服務廠商又回到了同一起跑線,對于想要打開云服務市場的字節和火山而言,這也是十年難得一遇的機遇。

本文作者:宛辰,來源:極客公園,原文標題:《字節的野心:做大模型時代的「軍火商」》

風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

關鍵詞: