啟明創投:最遲2024中國GPT4將誕生,長文本是大語言模型關鍵|全球播報
7月7日周五,世界人工智能大會召開的第二日,啟明創投合伙人周志峰作關于AI大模型以及整個產業發展趨勢的分享。
(資料圖)
啟明創投是國內最早關注且最活躍在AI該領域的創投機構之一,投資企業遍布整個AI生態鏈條,上游、中游、下游,其實都有設計,比如說像芯片、基礎軟件,還有像大模型以及下游的垂直的應用等等。
大模型第一性原理是壓縮數字化的知識、信息和數據
周志峰強調,大規模的算力,大規模的數據對AI未來發展非常重要。
大規模訓練的第一性原理是用大規模去壓縮人類世界全部被數字化的知識信息跟數據。
你從這句第一性原理中能看到,大規模的算力,大規模的數據是對AI未來發展非常重要的,而確實大規模的算力,大規模數據也是人類過去40年芯片在互聯網大數據各個領域中不斷累積的這些技術,然后去推動AI的爆發。
大規模預訓練學習生成,整個趨勢的底層邏輯其實非常清楚了,未來會繼續高速發展,深度學習被創業投資行業稱為叫做AI1.0,主要是說它是針對一個特定的小任務,用一個特定的小數據集訓練出來的一個小模型,而且主要是模式識別類,比如人臉識別語音識別,今天的大規模語音領域學習被我們更多稱為是AI2.0,主要它是通用的數據訓練出來的大模型,具有生成決策能力。
AI2.0浪潮將重建整個產業架構
周志峰進一步指出,AI2.0這一代新的浪潮,它會重建整個產業架構。整個生態架構會分為三層,最底層是基礎架構層,右邊提供算力,像aws火山引擎、阿里云等等都在提供這種計算中心平臺,右邊是工具鏈,且主要是對大模型的訓練、推理、部署做優化。
中間這層是最重要的,一層是模型層,模型層也有幾種模式,第一種是提供這種基礎模型底座模型,然后對外去輸出模型的能力,通過API通過模型定制。
然后還有一類是自建大模型,就他做了自己的大模型后,會針對某一個特定行業特定場景去做優化,然后提供端到端的從模型到應用的解決方案。
在第三層應用層,那一種是通過自建模型直接做到垂直應用,可能80~90%的公司都是左邊這種就利用第三方模型的能力去構建自己熟悉的場景或者行業的一個應用,
這是我們理解的三層架構,確實這種新的架構也對整個世界去構建產品的形態發生很大的變化。
左邊其實是過去幾十年,不論是一輛汽車還是一個互聯網的社交軟件,其實都是這樣一個架構,就是產品經理從用戶獲取需求,開發者從產品經理那塊獲取設計,然后用戶再把開發出的產品去使用。
過去講騰訊做得好,阿里巴巴做好,講任何一個公司做得好,某種意義上是說他把飛輪轉的最有效,而且能夠持續的去迭代飛輪。
未來企業分為兩種:+AI、AI+
談到產業發展,周志峰指出,未來企業分為兩種+AI、AI+。
未來更多的是把新一代的AI的能力放進工作流,它其實是一種舊場景的增強。
還有一類他會用這樣的能力全新構建一個產品,它其實是所謂的AI native 的一種應用,那我稱為叫做舊場景的重塑,或者叫做新場景的創造。
當下,可數的非常領先的AI公司還是翎毛鳳角,主要是因為AI并沒有實現賦能萬業的這樣一個真正的局面,它的產業化差強人意。周志峰表示:
ChatGTP重新點燃了AI2.0這波浪潮,你看全球的整個融資金額發生了巨大的發展,這一次會是一個依然是持續兩年,然后走低的泡沫,還是會真的一路向前,發展到一個通用人工智能,我覺得這是一個非常值得思考的問題
大模型肯定是會變的越來越厲害,OpenAI的CEO也說,他們有可能自己去介入類似于微軟這樣的產品,做一個辦公productivity產品,他們也在向往更廣闊的空間,我們是不是能夠找到一個自己的創業的黃金通道,最終走向一個廣闊的天地?
也許現實其實是這樣的,我們要走的路可能是一條死亡峽谷,兩邊都會不斷的擠壓,他們的技術都在動態變化,我們怎么能夠穿過這條死亡峽谷,我覺得這是在創業時候,我們要去發揮自己的理性思維,去努力去思考的。
每一個科技浪潮一定都會誕生出新的王者,新的偉大的企業。
十大AI發展趨勢展望
展望未來,啟明創投聯手未盡研究共同發布重磅報告《生成式AI》| State of Generative AI 2023總結出十點發展趨勢:
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。第一,以我們看到的信息啟明投資的企業,我們知道在2024年甚至更早,中國一定會出現比肩GTP4的一個多語言模型,我們已經很明確看到幾家企業在這個方向的進展。
第二,long context一定會是下一代大規模語言模型發展的一個重點。我們會看到真正你可以去跟一個大模型進行幾天幾個月的有上下文的交流,而不是今天只能聊3輪5輪就結束。
第三,我們認為做垂直大模型會有幾種,其實我們總結是5種方法。
第四,我們認為盡管今天的stabele-diffusion是非常好的diffusion模型架構,但我們相信無論是stability還是其他的公司,都會在未來的兩年內會出現一個新模式的模型。
第五,文字到圖像的模型未來將具備更強的可控性,我們已經看到了很多業內的頂級團隊已經在這方面有一些科研的突破。
第六,今年第三第四季度會是音樂生成的一個突破點,我們相信在明年v6跟3D的生成會有重大突破。
第七,如何把大語言模型大模型去跟真正的實體空間的控制機器人,人形機器人去做結合的智能會有重大發展。
第八,transform雖然現在是主流,就像我說的 AI的終極就是用最好的方法去壓縮全人類的數字化的信息,transform一定不是終局,還會有更先進的架構出現。
第九,商業角度,就是我們認為在未來三年內,模型能力與應用無法解耦,真正顛覆性的應用一定出現自那些掌握的核心底層模型研發能力的企業,而不會是一家純粹做應用的公司,我指的是顛覆性應用,因為我們看不到三年內解耦的這種可能性。
第十,就是現在依然是一個可以產生平臺性企業的黃金期,我們相信在未來這三年中成立的一些創業公司會有可能成為一個千億萬億市值的公司。
關鍵詞: