【時快訊】瘋狂的幻方:一家隱形AI巨頭的大模型之路
在蜂擁而至的大模型團戰中,幻方大概是最異類的一個。
這是一場注定是少數人的游戲,很多創業公司在大廠入局后開始調整方向甚至萌生退意,而這家量化基金卻孤絕前行。
(資料圖)
5月,幻方把下場做大模型的獨立新組織,命名為“深度求索”,并強調將專注于做真正人類級別的人工智能。他們的目標,不只是復刻ChatGPT,還要去研究和揭秘通用人工智能(AGI)的更多未知之謎。
不僅如此,在這個被認為格外依賴稀缺人才的賽道,幻方還試圖去集結一批有執念的人,并祭出了他們認為的最大武器:一群人的好奇心。
在量化領域,幻方是一家抵達過千億規模的“頂級基金”,但它被這波AI新浪潮集中關注到,其實還頗具戲劇性。
當國內云廠商高性能GPU芯片缺貨成為限制中國生成式AI誕生的最直接因素時,據《財經十一人》報道,國內擁有超過1萬枚GPU的企業不超過5家。而除幾家頭部大廠外,還包括一家名為幻方的量化基金公司。通常認為,1萬枚英偉達A100芯片是做自訓大模型的算力門檻。
其實,這家很少被置于人工智能視野打量的公司,早已是一家隱秘的AI巨頭:2019年,幻方量化成立AI公司,其自研的深度學習訓練平臺“螢火一號”總投資近2億元,搭載了1100塊GPU;兩年后,“螢火二號”的投入增加到10億元,搭載了約1萬張英偉達A100顯卡。
這意味著,單從算力看,幻方甚至比很多大廠都更早拿到了做ChatGPT的入場券。
只是大模型對算力、算法和數據都有強依賴,所以起步就需要5000萬美金,訓練一次需要上千萬美金,非百億美金公司其實很難持續跟進。各種艱難之下,幻方卻很樂觀,創始人梁文鋒告訴我們:“關鍵是我們想做這件事,能做這件事,那我們就是最合適的人選之一?!?/p>
這種謎之樂觀,首先來自幻方的獨特成長路徑。
量化投資是一個源自美國的舶來品,這使得幾乎所有中國的頭部量化基金創始班底,都或多或少有過美國或歐洲對沖基金的履歷。唯獨幻方是一個例外:它完全是本土班底起家,獨自摸索著長大。
2021年,成立僅六年的幻方,抵達千億規模,并被稱為“量化四大天王”之一。
以局外人殺入的成長路徑,讓幻方始終像一個攪局者。多位行業人士向我們表示,幻方“無論研發體系、產品還是銷售,都始終在用一種嶄新的方式,切入到這個行業中來?!?/p>
一家頭部量化基金創始人認為,這些年的幻方,始終“沒有按照某種約定成俗的道路在走”,而是“按照他們想要的方式 ” ,即便是有點離經叛道或者爭議,“也敢大大方方說出來 ,然后按照自己的想法去做”。
關于幻方的成長奧秘,幻方內部將之歸結為“選用了一批沒有經驗但有潛能的人,以及有一個可以讓創新發生的組織架構和企業文化”,他們認為這也將是大模型創業公司可以與大廠競爭的秘密所在。
而更關鍵的秘密,或許來自幻方的創始人梁文鋒。
還在浙江大學攻讀人工智能時,梁文鋒就無比篤信“人工智能一定會改變世界”,而2008年,這還是一個不被認同的執念。
畢業后,他沒有像周圍人一樣去大廠做個程序員,而是躲在成都的廉價出租屋里,不停接受進入諸多場景中嘗試的挫敗,最終切入了最復雜場景之一的金融,并成立了幻方。
一個有趣的細節是,在最早幾年,曾有個同樣瘋癲的、在深圳城中村做著“不靠譜”飛行器的朋友拉他入伙。后來這個朋友做成了一個千億美金的公司,名叫:大疆。
也因此,在做大模型必然涉及的錢、人、算力等話題外,我們還和幻方創始人梁文鋒特別聊了聊,怎樣的組織架構可以讓創新發生,以及人的瘋狂可以持續多久。
創業十余年,這是這位鮮少露面的“技術宅”型創始人第一次公開受訪。
巧合的是,4月11日,幻方在發布做大模型公告時,也引用了法國新浪潮導演特呂弗曾告誡青年導演的一句話:“務必要瘋狂地懷抱雄心,且還要瘋狂地真誠。”
以下為對話:
“做最重要、最困難的事”
「暗涌」:前不久,幻方發公告決定下場做大模型,一家量化基金為什么要做這樣一件事?
梁文鋒:我們做大模型,其實跟量化和金融都沒有直接關系。我們獨建了一個名為深度求索的新公司來做這件事。
幻方的主要班底里,很多人是做人工智能的。當時我們嘗試了很多場景,最終切入了足夠復雜的金融,而通用人工智能可能是下一個最難的事之一,所以對我們來說,這是一個怎么做的問題,而不是為什么做的問題。
「暗涌」:你們要自訓一個大模型,還是某個垂直行業——比如金融相關的大模型?
梁文鋒:我們要做的是通用人工智能,也就是AGI。語言大模型可能是通往AGI的必經之路,并且初步具備了AGI的特征,所以我們會從這里開始,后邊也會有視覺等。
「暗涌」:因為大廠的入局,很多創業型公司都放棄了只做通用型大模型的大方向。
梁文鋒:我們不會過早設計基于模型的一些應用,會專注在大模型上。
「暗涌」:很多人認為,創業公司在大廠形成共識后下場,已經不是一個好的時間點。
梁文鋒:現在看起來,無論大廠,還是創業公司,都很難在短時間內建立起碾壓對手的技術優勢。因為有OpenAI指路,又都基于公開論文和代碼,最晚明年,大廠和創業公司都會把自己的大語言模型做出來。
大廠和創業公司都各有機會?,F有垂類場景不掌握在初創公司手上,這個階段對初創公司不太友好。但因為這種場景說到底也是分散的、碎片化的小需求,所以它又是更適合靈活的創業型組織的。從長期看,大模型應用門檻會越來越低,初創公司在未來20年任何時候下場,也都有機會。
我們的目標也很明確,就是不做垂類和應用,而是做研究,做探索。
「暗涌」:為什么你的定義是“做研究、做探索”?
梁文鋒:一種好奇心驅動。從遠處說,我們想去驗證一些猜想。比如我們理解人類智能本質可能就是語言,人的思維可能就是一個語言的過程。你以為你在思考,其實可能是你在腦子里編織語言。這意味著,在語言大模型上可能誕生出類人的人工智能(AGI)。
從近處說,GPT4還有很多待解之謎。我們去復刻的同時,也會做研究揭秘。
「暗涌」:但研究意味著要付出更大的成本。
梁文鋒:只做復刻的話,可以在公開論文或開源代碼基礎上,只需訓練很少次數,甚至只需finetune(微調)一下,成本很低。而做研究,要做各種實驗和對比,需要更多算力,對人員要求也更高,所以成本更高。
「暗涌」:那研究經費哪里來?
梁文鋒:幻方作為我們的出資人之一,有充足的研發預算,另外每年有幾個億的捐款預算,之前都是給公益機構,如果需要,也可以做些調整。
「暗涌」:但做基礎層大模型,沒有兩三億美元,連牌桌都上不了,我們如何支撐它的持續投入?
梁文鋒:我們也在找不同出資方在談。接觸下來,感覺很多VC對做研究有顧慮,他們有退出需求,希望盡快做出產品商業化,而按照我們優先做研究的思路,很難從VC那里獲得融資。但我們有算力和一個工程師團隊,相當于有了一半籌碼。
「暗涌」:我們對商業模式做了哪些推演和設想?
梁文鋒:我們現在想的是,后邊可以把我們的訓練結果大部分公開共享,這樣可以跟商業化有所結合。我們希望更多人,哪怕一個小 app都可以低成本去用上大模型,而不是技術只掌握在一部分人和公司手中,形成壟斷。
「暗涌」:一些大廠后期也會有一些服務提供,你們差異化的部分是什么?
梁文鋒:大廠的模型,可能會和他們的平臺或生態捆綁,而我們是完全自由的。
「暗涌」:無論如何,一個商業公司去做一種無限投入的研究性探索,都有些瘋狂。
梁文鋒:如果一定要找一個商業上的理由,它可能是找不到的,因為劃不來。
從商業角度來講,基礎研究就是投入回報比很低的。OpenAI早期投資人投錢時,想的一定不是我要拿回多少回報,而是真的想做這個事。
我們現在比較確定的是,既然我們想做這個事,又有這個能力,這個時間點上,我們就是最合適人選之一。
萬卡儲備與它的代價
“一件激動人心的事,或許不能單純用錢衡量。”
「暗涌」:GPU是這次ChatGPT創業潮的稀缺品,你們在2021年就可以有先見之明,儲備了1萬枚。為什么?
梁文鋒:其實從最早的1張卡,到2015年的100張卡、2019年的1000張卡,再到一萬張,這個過程是逐步發生的。幾百張卡之前,我們托管在IDC,規模再變大時,托管就沒法滿足要求了,就開始自建機房。
很多人會以為這里邊有一個不為人知的商業邏輯,但其實,主要是好奇心驅動。
「暗涌」:什么樣的好奇心?
梁文鋒:對 AI 能力邊界的好奇。對很多行外人來說,ChatGPT 這波浪潮沖擊特別大;但對行內人來說,2012年 AlexNet 帶來的沖擊已經引領一個新的時代。AlexNet 的錯誤率遠低于當時其他模型,復蘇了沉睡幾十年的神經網絡研究。雖然具體技術方向一直在變,但模型、數據和算力這三者的組合是不變的,特別是當 2020 年 OpenAI 發布 GPT3 后,方向很清楚,需要大量算力;但即便 2021 年,我們投入建設螢火二號時,大部分人還是無法理解。
「暗涌」:所以2012年起,你們就開始關注到算力的儲備?
梁文鋒:對研究員來說,對算力的渴求是永無止境的。做了小規模實驗后,總想做更大規模的實驗。那之后,我們也會有意識地去部署盡可能多的算力。
「暗涌」:很多人以為搭這個計算機集群,是量化私募業務會用到機器學習做價格預測?
梁文鋒:如果單純只做量化投資,很少的卡也能達到目的。我們在投資外做了大量研究,更想搞清楚什么樣的范式可以完整地描述整個金融市場,有沒有更簡潔的表達方式,不同范式能力邊界在哪,這些范式是不是有更廣泛適用,等等。
「暗涌」:但這個過程也是一個燒錢行為。
梁文鋒:一件激動人心的事,或許不能單純用錢衡量。就像家里買鋼琴,一來買得起,二來是因為有一群急于在上面彈奏樂曲的人。
「暗涌」:顯卡通常會以20%的速度在折損。
梁文鋒:我們沒有精確計算過,但應該沒這么多。英偉達的顯卡是硬通貨,即使是很多年前的老卡,也還有很多人在用。我們之前退役的老卡,二手處理時還挺值錢的,沒虧太多。
「暗涌」:搭一個計算機集群,維護費用,人工成本,甚至電費也都是不菲的支出。
梁文鋒:電費和維護費用其實是很低的,這些支出每年只占硬件造價的1%左右。人工成本不低,但人工成本也是對未來的投資,是公司最大的資產。我們選的人也會相對樸實一點,有好奇心,來這里有機會去做研究。
「暗涌」:2021年,幻方是亞太地區第一批拿到A100顯卡的公司,為什么會比一些云廠商更早?
梁文鋒:我們很早就對新卡做了預研、測試和規劃。至于一些云廠商,據我所知,他們之前的需求都是分散的,直到2022年自動駕駛,有租用機器做訓練的需求,又有付費能力,一些云廠商才去把基礎設施建好。大廠很難單純去做研究,做訓練,它更多會是業務需求驅動。
「暗涌」:你會如何看大模型的競爭格局?
梁文鋒:大廠肯定有優勢,但如果不能很快應用,大廠也不一定能持續堅持,因為它更需要看到結果。
頭部的創業公司也有技術做得很扎實的,但和老的一波AI創業公司一樣,都要面對商業化難題。
「暗涌」:一些人會覺得一個量化基金卻強調自己做AI,是為其他業務吹泡泡。
梁文鋒:但其實我們的量化基金已經基本不怎么對外募集了。
「暗涌」:你會如何去辨別哪些是AI信仰者,哪些是投機者?
梁文鋒:信仰者會之前就在這里,之后也在這里。他們更會去批量買卡,或者跟云廠商簽長協議,而不是短期去租。
如何讓創新真正發生??????
“創新往往都是自己產生的,不是刻意安排的,更不是教出來的”
「暗涌」:深度求索團隊的招聘進展如何?
梁文鋒:初始團隊已經集結到位,前期因為人手不夠,會從幻方臨時借調一部分人過去。去年底ChatGPT3.5風靡時,我們就開始動手招聘了,不過我們依然需要更多的人加入。
「暗涌」:大模型創業的人才也是稀缺的,有投資人說很多適合的人才可能只在OpenAI、FacebookAI Research 等巨頭的AI lab里。你們會去海外挖這類人才嗎?
梁文鋒:如果追求短期目標,找現成有經驗的人是對的。但如果看長遠,經驗就沒那么重要,基礎能力、創造性、熱愛等更重要。從這個角度看,國內合適的候選人就不少。
「暗涌」:為什么經驗沒那么重要?
梁文鋒:不一定是做過這件事的人才能做這件事。幻方招人有條原則是,看能力,而不是看經驗。我們的核心技術崗位,基本以應屆和畢業一兩年的人為主。
「暗涌」:在創新業務上,你覺得經驗是阻礙嗎?
梁文鋒:做一件事,有經驗的人會不假思索告訴你,應該這樣做,但沒有經驗的人,會反復摸索、很認真去想應該怎么做,然后找到一個符合當前實際情況的解決辦法。
「暗涌」:幻方從一個完全無金融基因的外行,切入到這個行業,幾年內做到頭部,這條招人法則是其中秘密之一嗎?
梁文鋒:我們的核心團隊,連我自己,一開始都沒有量化經驗,這一點很特殊。不能說是成功的秘密,但這是幻方的文化之一。我們不會故意回避有經驗的人,但更多是看能力。
拿銷售這個崗位舉個例子。我們的兩個主力銷售,都是這個行業的素人。一個原來做德國機械品類外貿的,一個是原來在券商做后臺寫代碼。他們進入這個行業時,沒有經驗,沒有資源,沒有積累。
而現在我們可能是唯一一家能以直銷為主的大私募。做直銷意味著不用給中間商分費用,同樣規模和業績下,利潤率更高,很多家會試圖模仿我們,但并沒有成功。
「暗涌」:為什么很多家試圖模仿你們,卻沒有成功?
梁文鋒:因為僅憑這一點不足以讓創新發生。它需要和公司的文化和管理相匹配。
事實上,第一年他們什么都做不出來,第二年才開始有點成績。但我們的考核標準和一般公司不太一樣。我們沒有 KPI,也沒有所謂的任務。
「暗涌」:那你們的考核標準是?
梁文鋒:我們不像一般公司,看重客戶下單量,我們的銷售賣多少和提成不是一開始就算好的,而會更鼓勵銷售去發展自己的圈子,認識更多人,產生更大影響力。
因為我們認為,一個讓客戶信任的正直的銷售,可能在短時間內做不到讓客戶來下單,但可以讓你覺得他是個靠譜的人。
「暗涌」:選來合適的人后,用何種方式讓他進入狀態?
梁文鋒:交給他重要的事,并且不干預他。讓他自己想辦法,自己發揮。
其實,一家公司的基因是很難被模仿的。比如說招沒有經驗的人,怎么判斷他的潛力,招進來之后如何才能讓他成長,這些都沒法直接模仿。
「暗涌」:你覺得什么是打造一個創新型組織的必要條件?
梁文鋒:我們的總結是,創新需要盡可能少的干預和管理,讓每個人有自由發揮的空間和試錯機會。創新往往都是自己產生的,不是刻意安排的,更不是教出來的。
「暗涌」:這是一種非常規的管理方式,這種情況下你如何確保一個人做事是有效率的,而且在你要的方向上?
梁文鋒:招人時確保價值觀一致,然后通過企業文化來確保步調一致。當然,我們并沒有一個成文的企業文化,因為所有成文東西,又會阻礙創新。更多時候,是管理者的以身示范,遇到一件事,你如何做決策,會成為一種準則。
「暗涌」:你覺得這波做大模型的競爭中,創業公司更適合創新的組織架構會是和大廠競爭的破局點嗎?
梁文鋒:按照教科書的方法論來推導創業公司,在當下,他們做的事,都是活不下來的。
但市場是變化的。真正的決定力量往往不是一些現成的規則和條件,而是一種適應和調整變化的能力。
很多大公司的組織結構已經不能快速響應和快速做事,而且他們很容易讓之前的經驗和慣性成為束縛,而這波AI新浪潮之下,一定會有一批新公司誕生。
真正的瘋狂??????
「暗涌」:做這樣一件事,最讓你們興奮的是什么?
梁文鋒:去搞清我們的猜想是不是事實,如果是對的,就會很興奮了。
「暗涌」:這次大模型招人,什么是我們必卡的條件?
梁文鋒:熱愛,扎實的基礎能力。其他都沒那么重要。
「暗涌」:這種人容易找到嗎?
梁文鋒:他們的熱情通常會表現出來,因為他真的很想做這件事,所以這些人往往同時也在找你。
「暗涌」:大模型可能是一件無休止投入的事,付出的代價會讓你們顧慮嗎?
梁文鋒:創新就是昂貴且低效的,有時候伴隨著浪費。所以經濟發展到一定程度之后,才能夠出現創新。很窮的時候,或者不是創新驅動的行業,成本和效率非常關鍵??碠penAI也是燒了很多錢才出來。
「暗涌」:會覺得你們在做一件很瘋狂的事嗎?
梁文鋒:不知道是不是瘋狂,但這個世界存在很多無法用邏輯解釋的事,就像很多程序員,也是開源社區的瘋狂貢獻者,一天很累了,還要去貢獻代碼。
「暗涌」:這里邊會有一種精神獎賞。
梁文鋒:類似你徒步50公里,整個身體是癱掉的,但精神很滿足。
「暗涌」:你覺得好奇心驅動的瘋狂可以一直持續下去嗎?
梁文鋒:不是所有人都能瘋狂一輩子,但大部分人,在他年輕的那些年,可以完全沒有功利目的,投入地去做一件事。
本文作者:于麗麗,來源:量化投資與機器學習,原文標題:《瘋狂的幻方:一家隱形AI巨頭的大模型之路》
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。關鍵詞: