這個被微軟高看的中國AI研究院,是何方神圣?
上周,微軟總裁在接受采訪時,cue到了一家中國機構:
(資料圖片僅供參考)
我們認為有三家公司處于絕對的前沿,一是與微軟合作的Open AI,二是谷歌,三是北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)。
谷歌自然不難理解,但說到智源研究院,大部分圈外人可能都要懵一會。
這是哪家機構,怎么之前好像沒聽說過?
事實上,這家機構確實很年輕——2018年創建,誕生至今也不過五年。
但它做的事情可不小。
2021年,智源推出了中國首個+世界最大超大規模預訓練模型【悟道2.0】,參數量達到了驚人的1.75萬億,這是GPT-3.5的十倍,也超越了谷歌的超大模型 Switch Transformers(1.6萬億)。
在國際公認的9項的機器學習任務“跑分”項目上,【悟道2.0】都取得了優異成績,超過了 GPT-3、Google ALIGN 等領域內同類技術。
此外,悟道2.0本身的訓練過程,也獲得了中國超級計算機項目的幫助。事實上,它也是中國團隊首次在100%國產的超級計算機上訓練出來的深度神經網絡模型。
而國外媒體也對其表示了密切關注。
除了大模型,智源研究院還推出了“天演”生命智能模型、“九鼎”智算平臺、“FlagOpen飛智大模型”,推動我國人工智能行業從基礎設施到跨學科應用的層層進步。
2022年5月,智源天演團隊發布天寶1.0,即生物精度最高的仿真秀麗線蟲,能夠高精度模擬秀麗線蟲全部302個神經元及連接關系,邁出天演人工智能生命模擬工程的第一步。
同日,智源推出的大型云計算服務平臺“九鼎智算平臺”,圍繞通用大模型、AI for Science等方向,為大模型訓練提供算力、數據、算法三方面的創新支持。
今年3月推出的“飛智”大模型技術開源體系,則是智源與多家產學研單位共同構建的大模型開源開放軟件體系,包含算法、模型、工具、評測等多個部分,能夠顯著降低大模型開發的難度。
盡管成立時間短,但智源已在業內聲名赫赫:一年一度的智源大會,已成為業內的每年的重要活動之一。
這些都暗示著,在大多數人都未曾注意到的時候,中國的人工智能技術,正悄悄走到了世界前列。
起源
智源研究院的起源,是一場“群英薈萃”(不是蘿卜開會)。
2018年年初,北京市出臺《北京市支持建設世界一流新型研發機構實施辦法》,進行科技體制的飛躍式改革。
同年,北京為建設懷柔科學城,聘請了清華大學藥學院教授魯白、原國家自然科學基金委員會主任楊衛院士、美國國家科學院院士楊培東、原微軟亞太研發集團首席技術官張宏江博士等四位專家擔任戰略專家。
在那年的一場研討會上,專家們圍繞“如何推動北京人工智能創新工作發展”提出了六項建議:
建設“北京智源”等人工智能軟硬件計算平臺建立“產學研用”聯合創新的人工智能基礎研究模式積極推動政府數據和企業數據開放共享開放人工智能應用場景和加大基礎保障加大人才培養、引進和完善保障措施加大國際交流力度
于是,2018年12月,在科技部和北京市委市政府的指導和支持下,北京智源人工智能研究院正式成立。
資料顯示,智源人工智能研究院依托了北京大學、清華大學、中國科學院、百度、小米、字節跳動、美團點評、曠視科技等北京人工智能領域優勢單位共建,實行理事會領導下的院長負責制,張宏江擔任理事長,北京大學信息科學技術學院教授黃鐵軍擔任智源研究院院長。
智源研究院的員工匯集了來企業、學術等不同背景的專家,集合了一支包括清華、人大、北大等知名學府不同專業方向的團隊,也有各合作企業的員工進駐。
對于人才,智源通常給予四類定位:首席科學家、研究項目經理、研究員,和青年科學家。在每一個研究不同技術方向的子團隊當中,都有不同資深程度、專業和技能方向、供職背景的成員,員工構成非常多元化。
2019年,智源推出了“智源學者計劃”。截至2021年,已遴選智源學者近百人,其中38歲以下的青年科學家就有40位。
主要涉及的研究方向包括人工智能的數理基礎、人工智能的認知神經基礎、機器學習、自然語言處理、智能信息檢索與挖掘、智能系統架構與芯片等。
可以說,智源研究院匯聚了中國AI圈內的頂尖人才,“集中力量辦大事”,誓要將北京在2028年建設為國際領先的人工智能創新中心。
自由探索+目標導向
智源人工智能研究院的定位是“新型研發機構”,但在這一領域上,如何規范、高效地運作,國內始終未有成熟且成功的樣板參考。
通過摸索,智源提出了一套“智源模式”:
即建立自由探索與目標導向相結合的科研管理機制,以小同行視角遴選支持智源學者自由探索,以“集中力量辦大事”的科研組織模式推動“悟道”大模型等重大科研任務的實施。
所謂“自由探索”,指智源研究院能夠賦予科學家最大的技術路線決定權和經費使用權,給予科學家盡可能大的研究自由度。
而“目標導向”,就是對于學界共識的方向,智源學者們的研究能夠聚焦在一個統一的愿景上,并自然錯開研究方向,頻繁相互交流反饋,形成來自組織的合力。
在這一體制的滋養下,智源研究院實現的科研成果斐然。
根據2021年智源研究院三周年時公布的數據,智源研究院發表或支持發表國際AI頂會頂刊論文1470余篇,其中,被AAAI、CVPR、ACL、ICLR、NIPS、SIGIR、TPAMI等國際頂級會議期刊收錄論文約1060篇,占比逾七成,形成多個國際首創、首發重大成果。
科學研究的探索之路往往曲折而漫長,作為學者的后盾,研究機構需要給予自由度,以鼓勵創新和促進進步,但同時也需要進行一定的引導,避免“迷失方向”。
正如智源研究院理事長張宏江在為圖靈獎獲得者Yann LeCun的自傳《科學之路》作序時所寫:
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。歷史上多數突破性研究成果的出現都是偶然事件,而研究機構所有努力都是為了提升這類偶然事件發生的概率。
智源要做的就是希望通過構筑協作社區,打造用于未來研究的計算和數據平臺,更重要地是,集結最優秀的同行,專注未來可能產生原始創新與長期影響的領域(包括過往投入不足、重視不夠的領域)等一系列機制和努力,讓創新系統更高效地運行,通過我們的努力能讓中國出現突破性成果的概率增加。
關鍵詞: