全球速看:BloombergGPT來了!金融大模型應用加快將帶來哪些產業鏈機遇?
近期根據彭博社最新發布的報告顯示,其構建迄今為止最大的特定領域數據集,并訓練了專門用于金融領域的LLM,開發了擁有500億參數的語言模型——BloombergGPT。
受到消息影響,金證股份午后漲停,同花順漲超16%,頂點軟件直線拉升觸及漲停,古鰲科技、東方財富、財富趨勢均漲超10%。
這款金融大模型的應用將實現哪些驚人的功能?相關金融業公司是否將受益于大模型的應用而實現降本增效?產業鏈機遇有哪些?本文將詳細解析。
(資料圖片僅供參考)
金融大模型開發與應用難度均不大
據《BloombergGPT: A Large Language Model for Finance》一文中所述, BloombergGPT和 OpenAI GPT模式一樣,也是基于 Transformer架構的,采用的是只有譯碼器的技術路線。通過比較, BloombergGPT模型參數為500億,在GPT-2 (1.5億)和GPT-3 (1750億)之間。
不同之處在于,為了加強 LLM對金融垂直領域的專業理解, Bloomberg構建了目前規模最大的金融數據集 FINPILE,通過對通用文本+金融知識的混合訓練,使得 BloombergGPT在執行金融任務方面的表現超過了現有的通用 LLM模型,而在通用場景方面的表現則與現有的通用 LLM模型基本持平。
GPT-3和GPT-4等大型語言模型都是由專業的人工智能團隊開發出來的,而且模型的訓練對計算能力的要求很高。BloombergGPT的成功驗證了“開放源代碼模型+優質垂直數據”的思路,為基于垂直數據構建大語言模型提供了可能。
大量的、高質量的垂直領域知識可以彌補模型在規模上的不足。通過對 BloombergGPT和GPT-3的對比,雖然 BloombergGPT的模型參數相對于GPT-3來說是比較小的,但是由于 BloombergGPT的預訓練數據增加了大量的高質量的金融數據,并且對預訓練數據進行了一系列的清洗和標注,所以 BloombergGPT在通用性和GPT-3基本持平的前提下,實現了對金融垂直能力的大幅提升。
算法方面,作者也有計劃披露他們訓練BloombergGPT的細節方法;算力方面,約使用512塊40GB的A100 GPU,在訓練過程中備份了4個模型,每個模型分了128塊GPU。從這個角度出發來看,無論是數據、算法、還是算力,國內頭部金融科技公司都是可復制、可追趕的。
金融GPT投資機遇或蓄勢待發
在 BloombergGPT的成功案例中,訓練數據是影響大規模語言模型性能的一個重要因素。
其原因主要有三點:第一,在金融垂直領域的數據輸入中, BloombergGPT成功地形成了對金融知識的理解,變得更加專業;二是 BloombergGPT模型的參數雖然有所縮減,但其通用性和垂直性依然很強,這說明當參數尺度一定時,高質量的數據才是決定模型性能的關鍵因素;三是 Bloomberg在文章中明確表示,為了避免數據泄露, Bloomberg GPT將采用和 OpenAI一樣的封閉源碼,這也從側面證明了 Bloomberg GPT所擁有的原始源碼是各大模型爭奪的關鍵。
作為一家不以人工智能為核心的金融垂直領域企業,Bloomberg為金融 GPT的發展提供了一個可借鑒的范例。金融 IT廠商擁有豐富的金融垂直知識和現有的人工智能產品布局,以高質量的金融數據和開源的大語言模型為基礎,同樣有機會打造出一個專屬于金融場景的大語言模型,從而實現大語言模型在金融場景中的有效賦能,讓大語言模型成為底層的人工智能操作系統。
在應用中,金融GPT落地場景有:
1)新聞的情緒傾向性分析和內容創造。它能幫助金融機構判斷市場對某一事件的看法,并幫助他們進行量化策略、投資決策;
2)財務類知識問答和股票代碼配對。能夠輔助金融機構進行信用評估,輔助投資人篩選新聞相關概念股,輔助分析師進行領域知識學習,提升資料閱讀效率等。
3)財務報表分析和會計稽核的幫助.能夠輔助金融機構生成基礎的財務分析報告和招股書,輔助投研人員報表配平,輔助會計和審計方面的工作。
很多中國的金融科技公司已經在落地大模型的應用。
同花順在2015年前后便推出人工智能應用,在2019年更是選擇“All in AI”,公司目前的AI技術涵蓋自然語言處理技術、知識圖譜技術和虛擬人等六大技術。
恒生電子在公開平臺上表示將充分挖掘對話式語言模型技術在金融業務場景中的應用潛力,通過集成“文心一言”的技術能力,在投研、投顧、營銷、客服、運營、風控等金融各類業務場景開展人工智能大模型技術應用,為金融機構提供全場景人工智能解決方案及服務,持續提升國內金融機構數智化發展水平。
國金證券建議關注同花順、恒生電子、財富趨勢、頂點軟件和凌志軟件等有金融大模型基礎的公司。
關鍵詞: