人工智能里程碑式應用,ChatGPT到底是什么?
AI繪畫的熱潮還沒散去,AI問答最近又迅速火了。
近期OpenAI發布了全新的聊天機器人模型ChatGPT,沒想到一經上線,就因其高質量的回答、高效獲取信息的方式、以及上癮式的交互體驗而迅速出圈。
(資料圖片)
不少體驗過的人都驚呼,ChatGPT可能一舉消滅記者、程序員和搜索引擎。
就連馬斯克也忍不住發推表示,ChatGPT厲害得嚇人,我們距離危險而強大的AI不遠了。最近這個周末因沒有跟蹤ChatGPT新聞的“紐約時報”,甚至直接遭到了的馬斯克發推“奚落”。
圖:TED負責人Chris對紐約時報沒有報道ChatGPT表示震驚,馬斯克也在下面奚落紐約時報應該改名叫“社會正義時報”
用戶數據上,上線還不到一周時間,12月5日OpenAI CEO就在推特上宣布,ChatGPT已經達到了百萬用戶。
什么是ChatGPT?
ChatGPT是OpenAI發布的聊天機器人模型,它的交互界面簡潔,只有一個輸入框,AI將根據輸入內容進行回復,并允許在一個語境下持續聊天。
自從發布以來,ChatGPT可謂出盡風頭,無論是讓它寫首押韻的詩、檢查代碼的bug、回答科學問題、對推特未來的發展提出建議……通通不在話下,它回復的內容每次都是隨機的,但總體保持著一定的專業性和信息量,具備很強的參考意義。
比如,知識講解。
比如,寫小說。
目前已經有網友嘗試讓ChatGPT參加美國高考;寫小說;誘騙ChatGPT規劃如何毀滅世界;甚至讓ChatGPT扮演OpenAI,在系統內構建ChatGPT套娃。
為什么這么強大?
據浙商和國盛證券研報,ChatGPT相比以往的主要提升點在于記憶能力,ChatGPT可以儲存對話信息,延續上下文,從而實現連續對話,這在對話場景中至關重要,極大地提升了對話交互模式下的用戶體驗。
具體而言,此次新加入的訓練方式被稱為“從人類反饋中強化學習”(ReinforcementLearning from Human Feedback,RLHF)。這一訓練方法增加了人類對模型輸出結果的演示,并且對結果進行了排序。具體操作上,人工智能訓練者扮演對話的雙方,即用戶和人工智能助手,提供對話樣本。在人類扮演聊天機器人的時候,會讓模型生成一些建議輔助訓練師撰寫回復,訓練師會對回復選項打分排名,將更好的結果輸回到模型中,通過以上獎勵策略對模型進行微調并持續迭代。
ChatGPT相比前輩模型還具有以下特征:
1)可承認錯誤,若用戶指出其錯誤,模型會聽取意見并優化答案。
2)可質疑不正確的前提,減少虛假描述,如被詢問“哥倫布2015年來到美國的情景”的問題時,機器人會說明哥倫布不屬于這一時代并調整輸出結果。
3)因ChatGPT采用了注重道德水平的訓練方式,ChatGPT在減少有害和不真實的回復上改善顯著,如拒絕回答尋求霸凌他人方案的問題,指出其不正義性。
此外,ChatGPT的背后離不開大模型、大數據、大算力。
ChatGPT成為AIGC里程碑的背后,是算力發展和數字時代形成的大數據所共同支持的大模型訓練,才能實現目前的效果。由OpenAI研發的ChatGPT是微調后的GPT-3.5系列模型,有著多達1750億個模型參數,并在今年年初訓練完成。模型訓練的背后離不開大數據的支持,OpenAI主要使用的公共爬蟲數據集有著超過萬億單詞的人類語言數據集。在算力方面,GPT-3.5在Azure AI超算基礎設施(由V100GPU組成的高帶寬集群)上進行訓練,總算力消耗約3640PF-days(即每秒一千萬億次計算,運行3640個整日)。
AIGC里程碑級應用
之前文章里,我們給大家介紹了AIGC——人工智能自動生成內容,它當前主要用在文字、繪畫、圖像、視頻、音頻、游戲以及虛擬人等。很明顯,AI問答ChatGPT都屬于AIGC的一個分支。
國盛證券表示,AIGC不僅改變創作,還將改變獲取信息的主要方式。而在此之上,ChatGPT所展示了作為生產力的存在,ChatGPT在尋找答案、解決問題的效率上已經部分的超越了如今的搜索引擎,ChatGPT或許在未來會改變我們獲取信息、輸出內容的方式,AIGC有望成為數字經濟時代驅動需求爆發的殺手級應用。
市場空間方面,Gartner預計到2025年,生成式人工智能將占所有生成數據的10%。根據《Generative AI:A Creative New World》的分析,AIGC有潛力產生數萬億美元的經濟價值。而國泰君安表示,未來五年或將有10%-30%的圖片內容由AI參與生成,相應或將有600億以上的市場規模。
相關行業
相比于此前的AI繪畫,ChatGPT更具有將AI能力與工作流程相結合的潛力。目前OpenAI等巨頭已著手自建計算集群來滿足AIGC的要求,這種集中式的訓練對GPU、存儲、機房、供電等基礎設施均有巨大需求。國內部分創業團隊目前基于公有云訓練,隨著需求的增加,也有望轉向自建集群。
國盛證券表示,今年以來,我國“東數西算”戰略自上而下快速推進,作為數字經濟的基礎,“算力即權力”,其重要性不言而喻,此前我們更多的互聯網應用聚焦于“存”而非“算”,隨著AIGC技術在全球的興起,“東數西算”的算力需求將越來越顯著。
公司方面,浙商證券表示,從下游相關受益應用來看,包括但不限于代碼機器人、小說衍生器、對話類搜索引擎、語伴、語音工作助手、對話虛擬人等。從上游增加需求來看,包括算力、數據標注、自然語言處理(NLP)等。
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。