玉林实硕医疗科技有限公司

速遞!AI見聞日報:大模型思想克??!讓AI像人類一樣思維,學習泛化能力大幅提升;SAM視覺模型升級,分割能力大幅提升 | 見智研究

今日要點:

1、下一代模型訓練方法:不是預測下一個字,而是模仿人類思維學習在行動中思考

2、SAM視覺模型升級,分割能力再提升,將進一步提升多模態能力


(資料圖)

3、微軟Office 365 Copilot已經擴大試用范圍,開啟漲價

4、谷歌發布AI學習課程,專為初學者設計

見聞視角

海外AI

1、下一代模型訓練方法:不是預測下一個字,而是模仿人類思維學習在行動中思考

要點:

動機:提出一種新的模仿學習框架,Thought Cloning,通過模仿人類思考過程來改進強化學習智能體的表現。研究者認為,強化學智能體在泛化能力、探索能力、規劃能力、適應新情境的能力等方面遠遠不及人類,其中一個原因是缺乏語言思考的收益。方法:提出Thought Cloning,不僅克隆人類示范者的行為,還克隆人類在執行這些行為時的思考過程。通過在大規模的包含人類思考過程的數據集上訓練,論文驗證了Thought Cloning相比行為克隆方法在學習速度和處理新情境能力上的優勢。優勢:Thought Cloning相較于行為克隆方法具有更快的學習速度,并且在面對新情境任務時具有更大的性能優勢。此外,Thought Cloning還對AI安全性和可解釋性有重要益處,可以更容易地診斷問題、糾正代理的思考或阻止代理執行不安全的計劃。思想數據來源:研究者選取了YouTube視頻和文字錄音,有大約數百萬小時,包含了人們行動、計劃、決定和重新規劃背后的思想。

見智研究一句話總結:

Shengran Hu, Jeff Clune(前OPEN AI成員)提出了一種名為Thought Cloning的模仿學習框架,通過模仿人類思考過程來訓練AI智能體,提高其學習速度、泛化能力和處理新情境的能力,同時提供重要的AI安全性和可解釋性優勢。

在Jeff Clune看來,思想克隆有助于人工智能的安全。因可以觀察到智能體的思想:(1)可以更容易地診斷出事情出錯的原因,(2)通過糾正智能體的思想來引導它,(3)或者阻止它做所計劃的不安全的事情。

2、SAM視覺模型升級,分割能力再提升,將進一步提升多模態能力

HQ-SAM,使 SAM 具備準確分割任何物體的能力,同時保持 SAM 原有的提示設計、效率和零樣本泛化能力。我們的精心設計重用并保留了 SAM 的預訓練模型權重,同時只引入了最少的額外參數和計算。

研究人員設計了一個可學習的高質量輸出令牌,它被注入到 SAM 的掩碼解碼器中,并負責預測高質量掩碼。我們不是僅將其應用于掩碼解碼器功能,而是首先將它們與早期和最終 ViT 功能融合以改進掩碼細節。為了訓練我們引入的可學習參數,研究人員從多個來源組成了一個 44K 細粒度掩碼數據集。 HQ-SAM 僅在引入的 44k 掩模 detaset 上進行訓練,在 8 個 GPU 上僅需 4 小時。我們展示了 HQ-SAM 在跨不同下游任務的一組 9 個不同分割數據集中的功效,其中 7 個在零鏡頭傳輸協議中進行了評估。

見智研究認為,SAM模型的出現讓視覺模型的范式發生改變,讓原本在視覺領域有所積累的AI公司被迅速拉平距離,甚至讓相當一部分此前積累的技術變得毫無意義。而此次SAM模型的升級,將是分割能力再次大幅提升。同時保持 SAM 原有的提示設計、效率和零樣本泛化能力。通用大模型多模態領域的進化將再次升級。

3、微軟Office 365 Copilot已經擴大試用范圍,開啟漲價

包括美國銀行、沃爾瑪、福特和埃森哲在內的600多家微軟最大的客戶預計將試用Microsoft Office 365中的人工智能功能,其中至少已有100家客戶已經額外分別為1000個訂閱賬戶支付了高達10萬美元的年費。(在原有的Office 365年費基礎上,每個賬戶多支出100美元)

與經典版本相比,這一AI版本的Office 365價格至少高出了40%,具有自動在Word文檔中撰寫文字和自動創建PPT等增值功能。

見智研究認為,目前階段,微軟為office AI定價較高的其中一個原因是這些功能通常需要更多的GPU服務器算力,比傳統的服務器消耗更多資源成本。市場普遍看好AI將為微軟帶來一次新的用戶付費改善飛躍,但市場仍需觀察微軟是否能在該項產品上做的足夠好,以及在現有GPU短缺的情況如何擴展用戶數量的桎梏。

4、谷歌發布AI學習課程,專為初學者設計

谷歌發布了一個名為 "Generative AI learning path" 的學習路徑課程,專門為初學者設計。它從基礎概念開始,如什么是生成式AI,然后逐步深入到更復雜的主題,如創建圖像字幕模型和使用Vertex AI的生成式AI工作室。目標是幫助初學者理解生成式AI的基礎知識,以及如何在Google Cloud上使用生成式AI。

明日看點:

蘋果WWDC將在北京時間6月6日凌晨2點召開,據悉,本次WWDC將是蘋果有史以來最長的一次。XR是否能成為下一個iPhone,全世界都在期待這次的one more thing.

風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

關鍵詞: