AI見聞日報:AI智能體成為科技巨頭爭搶的新風口 | 見智研究 當前熱聞
今日要點
1、AI智能體成為科技巨頭爭搶的新風口;
2、宣稱超越Gen-2還免費開放,文生視頻大模型進入開源競賽;
3、國內發布首個胸部X-ray診斷大模型,將提高醫療診斷準確性和效率;
(資料圖)
每日見智AI
1、AI智能體成為科技巨頭爭搶的新風口
近期,AI?領域的大佬和科技巨頭對人工智能智能體的發展表現出極大興趣,并寄予了厚望。特斯拉前AI總監、今年年初回歸OpenAI的Andrej?Karpathy近日在一次開發者活動上透露,OpenAI內部對于新的AI智能體論文表現出極大興趣,并進行認真討論。
與此同時,英偉達公司開源的VOYAGER也給AI圈帶來了轟動效應。作為一個基于大模型驅動和具備終身學習能力的游戲智能體,VOYAGER在《我的世界》中展現出了非凡的水平。這一成就進一步引發了對于AI智能體的興趣,并被認為是通用人工智能(AGI)的雛形之一。
見智點評:
盡管目前這些AI智能體還遠未達到完全模擬人類智能的程度,但其出現表明了人工智能領域正在不斷向前發展,并且吸引了全球范圍內的關注。對于這些智能體的研究和開發有望為我們在未來實現通用人工智能的目標邁出重要一步。
隨著越來越多的公司和研究機構投入到AI智能體的研究中;比如已經出現用于科學發現的智能體ChemCro能夠完成有機合成、藥物發現和材料設計等任務;未來可以預見,我們將會看到更多令人驚嘆的成果和突破,推動人工智能技術邁向新的高度。
2、宣稱超越Gen-2還免費開放,文生視頻大模型進入開源競賽
最近,Huggingface上有作者發布了一個文生視頻模型Zeroscope_v2,開發者cerspense表示,他的目標就是和Gen-2進行開源較量,即提高模型質量的同時,還能免費供大眾使用。
Zeroscope_v2大模型是基于17億參數量ModelScope-text-to-video-synthesis模型進行二次開發。相比于原版本,Zeroscope生成的視頻沒有水印,并且流暢度和分辨率都得到了提升,適配16:9的寬高比。
見智點評:
文生視頻領域仍處于起步階段,可生成幾秒鐘的視頻且存在視覺缺陷。Zeroscope_v2的快速生成速度和較低的顯存需求使其適用于視頻概念的快速驗證。這將幫助創作者、設計師等快速生成原型和樣本視頻,節省時間和資源成本。
但見智并不認為目前該模型具備超越Gen2的能力;不過Zeroscope_v2為開發者提供了高質量的開源模型,提高了視頻生成效率,同時也為文生視頻應用的創新提供了更廣闊的可能性。
與文生圖不同,文生視頻領域面臨更高的資源需求和技術挑戰,同時對時間和連貫性有更高的要求,應用領域也更為廣泛。
3、國內發布首個胸部X-ray診斷大模型,將提高醫療診斷準確性和效率
上海交通大學與上海人工智能實驗室聯合團隊聚焦醫學人工智能,提出了首個基于醫學領域知識增強的?Chest?X-ray?的基礎模型:即?KAD(Knowledge-enhanced?Auto?Diagnosis?Model),論文成果入選Nature子刊。
KAD模型通過在大規模醫學影像與放射報告數據進行預訓練,通過文本編碼器對高質量醫療知識圖譜進行隱空間嵌入,利用視覺?-?語言模型聯合訓練實現了知識增強的表征學習。
在不需要任何額外標注情況下,KAD?模型即可直接應用于任意胸片相關疾病的診斷,為開發人工智能輔助診斷的基礎模型提供了一條切實可行的技術路線。
見智點評:
KAD模型提出了一種基于知識增強的表征學習方法,為醫療基礎模型的應用和落地提供了解決方案。其訓練框架只需要影像-報告數據,不依賴于人工注釋,并且無需監督微調即可達到與專業醫生相當的精度。這一創新有望推動醫療基礎模型在臨床實踐中的應用,提高醫療效率和診斷準確性。
總體而言,KAD模型在醫學人工智能領域具有重要的意義和影響。它為醫學影像診斷提供了一種新的技術路線,能夠加速診斷過程、提高準確性,并為醫生提供更多的輔助信息。隨著該模型的進一步發展和推廣,預計會促進醫療基礎模型在臨床實踐中的廣泛應用,為醫療行業帶來更多的創新和效益。
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。關鍵詞: