AI見聞日報:OpenAI降價95%!還用API自己造插件;AMD挑戰英偉達發布超強AI芯片 | 見智研究 環球熱頭條
今日要點
1、OpenAI降價95%,用API自己造插件;
2、AMD發布AI芯片 MI300X,仍無法挑戰英偉達CUDA壁壘;
(相關資料圖)
3、微軟推出醫學大模型LLaVA-Med ,能夠推測患者病理情況;
4、Windows10到2025年后將永久停止使用;
5、阿聯酋打造的大模型持續霸榜Hugging Face;
每日見智AI
1、OpenAI大降價!開放函數調用功能,讓開發者操作更便捷
OpenAI官網宣布“更新更可調的API模型、函數調用功能(Function calling)、更長的上下文和更低的價格”,發布更高效更低成本的版本。
降價方面:不同版本降價幅度不同,OpenAI最先進、用戶最多的嵌入模型Text-embedding-ada-002降價75%;用戶最多的聊天模型gpt-3.5-turbo降價25%。此外,OpenAI還推出了gpt4-16k平替版——gpt-3.5-turbo-16k,價格為每輸入1000 tokens 0.003美元,相當于降價95%!
最值得關注的是:函數調用功能;開發者現在可以向gpt-4-0613和gpt-3.5-turbo-0613兩個模型描述函數,并讓模型智能地選擇輸出一個包含參數的JSON(JavaScript Object Notation,一種數據交換的文本格式)對象來調用這些函數。若將GPT功能與外部工具或API進行連接,這種方法更加可靠。
見智點評:
函數調用功能最大程度幫助開發者更輕松地構建調用外部工具、將自然語言轉換為外部 API 調用或進行數據庫查詢的聊天機器人。
底層邏輯是:允許開發者更可靠地從模型中獲取結構化數據,能夠很大程度提高程序的可讀性,能夠提升代碼的組織效率;
例如調用外部工具提供回答、從文本中提取數據化結構等。這樣很大程度降低了操作門檻,極大的優化了效率,同時還能夠更大程度發揮模型的功能。
函數調用能夠將復雜程序分解為更小的部分,同時更加便于管理和使用。另外在測試上面也更便捷和高效,在方便調用的同時更有助于提高整體運行的質量。
從降價角度來看,Sam Altman兌現了承諾,并且遠遠超過市場預期。另外,由于 OpenAI 不斷更新其模型,舊版本將不會永久存在。公司還宣布開始淘汰一些早期版本的這些模型,包括 gpt-3.5-turbo-0301 和 gpt-4-0314將在9月13日之后停止使用。
2、AMD發布AI芯片 MI300X,仍無法挑戰英偉達CUDA壁壘
AMD宣布即將推出迄今為止最先進的人工智能GPU MI300X芯片,并可以使用高達192GB的內存的HBM3高帶寬內存來加速大型語言模型和生成式AI計算。
AMD主要客戶將在第三季度開始試用MI300X,第四季度開始全面生產。另一種型號Instinct MI300A現在正在向客戶發售。
除了AI芯片外,AMD還推出專為云計算和超大規模用戶設計的全新EPYC服務器處理器,代號為Bergamo,每個插槽最多包含128個內核,并針對各種容器化工作負載進行了優化。
見智點評:
MI300X一定程度能夠成為AI芯片市場很受歡迎的產品,當下英偉達AI芯片供應仍舊處于非常緊缺的狀態,openAI等多家企業也紛紛想要申請購買更多的芯片滿足日漸增長的數據中心訪問量,但是訂單排期已經陸續延到年底。
雖然MI300X還不足以完全替代GH200,但在內存容量方面已經比英偉達GH100更大,且在節能方面MI300X表現比GH200更出色,但是對于價格方面目前還沒有定論,市場預估成本可能會高于H100。
另外,見智認為英偉達CUDA GPU 在許多計算密集型任務中比 AMD GPU 更快,包括 GPU 的設計和更高效的編譯器優化的可用性,AMD仍無法挑戰英偉達CUDA壁壘。AMD正在努力提高其MI300X GPU的性能,并為其平臺提供更好的支持。但AMD是否能夠縮小與NVIDIA的差距還有待觀察。
3、微軟推出醫學大模型LLaVA-Med,能夠推測患者病理情況
微軟研究人員展示了 LLaVA-Med 模型,該模型主要用于生物醫學方面的研究,可根據 CT、X 光圖片等推測出患者的病理狀況。
據悉,微軟研究人員與一批醫院合作,獲得了使用生物醫學圖像文本對應大型數據集來訓練多模態 AI 模型。該數據集包括胸部 X 光、MRI、組織學、病理學和 CT 圖像等,覆蓋范圍相對全面。
微軟使用 GPT-4,基于 Vision Transformer 和 Vicuna 語言模型,在八個英偉達 A100 GPU 上對 LLaVA-Med 進行訓練,其中包含“每個圖像的所有預分析信息”,用于生成有關圖像的問答,以滿足“可自然語言回答有關生物醫學圖像問題”的助手愿景。
在學習過程中,模型主要圍繞“描述此類圖像的內容”以及“闡述生物醫學概念”而展開。據微軟稱,該模型最終具有“出色的多模式對話能力”、“在用于回答視覺問題的三個標準生物醫學數據集上,LLaVA-Med 在部分指標上領先于業界其他先進模型”。
見智點評:
醫學大模型LLaVA-Med已經被證明對圖像問題的回答能夠達到90%的準確率,是一個非常有前景的專用大模型工具,未來很有可能徹底改變研究人員和生物醫學數據交互的方式,同時還能夠優化醫療診斷的流程,成為為醫生提供更具專業度和可信度的診斷的AI助手。
當然,任何大模型都還有需要提供的空間,比較這款大模型就會出現虛假舉例和推理不佳的問題,研究團隊也表示未來會側重于提高模型的質量和可靠性,有朝一日可以應用于商業生物醫學。
4、Windows10將在2025年后永久停止使用
微軟已宣布正式停止支持Windows10 21H2版本,這意味著仍在運行該版本的用戶將被強制升級至22H2版本。雖然Windows 11仍然可以選擇升級,但只適用于支持該系統的硬件。
除了21H2版,微軟還停止支持了Windows10 20H2版本和第二代SurfaceBook。據悉,Windows10 22H2版本將是最后一個Windows10版本,支持也將于2025年10月結束。目前,Windows 10處于“維護模式”,只接收每月的累積更新。1月份,微軟已停止Windows10數字版的下載和售賣,集中精力開發Windows 11,并預計在2024年推出“Windows 12”。
5、阿聯酋打造的大模型持續霸榜Hugging Face
近日,阿聯酋科技創新研究所(TII)打造出的400億參數的語言模型Falcon-40B,在Hugging Face 的OpenLLM排行榜上依舊排名第一,并持續霸榜,贏過此前LLaMA、StableLM和RedPajama等競爭者。
Falcon-40B模型利用將近5億個Token、并使用384顆GPU進行了2個月的訓練。為提高訓練過程的質量,團隊成員還自己組建了一套工作流程來篩選出“最高質量的的語料”供該模型進行訓練。經過多個基準測試后,表現比LLaMA、Vicuna和Alpaca更加出色。
見智點評:
Falcon背后的研發方為阿聯酋的阿布扎比技術創新研究所(TII),這是中東首個世界頂級的大模型產品。團隊采用了“多重查詢注意力”機制來提高模型的效率。其中,“多重查詢注意力”機制即模型可以對每個token進行多個查詢,來更好表示同一序列中不同token之間的關系,從而在加速模型運算效率的同時,降低模型的復雜性,進一步提高模型整體的可維護性。
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。關鍵詞: