玉林实硕医疗科技有限公司

AI見聞日報:被曝光!BING和ChatGPT都要升級了,360多模態來了 | 見智研究

今日要點

微軟Bing要升級識圖功能;ChatGPT上傳文件更新遭泄露;Windows 12要來了;360智腦4.0發布,從對話進入多模態;Reddit 要API收費,訓練語料成本大幅上升;又有音頻新應用,每人都可以定制自己的AI語音克隆;

每日見智AI

1、微軟Bing要升級識圖功能

有Reddit網友發現,Bing的界面上突然就出現了個上傳圖片的選項。據說,上傳一張圖片之后,Bing什么都能干。不管是編程寫代碼、做題作圖,甚至看病,通通不在話下。(似乎還在小規模測試)

2、ChatGPT上傳文件更新遭泄露


(相關資料圖)

ChatGPT的新功能遭泄露?一位Reddit用戶在挖掘源代碼時遇到了一個新的ChatGPT界面,就像他們在發布前一周發現“聊天共享”功能。泄露的屏幕截圖展示了“工作區”,允許用戶創建ChatGPT可以輕松記住的配置文件,并且似乎還暗示了文件上傳這一功能。這一發現也符合 OpenAI 承諾未來推出 ChatGPT 業務變體的計劃。此外,還討論了新的隱私措施的推出,新業務ChatGPT不再使用用戶數據來訓練模型。


見智點評:無論是Bing還是?ChatGPT的業務升級都符合市場的預期,在人工智能助手迭代速度越來越快的今天,識別圖片和文件也勢必要成為人工智能助手升級的重要方向,上傳文件功能的開通更能夠增加用戶對文本操作的便捷性;另外讓機器理解圖片的基本內容是比較容易的,但是理解深層引申含義恐怕還比較難。

3、Windows 12要來了

根據微軟內部測試的情況,Windows 12可能具備一個外觀不同的桌面和沒有系統托盤的浮動任務欄等獨特的功能根據微軟內部測試的情況,Windows 12可能具備一個外觀不同的桌面和沒有系統托盤的浮動任務欄等獨特的功能。

新系統還將擁有深度集成的人工智能功能,而智能Snap UI和Windows Copilot只是其中一部分。盡管目前還沒有官方的消息確認,但這些傳聞已經讓許多Windows用戶對Windows 12充滿了期待。

另外,微軟還宣布推出 NewBing 桌面語音聊天功能,在 BingChat 對話框中增加語音輸入按鈕,只需單擊 BingChat 對話框上的麥克風,即可用語音向 NewBing 提問。

見智點評:Windows12預計將全面結合AI功能,大概率將改變用戶對操作系統的長期使用習慣,AI功能集成到操作系統中將極大的提高工作效率。微軟此前還宣布將在6月開始在Windows11中提供Copilot,讓用戶盡早使用AI工具,并為之后的操作系統全面AI化進行過度。

4、360智腦4.0發布,從對話進入多模態

360智腦大會發布了最新4.0版本,目前已經具備多模態功能,包括文生圖、圖生圖、圖生文、視頻理解和文生視頻。360全家桶也積極全面接入360智腦,包括安全衛士、瀏覽器和桌面等場景。另外值得關注的就是數字人對話功能非常有趣,并且可以定制自己的數字人。預計下個月會發布5.0插件版本

見智點評:國內大模型的迭代速度非???,特別是多模態競爭上未來一定是重要領域,將圖片、視頻、語音等多場景結合才能夠讓AI工具發揮出更出色的效果。另外,數字人現在也是非常重要的領域,由于成本的大幅下降,定制自己的數字人也非常方便,這將極大的推動數字人應用的大范圍應用落地。

5、Reddit 要API收費,訓練語料成本大幅上升

Reddit 表示將在 7 月 1 日開始對現有 API 收費,屆時第三方 Reddit 都將無法正常使用。在 Reddit 新政策下,第三方每調用一千次 Reddit 的 API 需要支付 0.24 美元(約 1.71 元人民幣);

知名第三方 Reddit App,例如 RIF、ReddPlanet、Sync 也宣布將在同一天停止服務。RIF 表示自己的營收遠遠無法承擔 Reddit API 所要的費用。還包括自動駕駛開發平臺Apollo。

見智點評:Reddit是一家知名的在線論壇公司,同時給企業提供API用于訪問數據,第三方公司可以創建與Reddit相關的應用程序。

即便是收到了眾多第三方用戶的反對,但Reddit預計仍舊堅持推行收費支付,因為目前Reddit還沒有盈利,隨著API調用量的激增,訓練語料成本大幅上升,Reddit也需要有一定的收入來繼續運營數據從而提供商業服務。

在品牌影響力已經足夠大的時候,長期免費并不符合公司的發展路徑,畢竟不是公益企業,一切運營都需要開支。短期來看,公司的用戶量肯定會受到影響,但是也會篩選出長期合作用戶以提供更優質的服務。

6、又有音頻新應用,每人都可以定制自己的AI語音克隆

PlatTH可以為用戶定制免費的AI語音克隆,準確率高達99%。操作簡單,無需專業設備,只要上傳2-3小時的語音,便可以得到自己的克隆聲音。

見智點評:超逼真的AI語音克隆適用于眾多視頻生產和游戲領域。比如制作抖音短視頻、B站長視頻、還可以創建人工智能博客等等,AI工具的出現讓視頻生產的效率獲得極大的改變。

風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

關鍵詞: