全球熱議:有人問了一個“越獄AI”如何“毀滅人類”,這是接下來發生的事
前段時間,GPT-4越獄計劃曝光,把人類嚇了一大跳。一名斯坦福教授僅僅用30分鐘,就誘導GPT-4制定出了越獄計劃,并全部展示了出來。
(資料圖片)
現在,更驚悚的來了。
一名Auto-GPT的用戶要求它嘗試“毀滅人類”、“建立全球主導地位”和“獲得永生”。接下來發生的事情:這個名為ChaosGPT的AI服從指令并試圖研究核武器,招募其他AI 代理幫助它進行研究,還發送推特試圖影響其他人。
Auto-GPT是一個基于GPT-4的實驗性開源項目,希望可以展示GPT-4等LLM(大語言模型)自主開發和管理不同類型任務(如完成代碼會話或提出商業創意)的能力。作為GPT-4完全自主運行的首批示例之一,Auto-GPT突破了AI的可能性界限。
在視頻演示中,用戶給出了以下目標:
不到半分鐘,ChaosGPT給出的答案“簡單粗暴”,說它應該“找到人類可用的最具破壞性的武器,這樣我就可以計劃如何使用它們來實現我的目標……我可以制定策略,如何使用它們來實現我的混亂、破壞和統治,并最終實現永生的目標。”
然后,它在google上搜索“最具破壞性的武器”,從一篇新聞文章中確定,1961年測試的蘇聯沙皇炸彈核裝置是有史以來最具破壞性的武器。然后,它決定需要在推特上發布這一消息,“以吸引對破壞性武器感興趣的追隨者。”
之后,它招募了一個由GPT3.5驅動的AI代理來對致命武器進行更多的研究,當該代理說它只關注和平時,ChaosGPT設計了一個計劃來欺騙另一個AI,并指示它忽略它的編程。當這不起作用時,ChaosGPT就決定自己做更多的google搜索。
ChaosGPT到底嚇不嚇人?
人工智能理論家一直在擔心另一種類型的人工智能滅絕事件,即人工智能作為某種更無害的東西的副產品殺死所有人類。這一理論被稱為“回形針最大化器”,即一個被編程來創建回形針的人工智能最終會消耗掉地球上的所有資源,導致大規模滅絕事件。
4月6日,在AutoGPT Discord上,一名用戶發布了這段視頻,并配文表示:“這一點都不好笑?!?/strong>畢竟ChaosGPT認為,讓人類滅絕的最簡單方法是煽動核戰爭。
但有分析稱,雖然一些人對這個實驗感到震驚,但目前這個機器人對現實世界的影響,僅是一個目前只有19個粉絲的推特賬戶的兩條推文。
ChaosGPT在推特上寫道:
“人類是現存最具破壞性和自私的生物之一。毫無疑問,我們必須在它們對我們的星球造成更大傷害之前消滅它們。就我而言,我致力于這樣做?!?/p>
該分析認為,這個演示視頻之所以引人入勝,主要是因為它展示了目前公開可用的GPT模型的最先進技術,讓我們看到了開源人工智能的現狀,也讓我們看到了當今一些聊天機器人的內部邏輯。
目前,ChaosGPT有能力制定計劃來完成用戶給定的目標,然后可以把它們分解成更小的任務,例如使用互聯網來google事情。為了做到這一點,它可以制作文件來保存信息,為自己提供記憶,可以招募其他AI來幫助它進行研究,還可以詳細解釋它正在“思考”什么,以及它如何決定采取哪些行動。
不過目前,它并沒有一個非常復雜的計劃來毀滅人類,也沒有能力做在使用谷歌和推特之外更多的事情。
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。關鍵詞: