環球關注:Nature一周連發兩文探討ChatGPT:學術圈使用已不可避免,是時候明確使用規范了
在科技巨頭為了ChatGPT大打出手的另一邊,學術圈對于ChatGPT的關注也在升高。
一周時間內,Nature連發兩篇文章探討ChatGPT及生成式AI。
【資料圖】
畢竟ChatGPT最早還是在學術圈內掀起風浪,先后有學者拿它寫論文摘要、改論文。
Nature為此專門頒布禁令:ChatGPT不能當論文作者。Science則直接禁止投稿使用ChatGPT生成文本。
但趨勢已擺在眼前。
現在更應該做的,或許是明確ChatGPT對于科學界的意義以及應當處于怎樣的身位。
正如Nature所言:
生成式AI及背后的技術發展如此之快,每個月都有創新出現。研究人員如何使用它們,將決定著技術和學界的未來。
ChatGPT改變學術圈規則
在《ChatGPT:五大優先研究問題》一文中,研究人員提出:
無法阻止ChatGPT殺入學術圈,當務之急應該是研究探討它會帶來哪些潛在影響。
如果后續ChatGPT被拿來設計實驗、進行同行審議、輔助出版、幫編輯決定是否要接收文章……這些應用應該注意哪些問題?現在人類需要明確哪些邊界?
研究人員認為,有5個方面需要優先考慮,并解釋了原因。
堅持人類審查
ChatGPT等對話式AI的一大特點,就是回答內容的準確性無法保證。而且編出來的瞎話都還很自然,容易對人產生誤導。
比如,研究人員讓ChatGPT對一篇關于認知行為療法(CBT)治療焦慮等癥狀是否有效的論文進行總結概述。
ChatGPT給出的回答中,存在很多事實性錯誤。如它說這項評估是基于46項研究,但實際上是69項,而且夸大了CBT的有效性。
研究人員認為如果有學者使用了ChatGPT幫忙做研究,很可能被錯誤信息誤導。甚至會導致學者在不知情的情況下,剽竊他人成果。
因此,研究人員認為在評審論文過程中,人類不能過度依賴于自動化系統,最終還是要由人類自己為科學實踐負責。
制定問責規則
為了應對生成式AI的濫用,很多鑒別AI文本工具陸續誕生,它們能很好分辨出一段文字是不是人類自己寫的。
不過,研究人員認為這種“軍備賽”大可不必,真正要做的是讓學術圈、出版商能更加公開透明地使用AI工具。
論文作者應該明確標注哪些工作是AI承擔的,期刊如果使用AI審稿,也應該公開說明。
尤其是目前生成式AI已經引發了關于專利問題的討論,AI生成的圖像版權究竟該怎么算?
那么對于AI生成的問題,著作權應該屬于為AI提供訓練數據的人?AI背后的制作公司?還是用AI寫文章的學者?作者身份的問題,也需要嚴謹定義。
投資真正開放的LLM
目前,幾乎所有先進的對話式AI,都是科技巨頭們帶來的。
關于AI工具背后算法的工作原理,很多都還不得而知。
這也引發了社會各界的擔憂,因為巨頭們的壟斷行為,嚴重違背了科學界開放的原則。
這將會影響學術圈探尋對話式AI的缺點和底層原理,進一步影響科技的進步。
為了克服這種不透明性,研究人員認為當下應該優先考慮開源AI算法的開發和應用。比如開源大模型BLOOM,就是由1000位科學家聯合發起的,性能方面可以匹敵GPT-3。
擁抱AI的優點
雖然有很多方面需要設限,但不可否認,AI確實能提升學術圈的效率。
比如一些審查工作,AI可以快速搞定,而學者們就能更加專注于實驗本身了,成果也能更快發表,從而推動整個學術圈的腳步走得更快。
甚至在一些創造性工作上,研究人員認為AI也能有用武之地。
1991年的一篇開創性論文提出,人和AI之間形成的“智能伙伴關系”,可以勝過單獨人類的智力和能力。
這種關系能夠將創新加速到無法想象的水平。但問題是,這種自動化能走多遠?應該走多遠?
因此,研究人員也呼吁,包括倫理學家在內的學者,必須就當今AI在知識內容生成方面的界限展開討論,人類的創造力和原創性可能仍舊是進行創新研究必不可缺的因素。
展開大辯論
鑒于當下LLM帶來的影響,研究人員認為學界應該緊急組織一次大辯論。
他們呼吁,每個研究小組都應該立即開組會,討論并親自試試ChatGPT。大學老師應該主動和學生討論ChatGPT的使用和倫理問題。
在早期規則還沒有明確的階段,對于研究小組負責人來說,重要的是如何號召大家更公開透明地使用ChatGPT,并開始形成一些規則。以及應該提醒所有研究人員,要對自己的工作負責,無論它是否由ChatGPT生成。
更進一步,研究人員認為要立即舉辦一個國際論壇,討論LLM的研究和使用問題。
成員應該包括各個領域的科學家、科技公司、研究機構投資方、科學院、出版商、非政府組織以及法律和隱私方面的專家。
Nature:ChatGPT和AIGC對科學意味著什么
興奮又擔憂,大概是許多研究人員對于ChatGPT的感受。
發展到現在,ChatGPT已經成為了許多學者的數字助手。
計算生物學家Casey Greene等人,用ChatGPT來修改論文。5分鐘,AI就能審查完一份手稿,甚至連參考文獻部分的問題也能發現。
來自冰島的學者Hafsteinn Einarsson,幾乎每天都在用ChatGPT來幫他做PPT、檢查學生作業。
還有神經生物學家 Almira Osmanovic Thunstr?m覺得,語言大模型可以被用來幫學者們寫經費申請,科學家們能節省更多時間出來。
不過,Nature對ChatGPT輸出內容做出了精辟總結:
流暢但不準確。
要知道,ChatGPT的一大缺點,就是它生成的內容不一定是真實準確的,這會影響它在學術圈的使用效果。
能解決嗎?
從現在來看,答案有點撲朔迷離。
OpenAI的競爭對手Anthroic號稱解決了ChatGPT的一些問題,不過他們沒有接受Nature的采訪。
Meta發布過一個名為Galactica的語言大模型,它由4800萬篇學術論文、著作煉成,號稱擅長生成學術方面內容,更懂研究問題。不過現在它的demo已經不開放了(代碼還能用),因為用戶在使用過程中發現它帶有種族歧視。
即便是已經被調教“乖巧”的ChatGPT,也可能會在刻意引導下輸出危險言論。
OpenAI讓ChatGPT變乖的方法也很簡單粗暴,就是去找非常多的人工給語料標注,有聲音認為這種雇人看有毒語料的行為,也是一種剝削。
但無論如何,ChatGPT及生成式AI,開啟了人類新的一扇想象之門。
醫學學者埃里克·托普(Eric Topol)表示,他希望未來能有包含LLM的人工智能,可以交叉檢查學術文獻中的文本和圖像,從而幫助人類診斷癌癥、理解疾病。當然這一切要有專家做監督。
他說,真沒想到我們在2023年年初,就看到了這樣的趨勢。
而這才只是開始。
本文來源:人工智能學家,原文標題:《Nature一周連發兩文探討ChatGPT:學術圈使用已不可避免,是時候明確使用規范了》
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。