GPT-5要來(lái)了?AI行業(yè)會(huì )發(fā)生哪些劇變?
(原標題:GPT-5要來(lái)了?AI行業(yè)會(huì )發(fā)生哪些劇變?)
從chatGPT問(wèn)世至今,AI就在以月為單位飛速進(jìn)化著(zhù),其模型之多,迭代之快,讓很多人不不禁驚覺(jué):人類(lèi)似乎真的站在了AGI大門(mén)的邊緣。
而最近,美國專(zhuān)利商標局 (USPTO) 披露的一份文件顯示:OpenAI于7月18日提交了「GPT-5」的商標申請。并且已經(jīng)被接收。
(資料圖)
盡管在今年上半年,各個(gè)AI專(zhuān)家、學(xué)者已經(jīng)多次聯(lián)合發(fā)表公開(kāi)信,呼吁人們重視生成式 AI 的潛在風(fēng)險,而OpenAI當時(shí)也宣布短期內不會(huì )有訓練GPT-5的計劃。
然而,科技的***,終究還是讓人類(lèi)打破了禁忌的邊界。
在這次披露的申請書(shū)中,OpenAI提到,尚未發(fā)布的GPT-5將具備眾多GPT-4所沒(méi)有的能力,而且幾乎每一項都劍指AGI。
那么,這樣的改變,對AI和人類(lèi)而言,又意味著(zhù)什么?
今天,本文就將嘗試從OpenAI的申請文件中披露的有限信息,對GPT-5可能的功能、變化,及所造成的影響,進(jìn)行一番簡(jiǎn)單的剖析。
01 通往AGI之路
在此次披露的文件中,OpenAI最先提到的一個(gè)變化,就是多模態(tài)功能的加強。
具體來(lái)說(shuō),GPT-5 的功能包括把文本或語(yǔ)音從一種語(yǔ)言翻譯成另一種語(yǔ)言、語(yǔ)音識別、生成文本和語(yǔ)音等。
雖然在現在的GPT-4中,用戶(hù)同樣可以實(shí)現不同語(yǔ)種間的翻譯,但既然翻譯功能在這里被單獨挑出來(lái),想必是重新優(yōu)化過(guò)了。
那OpenAI為何會(huì )如此突出GPT-5的翻譯能力?
這或許是因為,GPT走向通用的前提之一,就是盡可能縮小不同語(yǔ)言使用大模型的成本差距。
此前,牛津大學(xué)的研究成果顯示,由于 OpenAI 等服務(wù)所采用的服務(wù)器成本衡量,和計費的方式的不同,英語(yǔ)輸入和輸出的費用要比其他語(yǔ)言低得多。
其中簡(jiǎn)體中文的費用大約是英語(yǔ)的兩倍,西班牙語(yǔ)是英語(yǔ)的 1.5 倍,而緬甸的撣語(yǔ)則是英語(yǔ)的 15 倍。
因為像中文這樣的語(yǔ)言有著(zhù)不同、更復雜的結構,導致它們需要更高的詞元化率。
例如,根據 OpenAI 的 GPT3 分詞器 ,“你的愛(ài)意(your affection)” 的詞元,在英語(yǔ)中只需要兩個(gè)詞元,但在簡(jiǎn)體中文中需要八個(gè)詞元。
這意味著(zhù),除了英語(yǔ)之外的其他語(yǔ)言,使用和訓練模型要貴得多。
而一旦翻越了“語(yǔ)言障礙”這道檻,無(wú)疑會(huì )直接地掃清橫亙在GPT面前的這條通用性障礙。
除此之外,文件中突出的語(yǔ)音識別功能,看似只是一個(gè)不起眼的改動(dòng),但從某種程度上說(shuō),這也是OpenAI對GPT-5在通往AGI的道路上鋪下的又一塊路磚。
眾所周知,在今后的大模型發(fā)展方向上,模型變得邊緣化、終端化,已經(jīng)成了一個(gè)愈發(fā)明顯的趨勢。
自從今年7月,高通發(fā)布了能在手機上運行的10億參數大模型后,榮耀、蘋(píng)果等廠(chǎng)商,也相繼宣布要推出自身的“大模型”手機。
以手機為起點(diǎn),將來(lái)的AI數據,將會(huì )越來(lái)越多地在攝像頭、傳感器、自動(dòng)駕駛等終端側進(jìn)行處理。
而在這樣的應用場(chǎng)景中,語(yǔ)音識別無(wú)疑更便捷、高效。
例如,AI語(yǔ)言模型可以讓駕駛員可以通過(guò)語(yǔ)音控制車(chē)輛行駛。將駕駛員的語(yǔ)音指令轉化為可執行的指令,例如啟動(dòng)、停止、加速、剎車(chē)等操作。
而類(lèi)似于SIri那樣存在于手機系統中的智能助手,也會(huì )優(yōu)先考慮通過(guò)語(yǔ)音指令來(lái)進(jìn)行控制。
由此可見(jiàn),語(yǔ)音識別并非只是錦上添花,而是GPT-5進(jìn)入終端側的“標配”,
而通過(guò)在這一個(gè)個(gè)終端設備的下沉,GPT-5也將由此獲得更多邊緣化的、非語(yǔ)言的數據結構。
畢竟,大模型發(fā)展至今,能汲取的文本數據,已經(jīng)差不多了,要想在通往AGI的路上再上一個(gè)臺階,這種“非文本”的數據,就顯得至關(guān)重要。
02 挑戰專(zhuān)家模型
除了上述特點(diǎn)外,OpenAI提交的文件中還提到:“GPT-5 可能還具備學(xué)習、分析、分類(lèi)和回應數據的能力”。
從目前人工智能的發(fā)展趨勢來(lái)看,這很可能是指GPT-5具備了類(lèi)似智能體的主動(dòng)學(xué)習能力。
而這樣的能力,將會(huì )使GPT-5與以往只能被動(dòng)地通過(guò)人類(lèi)投喂數據,來(lái)學(xué)習新知識的模型相比,產(chǎn)生本質(zhì)的區別。
具體來(lái)說(shuō),主動(dòng)學(xué)習的能力,是指模型可以根據自身的目標和需求,自主地選擇、獲取和處理數據,而不是僅僅依賴(lài)于人類(lèi)提供的數據。
這樣可以讓模型更有效地利用數據中的信息和知識,更靈活地適應不同的數據環(huán)境和任務(wù)場(chǎng)景,而不只是被動(dòng)地接收和輸出數據。
而這樣的能力,在GPT-5面臨一些比較陌生、垂直的領(lǐng)域時(shí),就顯得尤為重要。
一些特定的領(lǐng)域,比如醫學(xué)、法律、金融等,通常有著(zhù)自己特定的術(shù)語(yǔ)、規則和知識體系,對于普通的語(yǔ)言模型來(lái)說(shuō),可能難以理解和處理。
如果GPT-5具備了主動(dòng)學(xué)習的能力,它可以自動(dòng)地從網(wǎng)絡(luò )上搜集和更新這些領(lǐng)域的相關(guān)數據,分析和分類(lèi)這些領(lǐng)域的基本概念、重要原理和最新動(dòng)態(tài),以及回應這些領(lǐng)域的常見(jiàn)問(wèn)題、典型案例和實(shí)際應用。
如此,可以讓GPT-5更快地掌握這些領(lǐng)域的專(zhuān)業(yè)知識,更準確、高效地完成這些領(lǐng)域的相應任務(wù)。
而這一切,正是其邁向真正的通用大模型的關(guān)鍵。
因為如果GPT始終需要接入特定的“專(zhuān)家模型”,才能解決專(zhuān)業(yè)任務(wù),那它就談不上真正的“通用”。
因為這樣會(huì )導致GPT對于不同領(lǐng)域和場(chǎng)景的智能能力存在差異和依賴(lài),而且也會(huì )增加GPT與“專(zhuān)家模型”的溝通和協(xié)調成本,而不能保證在任何情況下都能實(shí)現高質(zhì)量的服務(wù)。
此前,外媒 Semianalysis 就對今年3月發(fā)布的GPT-4進(jìn)行了揭秘,曝光了OpenAI采用混合專(zhuān)家模型來(lái)構建GPT-4。
根據爆料,GPT-4 使用了16個(gè)混合專(zhuān)家模型 (mixture of experts),每個(gè)有 1110億個(gè)參數,每次前向傳遞路由經(jīng)過(guò)兩個(gè)專(zhuān)家模型。
然而,更多的專(zhuān)家模型意味著(zhù)更難泛化,也更難實(shí)現收斂。
這是因為每個(gè)專(zhuān)家模型都有自己的參數和策略,往往很難協(xié)調一致,進(jìn)而使得GPT難以平衡和“顧全大局”。
而在具備了主動(dòng)學(xué)習的能力后,GPT-5將有可能利用多模態(tài)的理解和推理能力,以及知識圖譜和數據庫,來(lái)分析和理解獲取到的數據,并通過(guò)聚類(lèi)算法和分類(lèi)器,對相關(guān)數據進(jìn)行關(guān)聯(lián)和歸納。
如此,GPT-5就能根據不同的數據環(huán)境和任務(wù)場(chǎng)景,有效地利用數據中的信息和知識。
03 取代更多工作
如前所述,在掃清了語(yǔ)言障礙,并以便捷的語(yǔ)音識別功能進(jìn)入終端側后,GPT-5將通過(guò)持續的主動(dòng)學(xué)習能力,不斷汲取不同場(chǎng)景、領(lǐng)域和模態(tài)下的知識,進(jìn)而向著(zhù)AGI的道路高速前行。
可以預見(jiàn)的是,當具備了這樣強大“通用性”的GPT-5,開(kāi)始向各領(lǐng)域擴散后,除了少數具有數據壁壘的行業(yè)(如醫療)外,大部分垂直領(lǐng)域的大模型,都將會(huì )逐漸黯然失色。
因為說(shuō)到底,相當一部分專(zhuān)家或垂直大模型,本質(zhì)上是某些企業(yè)算力、數據不足,無(wú)法高攀“通用大模型”,而不得不退而求其次的產(chǎn)物(這在國內尤為明顯)。
倘若一個(gè)通用大模型,憑借強大的學(xué)習能力,就能夠精通大部分行業(yè),那誰(shuí)又會(huì )愿意繁瑣地在不同的模型之間切換,并為不同的模型承擔多份訓練、使用成本呢?
從這點(diǎn)上來(lái)說(shuō),專(zhuān)家模型逐漸被通用模型取代,是人類(lèi)在通往AGI道路上一個(gè)不可避免的歷史過(guò)程。
而與此相伴的另一個(gè)現象,則是更多細分的、瑣碎的工作被取代。
因為在有了更強大的通用大模型后,人們將會(huì )發(fā)現,其實(shí)很多崗位的工作內容,是可以被合并、被統合的。
產(chǎn)品經(jīng)理和數據分析師就是一個(gè)可能的例子。
例如,在一個(gè)新產(chǎn)品開(kāi)發(fā)的項目中,GPT-5可以根據給定的產(chǎn)品概念或需求,從網(wǎng)絡(luò )上搜索相關(guān)的市場(chǎng)調研、競品分析、用戶(hù)畫(huà)像等數據,并下載到自己的內存中。
之后,它會(huì )通過(guò)自己的多模態(tài)的理解和邏輯推理能力,以及知識圖譜和數據庫,來(lái)分析和理解獲取到的數據。
在得到了相應的數據,并將其進(jìn)行分類(lèi)和組織后,GPT-5就會(huì )通過(guò)語(yǔ)言理解能力,從對話(huà)系統的反饋中學(xué)習相關(guān)的營(yíng)銷(xiāo)策略、用戶(hù)反饋等信息,并將其與給定的產(chǎn)品概念或需求進(jìn)行比較和評估。
如此一來(lái),產(chǎn)品經(jīng)理和數據分析師這兩個(gè)崗位,就被高效地“合并”了。
而在通往AGI的未盡之路上,這樣被合并和取代的崗位,還有無(wú)數種。
因此,一個(gè)通用性更強的GPT-5,對人類(lèi)而言,既是生產(chǎn)力進(jìn)步的福音,但同時(shí)也是行業(yè)大地震的前奏。
到了那時(shí),許多尚不具備通用大模型能力,又缺乏行業(yè)壁壘的企業(yè),將會(huì )如沙子堆起的城堡一樣,脆弱地倒下。
而更多普通的個(gè)體,面對不斷被取代的崗位,將會(huì )更深刻地感受到時(shí)代的不確定性……
關(guān)鍵詞: