AI金字塔的底層:時薪15美元的“數據標注員” 全球百事通
人工智能的應用已經相當火熱,ChatGPT看起來就像“有求必應的魔法”,但這背后實際上有著勞動密集產業的功勞。
據CNBC和Gizmodo等媒體報道,OpenaAI雇傭了大量外包勞動力協助他們完成“必要的數據標記任務”——也就是給數據打標簽,正式一點的名字叫做“數據標注員”、“數據標注師”,或者,“AI訓練師”。
所謂打標簽,就是給AI將要分析的數據樣本打上不同標記(語音/圖片/文本等),以幫助AI模型更好地識別數據集中的特定項,從而更快地相應用戶的請求。
(相關資料圖)
這是AI模型訓練最基礎的工作。
但這份工作毫無疑問是枯燥的,它包含著大量重復性的工作,操作者每天只需要辨別數據樣本的類型,然后選擇不同的標簽。
一名接受CNBC采訪的數據標注員Alexej Savreux說:
我們是工人,但沒有我們就不會有人工智能語言系統。
你可以設計所有你想要的神經網絡,你可以讓所有你想要的研究人員參與進來,但沒有標簽,你就沒有ChatGPT。你一無所有。
更關鍵的是,這樣一份工作,薪酬是每小時15美元——高于美國各個州的最低工資,但并沒有高出太多(Savreux所在的堪薩斯城,最低工資7.25美元)。
目前,國內的AI相關企業也在雇傭著這樣的崗位。
科技媒體“鞭牛士”在3月的一篇文章中指出,和AI行業的高薪相比,數據標注員的工資并不高。
“一張圖9毛錢,一天做100張?!眑ili稱,如果都合格,一天能賺90塊。
“不同的標注價格不一樣。”何文新稱,他當時的工資在3000左右?;A的數據標注員月薪大部分在2000-4000元之間,但因為標注的速度、質量問題,“很難拿到當時面試跟你承諾的工資?!?/p>
鞭牛士在一些招聘網站上搜索“數據標注”,薪資區間在2000-8000之間。一些特殊的標注,比如小語種、高精制圖等,薪酬會更高。
人工智能,重點是人工
將重復勞動外包并不是人工智能行業獨有的現象。
CNBC指出,硅谷一直都依靠著這些數以千計的低技能、低工資的外包工人的勞動來建立計算機帝國,但這些工人自始至終都處于“低人一等”的地位:
這些工作是不穩定的、按需分配的,人們通過書面合同直接受雇于一家公司或通過專門從事臨時工或外包的第三方供應商。
健康保險等福利很少或不存在——這意味著科技公司的成本降低——而且工作通常是匿名的,所有的功勞都歸于科技創業公司的高管和研究人員。
現在,人工智能行業也在遵循這一游戲規則。而隨著人工智能蓬勃發展,越來越多的數據標注員被雇傭,但越來越多這樣的基礎勞動被忽略。
非營利組織“AI伙伴關系中的AI、勞工和經濟”(AI, labor and the economy at the Partnership on AI,PAI)項目負責人Sonam Jindal說:
圍繞人工智能的許多討論都是非??上驳?。
但我們忽略了故事的一個重要部分:這仍然極大地依賴于大量的人類勞動力。
漩渦中的科技巨頭
當然,隨著數據標注員這樣的外包崗位已經被越來越多的組織看到,這也令科技巨頭們不得不面對“麻煩”。
今年早些時候,據《時代》雜志報道,OpenAI正在依靠低工資的肯尼亞外包勞工來標記包含仇恨言論或性虐待語言的文本,以便其模型能更好地自行識別“有毒(toxic)”內容。
在肯尼亞內羅畢,150多名曾為Facebook、TikTok和ChatGPT從事AI工作的人投票決定成立工會,理由是工資低和工作的精神負擔。?
另一媒體Semafor在今年1月報道稱,OpenAI在東歐和拉丁美洲等地雇傭了大約1000名遠程外包工人,為數據貼標簽或對公司軟件進行計算機工程任務培訓,那里的工資低至2美元/小時。
與此相對的另一個數據是,截至今年1月,OpenAI約有375名員工。
而該公司的一位發言人說,沒有人可以回答有關其使用人工智能外包員工的問題。
PAI在2021年的一份報告中警告稱,對所謂“數據填充工作”的需求正在激增,該組織建議該行業致力于公平的補償和其他改進的做法,并在去年發布了供公司遵循的自愿準則。
CNBC指出,谷歌的AI子公司DeepMind是迄今為止唯一公開承諾遵守這些準則的科技公司。
Jindal表示:
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。很多人已經認識到這是很重要的事情?,F在的挑戰是如何讓公司去做。
這是一個由人工智能創造的新工作,我們有可能讓這成為一份高質量的工作,讓從事這項工作的工人因其對實現這一進步的貢獻而受到尊重和重視。
關鍵詞: