每日經(jīng)濟(jì)新聞 2023-02-12 21:51:18
每經(jīng)記者 蔡鼎 每經(jīng)編輯 段煉 高涵
于2022年11月發(fā)布,ChatGPT被譽(yù)為當(dāng)年最具創(chuàng)新性的人工智能工具之一。這項(xiàng)強(qiáng)大的AI聊天機(jī)器人幾乎可以生成任何問(wèn)題的文本,從莎士比亞的十四行詩(shī),到用5歲孩子都能理解語(yǔ)言描述的復(fù)雜數(shù)學(xué)問(wèn)題,可謂“無(wú)所不能”。
瑞銀此前發(fā)布的一份研究報(bào)告顯示,ChatGPT的月活躍用戶在今年1月份預(yù)計(jì)達(dá)到了1億,這距離其推出只有2個(gè)月時(shí)間,成為史上增長(zhǎng)最快的消費(fèi)者應(yīng)用。
然而,在ChatGPT掀起的這場(chǎng)人工智能“革命”和資本市場(chǎng)狂歡的背后,有一個(gè)被邊緣化的、被遺忘的卻又至關(guān)重要的群體,值得所有人關(guān)注,他們就是數(shù)據(jù)標(biāo)注員。
據(jù)美國(guó)《時(shí)代周刊》上月中旬的報(bào)道,為了訓(xùn)練ChatGPT,OpenAI雇傭了時(shí)薪不到2美元的肯尼亞外包勞工,他們所負(fù)責(zé)的工作就是對(duì)龐大的數(shù)據(jù)庫(kù)手動(dòng)進(jìn)行數(shù)據(jù)標(biāo)注。
時(shí)薪1.32~2美元
每小時(shí)或標(biāo)注超2萬(wàn)個(gè)單詞
從當(dāng)下看來(lái),OpenAI已經(jīng)成為“生成式人工智能”行業(yè)無(wú)可爭(zhēng)議的領(lǐng)頭羊。
最樂(lè)觀的投資者認(rèn)為,計(jì)算機(jī)生成的文本、圖像、視頻和音頻將改變無(wú)數(shù)行業(yè)的經(jīng)營(yíng)方式,從創(chuàng)意藝術(shù)到法律,再到計(jì)算機(jī)編程,該技術(shù)都將提高人類的工作效率。
然而,數(shù)據(jù)標(biāo)簽員工的工作條件揭示了行業(yè)背后“黑暗”的部分:盡管人工智能魅力無(wú)限,但它往往依賴于全球最廉價(jià)的勞動(dòng)力,他們往往被大幅剝削。盡管他們?yōu)閿?shù)十億美元的產(chǎn)業(yè)作出了杰出貢獻(xiàn),但這些幾乎“隱形”的工人仍然處于最邊緣的地帶。
《時(shí)代周刊》查閱的文件顯示,OpenAI在2021年底與Sama簽署了三份總價(jià)值約20萬(wàn)美元的合同,為數(shù)據(jù)庫(kù)中有害的內(nèi)容進(jìn)行標(biāo)記。
Sama是一家總部位于美國(guó)舊金山的公司,該公司雇傭了肯尼亞、烏干達(dá)和印度的外包員工。
大約30多名工作人員被分成三個(gè)小組,每個(gè)小組都專注于一個(gè)主題。三名員工對(duì)《時(shí)代周刊》表示,他們每9個(gè)小時(shí)要閱讀和標(biāo)注150~200段文字。這些段落的范圍從100個(gè)單詞到1000多個(gè)單詞不等。如此計(jì)算,平均每小時(shí)他們最多要閱讀和標(biāo)注超2萬(wàn)個(gè)單詞。
接受《時(shí)代周刊》采訪的四名員工都表示,這份工作給他們留下了持久的心理創(chuàng)傷。盡管他們有權(quán)參加健康咨詢師課程,但四人都表示,由于對(duì)工作效率的要求很高,他們只能選擇參加小組會(huì)議。其中還有一人表示,他們要求以一對(duì)一的方式與心理咨詢師會(huì)面的請(qǐng)求被Sama管理層多次拒絕。
Sama官網(wǎng)截圖
合同規(guī)定,OpenAI將為該項(xiàng)目向Sama支付每小時(shí)12.50美元的報(bào)酬,這是該項(xiàng)目員工時(shí)薪的6~9倍。
《時(shí)代周刊》稱,其查閱了數(shù)百頁(yè)Sama和OpenAI的內(nèi)部文件(包括工人工資單),并采訪了Sama四名參與該項(xiàng)目的員工,驚人的內(nèi)幕顯示,Sama為OpenAI雇傭的數(shù)據(jù)標(biāo)簽員工支付的時(shí)薪在1.32美元~2美元之間(約8.99元~13.62元),具體取決于資歷和表現(xiàn)。
據(jù)Sama員工透露,“代理商”是三個(gè)小組中最初級(jí)的數(shù)據(jù)標(biāo)簽人員,他們的基本工資為每月2.1萬(wàn)肯尼亞先令(約170美元或者約1158元)。此外,他們每月還能獲得約70美元(約477元)的獎(jiǎng)金,如果達(dá)到準(zhǔn)確性和速度等關(guān)鍵績(jī)效指標(biāo),他們還可以獲得傭金。
按此計(jì)算,一名每天工作9小時(shí)的員工預(yù)計(jì)稅后時(shí)薪至少能拿1.32美元,如果超額完成所有目標(biāo),則最高可達(dá)到1.44美元。質(zhì)量分析師是資歷更深的數(shù)據(jù)標(biāo)簽員工,他們的工作是檢查“代理商”的工作,如果他們達(dá)到了所有績(jī)效目標(biāo),時(shí)薪可以拿到2美元。
公開(kāi)資料顯示,肯尼亞并沒(méi)有統(tǒng)一的最低工資標(biāo)準(zhǔn),但當(dāng)這些外包員工受雇時(shí),肯尼亞首都內(nèi)羅畢的最低時(shí)薪是1.52美元。
據(jù)《時(shí)代周刊》報(bào)道,Sama的一名發(fā)言人在一份聲明中稱,公司對(duì)工人的要求是在9小時(shí)的工作中標(biāo)注70段文字,而非200段。此外,工人們的稅后時(shí)薪是1.46美元~3.74美元,不過(guò)這位發(fā)言人拒絕透露哪類崗位會(huì)達(dá)到其所述時(shí)薪區(qū)間的上限。
OpenAI的一位發(fā)言人則在另一份聲明中稱,該公司沒(méi)有發(fā)布任何的業(yè)績(jī)目標(biāo),且外包員工的工資和心理健康由Sama的管理層負(fù)責(zé)。
2022年2月,Sama開(kāi)始為OpenAI的另一個(gè)項(xiàng)目進(jìn)行試點(diǎn)工作,但工作內(nèi)容根據(jù)美國(guó)的法律是非法的。盡管這項(xiàng)試點(diǎn)工作似乎與ChatGPT無(wú)關(guān),但僅僅在幾周之內(nèi),Sama便叫停了與OpenAI的所有項(xiàng)目,比合同中約定的時(shí)間提前了8個(gè)月。
Sama當(dāng)時(shí)在一份聲明中稱,其為OpenAI收集的圖像協(xié)議中不包括任何涉及非法的內(nèi)容,直到相關(guān)工作開(kāi)始后,OpenAI才發(fā)來(lái)“附加指示”,提到了“一些非法的類別”,隨后肯尼亞團(tuán)隊(duì)的高管立即提出了擔(dān)憂并結(jié)束了該項(xiàng)目。
Sama曾向多家硅谷大廠提供類似服務(wù)
自稱是“有道德的人工智能公司”
訓(xùn)練ChatGPT對(duì)OpenAI來(lái)說(shuō)至關(guān)重要。
ChatGPT的前身GPT-3已經(jīng)展示了非常強(qiáng)大的語(yǔ)句串聯(lián)的能力。然而,當(dāng)時(shí)的GPT-3卻存在很多弊端,例如內(nèi)容容易出現(xiàn)暴力、性別歧視等言論。之所以會(huì)出現(xiàn)這樣的不足之處,是因?yàn)锳I工具從互聯(lián)網(wǎng)抓取了數(shù)千億個(gè)單詞來(lái)訓(xùn)練,這也是一把雙刃劍——由于互聯(lián)網(wǎng)的詞匯有不少帶有偏見(jiàn)及負(fù)面的詞匯,因此單純憑借學(xué)習(xí)能力無(wú)法來(lái)清除這些訓(xùn)練數(shù)據(jù)。
《時(shí)代周刊》的報(bào)道顯示,即使是一個(gè)由數(shù)百人組成的團(tuán)體,也需要幾十年的時(shí)間才能手動(dòng)搜索龐大的數(shù)據(jù)庫(kù)。OpenAI只能通過(guò)建立一個(gè)額外的、AI驅(qū)動(dòng)的安全機(jī)制,才能控制上述弊端,創(chuàng)造出適合人們?nèi)粘J褂玫牧奶鞕C(jī)器人。
《時(shí)代周刊》報(bào)道截圖
據(jù)報(bào)道,為了建立這個(gè)安全系統(tǒng),OpenAI借鑒了Facebook(現(xiàn)Meta)等社交媒體公司的做法。此前,F(xiàn)acebook已經(jīng)證明其可以構(gòu)建能夠檢測(cè)仇恨言論等的AI工具,并將這些內(nèi)容從其平臺(tái)上移除。這項(xiàng)工作也很簡(jiǎn)單:給AI提供標(biāo)有暴力、仇恨語(yǔ)言等標(biāo)簽,AI工具就可以學(xué)會(huì)檢測(cè)這些內(nèi)容。目前類似的工具已經(jīng)內(nèi)置到ChatGPT當(dāng)中,以檢測(cè)它是否與訓(xùn)練數(shù)據(jù)的內(nèi)容相呼應(yīng),并在它觸及到用戶之前將不良內(nèi)容過(guò)濾掉。
《時(shí)代周刊》報(bào)道稱,為了獲得這些有害內(nèi)容的標(biāo)簽,OpenAI從2021年11月開(kāi)始便向一家外包公司發(fā)送了數(shù)萬(wàn)條文本片段。其中大部分文字似乎都是從互聯(lián)網(wǎng)“最黑暗的角落”挖掘出來(lái)的。
據(jù)報(bào)道,OpenAI發(fā)言人曾在一份聲明中證實(shí),Sama在肯尼亞的員工為該公司正在開(kāi)發(fā)的監(jiān)測(cè)有害內(nèi)容的工具作出了貢獻(xiàn),該工具最終被內(nèi)置到ChatGPT中。
除了OpenAI,Sama還為谷歌、Mate和微軟等硅谷科技巨頭標(biāo)注數(shù)據(jù)。此外,Sama還標(biāo)榜其是一家“有道德的人工智能公司”,并稱其已經(jīng)幫助5萬(wàn)多人脫貧。
人工智能組織聯(lián)盟Partnership on AI表示,“盡管這些豐富數(shù)據(jù)的專業(yè)人士發(fā)揮了基礎(chǔ)作用,但越來(lái)越多的研究表明,這些工人都面臨著不穩(wěn)定的工作條件。這可能是慶祝技術(shù)效率提升的同時(shí),試圖掩蓋人工智能對(duì)龐大勞動(dòng)力依賴的結(jié)果?!?/span>
記者|蔡鼎
編輯|段煉?高涵?杜波
校對(duì)|盧祥勇
|每日經(jīng)濟(jì)新聞 ?nbdnews??原創(chuàng)文章|
未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP