每日經(jīng)濟(jì)新聞 2024-03-09 16:19:03
每經(jīng)記者 文巧 每經(jīng)編輯 蘭素英
圖片來(lái)源:每經(jīng)記者 劉雪梅 攝
馬斯克起訴OpenAI事件已經(jīng)發(fā)酵了一周。3月7日,馬斯克在推特上稱,如果OpenAI把名字改為ClosedAI他就撤銷訴訟,暗諷OpenAI的不開源行為。
此前,OpenAI公布了馬斯克與包括山姆·阿爾特曼在內(nèi)的OpenAI聯(lián)合創(chuàng)始人的郵件對(duì)話,逐一駁回馬斯克的指控,并暗指其唯利是圖。
此次糾紛的焦點(diǎn)之一是馬斯克對(duì)OpenAI的開源要求。而這背后所折射出的也是AI浪潮下科學(xué)界的長(zhǎng)期爭(zhēng)論話題——到底應(yīng)該開源還是閉源?
紐約大學(xué)坦登工程學(xué)院計(jì)算機(jī)科學(xué)與工程系副教授Julian Togelius在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,開源是大勢(shì)所趨。“開源對(duì)于防止權(quán)力集中很重要。到目前為止,每個(gè)大型模型都在某種程度上是‘可越獄的’。”
馬薩諸塞大學(xué)洛厄爾分校計(jì)算機(jī)科學(xué)教授Jie Wang則對(duì)每經(jīng)記者表示,“未來(lái)各主要參與者都會(huì)將其大模型的某些部分開源,但絕對(duì)不是最重要的部分,例如用于訓(xùn)練其大語(yǔ)言模型和預(yù)訓(xùn)練模型權(quán)重的完整數(shù)據(jù)集。這或多或少類似于Meta開源LLaMA的方式。”
2月29日,馬斯克在舊金山法院對(duì)OpenAI及公司CEO阿爾特曼和總裁布羅克曼提起訴訟,震驚全球科技圈。在馬斯克的起訴書中,他斥責(zé)OpenAI違背“初心”,要求OpenAI恢復(fù)開源并給予賠償。
3月5日,OpenAI曝光了馬斯克與他們的大量往來(lái)郵件,稱馬斯克提議 OpenAI 與特斯拉合并或由他完全控制,但雙方未能就盈利性實(shí)體的條款達(dá)成一致。3月6日,馬斯克在推特上回復(fù),“如何OpenAI改名為ClosedAI,我就撤銷訴訟。”
圖片來(lái)源:每經(jīng)制圖
9年前,正是在AI上志同道合,馬斯克和阿爾特曼等人攜手創(chuàng)辦了非營(yíng)利性AI研究實(shí)驗(yàn)室“OpenAI”來(lái)對(duì)抗以谷歌為代表的科技巨頭。而如今,馬斯克與阿爾特曼及其所在的OpenAI徹底決裂,雙方舊日?qǐng)?jiān)持的“初心”成為矛盾焦點(diǎn)。
在OpenAI的官網(wǎng)主頁(yè)上寫著,“我們的使命是確保通用人工智能(AGI)造福全人類。”最初,OpenAI的確作為一個(gè)非營(yíng)利組織堅(jiān)持著這樣的路線。而自GPT-2后,OpenAI采取了閉源策略,公司出售大模型API訪問(wèn)權(quán)限,但不再發(fā)布有關(guān)其訓(xùn)練數(shù)據(jù)和模型架構(gòu)的詳細(xì)信息。
2019年,阿爾特曼還組建了一個(gè)由OpenAI非營(yíng)利組織管理的營(yíng)利性實(shí)體,以便從微軟等外部投資者那里籌集資金。對(duì)此,OpenAI在5日發(fā)文時(shí)曾解釋,這是因?yàn)?ldquo;開發(fā) AGI 所需的資源遠(yuǎn)超過(guò)最初預(yù)期”。
隨著OpenAI核心技術(shù)不再開源,且與微軟的關(guān)系越來(lái)越密切時(shí),馬斯克的不滿可想而知。馬斯克在起訴書中批評(píng)稱:“OpenAI已經(jīng)變成了全球最大技術(shù)公司微軟事實(shí)上的閉源子公司。在其新董事會(huì)的領(lǐng)導(dǎo)下,OpenAI不僅在開發(fā),而且實(shí)際上正在完善一種AGI,以最大化微軟的利潤(rùn),而不是造福人類。”
在雙方的爭(zhēng)端中,一個(gè)值得關(guān)注的點(diǎn)是,馬斯克要求OpenAI恢復(fù)開源。這折射出的也是AI浪潮下的一個(gè)爭(zhēng)議性話題——到底應(yīng)該開源還是閉源?
在開源閉源之爭(zhēng)上,馬斯克堅(jiān)定地選擇了前者。
《每日經(jīng)濟(jì)新聞》記者注意到,馬斯克旗下特斯拉的核心技術(shù)就已經(jīng)在全球范圍內(nèi)開源。根據(jù)新加坡咨詢公司GreyB的統(tǒng)計(jì),截至2023年末,全球范圍內(nèi)特斯拉共擁有專利3304項(xiàng)(不包含審批中專利),其中有2397項(xiàng)仍然有效。據(jù)媒體統(tǒng)計(jì),刨除重復(fù)的情況,特斯拉共有222項(xiàng)開放專利。從技術(shù)類別上看,特斯拉開放的專利屬于比較核心的專利。
圖片來(lái)源:GreyB網(wǎng)站
馬斯克旗下另一家公司SpaceX也曾公開猛禽發(fā)動(dòng)機(jī)圖紙。在去年12月接受外媒采訪時(shí),馬斯克曾透露,“SpaceX不使用(獨(dú)占)專利,完全開放。”
而將視角放大到整個(gè)科技界,開源還是閉源也是一直爭(zhēng)論不休的話題。2023年10月31日,“開源派”曾簽署了一份呼吁AI研發(fā)更加開放的聯(lián)名信,截至發(fā)稿,1821名專家都簽下了名字。
圖片來(lái)源:mozilla官網(wǎng)
“開源對(duì)于防止權(quán)力集中很重要,我們不希望未來(lái)只有少數(shù)財(cái)力雄厚的科技公司才能控制前沿模型。” 紐約大學(xué)坦登工程學(xué)院計(jì)算機(jī)科學(xué)與工程系副教授Julian Togelius在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示。“到目前為止,每個(gè)大型模型都在某種程度上是‘可越獄的’。(開源讓)我們了解其弱點(diǎn),才能知道如何更好地部署模型。”(注:“越獄”指的是通過(guò)提示注入技術(shù)修改模型的行為。)
馬薩諸塞大學(xué)洛厄爾分校計(jì)算機(jī)科學(xué)教授Jie Wang也對(duì)每經(jīng)記者稱,“開源代碼可以提高透明度并有助于推進(jìn)技術(shù),世界各地的相關(guān)方可以幫助識(shí)別開發(fā)團(tuán)隊(duì)未能發(fā)現(xiàn)的代碼中的潛在陷阱,并提供更正。這有助于降低代碼可能執(zhí)行有害操作的風(fēng)險(xiǎn)。”不過(guò),他也指出,開源并不是解決所有安全問(wèn)題的靈丹妙藥。
而反對(duì)開源的一派認(rèn)為,開源AI會(huì)被不良行為者操縱。去年10月20日,來(lái)自麻省理工學(xué)院和劍橋大學(xué)的科學(xué)家們發(fā)表了一篇論文,他們通過(guò)實(shí)驗(yàn)研究了持續(xù)模型權(quán)重的擴(kuò)散是否會(huì)幫助惡意者利用更強(qiáng)大的未來(lái)模型來(lái)造成大規(guī)模傷害,結(jié)果發(fā)現(xiàn),開源大模型的確可能存在風(fēng)險(xiǎn)。
Jie Wang對(duì)記者表示,“不同的態(tài)度取決于不同的身份。學(xué)術(shù)研究人員希望AI技術(shù)是開源的,以便可以評(píng)估和修改代碼。另一方面,企業(yè)家可能為了保護(hù)投資和業(yè)務(wù),而不愿意開放源代碼。”
科技巨頭與AI新貴在開源或閉源的問(wèn)題上也采取了不同的路線。前者最近在互聯(lián)網(wǎng)上免費(fèi)提供了其生成式AI的代碼,例如,目前開源大模型被Meta的Llama主導(dǎo),許多開源模型都是基于Llama而開發(fā);后者如OpenAI和Anthropic則出售專有AI模型的API訪問(wèn)權(quán)限,但不共享代碼。
OpenAI和Anthropic高管認(rèn)為,政府應(yīng)該監(jiān)管最強(qiáng)大的AI模型,這樣壞人就不能輕易利用它們。今年1月,Anthropic 公司研究人員還發(fā)表論文警告稱,AI中毒可能導(dǎo)致開源大模型變成潛伏的間諜。
但在去年9月的美國(guó)參議院人工智能洞察論壇上,Meta首席執(zhí)行官馬克·扎克伯格等人卻認(rèn)為,開源模式對(duì)美國(guó)保持競(jìng)爭(zhēng)力至關(guān)重要,科技行業(yè)可以解決對(duì)開源模式安全的擔(dān)憂。
“開源是大勢(shì)所趨,我認(rèn)為Meta正在引領(lǐng)這一趨勢(shì),其次是Mistral AI、HuggingFace等規(guī)模較小的公司。” Julian Togelius告訴《每日經(jīng)濟(jì)新聞》記者。
盡管Mistral AI最初推出了開源模型,隨著規(guī)模的擴(kuò)大,其作風(fēng)似乎越來(lái)越像OpenAI靠近,采取了閉源路線。對(duì)此,Togelius表示,“他們需要以某種方式賺錢,但目前還不清楚如何在這個(gè)領(lǐng)域最好地賺錢,但Mistral AI比 OpenAI 幾乎不開源的情況要好得多。”
而大型科技巨頭谷歌近日的動(dòng)作似乎也是對(duì)Togelius言論的驗(yàn)證。今年2月,谷歌罕見地改變了去年堅(jiān)持的大模型閉源策略,推出了“開源”大模型Gemma。有報(bào)道認(rèn)為,Gemma代表谷歌大模型策略的轉(zhuǎn)變——兼顧開源和閉源,開源主打性能最強(qiáng)大的小規(guī)模模型,希望戰(zhàn)勝M(fèi)eta和Mistral AI;閉源則主打規(guī)模大的效果最好的大模型,希望盡快追上OpenAI。
去年5月,一份谷歌的內(nèi)部文件曾在網(wǎng)上激起千層浪。文件認(rèn)為,開源大模型迅猛發(fā)展,正在侵蝕OpenAI和谷歌的陣地。除非改變閉源的立場(chǎng),否則開源替代品將最終使這兩家公司黯然失色。“雖然我們的模型在質(zhì)量方面仍略占優(yōu)勢(shì),但(閉源和開源模型)的差距正在以驚人的速度縮小。”文件寫道。
“這(指的是谷歌的新舉措)對(duì)研究和開發(fā)人員來(lái)說(shuō)的確是個(gè)好消息。”Jie Wang對(duì)每經(jīng)記者說(shuō)道。“不過(guò)我懷疑谷歌是否會(huì)將一切開源。我認(rèn)為未來(lái)各個(gè)主要參與者都會(huì)將其大模型的某些部分開源,以便研究人員和開發(fā)人員了解模型的架構(gòu)和訓(xùn)練過(guò)程,但從業(yè)務(wù)角度來(lái)看絕對(duì)不是最重要的部分,例如用于訓(xùn)練其 LLM 和預(yù)訓(xùn)練模型權(quán)重的完整數(shù)據(jù)集。這或多或少類似于Meta開源LLaMA的方式。”
而在對(duì)OpenAI的起訴書中,馬斯克還提到了對(duì)AGI(通用人工智能)的擔(dān)憂。當(dāng)被問(wèn)及若達(dá)到AGI,是否需要開源時(shí),Julian Togelius表示,“我不認(rèn)為AGI是一個(gè)定義特別明確或有用的概念。如果你 5 年前向某人展示 Claude 3 或 GPT-4,他們可能會(huì)認(rèn)為我們已經(jīng)實(shí)現(xiàn)了 AGI。盡管如此,還有很多事情是大模型無(wú)法做到的。”
Togelius認(rèn)為,OpenAI可能最終不會(huì)選擇開源,“因?yàn)檫@將決定性地改變我們對(duì)風(fēng)險(xiǎn)計(jì)算的看法,并最終消除人們認(rèn)為OpenAI具有某種秘密武器的傾向(事實(shí)并非如此,Google 和 Anthropic 都擁有相似強(qiáng)度的模型)。”
Jie Wang也向記者表示,“除非有一個(gè)可執(zhí)行的國(guó)際法要求所有AI技術(shù)必須開源,而如何強(qiáng)制執(zhí)行是另一個(gè)具有挑戰(zhàn)性的問(wèn)題,我對(duì)OpenAI 是否會(huì)開源一切持懷疑態(tài)度。”
封面圖片來(lái)源:每經(jīng)記者 劉雪梅 攝
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP