要聞

馬斯克、OpenAI決裂背后，大模型應(yīng)該開源還是閉源？

每日經(jīng)濟(jì)新聞 2024-03-09 16:19:03

每經(jīng)記者文巧每經(jīng)編輯蘭素英

圖片來(lái)源：每經(jīng)記者劉雪梅攝

馬斯克起訴OpenAI事件已經(jīng)發(fā)酵了一周。3月7日，馬斯克在推特上稱，如果OpenAI把名字改為ClosedAI他就撤銷訴訟，暗諷OpenAI的不開源行為。

此前，OpenAI公布了馬斯克與包括山姆·阿爾特曼在內(nèi)的OpenAI聯(lián)合創(chuàng)始人的郵件對(duì)話，逐一駁回馬斯克的指控，并暗指其唯利是圖。

此次糾紛的焦點(diǎn)之一是馬斯克對(duì)OpenAI的開源要求。而這背后所折射出的也是AI浪潮下科學(xué)界的長(zhǎng)期爭(zhēng)論話題——到底應(yīng)該開源還是閉源？

紐約大學(xué)坦登工程學(xué)院計(jì)算機(jī)科學(xué)與工程系副教授Julian Togelius在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示，開源是大勢(shì)所趨。“開源對(duì)于防止權(quán)力集中很重要。到目前為止，每個(gè)大型模型都在某種程度上是‘可越獄的’。”

馬薩諸塞大學(xué)洛厄爾分校計(jì)算機(jī)科學(xué)教授Jie Wang則對(duì)每經(jīng)記者表示，“未來(lái)各主要參與者都會(huì)將其大模型的某些部分開源，但絕對(duì)不是最重要的部分，例如用于訓(xùn)練其大語(yǔ)言模型和預(yù)訓(xùn)練模型權(quán)重的完整數(shù)據(jù)集。這或多或少類似于Meta開源LLaMA的方式。”

AI巨頭的決裂

2月29日，馬斯克在舊金山法院對(duì)OpenAI及公司CEO阿爾特曼和總裁布羅克曼提起訴訟，震驚全球科技圈。在馬斯克的起訴書中，他斥責(zé)OpenAI違背“初心”，要求OpenAI恢復(fù)開源并給予賠償。

3月5日，OpenAI曝光了馬斯克與他們的大量往來(lái)郵件，稱馬斯克提議 OpenAI 與特斯拉合并或由他完全控制，但雙方未能就盈利性實(shí)體的條款達(dá)成一致。3月6日，馬斯克在推特上回復(fù)，“如何OpenAI改名為ClosedAI，我就撤銷訴訟。”

圖片來(lái)源：每經(jīng)制圖

9年前，正是在AI上志同道合，馬斯克和阿爾特曼等人攜手創(chuàng)辦了非營(yíng)利性AI研究實(shí)驗(yàn)室“OpenAI”來(lái)對(duì)抗以谷歌為代表的科技巨頭。而如今，馬斯克與阿爾特曼及其所在的OpenAI徹底決裂，雙方舊日?qǐng)?jiān)持的“初心”成為矛盾焦點(diǎn)。

在OpenAI的官網(wǎng)主頁(yè)上寫著，“我們的使命是確保通用人工智能（AGI）造福全人類。”最初，OpenAI的確作為一個(gè)非營(yíng)利組織堅(jiān)持著這樣的路線。而自GPT-2后，OpenAI采取了閉源策略，公司出售大模型API訪問(wèn)權(quán)限，但不再發(fā)布有關(guān)其訓(xùn)練數(shù)據(jù)和模型架構(gòu)的詳細(xì)信息。

2019年，阿爾特曼還組建了一個(gè)由OpenAI非營(yíng)利組織管理的營(yíng)利性實(shí)體，以便從微軟等外部投資者那里籌集資金。對(duì)此，OpenAI在5日發(fā)文時(shí)曾解釋，這是因?yàn)?ldquo;開發(fā) AGI 所需的資源遠(yuǎn)超過(guò)最初預(yù)期”。

隨著OpenAI核心技術(shù)不再開源，且與微軟的關(guān)系越來(lái)越密切時(shí)，馬斯克的不滿可想而知。馬斯克在起訴書中批評(píng)稱：“OpenAI已經(jīng)變成了全球最大技術(shù)公司微軟事實(shí)上的閉源子公司。在其新董事會(huì)的領(lǐng)導(dǎo)下，OpenAI不僅在開發(fā)，而且實(shí)際上正在完善一種AGI，以最大化微軟的利潤(rùn)，而不是造福人類。”

背后是開源閉源路線之爭(zhēng)

在雙方的爭(zhēng)端中，一個(gè)值得關(guān)注的點(diǎn)是，馬斯克要求OpenAI恢復(fù)開源。這折射出的也是AI浪潮下的一個(gè)爭(zhēng)議性話題——到底應(yīng)該開源還是閉源？

在開源閉源之爭(zhēng)上，馬斯克堅(jiān)定地選擇了前者。

《每日經(jīng)濟(jì)新聞》記者注意到，馬斯克旗下特斯拉的核心技術(shù)就已經(jīng)在全球范圍內(nèi)開源。根據(jù)新加坡咨詢公司GreyB的統(tǒng)計(jì)，截至2023年末，全球范圍內(nèi)特斯拉共擁有專利3304項(xiàng)（不包含審批中專利），其中有2397項(xiàng)仍然有效。據(jù)媒體統(tǒng)計(jì)，刨除重復(fù)的情況，特斯拉共有222項(xiàng)開放專利。從技術(shù)類別上看，特斯拉開放的專利屬于比較核心的專利。

圖片來(lái)源：GreyB網(wǎng)站

馬斯克旗下另一家公司SpaceX也曾公開猛禽發(fā)動(dòng)機(jī)圖紙。在去年12月接受外媒采訪時(shí)，馬斯克曾透露，“SpaceX不使用（獨(dú)占）專利，完全開放。”

而將視角放大到整個(gè)科技界，開源還是閉源也是一直爭(zhēng)論不休的話題。2023年10月31日，“開源派”曾簽署了一份呼吁AI研發(fā)更加開放的聯(lián)名信，截至發(fā)稿，1821名專家都簽下了名字。

圖片來(lái)源：mozilla官網(wǎng)

“開源對(duì)于防止權(quán)力集中很重要，我們不希望未來(lái)只有少數(shù)財(cái)力雄厚的科技公司才能控制前沿模型。” 紐約大學(xué)坦登工程學(xué)院計(jì)算機(jī)科學(xué)與工程系副教授Julian Togelius在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示。“到目前為止，每個(gè)大型模型都在某種程度上是‘可越獄的’。（開源讓）我們了解其弱點(diǎn)，才能知道如何更好地部署模型。”（注：“越獄”指的是通過(guò)提示注入技術(shù)修改模型的行為。）

馬薩諸塞大學(xué)洛厄爾分校計(jì)算機(jī)科學(xué)教授Jie Wang也對(duì)每經(jīng)記者稱，“開源代碼可以提高透明度并有助于推進(jìn)技術(shù)，世界各地的相關(guān)方可以幫助識(shí)別開發(fā)團(tuán)隊(duì)未能發(fā)現(xiàn)的代碼中的潛在陷阱，并提供更正。這有助于降低代碼可能執(zhí)行有害操作的風(fēng)險(xiǎn)。”不過(guò)，他也指出，開源并不是解決所有安全問(wèn)題的靈丹妙藥。

而反對(duì)開源的一派認(rèn)為，開源AI會(huì)被不良行為者操縱。去年10月20日，來(lái)自麻省理工學(xué)院和劍橋大學(xué)的科學(xué)家們發(fā)表了一篇論文，他們通過(guò)實(shí)驗(yàn)研究了持續(xù)模型權(quán)重的擴(kuò)散是否會(huì)幫助惡意者利用更強(qiáng)大的未來(lái)模型來(lái)造成大規(guī)模傷害，結(jié)果發(fā)現(xiàn)，開源大模型的確可能存在風(fēng)險(xiǎn)。

Jie Wang對(duì)記者表示，“不同的態(tài)度取決于不同的身份。學(xué)術(shù)研究人員希望AI技術(shù)是開源的，以便可以評(píng)估和修改代碼。另一方面，企業(yè)家可能為了保護(hù)投資和業(yè)務(wù)，而不愿意開放源代碼。”

科技巨頭與AI新貴在開源或閉源的問(wèn)題上也采取了不同的路線。前者最近在互聯(lián)網(wǎng)上免費(fèi)提供了其生成式AI的代碼，例如，目前開源大模型被Meta的Llama主導(dǎo)，許多開源模型都是基于Llama而開發(fā)；后者如OpenAI和Anthropic則出售專有AI模型的API訪問(wèn)權(quán)限，但不共享代碼。

OpenAI和Anthropic高管認(rèn)為，政府應(yīng)該監(jiān)管最強(qiáng)大的AI模型，這樣壞人就不能輕易利用它們。今年1月，Anthropic 公司研究人員還發(fā)表論文警告稱，AI中毒可能導(dǎo)致開源大模型變成潛伏的間諜。

圖片來(lái)源:arxiv.org

但在去年9月的美國(guó)參議院人工智能洞察論壇上，Meta首席執(zhí)行官馬克·扎克伯格等人卻認(rèn)為，開源模式對(duì)美國(guó)保持競(jìng)爭(zhēng)力至關(guān)重要，科技行業(yè)可以解決對(duì)開源模式安全的擔(dān)憂。

若實(shí)現(xiàn)AGI，是否需要開源?

“開源是大勢(shì)所趨，我認(rèn)為Meta正在引領(lǐng)這一趨勢(shì)，其次是Mistral AI、HuggingFace等規(guī)模較小的公司。” Julian Togelius告訴《每日經(jīng)濟(jì)新聞》記者。

盡管Mistral AI最初推出了開源模型，隨著規(guī)模的擴(kuò)大，其作風(fēng)似乎越來(lái)越像OpenAI靠近，采取了閉源路線。對(duì)此，Togelius表示，“他們需要以某種方式賺錢，但目前還不清楚如何在這個(gè)領(lǐng)域最好地賺錢，但Mistral AI比 OpenAI 幾乎不開源的情況要好得多。”

而大型科技巨頭谷歌近日的動(dòng)作似乎也是對(duì)Togelius言論的驗(yàn)證。今年2月，谷歌罕見地改變了去年堅(jiān)持的大模型閉源策略，推出了“開源”大模型Gemma。有報(bào)道認(rèn)為，Gemma代表谷歌大模型策略的轉(zhuǎn)變——兼顧開源和閉源，開源主打性能最強(qiáng)大的小規(guī)模模型，希望戰(zhàn)勝M(fèi)eta和Mistral AI；閉源則主打規(guī)模大的效果最好的大模型，希望盡快追上OpenAI。

去年5月，一份谷歌的內(nèi)部文件曾在網(wǎng)上激起千層浪。文件認(rèn)為，開源大模型迅猛發(fā)展，正在侵蝕OpenAI和谷歌的陣地。除非改變閉源的立場(chǎng)，否則開源替代品將最終使這兩家公司黯然失色。“雖然我們的模型在質(zhì)量方面仍略占優(yōu)勢(shì)，但（閉源和開源模型）的差距正在以驚人的速度縮小。”文件寫道。

“這（指的是谷歌的新舉措）對(duì)研究和開發(fā)人員來(lái)說(shuō)的確是個(gè)好消息。”Jie Wang對(duì)每經(jīng)記者說(shuō)道。“不過(guò)我懷疑谷歌是否會(huì)將一切開源。我認(rèn)為未來(lái)各個(gè)主要參與者都會(huì)將其大模型的某些部分開源，以便研究人員和開發(fā)人員了解模型的架構(gòu)和訓(xùn)練過(guò)程，但從業(yè)務(wù)角度來(lái)看絕對(duì)不是最重要的部分，例如用于訓(xùn)練其 LLM 和預(yù)訓(xùn)練模型權(quán)重的完整數(shù)據(jù)集。這或多或少類似于Meta開源LLaMA的方式。”

而在對(duì)OpenAI的起訴書中，馬斯克還提到了對(duì)AGI（通用人工智能）的擔(dān)憂。當(dāng)被問(wèn)及若達(dá)到AGI，是否需要開源時(shí)，Julian Togelius表示，“我不認(rèn)為AGI是一個(gè)定義特別明確或有用的概念。如果你 5 年前向某人展示 Claude 3 或 GPT-4，他們可能會(huì)認(rèn)為我們已經(jīng)實(shí)現(xiàn)了 AGI。盡管如此，還有很多事情是大模型無(wú)法做到的。”

Togelius認(rèn)為，OpenAI可能最終不會(huì)選擇開源，“因?yàn)檫@將決定性地改變我們對(duì)風(fēng)險(xiǎn)計(jì)算的看法，并最終消除人們認(rèn)為OpenAI具有某種秘密武器的傾向（事實(shí)并非如此，Google 和 Anthropic 都擁有相似強(qiáng)度的模型）。”

Jie Wang也向記者表示，“除非有一個(gè)可執(zhí)行的國(guó)際法要求所有AI技術(shù)必須開源，而如何強(qiáng)制執(zhí)行是另一個(gè)具有挑戰(zhàn)性的問(wèn)題，我對(duì)OpenAI 是否會(huì)開源一切持懷疑態(tài)度。”

封面圖片來(lái)源：每經(jīng)記者劉雪梅攝

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。