每日經濟新聞 2025-01-20 22:08:49
每經記者 鄭雨航 實習記者 岳楚鵬 每經編輯 蘭素英
近日,OpenAI公司CEO阿爾特曼又在X平臺上放出旗下產品的最新消息。
據他透露,最新的o3-mini推理模型預計將在幾周內正式推出。他強調,o3-mini的表現“非常出色”。除此之外,阿爾特曼在回答網友提問時表示,希望在2025年將GPT系列和o系列合并。也許,一個結合GPT系列的強大語言理解能力和o系列的快速推理能力的強大AI模型將在2025年誕生。
至于最受公眾期待的GPT-5相關問題,阿爾特曼沒有給出具體的時間表和性能指標,只是表示“仍在確定中,但我認為你們會滿意的”。
AI 專 欄 作 家 Alberto Romero在個人博客里猜測GPT-5可能早就開發好了,但OpenAI或許參考了競爭對手Anthropic的做法,將其用于模型蒸餾,以提升其他功能稍差、價格更便宜的模型的性能。他認為,GPT-5或許永遠也不會對外發布了。
專注于推理速度和效率
近日,阿爾特曼在X平臺上透露了一系列關于OpenAI新模型開發和發布的消息。
阿爾特曼在推文中感謝了外部安全研究人員對最新o3-mini模型的測試,然后稱,o3-mini的最終版本已經確定,并進入發布流程,計劃將在幾周內正式推出。同時,針對之前的反饋意見,API(應用程序編程接口)和ChatGPT版本將同步發布。阿爾特曼還特別強調,o3-mini的表現“非常棒”。
在這條推文下,阿爾特曼還回答了許多網友關心的問題。
比如,有網友問:即將推出的o3-mini和o1 pro相比,誰更強?對此,阿爾特曼表示,o3-mini在大多數方面比o1 pro要差一些,但其最大優勢在于速度極快。o3mini是一個專注于推理速度和效率的模型,適合對響應時間要求較高的應用場景。
阿爾特曼明確表示,o3-mini的消息速率“非常高”,Plus用戶屆時可以使用。據他透露,OpenAI在計劃推出更智能的o3模型,o3 pro的訂閱費為一個月200美元。
專家猜測GPT-5已完成
關于GPT系列的未來,阿爾特曼表示,“希望在2025年將GPT系列和o系列合并。”如果他的想法實現,那外界有望在今年見到一個融合GPT系列的強大語言理解能力和o系列快速推理能力的強大AI模型。
當被問及關于GPT-5的發布時間和性能表現時,阿爾特曼表示:“仍在確定中,但我認為你們會開心的。”阿爾特曼的回答耐人尋味,或許GPT-5的發布也很快將被提上日程。
此前有人猜測,GPT-5的內部開發已經完成,只是回報率不夠高,遠沒有內部使用來的好處大,比如用于模型蒸餾。
當地時間1月17日,AI專欄作家Alberto Romero在個人博客上發表了一篇關于GPT-5的深度分析文章,他通過一系列推理分析提出一個令人震驚的猜測:“OpenAI很可能已經開發出了GPT-5,但選擇將其內部保留,而不是公開發布。”并且,OpenAI或許不會很快發布GPT-5,除非還有更好的模型(GPT-6)被訓練出來。
Romero的證據來自OpenAI的最大競爭對手Anthropic。2024年10月,業界普遍預期Anthropic會發布3.5 Opus作為對GPT-4o的回應,但出人意料的是,該公司只更新了Claude 3.5 Sonnet版本。次月,彭博社報道稱,3.5Opus訓練后表現雖優于舊版,但因模型大小及成本,優勢未達預期。Anthropic之所以不推出3.5Opus,是因為成本和性能并不匹配,雖然3.5 Opus訓練未失敗,但結果不佳。
2024年12月,半導體專家Dylan Patel及其團隊稱,Anthropic實際上已經完成Claude3.5 Opus訓練且表現良好。未發布的原因是,Anthropic使用Claude 3.5 Opus來生成合成數據并進行獎勵建模,Claude 3.5Sonnet更新版本就是獎勵建模的成果。
使用功能強大、價格昂貴的模型來生成數據,從而提升功能稍差、價格更便宜的模型的性能,這一過程被稱為蒸餾。這是一種常見的做法。此前在國內引起轟動的DeepSeek-V3模型也使用了這一方法。
Dylan表示,Anthropic選擇不發布3.5 Opus,因為它在內部更有價值。這也就是開源社區如此迅速趕上GPT-4的原因,他們直接從OpenAI的礦山中獲取黃金。
Romero認為,OpenAI可能也在采用類似的方法處理GPT-5。由于最新的模型不僅性能更好,而且比上一代更小、更便宜,OpenAI可能也在通過蒸餾技術來提升其模型性能,同時控制成本。Romero稱,也許這就是OpenAI在短短3個月內從o1躍升至o3的原因。
隨著時間的推移,GPT-5 需要達到的門檻不斷提高,公眾對于GPT-5的期待也越來越高。
華爾街日報對GPT-5的報道,與彭博社對3.5 Opus的評價幾乎一致。“OpenAI意識到GPT-5比目前的產品表現更好,但還未好到足以證明維持(GPT-5)運行的巨大成本是合理的。”
Romero認為,OpenAI或許永遠也不會推出GPT-5了,“現在對他們(指的是OpenAI)來說唯一重要的目標是,繼續為下一代模型生成更好的數據。從現在開始,基礎模型可能會在后臺運行,使其他模型能夠實現它們自己無法完成的壯舉——就像一位老隱士從秘密的山洞中傳授智慧,只不過這個山洞是一個巨大的數據中心。”
封面圖片來源:視覺中國
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP