亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

OpenAI王炸新一波:向開發者開放滿血o1,測試中全面超越人類博士專家 ,準確率達到78.3%

每日經濟新聞 2024-12-18 06:49:12

在人工智能的浪潮中,OpenAI再次掀起波瀾,宣布向開發者開放其最新的推理模型o1,標志著AI技術的又一重大飛躍。這款全面超越人類博士專家的模型,在多個基準測試中展現出78.3%的驚人準確率,相較于人類專家的69.7%得分,o1無疑站在了智能推理的前沿。此外,英偉達推出了一款生成式AI超級計算機,僅售249美元。

每經編輯 杜宇

在人工智能領域,英偉達再次引領技術革新,于當地時間12月17日推出了Jetson Orin Nano Super,一款手掌大小的生成式AI超級計算機。這款僅售249美元的開發者套件,以其卓越的性能和親民的價格,為商業AI開發者、愛好者和學生提供了一個強大的工具。英偉達CEO黃仁勛強調,Jetson Orin Nano Super的性能提升了70%,每秒可執行高達67萬億次的INT8運算。

同時,OpenAI也不甘示弱,推出了最強推理模型o1,其在多個基準測試中超越人類專家,預示著通用人工智能(AGI)的進一步發展。

圖片來源:視覺中國

OpenAI王炸新一波:向開發者開放滿血o1,全面超越人類博士專家

在為期12個工作日的線上新品和新技術發布活動中,OpenAI的王炸又來了一波:將OpenAI的最強推理模型o1向開發者開放,用于開發語音類App的API中納入了收費更低的先進模型GPT-4o版本。

今年9月,OpenAI 發布了o1的預覽版o1 preview,稱o1是第一個具備真正通用推理能力的大模型,它的核心能力推理在測試化學、物理和生物學專業知識的基準GPQA-diamond上得到了充分體現。

據OpenAI的評估,o1在該測試中全面超過了人類博士專家,準確率達到78.3%,而人類專家的得分為69.7%。OpenAI稱,“通用人工智能(AGI)之路,已經沒有任何阻礙”。此外,o1在多個高難度的推理基準測試中表現優異,例如在美國數學邀請賽(AIME)中,o1的正確率達到了83.3%,遠超其前身GPT-4o的表現。

12月5日,OpenAI在預告的連續12日王炸發布活動首日就推出了正式版的o1,所謂滿血o1,它被納入ChatGPT Plus套餐。正式版o1支持多模態輸入,具備視覺推理能力。相比o1 preview版本,正式版o1的平均響應速度快了60%,OpenAI還發現正式版o1在推理時犯重大錯誤的頻率比o1 preview減少34%。

在包括編碼、數學和視覺推理任務在內的一系列基準測試中,正式版o1都相比預覽版取得了明顯進步。例如在SWE-bench Verified基準的編碼測試中,o1的評分從o1 preview的41.3提高到48.9,而以數學為重點的AIME測試中的評分甚至從42躍升至79.2。

O1的新功能為開發者提供更多幫助。比如結構性輸出Structured Outputs功能讓響應可靠地匹配自定義格式,如JSON模式,從而確保與外部系統交互時的一致性;函數調用Function calling功能簡化了將o1連接到API和數據庫的過程;對視覺輸入進行推理的能力Vison capabilities發掘了制造、科學和編碼方面用例的前景。

開發人員還可以使用新的reasoning_effort參數微調o1的行為,該參數控制模型在任務上花費的時間,以此平衡性能和響應時間。

同時,o1的延遲更低,對于給定的請求,o1使用的推理token比o1-preview平均少60%。

本周二OpenAI還更新了支持語音助手、實時翻譯工具等低延遲自然對話體驗的Realtime API。OpenAI同時降低Realtime API的收費,將GPT-4o音頻的定價降低了60%,降至每100萬個輸入token收費40美元,每100萬個輸出token收費80美元。GPT-4o mini的文本token費率也大幅下調,輸入token起步價0.60美元,輸出token起步價2.40美元。

英偉達推出僅249美元的AI超級電腦 生成式AI性能提高達1.7倍

另外值得注意的是,英偉達當地時間12月17日推出了一款名為Jetson Orin Nano Super的生成式AI超級計算機。英偉達CEO黃仁勛表示,這款開發者套件通過軟件升級實現了更高性能和更低價格,僅售249美元,尺寸小巧,可放在手掌中,可將生成式AI性能提高高達1.7倍。

該公司表示,這款產品適合商業AI開發者、愛好者和學生,與其前代產品相比,其生成式AI推理性能提升了1.7倍,性能提高了70%,每秒可以執行高達67萬億次的INT8運算(67 INT8 TOPS),內存帶寬也提升了50%,達到了102GB/s。

黃仁勛還特意為這款產品錄制了一段視頻,如同2021年發布Hopper H100時一樣,展現英偉達對這款產品的重視。在視頻中,黃仁勛表示,從Xavier開始,英偉達就創造了一種新的處理器,也就是機器人處理器,當時沒人知道他們在做什么。

黃仁勛表示,Jetson Orin Nano Super非常適合那些希望在生成式AI、機器人技術或計算機視覺領域發展技能的人士。在AI領域從任務專用模型向基礎模型轉變的趨勢下,它也為開發者提供了一個將創意變為現實的易用平臺。

Jetson Orin Nano Super性能增強,為所有流行的生成式AI模型,例如Meta的LLaMA、阿里巴巴的通義千問以及谷歌的Gemma。這款套件基于Transformer的計算機視覺模型帶來了顯著提升,進一步提升效能表現。

英偉達強調,隨著AI技術逐漸從云端走向終端,實體AI將是下一波發展重點,Jetson Orin Nano Super不僅可以用于開發聊天機器人,也適合簡歷視覺AI代理或部署AI機器人等應用。

英偉達也宣布將為Jetson Orin NX和Nano系列的系統模塊提供軟件更新,讓它們也能享受到Super模式的性能提升,最高可達70%。這些更新將通過Jetpack SDK管理器發布在英偉達網站和GitHub上。

每日經濟新聞綜合公開資料

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

Ai OpenAI

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0