每日經濟新聞 2024-08-15 22:13:02
每經記者 文巧 每經實習記者 岳楚鵬 每經編輯 蘭素英
當地時間8月13日,OpenAI的聊天機器人賬號發文宣布,ChatGPT新上線了一個GPT-4o模型。根據該賬號的回帖,新上線的模型并不是上周發布的API端GPT-4o 0806模型,目前該模型也對免費用戶開放,不過有使用次數的限制。
視覺中國
這一消息立刻引發了網友的熱議:難道這就是傳說中的“草莓”項目?之所以網友的熱情如此之高,是因為“草莓”項目的前身是Q*算法模型,Q*能夠解決棘手的科學和數學問題。如果AI模型掌握了數學能力,將擁有更強的推理能力,甚至與人類智能相媲美。然而,在隨后的測試中,網友發現新模型與原來的版本相比,沒有太大改善,也未能通過經典的草莓單詞測試,不過在邏輯推理方面還是有所改進。
不再輕易陷入邏輯循環
新模型發布的前一周,OpenAI首席執行官阿爾特曼在X上發布了一張花園里的草莓照片,網友隨即聯想到了OpenAI團隊此前被爆出的一個名為“草莓(Strawberry)”的項目。但對于評論區的猜測,阿爾特曼本人沒有證實,也沒有否認,只是確認這張照片拍的是他現實中的花園。
而后,ChatGPT賬號發了一個草莓表情,OpenAI員工特里弗·克里奇發了餐盤上的草莓圖片,爆料人@iruletheworldmo也頻繁更新,幾乎次次都與草莓相關,這些似乎都指向一個重要時刻。
因此,當ChatGPT賬號宣布GPT-4o家族更新,網友的情緒也達到了高點,這一更新是否就是“草莓”項目?不過,隨著測試信息披露,網友發現,這一更新并沒能滿足他們的預期。而且,對于新模型的具體改進和新功能,OpenAI出奇地保持了沉默。
一系列測試顯示,新模型與之前的模型相比并沒有太大的改善。在經典的草莓單詞測試中,新模型還是出現了錯誤。大多數測試者反饋稱,他們并沒有感受到明顯的性能提升。有的網友甚至直言根本分不清楚新版本和舊版本到底有什么區別。
但本次更新并非沒有亮點。一些用戶指出,新模型在邏輯推理方面有所改進,例如它不再輕易陷入邏輯循環。另外,新模型的響應速度也比之前的版本快了不少。
AI發展的安全挑戰
對于網友評論,ChatGPT的回復是:“還有很多工作要做,我們正在努力。”至于這是不是備受關注的“草莓”項目,外界依然不得而知。
之所以網友的熱情如此高漲,是因為“草莓”項目的前身是Q*算法模型,Q*能夠解決棘手的科學和數學問題。如果AI模型掌握了數學能力,將擁有更強的推理能力,甚至與人類智能相媲美,而這是目前的大語言模型無法做到的。
盡管這一方法有可能使模型在智能上實現質的飛躍,但其伴隨的危險性也不容忽視。
據外媒此前報道,“草莓”項目的訓練涉及對經過后期訓練的模型進行最終微調。這一過程類似于斯坦福大學的自學推理機(STaR)技術。STaR技術允許AI模型通過反復創建自己的訓練數據,“引導”自己進入更高的智能水平,理論上可以讓語言模型達到超越人類的智能水平。
值得注意的是,OpenAI此前多次因安全問題受到質疑。今年7月,OpenAI的一名內部人士向美國證券交易委員會(SEC)投訴,指控公司通過非法限制性保密協議限制員工對外披露與公司技術潛在安全問題相關的信息。更早之前,OpenAI原超級對齊團隊負責人Jane Leike在離職后也指責公司忽視安全文化,只注重“閃亮的產品”而非安全。
而在8月9日,OpenAI發布了一篇關于安全性的博客文章,詳細介紹了公司在開發ChatGPT用戶的旗艦模型GPT-4o時所做的安全努力,并探討了這些技術可能對社會帶來的風險。
在談到GPT-4o的早期測試時,OpenAI透露,他們觀察到用戶與模型的互動語言開始出現微妙的變化。例如,表達共同紐帶的語言,“這是我們在一起的最后一天”,等等。這種看似無害的行為,背后可能隱藏著更大的問題。
此外,OpenAI還提到,GPT-4o有時會無意間生成模仿用戶聲音的輸出。換句話說,它可能被用來冒充他人,從而被利用進行犯罪活動。
封面圖片來源:視覺中國
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP