每日經濟新聞 2025-02-06 14:48:48
2月6日,阿里巴巴正式宣布全球頂尖人工智能科學家許主洪教授出任阿里集團副總裁,負責AI To C業務的多模態基礎模型及Agents相關研究與應用。值得注意的是,阿里AI To C業務正在組建頂級AI算法研究和工程團隊,吸引大量業內優秀人才加盟。
每經編輯 杜宇
據上海證券報,2月6日,記者從多方確認,全球頂尖人工智能科學家許主洪教授(Steven Hoi)正式加入阿里巴巴,出任阿里集團副總裁,負責AI To C業務的多模態基礎模型及Agents相關基礎研究與應用解決方案。
另據了解,阿里AI To C業務正在組建頂級AI算法研究和工程團隊,吸引大量業內優秀人才加盟。
圖片來源:每日經濟新聞 資料圖
公開資料顯示,許主洪教授在人工智能工業界和學術界擁有超20年經驗,曾在新加坡南洋理工大學、新加坡管理大學擔任教授。他發表的300余篇人工智能頂級學術論文,引用量超過五萬次。他的多篇“多模態預訓練”主題論文影響力很大,論文引用數位列當年全球前五,其提出的預訓練策略有效降低成本,深刻影響了全球大模型研發。
作為全球多模態大模型領域的領軍人物,他曾擔任全球最大企業軟件廠商Salesforce集團副總裁、亞洲研究院創始院長,從0到1搭建了Salesforce亞洲人工智能研究體系,主導多個開創行業先河的人工智能研究項目和應用產品。2023年,許主洪創立人工智能初創公司,開發出先進的多模態大語言模型,推出了前沿的圖像和視頻生成模型及產品。
據內部人士透露,許主洪將專注于AI To C業務的多模態基礎模型及Agents相關基礎研究與應用解決方案,大幅提升阿里巴巴AI應用C端產品在模型結合應用的端對端閉環能力。有業內人士分析,2025年初,世界級頂尖科學家的加盟,可以視為阿里AI To C加碼人才與資源投入的重要信號。未來,大模型頂級人才團隊將支撐起阿里AI To C在多模態Agents等方向的深入探索,也為下一階段構建面向用戶的AI應用平臺打開了想象空間。
1月29日,阿里云通義千問旗艦版模型Qwen2.5-Max正式升級發布。
據微信公眾號“阿里云”消息,Qwen2.5-Max模型是阿里云通義團隊對MoE模型的最新成果,預訓練數據超過20萬億tokens。新模型展現出極強勁的綜合性能,在多項公開主流模型評測基準上錄得高分,全面超越了目前全球領先的開源MoE模型以及最大的開源稠密模型。目前,開發者可在Qwen Chat平臺免費體驗模型,企業和機構也可通過阿里云百煉平臺直接調用新模型API服務。
官方資料表示,由于無法訪問GPT-4o和Claude-3.5-Sonnet等閉源模型的基座模型,通義團隊將Qwen2.5-Max與目前領先的開源MoE模型DeepSeek V3、最大的開源稠密模型Llama-3.1-405B,以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比。在所有11項基準測試中,Qwen2.5-Max全部超越了對比模型。
圖片來源:微信公眾號阿里云
據中國基金報,阿里通義千問團隊表示,Qwen2.5-Max采用超大規模MoE(混合專家)架構,基于超過20萬億token的預訓練數據及精心設計的后訓練方案進行訓練。
據介紹,Qwen2.5-Max在知識、編程、全面評估綜合能力以及人類偏好對齊等主流權威基準測試上,展現出全球領先的模型性能。指令模型是所有人可直接對話體驗到的模型版本,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基準測試中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
值得注意的是,除了發布Qwen2.5-Max以外,1月28日,阿里還開源了全新的視覺理解模型Qwen2.5-VL,推出了3B、7B、72B三個尺寸版本。其中,旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍,全面超越GPT-4o與Claude3.5。
截至2月6日發稿,阿里巴巴-W(HK9988)報97.95港元,漲幅0.41%,市值1.9萬億港元。
每日經濟新聞綜合上海證券報、中國基金報、公開資料
免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。
封面圖片來源:每日經濟新聞 資料圖
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP