亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

每日經濟新聞
首頁公司

每經網首頁 > 首頁公司 > 正文

豆包App月活破7500萬,模型能力再進化,智商情商在線

2025-02-06 14:54:19

AI原生應用蓬勃發展,豆包App以其卓越的表現,成為行業焦點。

QuestMobile2024年AIGC應用發展年度報告數據顯示,截至2024年12月,豆包App月活躍用戶規模復合增長率達到21.2%,強勢突破7500萬大關,在綜合類AI原生App中以顯著優勢穩居榜首。

在綜合類原生App呈現的二八流量格局中,豆包與另外兩家頭部應用共同包攬80%流量,憑借龐大的用戶基礎和高活躍度,成為行業發展的引領者。

1月22日,豆包大模型1.5Pro版本正式發布。此次更新進一步提升了豆包大模型的性價比:32k上下文長度的Doubao-1.5-pro處理100萬token僅需8毛錢,輸出100萬token也只需2元。

然而,豆包并不是一味“卷”價格,而是真正做到在價廉物美的基礎上實現收益。報道稱,豆包大模型去年大幅降價后,毛利率依然為正。其中,字節跳動最新推出的豆包大模型1.5,在推理成本優化上取得進一步突破。在火山引擎上售賣API的Doubao-1.5-pro,毛利率仍能達到50%。

豆包App的領先,得益于其持續進化的模型能力。

豆包大模型1.5Pro綜合能力顯著增強,低訓練/推理成本和高效模型結構全面提升多模態能力和推理能力,在多項公開評測基準上全球領先。模型訓練過程中,豆包大模型1.5Pro未使用任何其他模型生成的數據,扎實不走“捷徑”。

智商、情商、聽說讀寫全面提升

豆包大模型pro 1.5在同一模型中融合并提升了視覺、語音等多模態能力,可為用戶帶來更自然、更豐富的交互體驗。

它到底有多強?先看排名。

在多項基準測試里,豆包1.5 Pro的得分達到了全球領先水平

首先,在編程和數學能力方面,豆包1.5 Pro的表現屬于行業第一梯隊。

其次,在更適合中國人使用的中文理解方面更是明顯優于海外模型。

圖片來源:豆包技術博客

此外,豆包1.5 pro還是一個多模態模型,具備視覺、語音等多模態能力,而且多模態能力處于世界一流水平。

豆包1.5 pro的視覺推理能力表現優越,在各類評測基準上均取得了優異表現。

漂亮的參數背后是否有真材實料?一一來看。

首先,先看邏輯推理能力。

先來一道經典的愛因斯坦謎題開開胃。

這一問題豆包僅使用不到7秒的時間就解出了正確答案。

Doubao-1.5-pro-AS1-Preview模型能力更是炸裂,連網絡梗知識都能給你分析得明明白白。

其次,視覺多模態性能進一步提升,從容應對更復雜場景。相比于上一版本,Doubao-1.5-pro在多模態數據合成、動態分辨率、多模態對齊、混合訓練上進行了全面的技術提升,進一步增強了模型在視覺推理、文字文檔識別、細粒度信息理解、指令遵循等方面的能力,并讓模型的回復模式變得更加精簡、友好。在同一模型中融入強大的視覺理解能力,使模型可以同時理解虛擬和現實世界的各類視覺信號,更好地輔助人類決策。輸入任意分辨率圖像,無論是高清大圖、低分辨率小圖還是極端長寬比圖像。豆包大模型都能根據需求,實現精準的特征提取和高效的計算性能,滿足提問者對圖像內容深度探索的需求。

筆者請求豆包批改圖片中的英文作文,豆包很快就給出了評分與理由,并提出了修改意見。豆包對錯誤的識別異常精準,想來以后老師們改作業就有福了。

之后我們再加大難度,讓豆包站在產品設計師的角度來評判一張椅子的產品設計圖

這回答專業感爆表,以后做設計又要少熬幾個通宵了。

豆包最新更新的語音模式更是一絕。語音多模態理解生成一體化,情商智商雙雙在線。在語音多模態上,豆包團隊提出了新的Speech2Speech的端到端框架,不僅通過原生方法將語音和文本模態進行深度融合,同時還實現了語音對話中真正意義上的語音理解生成端到端,相比傳統的ASR+LLM+TTS的級聯方式,在對話效果上有質的飛躍。這使得豆包語音模型可以理解各種人類情感,并完美的模仿出來。

 

 

除此之外,豆包連方言都能輕松解讀。

 

 

豆包1.5 pro如何打破“低價無高性能”魔咒

長期以來,AI行業迷信“大力出奇跡”,認為優秀的大模型必定耗費巨大。低價和性能不可兼得。

許多同行為了降低成本,依賴外部數據或蒸餾其他大模型。

此前就有學者指出,蒸餾技術雖能提高效率,但存在巨大缺陷,就是被訓練的模型(即“學生模型”)沒法真正超越“教師模型”,會產生一種隱性天花板效應。更深層次看,過度依賴蒸餾可能會扼殺AI領域中新穎的、具有變革性的創意。

阿爾特曼也表示:“復制已有的東西容易,但創新卻很難。”

圖片來源:X

而豆包走的是另外一條路。豆包1.5 pro的訓練過程中完全依靠自有數據,不僅保障了數據的獨立性和可靠性,還有效避免了外部模型潛在的偏差影響。

其次,豆包1.5 pro采用MoE(混合專家)架構,通過訓練-推理一體化設計,在保持強大模型性能的同時,極大地降低了推理成本。

從訓練和推理效率的角度來說,豆包1.5 pro所使用的稀疏MoE架構僅用較小參數激活,性能即可超過Llama3.1-405B等超大稠密預訓練模型。

豆包團隊通過對稀疏度Scaling Law(縮放定律)的研究,確定了性能和效率比較平衡的稀疏比例,讓小參數量激活的模型同樣能夠達到當前世界一流大模型的性能。

此前的MoE架構普遍只能達到3倍杠桿的水平,而豆包1.5pro就把標準提升到了7倍。

在完全相同的9T tokens數據對比驗證下,用激活參數僅為稠密模型參數量1/7的MoE(混合專家)模型,就超過了稠密模型的性能。不僅如此,得益于更優的預訓練數據質量和訓練超參,Doubao-MoE的性能同樣可以超越總參數遠大于它的超大規模稠密預訓練模型,比如LLaMA-3.1-405B,其訓練數據為15T tokens。

圖片來源:豆包技術博客

另外,算法團隊在預訓練模型的基礎上,設計了一系列模型參數動態調整算法,可以根據不同應用對模型性能的需求,從模型深度、寬度、MoE專家數、激活專家數、隱藏token推理等維度來選擇擴增和縮小模型參數,靈活性和適配性拉滿,最大程度達成模型能力與推理成本的最優平衡。

豆包大模型攜手火山引擎,深度賦能千行百業

當下,人工智能已成為各行業轉型升級的核心驅動力。豆包大模型憑借其卓越性能,在火山引擎的強力支撐下,正深度融入汽車、手機等諸多行業,重塑產業格局。

火山引擎作為字節跳動旗下云服務平臺,幫助企業和開發者更方便地調用豆包大模型,大幅降低了使用成本,讓企業能夠以極低的成本獲取強大的AI能力,真正實現了AI技術的普惠,為大中小企業在數字化轉型過程中減輕了經濟負擔,加速了AI技術在各領域的廣泛應用與深度融合。

據悉,豆包大模型已經與八成主流汽車品牌合作,并接入到榮耀、VIVO等多家手機品牌。此外,豆包視覺理解模型已經接入PC端產品。覆蓋終端設備約3億臺,來自智能終端的豆包大模型調用量在半年時間內增長100倍。

火山引擎持續深耕技術研發,不斷推動豆包大模型迭代升級。從豆包3D生成模型與火山引擎數字孿生平臺veOmniverse協同打造物理世界仿真模擬器;到對標GPT-4o且價格優勢顯著的通用模型pro;再到音樂模型、文生圖模型等功能的進階突破,以及即將推出的視頻生成模型1.5版和端到端實時語音模型所蘊含的巨大潛力,都彰顯了其在AI領域的創新實力與全方位布局。在為企業提供豐富多樣、高性能模型選擇的同時,火山引擎還通過升級火山方舟、扣子和HiAgent等平臺產品,助力企業高效構建自身AI能力中心,加速AI應用開發進程,全方位保障企業在智能化轉型道路上穩步前行。

隨著豆包大模型與火山引擎的深度融合與持續創新,在千行百業的滲透將更為深入,有望解鎖更多創新應用場景,創造更大商業價值與社會福祉。

文/丘山

責編 蒲禎

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

模型 豆包

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0