首頁公司

豆包App月活破7500萬，模型能力再進化，智商情商在線

2025-02-06 14:54:19

AI原生應用蓬勃發展，豆包App以其卓越的表現，成為行業焦點。

QuestMobile2024年AIGC應用發展年度報告數據顯示，截至2024年12月，豆包App月活躍用戶規模復合增長率達到21.2%，強勢突破7500萬大關，在綜合類AI原生App中以顯著優勢穩居榜首。

在綜合類原生App呈現的二八流量格局中，豆包與另外兩家頭部應用共同包攬80%流量，憑借龐大的用戶基礎和高活躍度，成為行業發展的引領者。

1月22日，豆包大模型1.5Pro版本正式發布。此次更新進一步提升了豆包大模型的性價比：32k上下文長度的Doubao-1.5-pro處理100萬token僅需8毛錢，輸出100萬token也只需2元。

然而，豆包并不是一味“卷”價格，而是真正做到在價廉物美的基礎上實現收益。報道稱，豆包大模型去年大幅降價后，毛利率依然為正。其中，字節跳動最新推出的豆包大模型1.5，在推理成本優化上取得進一步突破。在火山引擎上售賣API的Doubao-1.5-pro，毛利率仍能達到50%。

豆包App的領先，得益于其持續進化的模型能力。

豆包大模型1.5Pro綜合能力顯著增強，低訓練/推理成本和高效模型結構全面提升多模態能力和推理能力，在多項公開評測基準上全球領先。模型訓練過程中，豆包大模型1.5Pro未使用任何其他模型生成的數據，扎實不走“捷徑”。

智商、情商、聽說讀寫全面提升

豆包大模型pro 1.5在同一模型中融合并提升了視覺、語音等多模態能力，可為用戶帶來更自然、更豐富的交互體驗。

它到底有多強？先看排名。

在多項基準測試里，豆包1.5 Pro的得分達到了全球領先水平

首先，在編程和數學能力方面，豆包1.5 Pro的表現屬于行業第一梯隊。

其次，在更適合中國人使用的中文理解方面更是明顯優于海外模型。

圖片來源：豆包技術博客

此外，豆包1.5 pro還是一個多模態模型，具備視覺、語音等多模態能力，而且多模態能力處于世界一流水平。

豆包1.5 pro的視覺推理能力表現優越，在各類評測基準上均取得了優異表現。

漂亮的參數背后是否有真材實料？一一來看。

首先，先看邏輯推理能力。

先來一道經典的愛因斯坦謎題開開胃。

這一問題豆包僅使用不到7秒的時間就解出了正確答案。

Doubao-1.5-pro-AS1-Preview模型能力更是炸裂，連網絡梗知識都能給你分析得明明白白。

其次，視覺多模態性能進一步提升，從容應對更復雜場景。相比于上一版本，Doubao-1.5-pro在多模態數據合成、動態分辨率、多模態對齊、混合訓練上進行了全面的技術提升，進一步增強了模型在視覺推理、文字文檔識別、細粒度信息理解、指令遵循等方面的能力，并讓模型的回復模式變得更加精簡、友好。在同一模型中融入強大的視覺理解能力，使模型可以同時理解虛擬和現實世界的各類視覺信號，更好地輔助人類決策。輸入任意分辨率圖像，無論是高清大圖、低分辨率小圖還是極端長寬比圖像。豆包大模型都能根據需求，實現精準的特征提取和高效的計算性能，滿足提問者對圖像內容深度探索的需求。

筆者請求豆包批改圖片中的英文作文，豆包很快就給出了評分與理由，并提出了修改意見。豆包對錯誤的識別異常精準，想來以后老師們改作業就有福了。

之后我們再加大難度，讓豆包站在產品設計師的角度來評判一張椅子的產品設計圖

這回答專業感爆表，以后做設計又要少熬幾個通宵了。

豆包最新更新的語音模式更是一絕。語音多模態理解生成一體化，情商智商雙雙在線。在語音多模態上，豆包團隊提出了新的Speech2Speech的端到端框架，不僅通過原生方法將語音和文本模態進行深度融合，同時還實現了語音對話中真正意義上的語音理解生成端到端，相比傳統的ASR+LLM+TTS的級聯方式，在對話效果上有質的飛躍。這使得豆包語音模型可以理解各種人類情感，并完美的模仿出來。

除此之外，豆包連方言都能輕松解讀。

豆包1.5 pro如何打破“低價無高性能”魔咒

長期以來，AI行業迷信“大力出奇跡”，認為優秀的大模型必定耗費巨大。低價和性能不可兼得。

許多同行為了降低成本，依賴外部數據或蒸餾其他大模型。

此前就有學者指出，蒸餾技術雖能提高效率，但存在巨大缺陷，就是被訓練的模型（即“學生模型”）沒法真正超越“教師模型”，會產生一種隱性天花板效應。更深層次看，過度依賴蒸餾可能會扼殺AI領域中新穎的、具有變革性的創意。

阿爾特曼也表示：“復制已有的東西容易，但創新卻很難。”

圖片來源：X

而豆包走的是另外一條路。豆包1.5 pro的訓練過程中完全依靠自有數據，不僅保障了數據的獨立性和可靠性，還有效避免了外部模型潛在的偏差影響。

其次，豆包1.5 pro采用MoE（混合專家）架構，通過訓練-推理一體化設計，在保持強大模型性能的同時，極大地降低了推理成本。

從訓練和推理效率的角度來說，豆包1.5 pro所使用的稀疏MoE架構僅用較小參數激活，性能即可超過Llama3.1-405B等超大稠密預訓練模型。

豆包團隊通過對稀疏度Scaling Law（縮放定律）的研究，確定了性能和效率比較平衡的稀疏比例，讓小參數量激活的模型同樣能夠達到當前世界一流大模型的性能。

此前的MoE架構普遍只能達到3倍杠桿的水平，而豆包1.5pro就把標準提升到了7倍。

在完全相同的9T tokens數據對比驗證下，用激活參數僅為稠密模型參數量1/7的MoE（混合專家）模型，就超過了稠密模型的性能。不僅如此，得益于更優的預訓練數據質量和訓練超參，Doubao-MoE的性能同樣可以超越總參數遠大于它的超大規模稠密預訓練模型，比如LLaMA-3.1-405B，其訓練數據為15T tokens。

圖片來源：豆包技術博客

另外，算法團隊在預訓練模型的基礎上，設計了一系列模型參數動態調整算法，可以根據不同應用對模型性能的需求，從模型深度、寬度、MoE專家數、激活專家數、隱藏token推理等維度來選擇擴增和縮小模型參數，靈活性和適配性拉滿，最大程度達成模型能力與推理成本的最優平衡。

豆包大模型攜手火山引擎，深度賦能千行百業

當下，人工智能已成為各行業轉型升級的核心驅動力。豆包大模型憑借其卓越性能，在火山引擎的強力支撐下，正深度融入汽車、手機等諸多行業，重塑產業格局。

火山引擎作為字節跳動旗下云服務平臺，幫助企業和開發者更方便地調用豆包大模型，大幅降低了使用成本，讓企業能夠以極低的成本獲取強大的AI能力，真正實現了AI技術的普惠，為大中小企業在數字化轉型過程中減輕了經濟負擔，加速了AI技術在各領域的廣泛應用與深度融合。

據悉，豆包大模型已經與八成主流汽車品牌合作，并接入到榮耀、VIVO等多家手機品牌。此外，豆包視覺理解模型已經接入PC端產品。覆蓋終端設備約3億臺，來自智能終端的豆包大模型調用量在半年時間內增長100倍。

火山引擎持續深耕技術研發，不斷推動豆包大模型迭代升級。從豆包3D生成模型與火山引擎數字孿生平臺veOmniverse協同打造物理世界仿真模擬器；到對標GPT-4o且價格優勢顯著的通用模型pro；再到音樂模型、文生圖模型等功能的進階突破，以及即將推出的視頻生成模型1.5版和端到端實時語音模型所蘊含的巨大潛力，都彰顯了其在AI領域的創新實力與全方位布局。在為企業提供豐富多樣、高性能模型選擇的同時，火山引擎還通過升級火山方舟、扣子和HiAgent等平臺產品，助力企業高效構建自身AI能力中心，加速AI應用開發進程，全方位保障企業在智能化轉型道路上穩步前行。

隨著豆包大模型與火山引擎的深度融合與持續創新，在千行百業的滲透將更為深入，有望解鎖更多創新應用場景，創造更大商業價值與社會福祉。

文/丘山

責編蒲禎

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

模型豆包

上一篇文章

截至14:48，兩市100只個股漲停

返回每經網首頁

下一篇文章

滬深京三市成交額突破1.5萬億元，較上日此時放量超2300億元