智東西(公眾號(hào):zhidxcom)
作者 | 程茜
編輯 | 李水青

智東西10月16日?qǐng)?bào)道,今天,在FORCE LINK AI創(chuàng)新巡展·武漢站上,火山引擎升級(jí)了豆包大模型1.6,原生支持4種思考長(zhǎng)度,并發(fā)布豆包大模型1.6 lite、豆包語(yǔ)音合成模型2.0、豆包聲音復(fù)刻模型2.0三款模型。

為了平衡企業(yè)在不同場(chǎng)景下對(duì)模型效果、時(shí)延、成本的不同需求,豆包大模型1.6支持Minimal、Low、Medium、High四種思考長(zhǎng)度,火山引擎總裁譚待稱(chēng),這是國(guó)內(nèi)首個(gè)原生支持“分檔調(diào)節(jié)思考長(zhǎng)度”的模型。

此外,為了幫助企業(yè)平衡模型效果與成本,火山引擎還發(fā)布“智能模型路由”方案,支持豆包大模型、DeepSeek、Qwen、Kimi等多種主流模型的智能選擇調(diào)用。

豆包團(tuán)隊(duì)透露,以DeepSeek為例,經(jīng)過(guò)實(shí)測(cè),在效果優(yōu)先模式下,智能路由后,模型效果相比直接使用DeepSeek-V3.1提升14%;在成本優(yōu)先模式下,在實(shí)現(xiàn)DeepSeek-V3.1相似效果的條件下,模型的綜合成本最高下降超過(guò)70%。

火山引擎總裁譚待透露,去年5月發(fā)布至今,豆包大模型的每日Token調(diào)用量達(dá)到1200億,今年5月,達(dá)到1.6萬(wàn)億,9月達(dá)到30萬(wàn)億每天,實(shí)現(xiàn)了253倍的增長(zhǎng)。在企業(yè)市場(chǎng),根據(jù)IDC的報(bào)告,今年上半年火山引擎在中國(guó)公有云的這個(gè)大模型的服務(wù)調(diào)用量上居第一,市場(chǎng)份額達(dá)到49.2%。

一、國(guó)內(nèi)首個(gè)分檔調(diào)節(jié)思考長(zhǎng)度模型,低強(qiáng)度模式總Token輸出下降超70%

火山引擎總裁譚待提到,今年AI有三個(gè)比較明顯的趨勢(shì),第一是具備多模態(tài)理解能力的深度思考模型不斷,第二是視頻圖像等模型的能力已經(jīng)逐步達(dá)到生產(chǎn)級(jí)水平,第三是企業(yè)級(jí)Agent正逐步走向成熟。

今年6月,豆包推出具有多模態(tài)理解能力的深度思考模型Doubao-Seed-1.6。

綜合來(lái)看,Doubao-Seed-1.6實(shí)現(xiàn)了開(kāi)啟思考模型后,模型效果提升31%,但這也增加了推理成本,實(shí)時(shí)場(chǎng)景下CoT Tokens占總數(shù)出比例超77%,所以有82%的企業(yè)選擇不打開(kāi)深度思考模式。

基于此,昨天,豆包推出Doubao-Seed-1.6-1015新版本,支持分檔深度思考長(zhǎng)度,企業(yè)可以根據(jù)需求在不同場(chǎng)景下選擇相應(yīng)思考長(zhǎng)度。

豆包大模型家族更新!豆包每日Token調(diào)用量達(dá)30萬(wàn)億,大漲253倍

低強(qiáng)度模式下,Doubao-Seed-1.6-1015新版本可以在相同模型效果下,使得總輸出Tokens下降77.5%,深度思考時(shí)間下降84.6%。

此外,豆包還發(fā)布了Doubao-Seed-1.6-lite,該模型尺寸更小,效果超越Doubao-Seed-1.5-Pro。0-32K上下文區(qū)間內(nèi),Doubao-Seed-1.6-lite總和成本相比Doubao-Seed-1.5-Pro下降了53%。

豆包大模型家族更新!豆包每日Token調(diào)用量達(dá)30萬(wàn)億,大漲253倍

二、發(fā)布語(yǔ)音合成、聲音復(fù)刻新模型,新推智能模型路由方案

在多模態(tài)模型方面,火山引擎此前發(fā)布最新圖像創(chuàng)作模型Seed?Dream?4.0,提升了文生圖、圖生圖、圖生圖能力。一張照片生成對(duì)應(yīng)手辦、一張照片生成手帳等。

豆包語(yǔ)音模型已經(jīng)逐步覆蓋從語(yǔ)音合成到語(yǔ)音識(shí)別、聲音復(fù)刻、實(shí)時(shí)語(yǔ)音、同聲傳譯等不同的領(lǐng)域,以智能終端為例,目前豆包語(yǔ)音模型已經(jīng)覆蓋了超過(guò)4.6億臺(tái)的智能終端。

今天發(fā)布豆包語(yǔ)音合成模型2.0和聲音復(fù)刻模型2.0,其采取對(duì)話式合成模式,并增強(qiáng)了在情感和演繹指令遵循。語(yǔ)音合成模型針對(duì)小學(xué)到高中全階段的學(xué)科基本對(duì)應(yīng)的公式,合成準(zhǔn)確率達(dá)到90%以上。

對(duì)比傳統(tǒng)的軟件,Agent能端到端處理任務(wù),自主解決更復(fù)雜問(wèn)題,在編程方面,火山引擎不斷開(kāi)源開(kāi)源矩陣,其國(guó)內(nèi)首個(gè)AI原生IDE平臺(tái)TRAE和AI Agent開(kāi)發(fā)平臺(tái)扣子已經(jīng)服務(wù)了數(shù)百萬(wàn)開(kāi)發(fā)者。

豆包大模型家族更新!豆包每日Token調(diào)用量達(dá)30萬(wàn)億,大漲253倍

為了幫助企業(yè)進(jìn)行智能模型選擇,火山引擎還推出了智能模型路由方案,該方案支持不同的模式,如平衡模式、效果優(yōu)先模式、成本優(yōu)先模式,定好不同模式的目標(biāo)之后,模型就會(huì)根據(jù)對(duì)應(yīng)的請(qǐng)求自動(dòng)選擇最合適的模型。該平臺(tái)支持豆包全系列模型以及DeepSeek、Qwen、Kimi等業(yè)界主流開(kāi)源模型。

豆包團(tuán)隊(duì)透露,以DeepSeek為例,經(jīng)過(guò)實(shí)測(cè),在效果優(yōu)先模式下,智能路由后,模型效果相比直接使用DeepSeek-V3.1提升14%;在成本優(yōu)先模式下,在實(shí)現(xiàn)DeepSeek-V3.1相似效果的條件下,模型的綜合成本最高下降超過(guò)70%。

三、將推扣子空間企業(yè)版,滿足企業(yè)個(gè)性化定制需求

為了幫助企業(yè)做好AI轉(zhuǎn)型,火山引擎還將Agent和傳統(tǒng)的各種存量系統(tǒng)進(jìn)行了打通,通過(guò)HiAgent平臺(tái),構(gòu)造了一+N+X的體系,幫助企業(yè)打造統(tǒng)一Agent界面,包含1個(gè)統(tǒng)一交互入口、N個(gè)企業(yè)通用智慧助手以及X個(gè)企業(yè)定制智能體應(yīng)用。

豆包大模型家族更新!豆包每日Token調(diào)用量達(dá)30萬(wàn)億,大漲253倍

2024年,低代碼Agent開(kāi)發(fā)平臺(tái)扣子發(fā)布,其中預(yù)置智能客服助手、寫(xiě)作助手等模版,還會(huì)提供插件、可視化界面、數(shù)據(jù)庫(kù)等各項(xiàng)功能。

今年4月,火山引擎發(fā)布面向辦公場(chǎng)景的AI Agent產(chǎn)品扣子空間,目前已經(jīng)服務(wù)了上百萬(wàn)知識(shí)工作者,包括股票分析師、老師、電商運(yùn)營(yíng)等。

接下來(lái),扣子空間計(jì)劃推出企業(yè)版,滿足企業(yè)的個(gè)性化需求。

其有兩大特點(diǎn),一是定制化的Agent,企業(yè)可以自定義更加符合自身業(yè)務(wù)需求的個(gè)性化智能體,二是MCP開(kāi)發(fā),企業(yè)可以通過(guò)API為自己的Agent增加私有化的技能,三是數(shù)據(jù)連接器、企業(yè)知識(shí)庫(kù),可以幫助企業(yè)鏈接內(nèi)部數(shù)據(jù),最后是企業(yè)級(jí)系統(tǒng)管理,為企業(yè)提供不同權(quán)限管理模式。

結(jié)語(yǔ):火山引擎正幫企業(yè)進(jìn)一步掃清落地障礙

火山引擎此次更新凸顯出的關(guān)鍵是,其正在幫助企業(yè)更便捷、快速且在成本可控的程度下用上大模型,豆包大模型1.6版本首創(chuàng)四檔思考長(zhǎng)度調(diào)節(jié)功能,實(shí)現(xiàn)了模型性能與成本控制的動(dòng)態(tài)平衡。

此前,Agent的商業(yè)化落地受困于高Token消耗帶來(lái)的成本壓力,此次火山引擎的更新為這一瓶頸提出了有效路徑,或許可以加速Agent的規(guī)模化應(yīng)用。