news 2026/4/16 0:33:19

火山引擎发布豆包大模型1.8和音视频创作模型Seedance 1.5 pro

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
火山引擎发布豆包大模型1.8和音视频创作模型Seedance 1.5 pro

12月18日,火山引擎在FORCE原动力大会上正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro。权威评测数据显示,豆包大模型在多模态理解、生成能力及Agent能力上,已跻身全球第一梯队。

据火山引擎总裁谭待介绍,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。

图:火山引擎总裁 谭待

豆包大模型1.8:打造更强多模态Agent“大脑”

作为豆包家族的最新旗舰模型,豆包大模型1.8(Doubao-Seed-1.8)面向多模态Agent场景进行了定向优化。其工具调用能力、复杂指令遵循能力及OS Agent能力均得到增强,提升了模型在处理复杂任务时的规划与执行水平。

在视觉理解方面,豆包1.8的单次视频理解帧数从640帧倍增至1280帧。模型支持以低帧率理解超长视频,并能调用工具对关键片段进行高帧率理解。该能力可广泛用于在线教育、产品质检等场景中。

图:豆包大模型1.8测试表现

在多项公开评测中,豆包1.8展现出极具竞争力的全面表现:在视觉推理、通用视觉问答、空间理解及视频理解等任务中,均获得最佳或接近最佳成绩;在通用智能体测评集BrowserComp上表现全球领先;在数学与推理等基础能力维度上,整体水平已接近全球顶尖的通用模型。

Seedance 1.5 pro:音画高精同步,重塑AI视频生产力

针对日益增长的视频创作需求,火山引擎推出了Seedance 1.5 pro音视频创作模型。该模型不仅具备影视级的叙事张力,能够精准捕捉运动细节并细腻呈现人物情绪,更在音画同步技术上取得了突破性进展。

Seedance 1.5 pro采用创新的原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现了毫秒级的音画同步输出。在对白处理上,模型支持多人多语言对话,口型对齐精准,覆盖中文方言(如四川话、粤语等)、英文及小语种,极大地提升了视频内容的真实感与全球化创作潜力。

为进一步降低创作门槛与成本,Seedance系列即将上线“Draft样片”功能。创作者可先生成低分辨率样片进行预览,其关键要素与最终成片高度一致,真正做到“预览即所得”。数据显示,该功能可帮助创作者提升65%的整体效率,并减少60%的无效创作成本。

目前,个人用户已可在豆包、即梦AI等平台体验该模型;企业用户则可从12月23日起,通过火山引擎API接入Seedance 1.5 pro模型服务。

升级AI云原生架构,构建Agent规模化落地基座

谭待指出,传统的IT架构已无法满足Agent时代的需求,以模型为中心的AI云原生架构正在形成,并围绕Agent的开发与运营进行重构。

在Agent开发层面,火山引擎全面升级了企业级AI Agent平台——AgentKit。该平台覆盖了Agent从开发、部署到管控的全生命周期,旨在解决企业在Agent落地中面临的身份权限管理、模型确定性及系统集成等核心挑战。

在Agent运营层面,火山引擎推出了HiAgent智能体工作站。该工作站通过构建统一的企业AI任务调度中心、提供一系列开箱即用的通用智能体,以及支持个性化定制智能体应用,帮助企业实现Agent的规模化管理与应用。

此外,为降低企业使用门槛,火山引擎推出了业内首个“AI节省计划”。该计划覆盖所有按量后付费的大模型产品,通过阶梯式折扣,帮助企业最高节省47%的成本。

谭待表示,通过从模型能力到基础设施的全面革新,火山引擎正在推动AI应用从单一的模型调用向复杂的Agent智能体生态演进,加速AI能力在各行各业的深度落地。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/13 10:34:19

以机器为中心到以人为中心,大晓机器人首创ACE具身研发范式

中国上海,12月18日——大晓机器人正式发布行业首创的ACE具身研发范式、首个开源且商业应用的开悟世界模型3.0(Kairos 3.0)、让具身本体拥有自主空间智能的具身超级大脑模组A1,与行业伙伴共同构建全链自主可控、开放共赢的产业级生…

作者头像 李华
网站建设 2026/4/14 20:30:43

告别传输难题!Localsend+cpolar让文件互传高效又简单

文章目录前言1. 在Windows上安装LocalSend2. 安装Cpolar内网穿透3. 公网访问LocalSend4. 固定LocalSend公网地址前言 Localsend 是一款专注于设备间文件传输的工具,支持 Windows、macOS、Linux 等多种系统,通过 UDP 协议和多线程加速技术,能…

作者头像 李华
网站建设 2026/4/12 6:07:01

介观交通流仿真软件:VISSIM (介观模式)_(6).驾驶行为参数设置

驾驶行为参数设置 在VISSIM介观模式中,驾驶行为参数的设置是仿真模型的重要组成部分,直接影响到交通流的动态特性和仿真的准确性。驾驶行为参数主要包括加速度、减速度、跟车模型、换道模型、超车型行为等。本节将详细介绍如何在VISSIM中设置这些参数&am…

作者头像 李华
网站建设 2026/4/13 18:46:21

6、日期时间与算法数据结构问题及解决方案

日期时间与算法数据结构问题及解决方案 1. 日期与时间问题概述 在处理日期和时间相关的编程任务时,我们常常会遇到一些常见的问题,下面将对这些问题进行详细介绍,并给出相应的解决方案。 1.1 问题列表 问题编号 问题描述 39 测量函数执行时间 40 计算两个日期之间的…

作者头像 李华