AIDEEPAI 深度拆解
← 全部拆解
published

字节把视频生成砍到 5 毛一秒:Seedance 2.0 Mini 和"按 token 卖视频"这件事

SeedanceByteDance火山引擎火山方舟视频生成token计费AIGC电商素材UGCKlingSoraVeo
字节把视频生成砍到 5 毛一秒:Seedance 2.0 Mini 和"按 token 卖视频"这件事 配图 1

字节把视频生成砍到 5 毛一秒:Seedance 2.0 Mini 和"按 token 卖视频"这件事

本期关键词:token 计费(按"数据块"算钱——视频被切成一堆叫 token 的小单位,生成时数多少个就收多少钱,不再按"一条视频"或"一分钟"打包卖)/ 模型蒸馏(把一个又大又准的模型当老师,训练出一个更小更快的学生模型,让它学会老师七八成的本事,但跑起来便宜很多)

2026 年 6 月 15 日,火山引擎旗下的火山方舟体验中心悄悄上线了一个新模型,名字叫 Seedance 2.0 Mini。它没有发布会,没有 demo 刷屏,连 API 都还没开放。但它把一个数字摆到了桌面上——按 720P 规格折算,单秒视频生成成本约 0.5 元。

半年前,同一家公司的同一代视频模型,这个数字还是 1 块钱左右。

0.5 元一秒,听起来像是又一次稀松平常的降价。但这次降的不是"会员月费打五折"那种营销价,而是模型按 token 收费的底层单价。把它拆开看,会发现字节在做一件比"便宜一半"更值得琢磨的事:它正在把视频生成,变成一门和卖电、卖云存储一样按量计价的水电生意。

一、先把那个 0.5 元说清楚:它是怎么算出来的

火山引擎公布的定价方案是这样的:Seedance 2.0 Mini 图生视频(给一张图让它动起来)定价 0.023 元/千 tokens,视频生视频(给一段视频让它续写或改写)定价 0.014 元/千 tokens。IT之家在 6 月 16 日的报道里把这两个数字和它的换算口径一起摆了出来:"若以 720P 规格计算,该模型单秒视频生成成本约为 0.5 元,较 Seedance 2.0 标准版降低约一半。"

这里有个容易被滑过去的关键点:视频模型不再按"秒"或者"条"来定价,而是按 token。

token 这个词,玩过 ChatGPT 之类文字模型的人不陌生——一段文字会被切成一个个 token,你问一句话、它答一段话,数清楚总共多少 token,按单价收钱。视频生成把同一套逻辑搬了过来:一段画面被编码成一串 token,分辨率越高、时长越长、动作越复杂,token 就越多,账单就越厚。所谓"0.023 元/千 tokens",就是每生成一千个这样的视频数据块收两分三厘钱。

而 0.5 元/秒,是把这个 token 单价套进"720P、典型时长"这个具体规格后,反算出来的一个直观参考值。它不是定价本身,而是定价的"人话翻译"。

这意味着什么?意味着同一个 Mini 模型,你生成一条 480P 的短素材和一条 720P 的高清片,价格完全不同;生成一段静止说话头和一段满屏运动的特效,价格也完全不同。视频生成的成本第一次和"内容本身有多重"精确挂钩,而不是被一个统一的"每秒几毛"档位粗暴地框住。

字节把视频生成砍到 5 毛一秒:Seedance 2.0 Mini 和"按 token 卖视频"这件事 配图 2

二、和自家上一代比:这一半是怎么砍下来的

要看懂"降低约一半"的分量,得把火山方舟官网那张价格表翻出来对照。

火山方舟模型价格页(这是字节自己的官方定价文档,也是这次最硬的第一信源)列着 Seedance 全系的视频生成单价,口径是"元/百万 tokens":

  • doubao-seedance-2.0 标准版:720P、输入不含视频,46.00 元/百万 tokens;输入包含视频 28.00 元/百万 tokens。
  • doubao-seedance-2.0-fast:输入不含视频 37.00,包含视频 22.00。
  • Seedance 2.0 Mini:图生视频 0.023 元/千 tokens = 23 元/百万 tokens;视频生视频 0.014 元/千 = 14 元/百万。

把单位统一之后,这一刀砍得清清楚楚:Mini 的图生视频 23 元/百万 tokens,正好是标准版 720P 不含视频那一档 46 元的一半;Mini 的视频生视频 14 元/百万,也正好是标准版含视频 28 元的一半。所谓"成本降低约 50%",不是模糊的宣传话术,而是 token 单价被精确地对折了。

官方价格表还顺手给了一个更扎实的旁证。标准版 Seedance 2.0 在 720P、16:9、输出 5 秒的规格下,实际视频价格是每条 5.44 到 12.10 元(取决于输入视频时长),换算下来每秒大约 1.08 到 2.42 元。这就坐实了"标准版约 1 元/秒"的基准,Mini 的 0.5 元/秒正好对上了"砍半"。

那这一半到底砍在哪儿?官方给出的口径是性能取向的转移:Seedance 2.0 Mini 比 Seedance 2.0 Fast 快 2 倍,输出质量与 Fast 相当。

注意这句话的参照系——Mini 对标的不是质量最高的标准版,而是已经做过提速的 Fast 版。它的卖点不是"画质更好",而是"在 Fast 已经够快的基础上再快一倍,质量不掉队"。一个面向创作者的第三方站点(seedance2.ai)把这个定位说得更直白:Mini 是"效率优先的生成,平衡速度和成本,以便更频繁使用",质量层级"低于标准品质",但"更适合测试多种方向、大批量创意探索"。

这就是典型的蒸馏路线——拿大模型当老师,训一个更小的学生模型,让它学到老师七八成的本事,但跑起来快得多、便宜得多。字节没有重新发明视频生成,它是在同一套 Seedance 2.0 的多模态架构上,做了一个"够用就好、量大管饱"的精简版。

字节把视频生成砍到 5 毛一秒:Seedance 2.0 Mini 和"按 token 卖视频"这件事 配图 3

三、对电商和 UGC,0.5 元/秒踩中了一个成本拐点

火山引擎给 Mini 划定的战场很明确:面向电商内容生产、营销素材批量生成、用户原创内容(UGC)创作以及特效玩法生成等高频率、大规模的视频生成场景。

这几个场景有一个共同特征——它们不追求一条片子的极致质量,而追求海量片子的单条成本。

算一笔电商的账。一个中等规模的服饰商家,一次大促要给几百个 SKU 各做一条 5 秒的主图视频。按标准版约 1 元/秒,一条 5 元,500 条就是 2500 元,而且这还只是"出片成功"的钱,加上反复试错、改提示词重跑的废片,实际开销往往要翻一两倍。换成 Mini 的 0.5 元/秒,同样 500 条降到 1250 元,试错的废片成本也跟着对半减——而对电商素材来说,试错次数往往比单条质量更决定最终效果。

这意味着一个微妙的拐点:当单秒成本从 1 元降到 5 毛,很多原本"算不过账所以不做"的批量视频需求,会突然变得划算。一个原本只给爆款 SKU 配视频的商家,现在可能给全店都配上;一个原本舍不得 A/B 测试五版素材的投手,现在可以一口气跑二十版挑最好的。降价真正改变的不是已有需求的花费,而是把一批被价格压住的需求放了出来。

UGC 平台的逻辑也类似。一个让普通用户"上传一张照片生成特效视频"的玩法,如果每次调用要花一两块,平台多半只敢给付费用户开;但如果降到几毛,就有可能做成免费引流的全民功能。成本曲线往下移一截,产品形态的可能性就往上抬一层。

字节把视频生成砍到 5 毛一秒:Seedance 2.0 Mini 和"按 token 卖视频"这件事 配图 4

四、横着比:0.5 元/秒在全行业是什么水位

把镜头拉远,和可灵(Kling)、Sora、Veo 这些主流玩家放在一起,才能看清 Mini 这个价位的真实位置。

  • 可灵(快手):据小牛行研 2026 年 3 月的口径,可灵 O1、2.6 模型生成 1 秒标准/高品质视频的单价在 0.6 到 1.2 元区间。
  • Sora 2(OpenAI):官方 API 文档标注 720P 含音频 $0.10/秒;另有横评把它的文生视频列到 $0.80/秒、图生 $0.60/秒等更高口径,取决于规格。
  • Veo 3.1(Google):据 VidScore 横评,1080P 无音频 $0.20/秒,带唇音同步 $0.40/秒。
  • Seedance 2.0 Fast:第三方平台 Atlas Cloud 的横评把它列在 $0.09/秒,称"比 Sora 2 或 Kling Video O3 的 $0.15/秒便宜近 7 倍"。

把 Mini 的 0.5 元/秒按汇率粗算,约合 $0.07/秒,落在了这张表的最底部一档,比已经很便宜的自家 Fast 还要再低一点,更是把海外旗舰甩开了一截。

但这里要诚实地标一个坑:这些数字不是同一杆秤称出来的。可灵按"灵感值"扣点、Sora 按秒含音频、Veo 区分有无唇音、Seedance 按 token——口径各不相同,分辨率、时长、是否含音频、是否算废片都会让账单天差地别。所以"便宜 7 倍"这类横评结论,只能当作量级上的参考,不能当作精确的逐分对比。真正能逐分对照的,只有 Mini 和自家标准版那一组——因为它们用的是同一套 token 计量尺。

即便打足折扣地看,有一个判断仍然立得住:字节在视频生成这条赛道上打的是价格战,而且打法是"用自家 token 计费体系把单价压到行业地板"。这和它在文字大模型上靠豆包系列疯狂压价、抢 token 调用量份额,是同一套打法的复制。

字节把视频生成砍到 5 毛一秒:Seedance 2.0 Mini 和"按 token 卖视频"这件事 配图 5

五、盲区与过于乐观的地方

把这件事讲得太漂亮之前,有几个洞得先指出来。

第一,API 还没开放,现在能摸到的只有体验中心。 火山引擎自己的措辞是"计划近期开放 API 服务"。这意味着 6 月 15 日上线的,是一个让你在网页里点点试试的体验入口,而不是开发者能批量调用、接进自家流水线的生产级接口。对电商批量出片、UGC 平台集成这些"规模化"场景来说,没有 API 就等于没有真正落地。参照上一代节奏——Seedance 2.0 在 2 月发布模型、4 月中旬才全面开放 API,中间隔了约两个月——Mini 从体验中心到 API 可用,大概率也要等一段时间。在 API 真正开放、价格表正式挂出来之前,0.5 元/秒严格说还是一个"体验阶段公布的参考价"。

第二,"质量相当"是和 Fast 比,不是和最好的比。 多家报道都引用了官方原话"输出质量与 Seedance 2.0 Fast 相当",但 Fast 本身就是个提速版,seedance2.ai 直接把 Mini 的质量描述为"低于标准品质层级"。所以"质量相当"这四个字,描述的是 Mini 没有比 Fast 更差,而不是 Mini 能顶替标准版去做高质量成片。拿 Mini 去跑品牌 TVC、要上大屏的内容,大概率还是不够看。它的位置是草稿、是海量铺货、是试错,不是终稿。

第三,token 计费是把双刃剑。 按 token 算钱对"短、轻、静"的内容极友好,但对"长、高清、满屏运动"的内容,token 会迅速膨胀。官方那张价格表已经露了端倪:标准版 720P 5 秒一条要 5.44 到 12.10 元,1080P 直接跳到 13.56 到 30.13 元。Mini 单价虽然砍半,但只要你想要高清或长片,绝对账单一样会涨上去。"0.5 元/秒"是 720P 这个特定规格下的最优解,不是一个对所有内容都成立的承诺。真要规模化使用,得先算清楚自己的内容到底"有多重"。

六、对从业者意味着什么

把这件事落到具体的人身上,有几条可执行的判断。

如果你是电商/营销团队的人: 现在不必急着改流程,但要开始记账。把你现在用的视频工具的"每条实际成本"(含废片)算清楚,作为基准线。等 Seedance 2.0 Mini 的 API 一开放,用同一批素材跑一轮对比测试,重点不是看单条画质,而是看"批量铺 100 条素材"的总成本和废片率。Mini 的价值在量,不在单条精度——用它来做需要海量、可试错的主图视频、信息流素材,把省下的预算留给少数需要标准版/Fast 的精品片。

如果你做 UGC 或工具类产品: 这是一个重新评估"哪些功能可以白送"的信号。原来因为成本太高只敢对付费用户开的视频特效玩法,在 0.5 元/秒甚至更低的档位下,重新算一遍单用户成本,可能就能做成免费引流的全民功能了。但务必等 API 开放、价格正式落地后再动手,别拿体验中心的参考价去做产品定价测算。

如果你在跟踪 AI 行业: 真正要盯的不是这 0.5 元,而是"按 token 卖视频"这套计费范式会不会被同行跟进。一旦视频生成普遍切到 token 计量,行业的竞争焦点就会从"谁的画质炸裂"悄悄转向"谁的单位 token 更便宜、谁的 token 用量算法更省"——这正是文字大模型这两年走过的路。字节用 Mini 把这条路在视频领域又踩深了一脚。下一个观察点很明确:它的 API 什么时候开、正式价格表会不会比体验阶段公布的 0.5 元更低或更高。

降价从来不只是降价。当一项能力的单位成本被砍到某个临界点,它会从"少数人用得起的奢侈品",变成"所有人默认会用的基础设施"。Seedance 2.0 Mini 想做的,显然是后者。

引用

  1. IT之家《成本砍半,字节跳动推出 Seedance 2.0 Mini 视频生成模型》(原始信源),2026-06-16,https://www.ithome.com/0/964/672.htm —— "字节跳动火山引擎旗下火山方舟体验中心于 6 月 15 日正式上线 Seedance 2.0 Mini 视频生成模型……图生视频定价为 0.023 元 / 千 tokens,视频生视频定价为 0.014 元 / 千 tokens。若以 720P 规格计算,该模型单秒视频生成成本约为 0.5 元,较 Seedance 2.0 标准版降低约一半。"
  2. 火山方舟官方《模型价格》文档(第一信源·官方定价表),https://www.volcengine.com/docs/82379/1544106 —— 列出 doubao-seedance-2.0 标准版 720P 不含视频 46.00 元/百万 tokens、含视频 28.00;2.0-fast 37.00/22.00;以及标准版 720P 5 秒实际单价 5.44~12.10 元/条。用于核算"对半砍"与"标准版约 1 元/秒"。
  3. 新浪财经《火山引擎发布 Seedance 2.0 mini》,2026-06-16,https://finance.sina.com.cn/tech/shenji/2026-06-16/doc-inicqhiz4491214.shtml —— 交叉验证上线日期、定价与"高性价比、面向规模化生产"定位。
  4. 网易科技《火山引擎发布 Seedance 2.0 mini,API 将于近期上线》,2026-06-16,https://www.163.com/tech/article/KVHMIV7U00098IEO.html —— 验证 API 尚未开放、"近期上线"措辞及场景定位。
  5. 腾讯新闻《Seedance 2.0 API 服务全面开放》,2026-04-16,https://news.qq.com/rain/a/20260416A065I400 —— 提供上一代 Seedance 2.0 从发布到 API 开放的时间线参照(2 月发布、4 月中旬开放 API)。
  6. 小牛行研《可灵 AI 最新模型的 API 收费》,2026-03,https://www.hangyan.co/charts/3844549648186344865 —— 可灵 O1/2.6 生成 1 秒标准/高品质视频单价 0.6~1.2 元,用于横向定价对比。
  7. OpenAI API 文档 Sora 2 Model,https://developers.openai.com/api/docs/models/sora-2 —— Sora 2 官方定价 720P 含音频 $0.10/秒(英文原文:"$0.1 ... Portrait: 720x1280 Landscape: 1280x720 ... video with synced audio")。
  8. VidScore《Veo 3 vs Sora 2》,https://vidscore.dev/blog/veo-vs-sora —— Veo 3.1 1080P 无音频 $0.20/秒、含唇音 $0.40/秒(英文原文:"Veo 3.1 costs $0.20/sec without audio or $0.40/sec with lip-synced audio at 1080p")。
  9. Atlas Cloud《Cheapest AI Video Generation APIs in 2026》,https://www.atlascloud.ai/blog/guides/cheapest-ai-video-generation-api-2026 —— "Seedance 2.0 Fast at USD0.09/sec is nearly 7x cheaper per second than Sora 2 or Kling Video O3 at USD0.15/sec"(中译:Seedance 2.0 Fast 每秒 0.09 美元,几乎比 Sora 2 或 Kling Video O3 的每秒 0.15 美元便宜近 7 倍)。