
Seedance 2.0 完整使用指南:12种输入模态逐一讲解(含实操示例)
Seedance 2.0 全功能详解:12种输入模态、4种生成模式、@Reference 提示词用法、镜头运动复制、节拍同步音频,以及抖音/小红书/电商的实际工作流示例。
Seedance 2.0 支持12种输入类型——文本、最多9张参考图、3段参考视频、3个音频文件——配合 @Reference 提示词系统,你可以指定每个素材在生成中扮演的具体角色。本指南覆盖所有输入类型、4种生成模式,以及抖音、小红书和电商场景的实际工作流。
大多数 Seedance 教程专注于 API 调用或基础文生视频。这篇指南面向创作工作流:每种输入的作用是什么、什么时候使用、如何组合来获得可控的输出。
为什么输入灵活性至关重要
Sora 2 和 Veo 3.1 各支持2种输入(文本+1张图片)。Seedance 2.0 的12模态输入系统是完全不同的逻辑——它把模型当作一个可以接收详细参考素材的导演,而不仅仅是根据文字描述工作。
字节跳动官方技术资料将 Seedance 2.0 定位为"多参考组合生成"——模型专为同时处理多个参考输入而训练。
12种输入类型详解
文本(1种)
提示词。与 Sora 不同,Seedance 2.0 的提示词配合参考素材时效果最佳。纯文生视频也支持,但模型真正的优势是在理解如何使用上传的参考素材。
有效提示词结构:
[参考标签] + [场景描述] + [镜头/运动描述]图片(最多9张)
可上传最多9张参考图,每张服务于不同目的:
- 风格参考 ——"用@image1的色调和氛围"
- 角色参考 ——"用@image2的人物作为主角"
- 场景参考 ——"在@image3的环境中设置场景"
- 产品参考 ——"展示@image4的产品在运动中的状态"
- 首帧 ——在首尾帧模式中,@image1成为开场画面
有了9张图片输入,你可以同时上传角色、服装、环境、产品和风格方向——每个都是独立可控的参考。
视频片段(最多3段)
视频参考输入主要用于镜头运动引导和风格延续:
- 镜头运动参考 ——上传一段带有目标镜头运动的视频(@video1 camera motion)
- 风格参考 ——一段视频建立视觉美感和节奏
- 转场参考 ——展示场景间的连接方式
这是镜头运动控制功能的核心。如果你有一段特定运镜的无人机素材,将其作为@video1并标记"镜头运动",Seedance 会复制那个运镜轨迹。
音频文件(最多3个)
音频输入实现节拍同步剪辑:
- 音乐曲目 ——上传歌曲后,生成视频的剪辑节奏跟随节拍
- 参考音效 ——建立环境音频方向
- 旁白参考 ——引导节奏或音频设计
节拍同步是 Seedance 区别于 Veo 和 Sora 的核心音频功能。抖音、小红书跟热门BGM的内容,以及带品牌音乐的产品广告,这是选择 Seedance 的主要理由。
4种生成模式
1. 全参考(All Reference)
适用场景: 你有2个以上参考素材,希望模型将它们融合。
全参考模式接受最广泛的输入组合。上传角色图、环境参考、风格指南和镜头运动视频,模型根据你的提示词标签进行合成。
示例:
@image1 主角行走,@image2 背景环境,@video1 镜头运动,
平滑跟拍穿过霓虹灯夜晚的城市街道,5秒2. 首尾帧(First & Last Frame)
适用场景: 你明确知道镜头的开始和结束帧,希望AI填充过渡。
上传两张图片:第一帧和最后一帧。Seedance 2.0 生成两者之间的运动和变换。
常见用例:
- 产品从包装中出现(首帧:包装完整;末帧:产品展示)
- 人物走进房间(首帧:门口;末帧:室内)
- 昼夜变换(首帧:白天;末帧:黄金时刻)
3. 多帧(Multi-Frame)
适用场景: 你在构建一个有多个明确时间节点的序列。
按顺序上传3-5张关键帧图片,Seedance 生成相邻帧之间的过渡,形成类似分镜板驱动的短视频。
适合用于:
- 产品使用步骤演示
- 食谱或教程序列
- 特定地点的旅游拼接
4. 主体参考(Subject Reference)
适用场景: 你需要在多次生成中保持角色/产品外观一致。
上传主体的参考图,Seedance 2.0 在不同场景、背景、角度下保持其外观、面部特征和服装的一致性。
对于有固定IP形象的品牌、连续剧集内容或需要同款产品在不同场景中保持视觉一致的电商团队,主体参考模式是实现规模化内容生产的关键。
@Reference 提示词:使用方法
@reference 语法是 Seedance 为多素材输入设计的指令系统。不使用时,模型自行决定如何使用上传的素材;使用后,你指定每个素材的角色。
支持的角色标签:
@image1 角色——用此人/主体作为主角@image2 风格——将此图的美学风格应用到整个场景@image1 首帧——此图作为开场帧@image2 末帧——此图作为结束帧@video1 镜头运动——复制此视频片段的镜头运动@audio1 节拍同步——跟随此音频的节奏剪辑
可以在一条提示词中组合多个参考标签:
@image1 角色自信行走,@image3 城市背景,@video1 镜头运动,
@audio1 节拍同步,都市时尚广告,5秒,黄金时刻光线镜头运动控制:实操说明
这是 Seedance 2.0 独有的能力,Sora 和 Veo 都不具备。操作流程:
- 找到或录制你想要的镜头运动参考视频
- 将其作为参考上传(视频输入区)
- 标记:
@video1 镜头运动 - 在提示词中描述场景内容
模型从参考视频学习镜头的速度、方向和特性,并将其应用到新场景。这让你能在一系列视频中保持统一的摄影风格,而不需要用文字精确描述复杂的镜头运动。
节拍同步实操步骤
- 上传音频文件(MP3 或 WAV)作为音频参考
- 在提示词中标记:
@audio1 节拍同步 - 模型分析音轨的节拍标记
- 生成视频的剪辑和过渡与节拍对齐
生成的视频有自然的剪辑节奏。如果你的音频在第3秒有节奏高潮,视频会在那里有视觉强调。
注意:Seedance 2.0 会额外生成环境视频音效叠加在你的音轨上。如果只需要你的原始音轨,可以在后期剪辑中单独处理音频轨道。
典型工作流示例
电商产品视频(淘宝/小红书)
输入:
- @image1:产品正面图
- @image2:生活场景环境图(厨房、健身房等)
- @audio1:品牌背景音乐
提示词:
@image1 产品突出展示,@image2 环境,@audio1 节拍同步,
流畅展示镜头,温暖打光,专业产品广告风格,5秒音乐视频片段
输入:
- @image1:艺人参考照片
- @video1:镜头运动参考视频
- @audio1:歌曲
提示词:
@image1 艺人表演,@video1 镜头运动,@audio1 节拍同步,
演出现场动感灯光,背景虚化人群,5秒房产展示视频
输入:
- @video1:特定飞越路线的无人机素材
- @image1:楼盘外立面照片
提示词:
@video1 镜头运动,@image1 建筑外观,航拍飞越视角,
夕阳光线,房产展示,电影质感,8秒常见问题
单次生成最多能上传几张图片? 9张参考图,加上最多3段视频和3个音频文件,一次生成最多可以引用15个独立素材。
Seedance 2.0 支持1080p吗? 支持,在 Pro 和 Business 套餐可用。免费账号输出720p。1080p约额外消耗80积分/次。
最长可以生成多长的视频? Seedance 2.0 支持4-12秒,时长在此范围内可选。
可以用于商业项目吗? Pro 和 Business 套餐包含完整商业使用权,付费套餐无水印输出。
节拍同步效果如何? 对节奏感强的音乐(电子音乐、流行、嘻哈)效果最好。节奏不规律的音乐(爵士、古典)同步精度会下降。建议使用 BPM 稳定的音轨。
@reference 标签区分大小写吗? 不区分。@Image1、@image1 和 @IMAGE1 效果相同。
中文提示词支持好吗? Seedance 2.0 对中文提示词支持良好(字节跳动的中文训练数据积累深厚),场景描述、产品说明和中文标签都可以正常使用。
最后更新:2026年2月
更多文章

不用 Vertex AI 也能用 Google Veo 3.1 Pro:完整使用指南(2026)
无需 Google Cloud 账号或 Vertex AI 配置,通过 SeedanceVideo 使用 Google Veo 3.1 Pro,月费 $19.90,含原生音效生成和1080p输出。

AI视频生成工具价格对比(人民币):2026年最划算方案
2026年主流AI视频生成工具完整价格对比,全部换算成人民币。可灵、即梦、Sora 2、Veo 3.1、Runway、SeedanceVideo,帮你算清楚哪个最划算。

Sora 2在国内怎么用?2026年无需翻墙完整教程
国内用户使用Sora 2的完整攻略。不用ChatGPT Pro,不用翻墙,通过SeedanceVideo直接访问Sora 2 Max,月费不到¥145。
Seedance 2.0 邮件订阅 — AI视频技巧与更新
加入 Seedance 2.0 社区
每周获取AI视频生成技巧、创意工作流及 Seedance 2.0 产品更新,直达邮箱。