Coze 多模态视频生成 Agent
在 Coze(字节扣子)上拼出来的「文案 → 图片 → 视频」全自动短视频流水线,5 个互相调用的 workflow,每个 workflow 是一个独立的 zip。
在一个样例选题上复演 5 个 Coze 工作流:produce 分发任务,get_produce 写标题 + 6 个分镜,create_image / create_video 逐镜生成,get_video 合并成片。
本地版本说明
这是用真实工作流链(5 个带 draft ID 的 zip)在案例样例选题上的复演,不生成真实媒体——重点是模块化 workflow 设计,不是真跑图生/视频模型。
运行 5 工作流短视频流水线
在一个样例选题上复演 Coze 工作流链:produce → get_produce → create_image → create_video → get_video,从 brief 一路到成片。
选题 brief
关于「深圳早高峰地铁」的 60 秒短视频
produce
Master: reads the brief, routes to sub-workflows
Workflow-produce-draft-1308.zip
get_produce
Copywriting: title / storyboard shots / narration
Workflow-get_produce-draft-1319.zip
create_image
Image gen: one image per shot
Workflow-create_image-draft-1329.zip
create_video
Video gen: image + narration → clip
Workflow-create_video-draft-1324.zip
get_video
Merge: clips + BGM + subtitles → final video
Workflow-get_video-draft-1314.zip
执行日志
运行流水线,看 5 个 workflow 依次接力。
分镜 → 图 → 视频片段
建议体验
运行流水线,看 5 个 workflow 依次接力:produce → get_produce → create_image → create_video → get_video。
注意每个分镜先点亮「图」徽标,再点亮「片段」徽标。
体会为什么拆成 5 个 zip:独立失败 / 独立换模型 / 独立 cache / 独立调试。
这个试玩能说明什么
你知道什么时候低代码平台胜过写长代码——内容流水线依赖平台内置的图生/视频插件。
你按能力拆分、按引用(draft ID)组合 workflow,而不是一个超大流程。
你能按场景在 Coze / Dify / LangChain 之间选型:内容 / 对话 / 自定义逻辑。
5 个工作流
produce · get_produce · create_image · create_video · get_video
为什么 Coze
字节系图生/视频模型内置成插件——不用接 API key、不用管限流
最强信号
模块化编排 + 按场景选平台的判断力