如果说文章创作的难度是1,那么视频剪辑的难度就是10!
但是现在做视频基本上已经成为了营销的刚需。
如果很不巧,你对你的画面还有一些追求,想要进行一些独特的包装和特效,那就只能每天坐在电脑前,对身体和心灵都是一种折磨。
这里大家当然会提出异议:都2026年了,谁家好人还自己剪视频?当然是AI生成!
但是! AI生成视频过程中存在两个问题:
- 视频衔接和处理并不方便
人物一致性问题可以算是AI生成视频中老生常谈的问题了,甚至衍生出了专门的技能来针对AI生成的视频内容进行处理,可见其中难度是非常大的。
另外一个方面,如果想要对AI生成的视频中内容进行调整只有两条路可以走:其一就是用AE这样的工具,从头开始,每一帧去进行调整——这又回到了原来做特效时候盯着屏幕干苦力活的样子;其二就是直接让AI重新生成,当然这也不是万能的,抛开token不谈,哪怕是最理想的结果也不能保证完全不用进行修改。
当然,token是抛不开的,所以就出现了第二个痛点: - 视频生成成本高昂
- 相较于生成文本、代码、图片。生成视频的成本极高的。我们正常生成一个1分钟1080p的短视频,哪怕一次通过,也需要 37块8。而事实上生成出一条真正可用的短视频,成本都赶上一个月Claude Code会员费了。
所以有没有一种可能:通过代码的形式来进行视频的编辑?
这就不得不提到remotion了,最近remotion发布了skills,让AI能够更精细化的操控remotion。
remotion是什么?
这是一个纯粹的前端代码生成视频动画的项目。
我们在html中可以通过代码来进行动画的控制,在此之前我也常会用Gemini生成html动画。但是丰富程度上还是略逊一筹。remotion通过react实现了更丰富多彩的动画类型。作为代码版的AE,remotion可以做到的画面复杂程度可以说远超普通html,同时他的内置组件也能更稳健的直接导出视频格式。
快速上手remotion
环境准备
作为react为核心的项目,我们只需要使用Node.js 和Claude Code即可实现remotion的使用
开始生成三板斧
- 创建项目
npx create-video@latest my-video cd my-video
- 安装skill
npx skills add remotion-dev/skills
- 开始在Claude中生成
现在我们就可以直接通过自然语言的方式让remotion进行内容的生成
Remotion vs AI视频生成
Remotion和AI视频生成属于两个不同的流派,二者其实并非完全的替代关系。
追求精确控制的remotion
✅ 优势
- 绝对的可控性(Pixel-Perfect):你可以精确控制每一个文字的大小、颜色、位置以及每一帧的动作。
- 修改成本极低:如果要把背景从红色改成蓝色,只需AI修改一行CSS变量并重新渲染(几秒钟),而不需要重新生成整段视频。
- 帧准确与音频对齐:动画与音乐节拍、旁白可以做到毫秒级的精准对齐,不会出现AI视频中常见的口型对不上或动作漂移的情况。
- 数据驱动:它可以轻松接入实时数据(如:自动生成带你名字的年度报告视频),这是目前纯AI视频难以做到的。
- 无"AI幻觉":文字不会乱码,人体结构不会在运动中突然多出一根手指。
❌ 劣势
- 视觉天花板受限:它主要擅长2D/3D动效、图表、UI展示、教学视频。你无法用它生成像《流浪地球》那样的写实电影级画面。
- 依赖Web技术生态:虽然AI能帮忙写,但如果需要高度自定义,仍然需要开发者具备一定的前端基础。
- 资产消耗:视频中的所有图片、3D模型、素材需要预先准备好,它只是负责"搬运"和"动画"。
具有创造力的AI生成
✅ 优势
- 惊人的视觉表现力:只要Prompt足够出色,它可以生成物理世界中难以拍摄的宏大场景、写实人像或奇幻特效。
- 创作门槛极低:"只要会说话就会做视频"。不需要懂任何代码、图层或关键帧的概念。
- 极高的上限:
❌ 劣势
- "抽卡"随机性:很难让AI完全听话。你可能为了让视频里的角色点一下头,而需要消耗大量算力重复生成几十遍。
- 修改即重做:视频一旦生成,想要微调其中的某个局部元素(比如换掉路人的衣服)极其困难,通常需要整段重来。
- 文字处理硬伤:虽然像Sora等模型在改善,但目前的AI视频在处理长文本排版、精准数据展示方面依然经常出错。
- 版权与合规风险:画面来源不可溯,且在某些平台上需要显式标注"AI生成"标识,否则可能限流。
总的来说二者的优劣势对比还是非常显著。
未来的高效工作流应该是:用直接AI生成视频来制作宏大的背景或过场素材,再用Remotion Skills将这些素材整合,并加上精准的文字包装、UI交互和数据展示。这才是"效率"与"美感"的最佳平衡点。