土木人的“视频工厂”:用代码做视频,用AI当导演,这才是2026年的创作方式!
视频生产进入“编程”时代?Remotion与AI导演的视频工作流我做了一个视频,但我完全没有打开 PR、剪映或者必剪这些软件。以前我觉得做视频太累了:找素材、对轴、加特效、调颜色,稍微动一下就要几个小时。我就想:既然文章可以用AI写,代码可以用AI写,为什么视频不能用AI“跑”出来?结果,我真的跑通了。利用 Remotion 这个开源神器,配合官方的 Claude Code Skill,我现在做视频就像做工程一样:定义规则,自动施工。(今天做的视频放在视频号上拉)🎬 什么是“代码做视频”?(Remotion)简单说,Remotion 就是一个能用代码控制像素的工具。以前你要在剪辑软件里手动拖拽一个“3D旋转”特效。现在,我只需要告诉 Claude:“给我来个 3D 旋转,配色要赛博朋克风。”Claude 就会自动调用 Remotion 的代码库,生成出无比精确、丝滑的画面。这不是最骚的,最骚的是官方把这做成了SKILL,然后我们自己优化就好了。核心观点:Remotion用代码控制视频像素,实现精确、丝滑的画面生成。关键功能:Claude Code Skill自动调用Remotion代码库,无需手动操作。未来方向:视频制作流程自动化,从手动拖拽到指令式生成,效率大幅提升。1.视觉车间:Claude + Remotion Skill我把自己整理好的 Remotion 规则喂给了 Claude。现在我只要说:“做一个波纹扩散的转场”或者“模仿 YouTube 那个爆火的 3D 教学视频风格”。亮点: 想要改颜色?改参数?一句话的事,不用在轨道上一点点挪。需要图片?调用 Midjourney/Flux 生成。需要动态片段?调用 Luma/Runway 生成。需要人物?直接从我的“素材库”里调取(自动抠图好的)。Claude 会像一个“总包单位”,把这些分包出去的素材收回来,自动插入到视频轨道里。本来我想用声音克隆(复刻我自己的声音),但目前开源的效果还有点机械音,差点意思,还在测试中。所以我先用了阿里/OpenAI 的高质量 TTS(语音合成)。最爽的是:代码能自动识别语音长度,自动把视频画面和语音对齐! 再也不用手动剪气口了!我们搞土木的,最大的短板是啥?审美不行,做出来的东西像包工头PPT。但我有 AI 啊!我设计了一个“审美闭环”:2.导演审核: 我把视频截图发给 GPT-5 或 Gemini 3 Pro(视觉能力强的 AI)。3.提出意见: “导演”AI 会吐槽:“配色太土,字体太小,转场太生硬。”4.自动修改: Claude 根据“导演”的意见,自动修改代码,重新渲染。反复几轮,一个审美在线、逻辑清晰的视频就出来了。我只负责最后点个头:“通过!”这次折腾让我明白了一个道理:在 AI 时代,你的“手艺”不值钱,你的“Skill(技能包)”才值钱。你今天花时间调教好的“视频转场 Skill”、“字幕自动对齐 Skill”、“3D 特效 Skill”,它们就是你的固定资产。你自己可以用;你可以分给团队用;你甚至可以打包卖给别人。以后做视频,比拼的不是谁鼠标点得快,而是谁的 Skill 库更丰富,谁的 AI 迭代得更好。✍️ 写在最后这套“Remotion + Claude + AI导演”的视频生成流,目前还在 MVP 阶段。但我已经看到了未来的样子:万物皆可 AI,万物皆可自动化。然后我觉得,这个东西很好的填补了我的输出形式的单一。就是当我把视频这一块短板补上那我的AI人生系统从原本单一的内容产生到文章现在可以发展到AI提速,同步产生视频、图片等等最近我也做好了最近全网很火的dan koe的知识库了(扒完他的视频了)同步我的AI自动填表现在还在进行优化,毕竟我想做一个精品,需要调试比较长的时间。其次,我最近做了一个会议录音转文案的工具,就是可以识别每个人的声音,记住后下次会议就能知道是谁说话。然后按照转录的东西以及每个人说话直接出会议纪要(按照提前给他的模版)土木AI工具导航也在更新。