写在前面
你是不是也有过这种时刻?脑子里有个想法,但想到要写代码就放弃了。
我是一个音乐老师,不懂代码,就连HTML是什么都说不清楚。前段时间,我做了一件以前想都不敢想的事:从0开始花了不到两天上线了一个网站。
地址先放这:https://www.qianlangai.top/
这篇文章想聊的是这件事到底是怎么发生的,中间有多少次我差点放弃,又是什么让我最终做出来了。
如果你在某个领域有积累,脑子里有想法,但总觉得我又不会开发,这篇文章会告诉你三件事:怎么让AI互相配合、怎么把领域知识喂给它、以及我踩过哪些你可以直接跳过的坑。
我的工作流:Gemini负责思考,v0负责执行
有用的经验:找一个能用中文沟通的AI当翻译官。
v0可以生成网页。但它更认代码,不认我的中文描述。而且一旦出了bug,我没有能力用技术语言告诉它哪里错了。
于是我用Gemini来做我的翻译官,当然你用DeepSeek也行。用它来帮你把模糊的需求翻译成代码,v0、Cursor这些工具负责执行。你不需要懂代码,但你需要一个中间层帮你和代码对话。
打开两个窗口:
- Gemini负责整理翻译。用中文描述需求,让它理清逻辑,生成代码。
- v0负责施工。它不需要理解你想干什么,它只负责把代码变成网页就行。
整个开发过程,我没写过一行代码。我做的事情是:
跟Gemini聊需求→它生成代码→我复制给v0→看效果→发现问题→回到Gemini描述问题。
循环往复。爆肝一天。十几个版本。
系统设计:领域知识的数字化
有用的经验:把你的领域知识结构化,然后喂给它。
你脑子里的经验、你积累的资料、你踩过的坑,这些才是最值钱的东西。没有这些,AI只会给你生成正确的废话。
我的一个学生想用Suno做一首很燃的歌,提示词也写了热血,结果Suno给他生成了一首土味DJ。不是AI不行。是他不知道“热血”在音乐术语里可能对应的是“Orchestral, Brass Section, Heavy Drums”。
这就是我做这个工具的起点。
在开发初期,最大的挑战不是写代码,而是如何将音乐理论投给 AI。
音乐风格太多,AI自己生成会出现风格错乱等问题。我整理了一份音乐风格词库,包含了13种对现代音乐史有重要影响的元风格和80多种子风格。20种融合风格。并描述了所有风格的核心特征。
把文档投给Gemini,让它把文档内容转成JSON代码。
我还设计了一个叫听觉调味罐的板块,用户可以往提示词里添加一些元素,比如吉他独奏、鼓点过门、和声铺底。这些会让生成的音乐更有细节。
但同时出现了另一个问题:用户拿到Guitar Solo这个词,不知道该往哪放。加在开头?加在结尾?还是随便加?放错了,Suno根本不理你。
于是我让Gemini设计了一个功能,鼠标放在元素上,会直接显示放置建议:
🌞[Guitar Solo] - 建议位置:[Chorus] 之后或 [Bridge] 之前
就这么一行字,这个工具从词典变成了老师。
所以,没有领域知识,AI只会生成正确的废话。
什么时候该做减法
整个搭建过程中最崩溃的是歌曲结构开关那个功能。
我的设计是:做一个开关,打开后,生成的提示词会自动变成 [Intro] [Verse] [Chorus] 那种结构格式。Suno需要这个,Udio不需要。
这个开关我跟Gemini改了四五版,发给v0执行,要么点了没反应,要么跟别的功能打架。
改到第五版的时候,我盯着屏幕,认真想一个问题:
我是不是在浪费时间?
那天晚上我没再改代码。
我去洗了个澡,问了自己一个问题:
用户真的需要一个开关吗?
Suno用户都需要结构。Udio用户都不需要。这根本不是一个需要"让用户选择"的问题。
第二天我回来,让Gemini把开关删掉。换成一个简单粗暴的逻辑:
选Suno→点按钮→强制输出结构。选Udio→点按钮→只输出标签。
不给用户选择。直接把逻辑写死在按钮里。
一次跑通。
AI能帮你实现任何功能,但它不会帮你判断这个功能值不值得实现。 做加法是AI的事,做减法是你的事。
我遇到的两个坑
我一开始也很纠结做出来好不好看、完不完整的问题。在一开始的构想上,花了很长时间,甚至看着我丑得像Windows 98的第一版,就想放弃了。但我后来发现,比起好看,做出来才更重要,虽然现在这版也谈不上精致。但它能用。
能用就是起点。
网站做完,我兴冲冲地把链接发给朋友。他说:打不开。我一查才知道:vercel.app 这个后缀在国内打不开。
解决方法很简单:买一个自己的域名,绑定到Vercel。
我在 NameSilo 花了不到15块钱买了个 .top 后缀的域名,按照Gemini给的教程改了DNS设置,等了半小时,国内就能访问了。
如果你也打算做一个面向国内用户的工具,记得买域名。
写在最后
这个网站现在还很粗糙。功能不多,界面一般,移动端体验也有问题。
但每次看到它能跑起来,我都会想一件事:
在这之前我还觉得做网站是程序员的事。现在它就在那,有人在用了。
工具地址再放一遍:https://www.qianlangai.top/
如果你在用的过程中发现哪里反人类,评论区告诉我,我继续改。
之后计划会继续迭代的几个功能:
- 2. 听觉化标签:鼠标悬停到声音标签后会听到一小段示例声音
作为音乐老师,我的资产是乐理;你的呢?欢迎在评论区聊聊。