零基础打造爆款AI角色唱歌视频

1

灵感与歌词创作

第一步是确定角色和歌词。我们可以利用 deepseek/豆包让经典角色（如西游记人物）“穿越”到现代，吐槽打工人的生活，引发共鸣。

参考提示词 (Prompt)

你是一位非常专业的做西游记人物唱歌的短视频博主，非常擅长创作西游记人物的二创歌词。请你以【女儿国国王】为第一视角，创作一段流行歌曲的歌词。以下是我的详细要求： 1. 角色一定要符合原著的角色特征（如深情、遗憾）。 2. 歌词需要结合现代人的生活现状以及生活中的困扰，比如赚钱难、想要稳定的生活、工作比较累、对未来迷茫、背负巨大的压力等，要让歌词成为现代人的“嘴替”。 3. 歌词要融入原著中的专属元素，比如取经八十一难、紧箍咒、雷音寺、如来佛等。 4. 要求用神话以及原著中的故事场景隐喻现实中的困难，比如用“取经路”来形容“打工路”，妖魔鬼怪用于形容生活中的各种挫折和苦闷。请帮我确定好歌曲的风格提示词并生成歌词，适用于Suno AI生成歌曲。

生成的歌词可以直接用于下一步。如果想要更好的效果，可以多生成几次挑选最“扎心”的句子。你可以将【女儿国国王】换为任意你想要的角色，比如孙悟空等等，从而生成无数个歌词

2

AI 歌曲生成

方法一：全自动原创

使用 Suno AI（建议先学习）

适合完全没有音乐基础的人。Suno 会根据你的歌词和风格描述直接生成完整的歌曲。

1 打开 Suno AI 官网，点击 "Create"。
2 开启 "Custom Mode" (自定义模式)。
3 将 deepseek 生成的歌词粘贴到 Lyrics 框。
4 填入风格提示词 (如: Pop, Ballad, Female Vocals)。
5 点击 "Create"，生成后下载音频。

方法二：旧曲新词

下载 RVC / 变声工具

保留原曲的旋律，只修改歌词。适合改编经典老歌。（需注意版权）。

基本流程： 1. 使用人声分离工具将原曲分离为“人声”和“伴奏”。
2. 将人声导入 RVC/AI 翻唱工具。
3. 输入新歌词，替换原有内容。
4. 将生成的新人声与原伴奏在剪辑软件中合成。

长期运营建议使用方法一原创歌曲，避免版权风险。

关键提示：音频时长

为了配合后续的 AI 对口型工具，建议将下载的歌曲裁剪成片段：

如果是用云端工具 (即梦)，通常限制单次生成时长，建议裁剪为 15-28秒 的片段。
如果是本地工具，时长限制较少。但是也建议裁剪为30秒左右的片段再生成对口型视频

3

角色形象定制

我们需要先从任意网站找到一张高质量的角色图片，比如百度。为了让视频更有反差感，我们可以让古装角色出现在现代录音棚里，需要用到AI工具把你找到的角色图转换为在录音棚里。推荐工具：豆包或即梦AI生图。

生图提示词思路

要点 1

保持角色面部特征和发型、穿着不变（如女儿国国王的头饰）。

要点 2

背景改为现代录音棚 (Recording Studio)。

要点 3

人物前方有专业麦克风，且是唱歌的状态 (Singing)，表情自然。

要点 4

不要遮挡面部，尤其是嘴巴区域，否则影响口型生成。

保持图中角色的面部特征发型，穿着等不变

将背景更换为现代专业录音棚，录音棚内灯光明亮柔和，

角色的侧前方有专业话筒录音，话筒不要遮挡角色面部，角色戴着专业监听耳机，唱歌的状态，表情自然

生成6张图片。. --ar 3:4

点击复制豆包生图中文提示词参考。输入到豆包中，然后将你从网上找到的女儿国国王的图片也一并上传，然后就会生成6张图片，下载保存挑选你喜欢的即可。

4

让图片动起来 (对口型)

这是最关键的一步，我们需要让静态的图片根据我们的音频“张嘴唱歌”。

方案 A：即梦 AI (或其他云端工具)

操作简单，无需电脑配置，在线即可完成。

上传生成的角色图片。
选择“数字人”功能。
上传你的音频片段 (建议 <29秒)。
动作描述填写：人物在唱歌，深情专注，表情自然。
点击生成。

方案 B：Infinite Talk (本地开源工具)

点击下载 Infinite Talk 整合包 (网盘链接)

* 需自行替换代码中的链接

效果最好，面部晃动自然，无时长限制，但对电脑显卡有要求 (建议 NVIDIA 3060以上)。

下载并部署 Infinite Talk 整合包。
导入图片和音频。
勾选“高清修复” (Face Enhancer) 保证面部清晰。
设置分辨率与原图一致。
开始生成。

5

剪辑合成

因为对口型生成的视频通常是片段，我们需要在剪辑软件（如剪映）中把它们拼起来。

拼接片段

按顺序排列生成的视频片段。

添加转场

片段连接处使用“叠化”消除跳跃感。

添加字幕

使用“识别歌词”功能自动加字幕。

变现思路

1. 流量分成

发布在 YouTube, B站, 抖音等平台。这类视频情绪价值高，完播率和评论互动通常很好，容易获得平台补贴。

2. 定制服务

在闲鱼或私域接单。为客户制作特定角色的祝福视频、或者帮别人把写好的词做成歌。这本质是卖“技术差”。

3. 广告商单

积累粉丝后，品牌方（如游戏、APP）会找你做角色口播广告，或者将广告词改编进歌词里进行软植入。