新手友好 · 无需露脸 · 0门槛

零基础打造 全网疯传
AI角色唱歌视频

不用自己唱,不用自己演。只需简单的复制粘贴,利用 AI 工具,让孙悟空唱 Rap,让林黛玉唱摇滚。掌握这套流程,你也能做出百万播放的爆款视频。

AI写词
豆包
AI作曲
Suno / RVC
角色生成
豆包
对口型
即梦/Infinite Talk
1

灵感与歌词创作

第一步是确定角色和歌词。我们可以利用 deepseek/豆包 让经典角色(如西游记人物)“穿越”到现代,吐槽打工人的生活,引发共鸣。

参考提示词 (Prompt)
你是一位非常专业的做西游记人物唱歌的短视频博主,非常擅长创作西游记人物的二创歌词。 请你以【女儿国国王】为第一视角,创作一段流行歌曲的歌词。 以下是我的详细要求: 1. 角色一定要符合原著的角色特征(如深情、遗憾)。 2. 歌词需要结合现代人的生活现状以及生活中的困扰,比如赚钱难、想要稳定的生活、工作比较累、对未来迷茫、背负巨大的压力等,要让歌词成为现代人的“嘴替”。 3. 歌词要融入原著中的专属元素,比如取经八十一难、紧箍咒、雷音寺、如来佛等。 4. 要求用神话以及原著中的故事场景隐喻现实中的困难,比如用“取经路”来形容“打工路”,妖魔鬼怪用于形容生活中的各种挫折和苦闷。 请帮我确定好歌曲的风格提示词并生成歌词,适用于Suno AI生成歌曲。

生成的歌词可以直接用于下一步。如果想要更好的效果,可以多生成几次挑选最“扎心”的句子。你可以将【女儿国国王】换为任意你想要的角色,比如孙悟空等等,从而生成无数个歌词

2

AI 歌曲生成

方法一:全自动原创

使用 Suno AI(建议先学习)

适合完全没有音乐基础的人。Suno 会根据你的歌词和风格描述直接生成完整的歌曲。

  1. 1 打开 Suno AI 官网,点击 "Create"。
  2. 2 开启 "Custom Mode" (自定义模式)。
  3. 3 将 deepseek 生成的歌词粘贴到 Lyrics 框。
  4. 4 填入风格提示词 (如: Pop, Ballad, Female Vocals)。
  5. 5 点击 "Create",生成后下载音频。
方法二:旧曲新词

下载 RVC / 变声工具

保留原曲的旋律,只修改歌词。适合改编经典老歌。(需注意版权)。

基本流程: 1. 使用人声分离工具将原曲分离为“人声”和“伴奏”。
2. 将人声导入 RVC/AI 翻唱工具。
3. 输入新歌词,替换原有内容。
4. 将生成的新人声与原伴奏在剪辑软件中合成。

长期运营建议使用方法一原创歌曲,避免版权风险。

关键提示:音频时长

为了配合后续的 AI 对口型工具,建议将下载的歌曲裁剪成片段:

  • 如果是用云端工具 (即梦),通常限制单次生成时长,建议裁剪为 15-28秒 的片段。
  • 如果是本地工具,时长限制较少。但是也建议裁剪为30秒左右的片段再生成对口型视频

3

角色形象定制

我们需要先从任意网站找到一张高质量的角色图片,比如百度。为了让视频更有反差感,我们可以让古装角色出现在现代录音棚里,需要用到AI工具把你找到的角色图转换为在录音棚里。推荐工具: 豆包即梦AI生图

生图提示词思路
要点 1

保持角色面部特征和发型、穿着不变(如女儿国国王的头饰)。

要点 2

背景改为现代录音棚 (Recording Studio)

要点 3

人物前方有专业麦克风,且是唱歌的状态 (Singing),表情自然。

要点 4

不要遮挡面部,尤其是嘴巴区域,否则影响口型生成。

保持图中角色的面部特征发型,穿着等不变

将背景更换为现代专业录音棚,录音棚内灯光明亮柔和,

角色的侧前方有专业话筒录音,话筒不要遮挡角色面部,角色戴着专业监听耳机,唱歌的状态,表情自然

生成6张图片。. --ar 3:4

点击复制 豆包生图 中文提示词参考。输入到豆包中,然后将你从网上找到的女儿国国王的图片也一并上传,然后就会生成6张图片,下载保存挑选你喜欢的即可。

4

让图片动起来 (对口型)

这是最关键的一步,我们需要让静态的图片根据我们的音频“张嘴唱歌”。

方案 A:即梦 AI (或其他云端工具)

操作简单,无需电脑配置,在线即可完成。

  • 上传生成的角色图片。
  • 选择“数字人”功能 。
  • 上传你的音频片段 (建议 <29秒)。
  • 动作描述填写:人物在唱歌,深情专注,表情自然。
  • 点击生成。

方案 B:Infinite Talk (本地开源工具)

点击下载 Infinite Talk 整合包 (网盘链接)

* 需自行替换代码中的链接

效果最好,面部晃动自然,无时长限制,但对电脑显卡有要求 (建议 NVIDIA 3060以上)。

  • 下载并部署 Infinite Talk 整合包。
  • 导入图片和音频。
  • 勾选“高清修复” (Face Enhancer) 保证面部清晰。
  • 设置分辨率与原图一致。
  • 开始生成。
5

剪辑合成

因为对口型生成的视频通常是片段,我们需要在剪辑软件(如剪映)中把它们拼起来。

拼接片段

按顺序排列生成的视频片段。

添加转场

片段连接处使用“叠化”消除跳跃感。

添加字幕

使用“识别歌词”功能自动加字幕。

变现思路

1. 流量分成

发布在 YouTube, B站, 抖音等平台。这类视频情绪价值高,完播率和评论互动通常很好,容易获得平台补贴。

2. 定制服务

在闲鱼或私域接单。为客户制作特定角色的祝福视频、或者帮别人把写好的词做成歌。这本质是卖“技术差”。

3. 广告商单

积累粉丝后,品牌方(如游戏、APP)会找你做角色口播广告,或者将广告词改编进歌词里进行软植入。

复制成功!