灵感与歌词创作
第一步是确定角色和歌词。我们可以利用 deepseek/豆包 让经典角色(如西游记人物)“穿越”到现代,吐槽打工人的生活,引发共鸣。
生成的歌词可以直接用于下一步。如果想要更好的效果,可以多生成几次挑选最“扎心”的句子。你可以将【女儿国国王】换为任意你想要的角色,比如孙悟空等等,从而生成无数个歌词
AI 歌曲生成
使用 Suno AI(建议先学习)
适合完全没有音乐基础的人。Suno 会根据你的歌词和风格描述直接生成完整的歌曲。
- 1 打开 Suno AI 官网,点击 "Create"。
- 2 开启 "Custom Mode" (自定义模式)。
- 3 将 deepseek 生成的歌词粘贴到 Lyrics 框。
- 4 填入风格提示词 (如: Pop, Ballad, Female Vocals)。
- 5 点击 "Create",生成后下载音频。
下载 RVC / 变声工具
保留原曲的旋律,只修改歌词。适合改编经典老歌。(需注意版权)。
2. 将人声导入 RVC/AI 翻唱工具。
3. 输入新歌词,替换原有内容。
4. 将生成的新人声与原伴奏在剪辑软件中合成。
长期运营建议使用方法一原创歌曲,避免版权风险。
关键提示:音频时长
为了配合后续的 AI 对口型工具,建议将下载的歌曲裁剪成片段:
- 如果是用云端工具 (即梦),通常限制单次生成时长,建议裁剪为 15-28秒 的片段。
- 如果是本地工具,时长限制较少。但是也建议裁剪为30秒左右的片段再生成对口型视频
角色形象定制
我们需要先从任意网站找到一张高质量的角色图片,比如百度。为了让视频更有反差感,我们可以让古装角色出现在现代录音棚里,需要用到AI工具把你找到的角色图转换为在录音棚里。推荐工具: 豆包 或 即梦AI生图。
保持角色面部特征和发型、穿着不变(如女儿国国王的头饰)。
背景改为现代录音棚 (Recording Studio)。
人物前方有专业麦克风,且是唱歌的状态 (Singing),表情自然。
不要遮挡面部,尤其是嘴巴区域,否则影响口型生成。
将背景更换为现代专业录音棚,录音棚内灯光明亮柔和,
角色的侧前方有专业话筒录音,话筒不要遮挡角色面部,角色戴着专业监听耳机,唱歌的状态,表情自然
生成6张图片。. --ar 3:4
点击复制 豆包生图 中文提示词参考。输入到豆包中,然后将你从网上找到的女儿国国王的图片也一并上传,然后就会生成6张图片,下载保存挑选你喜欢的即可。
让图片动起来 (对口型)
这是最关键的一步,我们需要让静态的图片根据我们的音频“张嘴唱歌”。
方案 A:即梦 AI (或其他云端工具)
操作简单,无需电脑配置,在线即可完成。
- 上传生成的角色图片。
- 选择“数字人”功能 。
- 上传你的音频片段 (建议 <29秒)。
- 动作描述填写:人物在唱歌,深情专注,表情自然。
- 点击生成。
方案 B:Infinite Talk (本地开源工具)
* 需自行替换代码中的链接
效果最好,面部晃动自然,无时长限制,但对电脑显卡有要求 (建议 NVIDIA 3060以上)。
- 下载并部署 Infinite Talk 整合包。
- 导入图片和音频。
- 勾选“高清修复” (Face Enhancer) 保证面部清晰。
- 设置分辨率与原图一致。
- 开始生成。
剪辑合成
因为对口型生成的视频通常是片段,我们需要在剪辑软件(如剪映)中把它们拼起来。
拼接片段
按顺序排列生成的视频片段。
添加转场
片段连接处使用“叠化”消除跳跃感。
添加字幕
使用“识别歌词”功能自动加字幕。
变现思路
1. 流量分成
发布在 YouTube, B站, 抖音等平台。这类视频情绪价值高,完播率和评论互动通常很好,容易获得平台补贴。
2. 定制服务
在闲鱼或私域接单。为客户制作特定角色的祝福视频、或者帮别人把写好的词做成歌。这本质是卖“技术差”。
3. 广告商单
积累粉丝后,品牌方(如游戏、APP)会找你做角色口播广告,或者将广告词改编进歌词里进行软植入。