← 上一章 返回课程主页 下一章:RAG 专属知识库 →
CHAPTER 06 / 10 · 2 小时实战课

🧑‍🎤 AI 数字分身 + 声音克隆

3 分钟训练数字人 · 30 秒克隆你的声音 · 文稿一键变出镜视频 · 不用设备不用录 · 产出你的第一段数字分身讲解片

完成下面 12 个任务,解锁「数字分身主理人」徽章

🗺 学习地图(约 120 分钟 · 8 个小节)

A · 开场(10 min)

讲师老周日更 + 远方儿子给爸妈讲解

B · 工具横评(20 min)

HeyGen / 腾讯智影 / 闪剪 / 硅基 / 即创

C · 训练素材(20 min)

3 分钟录像 · 好素材 vs 坏素材

D · 声音克隆(20 min)

30 秒录音 · 豆包 / 魔音 / ElevenLabs

E · 分身说话(20 min)

文稿 → 数字人视频

F · 表情 / 口型 / 场景(20 min)

让分身"看起来不假"

G · 🎯 产出 · 1 分钟讲解片(20 min)

可用可发 · 终身复用

H · 打卡 + 预告(10 min)

徽章 + 伦理底线 + 第 7 章

PART A · 开场 ⏱ 10 min

为什么"数字分身"是 2025 最有杠杆的个人资产?

> CLONE LAB v2.5 · HOLOGRAPHIC SCAN IN PROGRESS

🧑
REAL YOU 1 人 · 24 小时
⇢⇢
🧑‍🎤
DIGITAL YOU ∞ 副本 · 永不疲倦
TRAINING
99.7%
📚
知识博主
一次训练 · 日更讲解视频
🛒
电商直播
数字人 24 小时值班
👨‍🏫
微课 / 企培
标准化讲解 · 可重复
👨‍👩‍👧
远方亲情
每日语音陪伴父母
🌐
多语言分身
中文 → 英/日/韩一键
📣
品牌代言
小团队也能"有代言人"
🏥
医生分身
科普 / 术前讲解
🎓
导师答疑
学生 24h 点播听讲

你在深圳加班,爸妈在老家想听你讲话;你在卖课,但每周只能录 3 支视频;你是老师,学生想随时点开你讲题……数字分身让"你"变成可复制的数字资产——一次训练,终身调用。

📖 学员 · 老周 · 48 岁 · 财税讲师

过去他一周最多录 3 支讲解视频,嗓子经常发炎。用 HeyGen 训了一个数字分身后,一天写 10 个文稿、分身一键生成 10 个视频。3 个月粉丝从 8000 涨到 6 万,变现 26 万。他本人那段时间在医院陪爸爸——没耽误。

📖 学员 · 小雨 · 27 岁 · 远方打工女儿

妈妈不识字,生病期间靠视频陪伴。小雨用即创克隆自己的声音 + 数字形象,每天录 30 秒文稿 → 分身讲给妈妈听。妈妈说:"你虽然不在,但天天能看见你的脸、听见你的话。"——这是 AI 温度的一面。

💡 核心洞察

"出镜焦虑"挡住了 80% 想做自媒体的人。数字分身的本质不是替代你,而是把你的外貌 + 声音变成可反复使用的素材库——你只需要专心写好内容。

数字分身对个人 IP 最大价值是?
PART B · 工具选型 ⏱ 20 min

数字分身 + 声音克隆 · 2025 主流工具横评

工具类型训练时长免费额度推荐场景
HeyGen数字人 + 声音2 分钟视频免费 3 个视频英文 + 跨境内容 · 顶级质量
腾讯智影数字人 + 声音3~5 分钟免费额度较大本章主线 · 中文讲解
闪剪 AI数字人 + 声音1~3 分钟免费版带水印短视频博主 · 口播号
硅基智能数字人商业版需企业定制商业付费直播 / 电商直播数字人
即创(字节)数字人 + 声音3 分钟免费额度抖音 / 视频号生态
豆包语音仅声音克隆30 秒录音✅ 完全免费纯音频场景 / 播客 / 口播
ElevenLabs仅声音克隆30 秒~1 分钟基础免费英文有声书 / 情感克隆最强
魔音工坊仅声音克隆30 秒免费试用中文配音 · 自媒体
🎯 本章推荐
  • 数字人:腾讯智影zenvideo.qq.com)——中文友好、免费额度大、微信生态
  • 声音:豆包声音克隆——30 秒录音、完全免费、中文最自然
  • 英文场景:HeyGen + ElevenLabs——国际级质量
🛠 动手任务 · 5 分钟

打开腾讯智影 → 找"数字人"→ "定制数字人"入口;同时打开豆包 → 找"语音合成"→ "声音克隆"入口。确认你能看到这两个按钮——这就是本章的起跑线

⚠️ 伦理红线 · 上手前必看

  • 只训练"你自己"的形象和声音,不要用别人的素材(违法)
  • 输出视频中明显注明"AI 分身"(平台规则 + 避免诈骗嫌疑)
  • 不要用来冒充他人做表态 / 承诺 / 借钱
  • 家人给的语音素材,必须明确告知 + 得到同意再克隆
PART C · 第一课 · 训练素材 ⏱ 20 min

3 分钟训练视频 · 好素材决定分身"是否像你"

数字人像不像你,不靠算法升级,靠你喂给它的 3 分钟视频质量。遵守下面这份"拍摄清单",你的分身会像真人;不遵守,出来像塑料。

✅ 好素材清单

  1. 手机固定在三脚架 / 书桌支架
  2. 距离 1 米,胸口以上构图
  3. 正对相机 · 眼神看镜头
  4. 纯色 / 简洁背景(不要窗户逆光)
  5. 柔和正面光(不要顶光)
  6. 穿纯色上衣(不要花纹 / 格子)
  7. 自然说话 · 带日常表情
  8. 录 3 分钟连续 · 中间不剪辑
  9. 必要时做"张嘴 / 闭嘴 / 微笑"各 10 秒

❌ 翻车素材

  • 手持手机(画面晃 → 分身抖)
  • 逆光 / 窗户 / 顶光
  • 花衣服 / 挂饰 / 大耳环(算法识别出错)
  • 表情僵硬(分身没情绪)
  • 不停低头看稿(嘴巴角度不够)
  • 带眼镜反光(反射光斑识别错)
  • 背景有人走动
3 分钟训练脚本(直接拿来读)
【表情 30 秒】 微笑 5 秒、正常表情 5 秒、认真 5 秒、 抿嘴 5 秒、惊讶 5 秒、点头 5 秒。 【日常口播 120 秒】(任挑) 大家好,我是 [你的名字],今年 XX 岁,来自 [城市]。 今天是 XX 月 XX 日,天气很好,我想和大家聊聊我最近做的 3 件事: 第一,我开始学 AI 了,我发现 AI 能帮我做好多事…… 第二,我家里最近 XXX…… 第三,我觉得生活中最重要的是 XXX…… ……(自由扩展到 2 分钟) 【张嘴口型 30 秒】 请分别说:啊、哦、鹅、咦、呜,每个音重复 3 次。 再说一个绕口令:"四是四,十是十,十四是十四,四十是四十"。
📖 老周的拍摄小窍门

他说:"训练视频我录了 3 次都不满意,第 4 次戴眼镜摘了、挪到客厅北面纯白墙前、用台灯 45 度打侧光——分身立刻像真人。"——光和背景比镜头重要

🔍 拍摄完毕 · 6 项自动质检(任何一项不过都请重拍)

📐相机是否完全静止(三脚架或支架)PASS
💡面部正面光 + 无反光斑(摘眼镜)PASS
🎭背景纯色无杂物 · 无其他人出现PASS
👕穿纯色上衣 · 无花纹 / 挂饰PASS
😀录了 6 种表情 + 5 个口型音PASS
单段连续时长 ≥ 3 分钟 · 中间无剪辑PASS

💡 6 项任何一项标红 → 回去重录。这是一次性投入、终身复用的资产,值得多录 2 遍。

CLONE LAB · 训练素材实录 · 10 步走(15 分钟)

  1. 清场(3 分钟):挪到客厅 / 书房纯色墙前。
    • 清掉桌面所有东西(杯子 / 书 / 电线)
    • 关空调 / 风扇 / 窗户(消除嗡嗡声 + 气流吹头发)
    • 让家人 / 宠物暂时离开房间
    ✅ 做完的样子:你身后是纯色墙 · 镜头里除了你没有任何其他东西
  2. 架设备(1 分钟)
    • 手机 / 家用摄像头 → 固定在三脚架或桌面支架(手持绝对不行)
    • 镜头与胸口同高(不要俯拍或仰拍)
    • 距离 1 米 左右 · 能看到你上半身 + 一只手挥动空间
    • 画质设置 1080P / 30fps(别开 4K · 文件太大影响训练速度)
    ✅ 做完的样子:取景框下半部是桌面边缘 · 上半部留一拳空隙
  3. 补光(1 分钟)
    • 首选顺光:人脸正对窗户 · 窗外不是直射阳光(阴天/上午最佳)
    • 无自然光 → 台灯放镜头旁 45° 侧面
    • 严禁头顶正上方的吊灯(会打死黑眼圈)
    • 严禁逆光(窗户在你身后 → 你会变剪影)
    ⚠ 翻车点:窗户逆光 = 生成出来的分身脸糊 · 怎么训都救不回来
  4. 换衣服 + 去配饰(1 分钟)
    • 纯色上衣 · 推荐白 / 灰 / 深蓝(AI 最容易抠像)
    • 摘掉耳环 · 项链 · 手表 · 眼镜(反光会干扰训练)
    • 头发别挡耳朵 / 眼睛
    • 有化妆需求 → 化"看起来没化妆"的淡妆
    ✅ 做完的样子:镜头里你是一个"五官清晰 + 轮廓干净"的人像
  5. 热身(1 分钟):正式录之前练一遍:
    • 对镜头微笑 3 次 → 严肃 2 次 → 惊讶 2 次 → 思考 2 次
    • 说"一二三四五上山打老虎"各种情绪试一遍
    • 喝口温水润喉
  6. 录制 3 分钟 · 分三段(4 分钟):点录像键中间不要停,按下顺序:
    • 0~30 秒 · 表情段:平静 5s → 微笑 5s → 严肃 5s → 惊讶 5s → 思考 5s → 开心大笑 5s
    • 30~150 秒 · 口播段:读一段你准备好的 120 秒文本(可以用 PART D 那段黄金文稿)
    • 150~180 秒 · 口型段:清晰念"啊~哦~一二三四五六七八九十"重复 2 次
    ✅ 做完的样子:一条完整的 3 分钟 mp4 · 中间没有一刀剪辑
  7. 质检 6 项(1 分钟):回放视频,按上面"6 项质检卡"逐条核对:
    • 构图稳(没晃)· 光线匀(没过曝)· 背景干净(无杂物)
    • 口型清晰 · 眼神自然 · 表情 4 种
    ⚠ 任何 1 项不合格 → 回第 1 步重录。一次性投入、终身复用,多录 2 遍值得。
  8. 命名保存(30 秒)
    • 新建本地文件夹 06-分身/
    • 视频改名 train-raw.mp4
    • 同步备份到云盘(iCloud / 百度网盘 / OneDrive)
  9. 签授权书(1 分钟):打开上方黄框 CONSENT 卡 → 填你的姓名 + 今天日期 → 截图保存。
    • 把截图保存为 06-分身/consent-signed.png
    • 即使以后不发布 · 也是你作为 AI 用户的专业记录
    ✅ 做完的样子:文件夹里 2 个文件 · train-raw.mp4(~200MB)+ consent-signed.png
  10. 心态打卡(30 秒):对自己说一句:
    "从今天起,我有一个会 24 小时在线的我自己。他会替我见客户、教孩子、发视频——而我去做更值得做的事。"
    ✅ 做完的样子:你做完了 2025 年最高杠杆的 15 分钟
录训练素材时最不该省略的是?
PART D · 第二课 · 声音克隆 ⏱ 20 min

30 秒录音 · 克隆出你的声音

声音克隆比数字人简单得多:你只需要一段30 秒~1 分钟的干净录音,AI 就能学会你的音色、语速、情绪。

  1. 找一个安静房间(关窗关空调,家里人不在时)
  2. 手机靠近嘴 10 公分(近场录音,信噪比最好)
  3. 读下面"黄金 30 秒文稿"——包含多种语气
  4. 上传到豆包声音克隆doubao.com → 搜"声音克隆")
  5. 等 2 分钟即可,克隆完成后给个"试用文本"让它说说看
  6. 满意就保存到你的"我的声音",以后所有 TTS 都可用
黄金 30 秒克隆文稿(情绪均衡 · 可直接读)
大家好,我是 [你的名字],很开心今天能和你们聊一聊。 最近我在学一门新课,学到了一件让我特别震惊的事情—— 原来 AI 可以帮我们完成这么多事,比如写文章、做视频、 画图片,甚至模拟我们的声音。 你有没有遇到过,想说什么但就是说不出口的时刻? 我觉得 AI 最打动我的,不是它多聪明, 而是它替我们节省了很多"做决定"的时间, 让我们能把真正的时间,留给真正重要的人。
📖 小雨给妈妈录的"每日晚安"

她只录了一次 30 秒,之后每天只写一段文稿,让"她的声音"读给妈妈听。妈妈不懂技术,觉得女儿每天"真的录给她"。这个工具花了 0 元。

> VOICEPRINT ANALYSIS · [你的名字]

DURATION00:00:32.4
SAMPLE RATE44.1 kHz
SNR42 dB · 优
PITCH RANGE110~220 Hz
EMOTION COVERAGE4/4 ✓
CLONE READY✓ PASS

CLONE LAB · 30 秒克隆你的声音 · 10 步走(10 分钟)

  1. 找安静房间(1 分钟)
    • 关窗 · 关空调 / 风扇 · 关冰箱(嗡嗡声是第一杀手)
    • 避开人声 / 电视 / 宠物
    • 推荐窗帘厚的卧室(软家具吸声最好)· 次选书房
    ⚠ 翻车点:厨房 / 浴室 = 瓷砖回声大 · 克隆出来像电话筒声音
  2. 打开录音工具(30 秒)
    • iPhone:"语音备忘录" App · 默认格式 m4a
    • 安卓:"录音机" 或微信 → 我 → 收藏 → 语音
    • 电脑:Mac 用 QuickTime · Win 用"语音录音机"
  3. 近场录音(3 分钟)
    • 手机离嘴 10 cm(比平时打电话近一倍)
    • 手机斜过来避开正对嘴——防"噗"声(爆破音)
    • 深呼吸 2 次 → 点录音键 → 读上方"黄金 30 秒文稿"
    • 语气=跟朋友聊天,不要朗诵腔 / 不要字正腔圆
    • 读到"你有没有遇到过……" 这里要有疑问语气(疑问覆盖就靠这句)
    • 读完再停 2 秒再点停止(留尾音)
    ✅ 做完的样子:一段 30~40 秒的 m4a / mp3 · 文件大小 300~800KB
  4. 质量自检(1 分钟):戴耳机听回放:
    • 有"噗"声(爆破音)?→ 重录,手机再斜一点
    • 有"嘶嘶"本底噪音?→ 换房间 / 关噪音源 重录
    • 语气太平?→ 带情绪 重录(情绪覆盖不够是最大翻车原因)
    • 全程清晰 + 有起伏 → ✅ 通过
  5. 打开豆包(30 秒):浏览器 / App 访问 doubao.com → 手机号登录。
    • 顶部搜索 "声音复刻""声音克隆" → 进入
    • 首次使用需手机号验证 + 人脸识别(平台防盗声)
    ✅ 做完的样子:进入"开始录制 / 上传我的录音"页
  6. 上传录音 + 活体校验(2 分钟)
    • 上传本地文件 → 选刚才的 m4a/mp3
    • 系统会让你再朗读一句随机出现的文字(活体校验防盗用)
    • 读那句话 → 系统比对音色 → 通过
    ⚠ 若活体没通过 → 你上传的录音质量太差,重录第 3 步
  7. 等待克隆完成(1~2 分钟):进度条走完 → 弹出试听框。
    • 给克隆命名 [你的名字]-专属-v1
    • 免费账号每月 3~5 次 · 付费无限
    ✅ 做完的样子:你的声音库多了一条带你名字的音色
  8. 测试 3 种情绪(2 分钟):在输入框逐条输入,听效果:
    • 😄 开心:"我今天做成了一件大事!超级激动!"
    • 😌 平静:"今天天气还不错,想出去走走。"
    • 😤 严肃:"请大家注意一下这个数据——不能忽视。"
    • 3 条都像你 → ✅ 通过
    ⚠ 3 条里 ≥1 条不像 → 第一嫌疑是情绪覆盖不够,回第 3 步重录一份情绪差异更大的
  9. 保存 + 试用场景(1 分钟):点右上 保存到声音库
    • 跨产品复用:第 4 章播客旁白 / 第 5 章视频配音 / 本章数字人 / 给父母录晚安
    • 同一声音库入口:豆包 / 剪映 / 腾讯智影(扫码连接)
  10. 打卡(30 秒):发一段给自己用克隆声音生成的"给未来自己的话"给家人群:
    "嗨,这是 AI 版的我。以后爸妈想我了,我会每天发一条。"
    ✅ 做完的样子:家人群第一次听到"你的声音"不是你本人发的
30 秒声音克隆素材质量最关键的 3 点是?
PART E · 第三课 · 分身说话 ⏱ 20 min

文稿 → 分身视频 · 一次训练,永远调用

  1. 登录腾讯智影 → 左侧"数字人"→ "我的专属数字人"
  2. 上传 3 分钟训练视频,起名(推荐"XXX-商务版"/"XXX-亲和版"可训不同风格)
  3. 等 30 分钟~2 小时训练完成(邮件通知)
  4. 创建"视频作品"→ 选你的数字人 + 你克隆的声音 + 粘贴文稿
  5. 点生成,约 3~10 分钟产出 1 分钟视频(MP4)
  6. 预览 + 微调(下一节讲表情/口型/背景)
  7. 导出,1080P 无水印
数字人视频文稿 · 60 秒黄金模板
【0~5s 钩子】 "你是不是也遇到过 XXX 的烦恼?" 【5~15s 痛点共鸣】 "我 XX 岁那年,我也……"(讲一个短故事 / 身份) 【15~45s 干货 3 点】 "其实解决办法很简单,我总结了 3 条: 第 1 点:…… 第 2 点:…… 第 3 点:……" 【45~55s 证据】 "我身边有个朋友 / 学员 / 客户 XX,靠这 3 点 XX。" 【55~60s 行动号召】 "点赞 + 关注,下期教你 XXX。私信「XX」我发你 XX 工具。"
📖 老周的"流水线作业法"

他周日花 2 小时写 10 个文稿,分身+声音在周一早上跑完生成 10 个视频,每天发 1 条。一周 7 天无缝更新,他本人不必每天对着镜头。这是真正的"被动内容系统"。

CLONE LAB · 提交训练 + 生成第一条视频 · 10 步走(15 分钟)

  1. 打开腾讯智影(30 秒):浏览器访问 zenvideo.qq.com
    • 右上 微信扫码登录(用你常用微信扫)
    • 首次会问"实名认证"→ 跟随提示做 · 平台合规要求
    ✅ 做完的样子:主页显示你的头像 · 左侧有"数字人 / 我的素材"栏
  2. 进入数字人训练入口(30 秒)
    • 左侧菜单 → 数字人 → 顶部切到 "定制数字人" tab
    • 点大按钮 + 创建专属数字人
  3. 上传训练视频(2 分钟)
    • 拖入 train-raw.mp4(或点"选择文件")· 约 1~2 分钟上传
    • 给分身起名:[你的名字]-商务版(以后可再训亲和版 / 卡通版)
    • 可选:上传 3 张正面高清照(辅助训练,优先级 < 视频)
    ✅ 做完的样子:上传完成 · 显示"视频分析中"进度条
  4. 勾选授权 + 提交训练(30 秒)
    • 平台弹窗:"请上传授权书" → 上传你刚才截图的 consent-signed.png
    • 勾选 "我已获得授权"(这就是为什么前面让你先签授权书)
    • 提交训练
    ⚠ 训练队列高峰期可能排 30 分钟~2 小时 · 训练完成会有邮件 + 站内信通知
  5. 等待时先走一遍官方模板(3 分钟)这一步极大提升熟练度
    • 左侧 创建作品数字人视频
    • 随便选一个公共分身(平台预训好的,立即可用)
    • 文稿框粘入上方"60 秒黄金模板"文字
    • 声音下拉 → 选上一节克隆的"[你的名字]-专属-v1"
    • 预览 → 3 分钟看效果
    ✅ 做完的样子:虽然脸不是你的,但声音是你的 · 已经足够震撼了
  6. 训练完成 · 切换到专属分身(1 分钟):邮件 / 通知来了后:
    • 回到刚才的"创建作品"页
    • 数字人下拉从"公共分身" → 切到 "我的专属 / [你的名字]-商务版"
    • 声音保持克隆版不变
    • 生成(约 3~10 分钟出片)
  7. 预览 3 项自查(2 分钟):生成完了点播放:
    • 口型对位:嘴巴张开闭上跟声音对得上吗?(错位 → 回文稿加标点断句)
    • 表情自然:眨眼 / 微点头 / 眼神有没有呆视?
    • 声音是你:是不是你克隆的那版?(选错了就切回重生成)
    • 3 项全过 → ✅ 通过
  8. 导出视频(1 分钟):右上 导出
    • 格式选 MP4,分辨率 1080P
    • 勾选 "无水印"(免费版有水印 · 付费版可去)
    • 下载到本地 · 命名 06-分身/clip01.mp4
    ✅ 做完的样子:本地 60 秒 mp4 · 约 20~50MB · 播着就是"另一个你"在讲课
  9. 盲测 3 位熟人(2 分钟):发给 3 个熟朋友,先不说明,只问:
    "这条视频是我本人录的,还是 AI 分身?猜对我请你喝奶茶。"
    ✅ 做完的样子:2 / 3 人猜错 = 你的分身过关 · 可以正式用 ⚠ 3 人都猜是 AI · 多半是表情不够——PART F 会救
  10. 归档打卡(1 分钟)
    • 视频存 06-分身/clip01.mp4
    • 朋友圈发一条(可选):"第一次用 AI 做了'我自己'在说话 · 你敢分辨吗?"
数字分身视频质量最终取决于?
PART F · 第四课 · 微调 ⏱ 20 min

表情 / 口型 / 背景 · 让分身"看起来不假"

新手的数字人视频最容易被识破:嘴在动,脸没表情;眼睛直盯;背景不变。下面 5 招让你的分身逼真度瞬间提升。

① 口型同步精度

文稿用短句 + 标点密集。AI 按标点断句,长句会糊嘴。

② 加表情标签

在文稿里插入 [微笑][点头][思考] 标签,AI 会在对应位置调用表情。

③ 加手势动作

智影支持 [指向右侧][双手展开] 这类动作,让分身不死板。

④ 换背景

绿幕扣像 + AI 生成背景(办公室 / 咖啡馆 / 户外),同一分身用不同场景。

⑤ 加 B-roll 空镜

视频中间插 3~5 秒空镜(产品图 / 字幕卡 / 数据图),避免观众只盯一张人脸。

⑥ 声音情绪

豆包克隆后试一下"开心 / 严肃 / 惊讶"情绪模式,不要全篇一个调。

带表情标签的文稿示例
[微笑] 大家好,我是老周! [点头] 今天给大家分享 3 个容易被忽视的社保冷知识。 [思考] 第一点,其实很多人都不知道——灵活就业缴费有补贴! [指向右侧] 数据显示,2024 年各省补贴范围在 30% 到 70%。 [严肃] 第二点,断缴超过 3 个月,部分待遇清零! [惊讶] 第三点,这一条连 HR 都很少说…… [点头] 如果对你有启发,点赞支持一下!
📖 背景切换 · 一个分身当 3 个博主

学员 Kiki 用腾讯智影训了 1 个数字人,靠"换背景 + 换衣服"实现了办公室风(职场号)、厨房风(美食号)、书房风(读书号)3 个不同账号运营。同一张脸运营 3 条赛道,3 个月累计粉丝 10 万+。

CLONE LAB · 让分身"活过来"的 8 步走(10 分钟)

  1. 打开 clip01 文稿(1 分钟):回到腾讯智影 → 我的作品 → 找到 clip01 → 点 编辑
    • 右侧面板出现文稿编辑框
    • 通读一遍 · 找出节奏停顿点
  2. 标出 5 个高亮位置(2 分钟):用不同颜色 / 下划线标:
    • 🔵 问句(如"你是不是也……")→ 待加 [微笑]
    • 🟡 数字(如"3 个方法")→ 待加 [指向右侧]
    • 🟢 高光结论(如"关键在于……")→ 待加 [点头]
    • 🟣 转折(如"但是……")→ 待加 [思考]
    • 🔴 结尾行动号召("关注/点赞")→ 待加 [双手展开]
  3. 插入表情 / 动作标签(2 分钟)
    • 在每个标记位置前直接输入 [微笑] 等标签(方括号不能漏)
    • 标签与正文之间保留一个空格(否则不触发)
    • 平台支持的完整标签:[微笑][点头][指向右侧][思考][严肃][惊讶][双手展开][抿嘴]
    ⚠ 翻车点:用了英文方括号 · 中文方括号 · 漏了空格 · 都会不触发 → 一定用英文方括号
  4. 重新生成 v2(3 分钟):点 重新生成(消耗 1 次额度,绝对值得)。 ✅ 做完的样子:v2 视频生成完毕,显示在作品列表上方
  5. 验证 5 个标签是否触发(1 分钟):播放 v2,对照文稿的 5 个标签位:
    • 问句位置 → 嘴角是否上扬?
    • 数字位置 → 是否有手势?
    • 5 处全触发 → ✅ 通过
    • ≥1 处没触发 → 检查方括号 / 空格 / 拼写 → 重新生成
  6. 换背景场景(1 分钟):时间线上方 场景 Tab。
    • 从纯色 / 默认 → 切到 "居家书房"(温暖感)
    • "简约办公"(职业感)/ "咖啡馆"(生活感)
    • 同一分身切 3 种背景 → 运营 3 个不同账号都不违和
    ✅ 做完的样子:镜头里你从纯色墙换到真实场景 · 立刻不"塑料"了
  7. 插 B-roll 空镜(2 分钟):完播率 +15% 的关键。
    • 找文稿里 "嘴部自然停顿"位置(如讲完第一点 → 停顿 1 秒)
    • 时间线对应位置插入 1.5 秒空镜:产品图 / 数据图表 / 关键字幕卡
    • 建议插 3~5 处 · 避免观众看一张人脸看疲劳
  8. 导出 v2 + 对比(1 分钟)
    • 导出 clip02.mp4
    • 把 clip01 和 clip02 并排播放 · 这一步是"塑料"和"真人"的分水岭
    • 如果 v2 被识别"是 AI 分身"的概率降低 50% → 你已经掌握了这门手艺
    ✅ 做完的样子:本地 06-分身/ 有 clip01 + clip02 两版 · 展示技术成长曲线
让数字人"不像假人"最关键的一招是?
PART G · 🎯 本章产出 ⏱ 20 min

产出 · 1 分钟数字分身讲解视频 终身复用素材

CLONE LAB · 交付"永远在线的另一个你" · 10 步走(20 分钟)

  1. 资产盘点(1 分钟):打开 06-分身/文件夹,确认三件套齐活:
    • train-raw.mp4(训练原片)
    • clip01.mp4 + clip02.mp4(练习成果)
    • ✓ 已保存的"克隆声音 v1"
    • consent-signed.png(授权书)
    ✅ 做完的样子:文件夹里 4 个文件齐活 · 知道自己有什么资产
  2. 用 Prompt 出 60 秒文稿(3 分钟)
    • 把下方紫框"60 秒文稿 Prompt"整段复制
    • 粘到豆包 / ChatGPT / Kimi
    • 在 Prompt 开头加三句:
      • 主题:(你真实业务/兴趣/家人场景)
      • 身份:(你是谁 · 一句话)
      • 目标:(涨粉 / 带课 / 留资 / 家人陪伴)
    • AI 返回带表情标签的文稿(180~220 字)
    ✅ 做完的样子:一段已经插好 5~8 个 [微笑][指向] 标签的 60 秒文稿
  3. 生成视频(5 分钟):回腾讯智影:
    • 新建作品 → 数字人视频
    • 分身选 "[你的名字]-商务版"
    • 声音选 克隆 v1
    • 文稿粘进去 → 生成
    • 等 3~10 分钟出片
  4. 进时间线微调(3 分钟)
    • 前 3 秒加大字字幕(直接打上你的一句话钩子 · 字号 60+)
    • 结尾 5 秒加 "关注/点赞/私信 XX"贴纸
    • 可选:加背景音乐(15% 音量,参考第 4 章 BGM 规则)
    ✅ 做完的样子:首帧抓眼球 · 尾帧引导行动 · 中间带 BGM
  5. 加"AI 数字人"合规角标(1 分钟):这一步不能省
    • 时间线 → 贴纸库 → 搜 "AI 数字人"(平台自带模板)
    • 贴到左上角,持续 3 秒(开头闪一下即可)
    • 为什么要加:① 平台合规硬要求 ② 防被举报封号 ③ 诚信运营的底线
    ⚠ 2024 起国内所有平台硬性要求 AI 内容标注 · 不加角标可能被限流甚至封号
  6. 导出 final(1 分钟)
    • 右上 导出 → 1080P · MP4 · 无水印
    • 命名 06-分身/final-v3.mp4
    • 手机过一遍从头看到尾自查
  7. 盲测 3 人(2 分钟):发给 3 个熟人先不说明,问:
    "猜一猜这条视频是我本人录的还是 AI 分身?"
    ✅ 做完的样子:2 / 3 人无法辨别 · 你通过了"数字分身图灵测试"
  8. 选一个平台上线(2 分钟)3 选 1
    • 🌟 做个人 IP:视频号 / 抖音 / 小红书 → 定期更
    • 💼 做业务转化:微信工作群 / 客户群 · 带产品讲解
    • 💝 做情感陪伴:发给父母 / 家人群 · 每天一条问候
    ✅ 做完的样子:视频已经在真实平台上 · 截图保留作为"处女作"
  9. 归档作品集(1 分钟):新建 AI 作品集/06-数字分身/,放入:
    • train-raw.mp4 / 克隆声音.mp3 / final-v3.mp4
    • consent-signed.png / 发布平台截图
    • README.md:简述"我用 [X] 小时做出了第一个会说话的我"
    ✅ 做完的样子:一个完整可展示的求职 / 业务作品集目录
  10. 一周回顾(1 分钟现在承诺 · 1 周后执行)
    • 在日历上标 +7 天 → 回来数"这周分身被我调用了几次"
    • 每多用 1 次 = 你省下 1 次出镜 / 录音时间
    • 目标:1 周内至少调用 3 次(发 3 条视频 / 发 3 条家人问候 / 发 3 条客户讲解)
    "这是我今年做过的最高杠杆的 1 小时投入——此后每一次调用都是复利。"
✨ 数字人文稿 Prompt(让豆包一次写好带标签) 你是短视频编剧。请为我写一条 1 分钟(约 180~220 字)的数字人口播文稿: 主题:[你的主题] 身份:[你的身份] 目标:[涨粉 / 带课 / 留资私信] 要求: 1. 严格按 5 段结构: [0-5s] 钩子 / [5-15s] 痛点 / [15-45s] 3 个干货 / [45-55s] 案例 / [55-60s] 行动 2. 每句不超过 18 字,让口型更清晰 3. 自动插入 5~8 个表情/动作标签([微笑][点头][指向右侧][思考][严肃][惊讶][双手展开][抿嘴]) 4. 结尾行动号召含一个可互动钩子(私信"XX"领 / 评论扣"XX"送) 5. 输出格式:纯文本 + 标签,便于直接粘贴到腾讯智影

🏆 产出验收标准

  • ✅ 数字人已训练并可调用
  • ✅ 克隆声音已保存
  • ✅ 一段 60 秒视频 MP4,1080P
  • ✅ 视频中至少能识别 3 个表情变化
  • ✅ 加了"AI 数字人"声明
  • ✅ 朋友圈 / 群打卡 1 次
  • ✅ 归档「AI 作品集 / 06-数字分身」
💼 进阶玩法 · 家人专属"语音信箱"

用克隆声音每天给远方父母录一段 30 秒文稿(问候 / 天气 / 饭菜),通过微信发送。这不是替代真人,是把"你虽然在忙但心里有他们"的心意数字化地送出去。小雨就是这么做的。

PART I · 🎮 课堂 4 游戏 ⏱ 25 min

巩固关 · 4 个互动游戏让你"分身制作人肌肉上身" 边玩边会

分身这门手艺最难的不是技术,是识得出真假 · 写得出表情标签 · 判得出合规边界 · 想得出应用场景。下面 4 个游戏专门训练这 4 块肌肉。

🕵️ 游戏 1 · 真假分身侦探 · 4 个案例判断真假

给你 4 段视频描述。凭你刚学的知识判断是真人录 vs AI 分身

📹 案例 1:某博主视频 · 整段他对着镜头说话 · 眨眼频率规律 · 头部纹丝不动 · 鼻孔完全不动 · 衣服在 60 秒内完全没有任何褶皱变化
🧑 真人录
🤖 AI 分身
✅ AI 分身。真人鼻孔会微微动(呼吸)· 头部有自然小晃 · 衣服有呼吸带动的褶皱。"一动也不动"是分身最大破绽。PART F 的 B-roll 空镜就是用来掩盖这个问题。
📹 案例 2:讲课视频 · 偶尔笑 · 偶尔用手扶一下眼镜 · 口型与声音有 0.1 秒不同步 · 背景有模糊的书架和窗台上的绿植。
🧑 真人录
🤖 AI 分身
✅ 真人录。关键线索:无意识小动作(扶眼镜)+ 背景有真实生活痕迹(绿植)。AI 分身只会按标签做动作,不会"随手"扶一下。真实窗台角度的绿植远比 AI 背景真实。口型差 0.1s 可能只是视频压缩延迟。
📹 案例 3:网红带货视频 · 口型和声音完美同步 · 左上角有一个"AI 合成"小标识 · 讲了 8 分钟语气完全一致 · 背景纯色。
🧑 真人录
🤖 AI 分身
✅ AI 分身。三个信号全在:① 口型过分完美(真人反而会偶尔错位)② 左上角"AI 合成"角标(这就是 PART G 里必须加的合规标)③ 8 分钟语气零起伏 = TTS 特征。这条合规做得很到位。
📹 案例 4:朋友圈短视频 · 某人对镜头招手 · 手穿过了脸部 · 手指数错了 · 背景有局部扭曲
🧑 真人录
🤖 AI 分身
✅ AI 分身(且是不合格版本)。三个硬伤:手穿脸 = 分层合成错误 · 手指数错 = AI 生成经典 bug · 背景扭曲 = 运动补偿失效。这种分身不能发布,必须回 PART F 重训或加 B-roll 掩盖。
🎯 答对 0 / 4 · 得分 0

🎭 游戏 2 · 表情标签编辑器 · 给文稿点上"活过来"标签

下面是一段 60 秒文稿。点中一行再点下方任意标签 → 自动插入。目标:让每一行都恰到好处带情绪。

🎬 文稿编辑器(点行 · 选标签)

😊 [微笑] 👍 [点头] 👉 [指向右侧] 🤔 [思考] 😐 [严肃] 😲 [惊讶] 🙌 [双手展开] 😏 [抿嘴]
大家好,我是 [你的名字]! 今天给大家分享 3 个容易被忽视的社保冷知识。 第一点:其实很多人都不知道——灵活就业缴费有补贴! 数据显示,2024 年各省补贴范围在 30% 到 70%。 第二点:断缴超过 3 个月,部分待遇清零! 第三点:这一条连 HR 都很少说…… 如果对你有启发,点赞支持一下!

💡 推荐组合:问句→微笑 · 数字→指向右侧 · 高光→点头 · 转折→思考 · 结尾→双手展开

⚖ 游戏 3 · 授权风险判官 · 5 个场景判合规

分身最大的雷区不是技术是法律。下面 5 个真实场景,你判 ✅ 合规 / ❌ 违规。

🎬 场景 1:你用自己训练的分身 + 自己克隆的声音,在视频号带货自家淘宝店,视频左上角标"AI 数字人"。
✅ 完全合规。三个要素都满足:本人肖像 + 本人声音 + 合规角标 + 商品真实。这是标准用法。
🎬 场景 2:你偷偷用朋友一段 30 秒朋友圈视频的声音,做了一个克隆,给他微信里熟人发"借钱"消息。
❌ 严重违法。触犯侵犯肖像权 / 声音权 + 诈骗罪。未经授权克隆他人声音 = 民事侵权。用来骗钱 = 刑事诈骗罪(3 年起)。
🎬 场景 3:你用自己的分身帮公司老板在直播里"代班"讲产品,没加任何 AI 角标,产品信息都真实。
❌ 违反《生成式 AI 服务管理办法》。2024 起中国所有 AI 生成视频 必须标注(不加角标即违规)。即使内容真实,没加标识也会被平台限流 / 下架 / 处罚。
🎬 场景 4:你给父母生成一条"每天晚安视频",不发布任何公开平台,只发家庭群。
✅ 合规。本人肖像 + 本人声音 + 家庭私用场景 + 无商业化。家庭陪伴是分身最温暖的场景,法律完全不管私域分享。
🎬 场景 5:客户让你用他公司代言人(已去世明星)的老视频训一个 AI 分身做品牌宣传。报价 50w。
❌ 拒单。即使已去世,肖像权依然由家属继承 40~50 年(《民法典》1019 条)。客户若没拿到家属签的书面授权,你做了 = 连带侵权。哪怕 500w 也要拒。正确做法:让客户先拿授权。

🎰 游戏 4 · 应用场景盲盒 · 抽出你的分身第一个任务

训完了不知道用在哪?点一下 · 3 秒给你一个具体的身份 + 任务 + 预期效果

🎲 分身任务生成器 · 身份 × 场景 × 效果

点下面按钮 · 抽一个你分身的首秀任务 🎰

💡 连抽 3 次选一个最心动的 · 立刻回 PART G 用这个主题生成视频

PART J · 🚀 数字分身职业跃迁 ⏱ 20 min

会做数字分身的人 · 薪资多少 · 怎么变现 可跳槽 · 可副业

数字人在 2025 年从"玩具"变成了生产力工具——电商平台官方流量倾斜 AI 直播、品牌方预算一半砸虚拟代言人、老师用分身批量上课月入 10w+。这个技能栈卡位极好。

💰 3 档岗位 · 3 档薪资

TIER 1 · 新人入门
🎬 AI 短视频剪辑 / 内容编辑
7~14k / 月
给 MCN / 品牌号 / 知识付费账号剪分身视频——文稿 / 标签 / 背景 / 字幕。会 AI 全套 = 干 2 个人的活。
0~2 年经验,文科 / 设计都能上。
💼 MCN 短视频岗 · 知识付费剪辑 · 品牌号运营助理 · 电商直播脚本
TIER 2 · 本章毕业位
🧬 数字人主理人 / AI IP 运营
18~50k / 月 + 分成
独立操盘一个 AI IP 账号(视频号 / 抖音 / 小红书)· 月产 30+ 条分身视频 · 粉丝 10w+ 可接广告 · 帮品牌 / 个人 IP 代运营。
💼 品牌数字人主理人 · AI IP 运营 · 代运营工作室合伙人 · 企业虚拟代言人 PM
TIER 3 · 进阶目标
🏆 AI IP 创始人 / 数字人 MCN
50k~50w / 月 + 股权
自有分身账号 50w+ 粉丝 + 孵化 10~100 个中小 IP · 或成立数字人 MCN · 接品牌定制单(单单 5w~50w)。
💼 抖音头部 AI IP 主理人 · 数字人 MCN 创始人 · 虚拟代言人团队 CEO

💸 6 条变现路径 · 副业 / 全职都成立

代运营
企业数字人代运营 · 月费 2~10w
1 个客户 1~3w · 同时 3~5 个客户 = 6~15w / 月

品牌老板 / 中小企业想做视频号但没时间 · 你包"训分身 + 月产 30 条内容 + 分发"。AI 让你 1 人顶 5 人小组。

带货
分身带货 · 佣金 10~30%
1 条爆款视频 = 1 个月工资

视频号 / 抖音 / 小红书都可以分身带货。知识付费课 / 书 / 工具软件佣金 20~30% · 1 期爆款能出几万单。

课程
分身制作课 · 单课 399~1999
自带 sales pitch · 复购高

"零基础 7 天做出你的 AI 分身"打包课 · 小鹅通 / 抖音私域卖 · 你自己就是最好的案例。爆款单课 10w+ 份。

定制
品牌虚拟代言人 · 单单 5~50w
做 1 单吃半年 · 高客单价

品牌方要做"虚拟代言人 / 虚拟客服 / AI 客服机器人"。你提供"人设 + 分身 + 声音 + 脚本库"全套。单单 5w 起。

教培
分身讲师批量授课
1 次训 → 终身讲 · 边际成本 0

教师 / 讲师用分身把 30 节课批量生成 · 上架知识星球 / 小鹅通。学员月老师 张三"上百节课"拿 20w / 月 + 长尾收入。

陪伴
情感陪伴服务 · 订阅 99~399 / 月
老人陪伴 / 儿童教育 · 蓝海

帮留守家庭 / 独居老人做"子女 AI 陪聊分身" · 月订阅制。这是道德 + 商业双赢的蓝海赛道。

📄 简历 / 求职加分话术

应聘 AI 内容 / 短视频 / 数字人岗:
"独立训练 1 个专属数字人 + 1 个克隆声音 · 熟练使用 腾讯智影 + 豆包 + 剪映 + NotebookLM · 月产 30+ 条分身视频 · 运营 XX 账号粉丝 XX · 熟悉 AI 内容合规(角标 / 授权 / 平台规则)。"
应聘品牌 / MCN / 代运营:
"能为品牌设计虚拟代言人 / 虚拟客服 / 数字直播三档方案 · 过往代运营 XX 品牌账号 · 节省真人出镜成本 70% · 粉丝从 0 到 XXk。"
应聘 AI PM / 产品 / 战略:
"深度理解 AIGC 产品链——从素材采集 → 模型训练 → 内容生产 → 合规分发 · 能设计端到端数字人产品流程 · 熟悉腾讯 / 阿里 / 字节系工具栈。"
面试黄金回答(问到"AI 分身合规怎么做"):
"我有一套三查三标原则:① 查肖像授权 · ② 查声音授权 · ③ 查商业使用边界 · ① 标平台合规角标 · ② 标商品真实性 · ③ 标 AI 生成声明。过去做的所有内容 0 投诉 0 下架。"
🎯 本章 5 张门票
  • 门票 1 · 资产:训练完的专属分身 + 克隆声音 = 终身复用 · 每次调用都在省时间
  • 门票 2 · 合规思维:授权 + 角标 + 边界 = 你在 AI 时代的保命符
  • 门票 3 · 内容产能:1 次训 → 终身讲 · 从"人打内容"变"内容打人"
  • 门票 4 · 业务杠杆:分身可以 7×24 小时服务客户 · 代替你讲课 / 带货 / 服务
  • 门票 5 · 情感储蓄:给父母 / 孩子 / 爱人的"AI 版你" · 不能取代真实陪伴 · 但能填充空窗
PART H · 打卡 + 预告 ⏱ 10 min

本章 12 项打卡 · 解锁「数字分身主理人」徽章

✅ 完成下面 12 项任务

🎬 下一章预告

第 7 章 · RAG 专属知识库:你会学会把几百份公司制度 / 产品手册 / 家庭资料喂给 AI,让它"只回答你的行业问题"——这是企业 AI 实战最硬的一章。

🧑‍🎤

数字分身主理人

Chapter 06 · 徽章解锁中

你有了一个永远在线的"另一个你"——不用出镜、不用录音、24 小时待命。
第 6 件 AI 作品:一段你从未出镜的数字分身讲解视频。
下一章,我们让 AI"只回答你的问题"——搭建你的专属知识库。

🚀 进入第 7 章:RAG 专属知识库
← 上一章 下一章 →