第 6 章：AI 数字分身 + 声音克隆

PART A · 开场 ⏱ 10 min

为什么"数字分身"是 2025 最有杠杆的个人资产？

> CLONE LAB v2.5 · HOLOGRAPHIC SCAN IN PROGRESS

🧑

REAL YOU 1 人 · 24 小时

⇢⇢

🧑‍🎤

DIGITAL YOU ∞ 副本 · 永不疲倦

TRAINING

99.7%

📚

知识博主

一次训练 · 日更讲解视频

🛒

电商直播

数字人 24 小时值班

👨‍🏫

微课 / 企培

标准化讲解 · 可重复

👨‍👩‍👧

远方亲情

每日语音陪伴父母

🌐

多语言分身

中文 → 英/日/韩一键

📣

品牌代言

小团队也能"有代言人"

🏥

医生分身

科普 / 术前讲解

🎓

导师答疑

学生 24h 点播听讲

你在深圳加班，爸妈在老家想听你讲话；你在卖课，但每周只能录 3 支视频；你是老师，学生想随时点开你讲题……数字分身让"你"变成可复制的数字资产——一次训练，终身调用。

📖 学员 · 老周 · 48 岁 · 财税讲师

过去他一周最多录 3 支讲解视频，嗓子经常发炎。用 HeyGen 训了一个数字分身后，一天写 10 个文稿、分身一键生成 10 个视频。3 个月粉丝从 8000 涨到 6 万，变现 26 万。他本人那段时间在医院陪爸爸——没耽误。

📖 学员 · 小雨 · 27 岁 · 远方打工女儿

妈妈不识字，生病期间靠视频陪伴。小雨用即创克隆自己的声音 + 数字形象，每天录 30 秒文稿 → 分身讲给妈妈听。妈妈说："你虽然不在，但天天能看见你的脸、听见你的话。"——这是 AI 温度的一面。

💡 核心洞察

"出镜焦虑"挡住了 80% 想做自媒体的人。数字分身的本质不是替代你，而是把你的外貌 + 声音变成可反复使用的素材库——你只需要专心写好内容。

数字分身对个人 IP 最大价值是？

A. 免拍照 B. 免费使用 C. 一次训练 · 终身复用 · 解放出镜与录音的瓶颈 D. 换脸玩

PART B · 工具选型 ⏱ 20 min

数字分身 + 声音克隆 · 2025 主流工具横评

工具	类型	训练时长	免费额度	推荐场景
HeyGen	数字人 + 声音	2 分钟视频	免费 3 个视频	英文 + 跨境内容 · 顶级质量
腾讯智影	数字人 + 声音	3~5 分钟	免费额度较大	本章主线 · 中文讲解
闪剪 AI	数字人 + 声音	1~3 分钟	免费版带水印	短视频博主 · 口播号
硅基智能	数字人商业版	需企业定制	商业付费	直播 / 电商直播数字人
即创（字节）	数字人 + 声音	3 分钟	免费额度	抖音 / 视频号生态
豆包语音	仅声音克隆	30 秒录音	✅ 完全免费	纯音频场景 / 播客 / 口播
ElevenLabs	仅声音克隆	30 秒~1 分钟	基础免费	英文有声书 / 情感克隆最强
魔音工坊	仅声音克隆	30 秒	免费试用	中文配音 · 自媒体

🎯 本章推荐

数字人：腾讯智影（zenvideo.qq.com）——中文友好、免费额度大、微信生态
声音：豆包声音克隆——30 秒录音、完全免费、中文最自然
英文场景：HeyGen + ElevenLabs——国际级质量

🛠 动手任务 · 5 分钟

打开腾讯智影 → 找"数字人"→ "定制数字人"入口；同时打开豆包 → 找"语音合成"→ "声音克隆"入口。确认你能看到这两个按钮——这就是本章的起跑线。

⚠️ 伦理红线 · 上手前必看

只训练"你自己"的形象和声音，不要用别人的素材（违法）
输出视频中明显注明"AI 分身"（平台规则 + 避免诈骗嫌疑）
不要用来冒充他人做表态 / 承诺 / 借钱
家人给的语音素材，必须明确告知 + 得到同意再克隆

PART C · 第一课 · 训练素材 ⏱ 20 min

3 分钟训练视频 · 好素材决定分身"是否像你"

数字人像不像你，不靠算法升级，靠你喂给它的 3 分钟视频质量。遵守下面这份"拍摄清单"，你的分身会像真人；不遵守，出来像塑料。

✅ 好素材清单

手机固定在三脚架 / 书桌支架
距离 1 米，胸口以上构图
正对相机 · 眼神看镜头
纯色 / 简洁背景（不要窗户逆光）
柔和正面光（不要顶光）
穿纯色上衣（不要花纹 / 格子）
自然说话 · 带日常表情
录 3 分钟连续 · 中间不剪辑
必要时做"张嘴 / 闭嘴 / 微笑"各 10 秒

❌ 翻车素材

手持手机（画面晃 → 分身抖）
逆光 / 窗户 / 顶光
花衣服 / 挂饰 / 大耳环（算法识别出错）
表情僵硬（分身没情绪）
不停低头看稿（嘴巴角度不够）
带眼镜反光（反射光斑识别错）
背景有人走动

3 分钟训练脚本（直接拿来读）

【表情 30 秒】微笑 5 秒、正常表情 5 秒、认真 5 秒、抿嘴 5 秒、惊讶 5 秒、点头 5 秒。【日常口播 120 秒】（任挑）大家好，我是 [你的名字]，今年 XX 岁，来自 [城市]。今天是 XX 月 XX 日，天气很好，我想和大家聊聊我最近做的 3 件事：第一，我开始学 AI 了，我发现 AI 能帮我做好多事…… 第二，我家里最近 XXX…… 第三，我觉得生活中最重要的是 XXX…… ……（自由扩展到 2 分钟）【张嘴口型 30 秒】请分别说：啊、哦、鹅、咦、呜，每个音重复 3 次。再说一个绕口令："四是四，十是十，十四是十四，四十是四十"。

📖 老周的拍摄小窍门

他说："训练视频我录了 3 次都不满意，第 4 次戴眼镜摘了、挪到客厅北面纯白墙前、用台灯 45 度打侧光——分身立刻像真人。"——光和背景比镜头重要。

🔍 拍摄完毕 · 6 项自动质检（任何一项不过都请重拍）

📐相机是否完全静止（三脚架或支架）PASS

💡面部正面光 + 无反光斑（摘眼镜）PASS

🎭背景纯色无杂物 · 无其他人出现PASS

👕穿纯色上衣 · 无花纹 / 挂饰PASS

😀录了 6 种表情 + 5 个口型音PASS

⏱单段连续时长 ≥ 3 分钟 · 中间无剪辑PASS

💡 6 项任何一项标红 → 回去重录。这是一次性投入、终身复用的资产，值得多录 2 遍。

CLONE LAB · 训练素材实录 · 10 步走（15 分钟）

清场（3 分钟）：挪到客厅 / 书房纯色墙前。
- 清掉桌面所有东西（杯子 / 书 / 电线）
- 关空调 / 风扇 / 窗户（消除嗡嗡声 + 气流吹头发）
- 让家人 / 宠物暂时离开房间
✅ 做完的样子：你身后是纯色墙 · 镜头里除了你没有任何其他东西
架设备（1 分钟）：
- 手机 / 家用摄像头 → 固定在三脚架或桌面支架（手持绝对不行）
- 镜头与胸口同高（不要俯拍或仰拍）
- 距离 1 米 左右 · 能看到你上半身 + 一只手挥动空间
- 画质设置 1080P / 30fps（别开 4K · 文件太大影响训练速度）
✅ 做完的样子：取景框下半部是桌面边缘 · 上半部留一拳空隙
补光（1 分钟）：
- 首选顺光：人脸正对窗户 · 窗外不是直射阳光（阴天/上午最佳）
- 无自然光 → 台灯放镜头旁 45° 侧面
- 严禁头顶正上方的吊灯（会打死黑眼圈）
- 严禁逆光（窗户在你身后 → 你会变剪影）
⚠ 翻车点：窗户逆光 = 生成出来的分身脸糊 · 怎么训都救不回来
换衣服 + 去配饰（1 分钟）：
- 纯色上衣 · 推荐白 / 灰 / 深蓝（AI 最容易抠像）
- 摘掉耳环 · 项链 · 手表 · 眼镜（反光会干扰训练）
- 头发别挡耳朵 / 眼睛
- 有化妆需求 → 化"看起来没化妆"的淡妆
✅ 做完的样子：镜头里你是一个"五官清晰 + 轮廓干净"的人像
热身（1 分钟）：正式录之前练一遍：
- 对镜头微笑 3 次 → 严肃 2 次 → 惊讶 2 次 → 思考 2 次
- 说"一二三四五上山打老虎"各种情绪试一遍
- 喝口温水润喉
录制 3 分钟 · 分三段（4 分钟）：点录像键中间不要停，按下顺序：
- 0~30 秒 · 表情段：平静 5s → 微笑 5s → 严肃 5s → 惊讶 5s → 思考 5s → 开心大笑 5s
- 30~150 秒 · 口播段：读一段你准备好的 120 秒文本（可以用 PART D 那段黄金文稿）
- 150~180 秒 · 口型段：清晰念"啊~哦~一二三四五六七八九十"重复 2 次
✅ 做完的样子：一条完整的 3 分钟 mp4 · 中间没有一刀剪辑
质检 6 项（1 分钟）：回放视频，按上面"6 项质检卡"逐条核对：
- 构图稳（没晃）· 光线匀（没过曝）· 背景干净（无杂物）
- 口型清晰 · 眼神自然 · 表情 4 种
⚠ 任何 1 项不合格 → 回第 1 步重录。一次性投入、终身复用，多录 2 遍值得。
命名保存（30 秒）：
- 新建本地文件夹 06-分身/
- 视频改名 train-raw.mp4
- 同步备份到云盘（iCloud / 百度网盘 / OneDrive）
签授权书（1 分钟）：打开上方黄框 CONSENT 卡 → 填你的姓名 + 今天日期 → 截图保存。
- 把截图保存为 06-分身/consent-signed.png
- 即使以后不发布 · 也是你作为 AI 用户的专业记录
✅ 做完的样子：文件夹里 2 个文件 · train-raw.mp4（~200MB）+ consent-signed.png
心态打卡（30 秒）：对自己说一句：
"从今天起，我有一个会 24 小时在线的我自己。他会替我见客户、教孩子、发视频——而我去做更值得做的事。"
✅ 做完的样子：你做完了 2025 年最高杠杆的 15 分钟

录训练素材时最不该省略的是？

A. 化妆 B. 浓重背景 C. 使用手持手机拍 D. 三脚架 + 柔和正面光 + 简洁背景 + 稳定构图

PART D · 第二课 · 声音克隆 ⏱ 20 min

30 秒录音 · 克隆出你的声音

声音克隆比数字人简单得多：你只需要一段30 秒~1 分钟的干净录音，AI 就能学会你的音色、语速、情绪。

找一个安静房间（关窗关空调，家里人不在时）
手机靠近嘴 10 公分（近场录音，信噪比最好）
读下面"黄金 30 秒文稿"——包含多种语气
上传到豆包声音克隆（doubao.com → 搜"声音克隆"）
等 2 分钟即可，克隆完成后给个"试用文本"让它说说看
满意就保存到你的"我的声音"，以后所有 TTS 都可用

黄金 30 秒克隆文稿（情绪均衡 · 可直接读）

大家好，我是 [你的名字]，很开心今天能和你们聊一聊。最近我在学一门新课，学到了一件让我特别震惊的事情—— 原来 AI 可以帮我们完成这么多事，比如写文章、做视频、画图片，甚至模拟我们的声音。你有没有遇到过，想说什么但就是说不出口的时刻？我觉得 AI 最打动我的，不是它多聪明，而是它替我们节省了很多"做决定"的时间，让我们能把真正的时间，留给真正重要的人。

📖 小雨给妈妈录的"每日晚安"

她只录了一次 30 秒，之后每天只写一段文稿，让"她的声音"读给妈妈听。妈妈不懂技术，觉得女儿每天"真的录给她"。这个工具花了 0 元。

> VOICEPRINT ANALYSIS · [你的名字]

DURATION00:00:32.4

SAMPLE RATE44.1 kHz

SNR42 dB · 优

PITCH RANGE110~220 Hz

EMOTION COVERAGE4/4 ✓

CLONE READY✓ PASS

CLONE LAB · 30 秒克隆你的声音 · 10 步走（10 分钟）

找安静房间（1 分钟）：
- 关窗 · 关空调 / 风扇 · 关冰箱（嗡嗡声是第一杀手）
- 避开人声 / 电视 / 宠物
- 推荐窗帘厚的卧室（软家具吸声最好）· 次选书房
⚠ 翻车点：厨房 / 浴室 = 瓷砖回声大 · 克隆出来像电话筒声音
打开录音工具（30 秒）：
- iPhone："语音备忘录" App · 默认格式 m4a
- 安卓："录音机" 或微信 → 我 → 收藏 → 语音
- 电脑：Mac 用 QuickTime · Win 用"语音录音机"
近场录音（3 分钟）：
- 手机离嘴 10 cm（比平时打电话近一倍）
- 手机斜过来避开正对嘴——防"噗"声（爆破音）
- 深呼吸 2 次 → 点录音键 → 读上方"黄金 30 秒文稿"
- 语气=跟朋友聊天，不要朗诵腔 / 不要字正腔圆
- 读到"你有没有遇到过……" 这里要有疑问语气（疑问覆盖就靠这句）
- 读完再停 2 秒再点停止（留尾音）
✅ 做完的样子：一段 30~40 秒的 m4a / mp3 · 文件大小 300~800KB
质量自检（1 分钟）：戴耳机听回放：
- 有"噗"声（爆破音）？→ 重录，手机再斜一点
- 有"嘶嘶"本底噪音？→ 换房间 / 关噪音源重录
- 语气太平？→ 带情绪重录（情绪覆盖不够是最大翻车原因）
- 全程清晰 + 有起伏 → ✅ 通过
打开豆包（30 秒）：浏览器 / App 访问 doubao.com → 手机号登录。
- 顶部搜索 "声音复刻" 或 "声音克隆" → 进入
- 首次使用需手机号验证 + 人脸识别（平台防盗声）
✅ 做完的样子：进入"开始录制 / 上传我的录音"页
上传录音 + 活体校验（2 分钟）：
- 点 上传本地文件 → 选刚才的 m4a/mp3
- 系统会让你再朗读一句随机出现的文字（活体校验防盗用）
- 读那句话 → 系统比对音色 → 通过
⚠ 若活体没通过 → 你上传的录音质量太差，重录第 3 步
等待克隆完成（1~2 分钟）：进度条走完 → 弹出试听框。
- 给克隆命名 [你的名字]-专属-v1
- 免费账号每月 3~5 次 · 付费无限
✅ 做完的样子：你的声音库多了一条带你名字的音色
测试 3 种情绪（2 分钟）：在输入框逐条输入，听效果：
- 😄 开心："我今天做成了一件大事！超级激动！"
- 😌 平静："今天天气还不错，想出去走走。"
- 😤 严肃："请大家注意一下这个数据——不能忽视。"
- 3 条都像你 → ✅ 通过
⚠ 3 条里 ≥1 条不像 → 第一嫌疑是情绪覆盖不够，回第 3 步重录一份情绪差异更大的
保存 + 试用场景（1 分钟）：点右上 保存到声音库。
- 跨产品复用：第 4 章播客旁白 / 第 5 章视频配音 / 本章数字人 / 给父母录晚安
- 同一声音库入口：豆包 / 剪映 / 腾讯智影（扫码连接）
打卡（30 秒）：发一段给自己用克隆声音生成的"给未来自己的话"给家人群：
"嗨，这是 AI 版的我。以后爸妈想我了，我会每天发一条。"
✅ 做完的样子：家人群第一次听到"你的声音"不是你本人发的

30 秒声音克隆素材质量最关键的 3 点是？

A. 麦克风贵 + 录音室 + 背景乐 B. 安静环境 + 近场录音 + 多语气均衡 C. 大声朗读 + 带回声 + 朗诵腔 D. 越长越好

PART E · 第三课 · 分身说话 ⏱ 20 min

文稿 → 分身视频 · 一次训练，永远调用

登录腾讯智影 → 左侧"数字人"→ "我的专属数字人"
上传 3 分钟训练视频，起名（推荐"XXX-商务版"/"XXX-亲和版"可训不同风格）
等 30 分钟~2 小时训练完成（邮件通知）
创建"视频作品"→ 选你的数字人 + 你克隆的声音 + 粘贴文稿
点生成，约 3~10 分钟产出 1 分钟视频（MP4）
预览 + 微调（下一节讲表情/口型/背景）
导出，1080P 无水印

数字人视频文稿 · 60 秒黄金模板

【0~5s 钩子】 "你是不是也遇到过 XXX 的烦恼？" 【5~15s 痛点共鸣】 "我 XX 岁那年，我也……"（讲一个短故事 / 身份）【15~45s 干货 3 点】 "其实解决办法很简单，我总结了 3 条：第 1 点：…… 第 2 点：…… 第 3 点：……" 【45~55s 证据】 "我身边有个朋友 / 学员 / 客户 XX，靠这 3 点 XX。" 【55~60s 行动号召】 "点赞 + 关注，下期教你 XXX。私信「XX」我发你 XX 工具。"

📖 老周的"流水线作业法"

他周日花 2 小时写 10 个文稿，分身+声音在周一早上跑完生成 10 个视频，每天发 1 条。一周 7 天无缝更新，他本人不必每天对着镜头。这是真正的"被动内容系统"。

CLONE LAB · 提交训练 + 生成第一条视频 · 10 步走（15 分钟）

打开腾讯智影（30 秒）：浏览器访问 zenvideo.qq.com。
- 右上 微信扫码登录（用你常用微信扫）
- 首次会问"实名认证"→ 跟随提示做 · 平台合规要求
✅ 做完的样子：主页显示你的头像 · 左侧有"数字人 / 我的素材"栏
进入数字人训练入口（30 秒）：
- 左侧菜单 → 数字人 → 顶部切到 "定制数字人" tab
- 点大按钮 + 创建专属数字人
上传训练视频（2 分钟）：
- 拖入 train-raw.mp4（或点"选择文件"）· 约 1~2 分钟上传
- 给分身起名：[你的名字]-商务版（以后可再训亲和版 / 卡通版）
- 可选：上传 3 张正面高清照（辅助训练，优先级 < 视频）
✅ 做完的样子：上传完成 · 显示"视频分析中"进度条
勾选授权 + 提交训练（30 秒）：
- 平台弹窗："请上传授权书" → 上传你刚才截图的 consent-signed.png
- 勾选 "我已获得授权"（这就是为什么前面让你先签授权书）
- 点 提交训练
⚠ 训练队列高峰期可能排 30 分钟~2 小时 · 训练完成会有邮件 + 站内信通知
等待时先走一遍官方模板（3 分钟）：这一步极大提升熟练度。
- 左侧 创建作品 → 数字人视频
- 随便选一个公共分身（平台预训好的，立即可用）
- 文稿框粘入上方"60 秒黄金模板"文字
- 声音下拉 → 选上一节克隆的"[你的名字]-专属-v1"
- 点 预览 → 3 分钟看效果
✅ 做完的样子：虽然脸不是你的，但声音是你的 · 已经足够震撼了
训练完成 · 切换到专属分身（1 分钟）：邮件 / 通知来了后：
- 回到刚才的"创建作品"页
- 数字人下拉从"公共分身" → 切到 "我的专属 / [你的名字]-商务版"
- 声音保持克隆版不变
- 点 生成（约 3~10 分钟出片）
预览 3 项自查（2 分钟）：生成完了点播放：
- ① 口型对位：嘴巴张开闭上跟声音对得上吗？（错位 → 回文稿加标点断句）
- ② 表情自然：眨眼 / 微点头 / 眼神有没有呆视？
- ③ 声音是你：是不是你克隆的那版？（选错了就切回重生成）
- 3 项全过 → ✅ 通过
导出视频（1 分钟）：右上 导出。
- 格式选 MP4，分辨率 1080P
- 勾选 "无水印"（免费版有水印 · 付费版可去）
- 下载到本地 · 命名 06-分身/clip01.mp4
✅ 做完的样子：本地 60 秒 mp4 · 约 20~50MB · 播着就是"另一个你"在讲课
盲测 3 位熟人（2 分钟）：发给 3 个熟朋友，先不说明，只问：
"这条视频是我本人录的，还是 AI 分身？猜对我请你喝奶茶。"
✅ 做完的样子：2 / 3 人猜错 = 你的分身过关 · 可以正式用 ⚠ 3 人都猜是 AI · 多半是表情不够——PART F 会救
归档打卡（1 分钟）：
- 视频存 06-分身/clip01.mp4
- 朋友圈发一条（可选）："第一次用 AI 做了'我自己'在说话 · 你敢分辨吗？"

数字分身视频质量最终取决于？

A. 算法 B. 分辨率 C. 文稿内容质量（钩子 / 干货 / 行动） D. 背景音乐

PART F · 第四课 · 微调 ⏱ 20 min

表情 / 口型 / 背景 · 让分身"看起来不假"

新手的数字人视频最容易被识破：嘴在动，脸没表情；眼睛直盯；背景不变。下面 5 招让你的分身逼真度瞬间提升。

① 口型同步精度

文稿用短句 + 标点密集。AI 按标点断句，长句会糊嘴。

② 加表情标签

在文稿里插入 [微笑][点头][思考] 标签，AI 会在对应位置调用表情。

③ 加手势动作

智影支持 [指向右侧][双手展开] 这类动作，让分身不死板。

④ 换背景

用绿幕扣像 + AI 生成背景（办公室 / 咖啡馆 / 户外），同一分身用不同场景。

⑤ 加 B-roll 空镜

视频中间插 3~5 秒空镜（产品图 / 字幕卡 / 数据图），避免观众只盯一张人脸。

⑥ 声音情绪

豆包克隆后试一下"开心 / 严肃 / 惊讶"情绪模式，不要全篇一个调。

带表情标签的文稿示例

[微笑] 大家好，我是老周！ [点头] 今天给大家分享 3 个容易被忽视的社保冷知识。 [思考] 第一点，其实很多人都不知道——灵活就业缴费有补贴！ [指向右侧] 数据显示，2024 年各省补贴范围在 30% 到 70%。 [严肃] 第二点，断缴超过 3 个月，部分待遇清零！ [惊讶] 第三点，这一条连 HR 都很少说…… [点头] 如果对你有启发，点赞支持一下！

📖 背景切换 · 一个分身当 3 个博主

学员 Kiki 用腾讯智影训了 1 个数字人，靠"换背景 + 换衣服"实现了办公室风（职场号）、厨房风（美食号）、书房风（读书号）3 个不同账号运营。同一张脸运营 3 条赛道，3 个月累计粉丝 10 万+。

CLONE LAB · 让分身"活过来"的 8 步走（10 分钟）

打开 clip01 文稿（1 分钟）：回到腾讯智影 → 我的作品 → 找到 clip01 → 点 编辑。
- 右侧面板出现文稿编辑框
- 通读一遍 · 找出节奏停顿点
标出 5 个高亮位置（2 分钟）：用不同颜色 / 下划线标：
- 🔵 问句（如"你是不是也……"）→ 待加 [微笑]
- 🟡 数字（如"3 个方法"）→ 待加 [指向右侧]
- 🟢 高光结论（如"关键在于……"）→ 待加 [点头]
- 🟣 转折（如"但是……"）→ 待加 [思考]
- 🔴 结尾行动号召（"关注/点赞"）→ 待加 [双手展开]
插入表情 / 动作标签（2 分钟）：
- 在每个标记位置前直接输入 [微笑] 等标签（方括号不能漏）
- 标签与正文之间保留一个空格（否则不触发）
- 平台支持的完整标签：[微笑][点头][指向右侧][思考][严肃][惊讶][双手展开][抿嘴]
⚠ 翻车点：用了英文方括号 · 中文方括号 · 漏了空格 · 都会不触发 → 一定用英文方括号
重新生成 v2（3 分钟）：点 重新生成（消耗 1 次额度，绝对值得）。 ✅ 做完的样子：v2 视频生成完毕，显示在作品列表上方
验证 5 个标签是否触发（1 分钟）：播放 v2，对照文稿的 5 个标签位：
- 问句位置 → 嘴角是否上扬？
- 数字位置 → 是否有手势？
- 5 处全触发 → ✅ 通过
- ≥1 处没触发 → 检查方括号 / 空格 / 拼写 → 重新生成
换背景场景（1 分钟）：时间线上方 场景 Tab。
- 从纯色 / 默认 → 切到 "居家书房"（温暖感）
- 或 "简约办公"（职业感）/ "咖啡馆"（生活感）
- 同一分身切 3 种背景 → 运营 3 个不同账号都不违和
✅ 做完的样子：镜头里你从纯色墙换到真实场景 · 立刻不"塑料"了
插 B-roll 空镜（2 分钟）：完播率 +15% 的关键。
- 找文稿里 "嘴部自然停顿"位置（如讲完第一点 → 停顿 1 秒）
- 时间线对应位置插入 1.5 秒空镜：产品图 / 数据图表 / 关键字幕卡
- 建议插 3~5 处 · 避免观众看一张人脸看疲劳
导出 v2 + 对比（1 分钟）：
- 导出 clip02.mp4
- 把 clip01 和 clip02 并排播放 · 这一步是"塑料"和"真人"的分水岭
- 如果 v2 被识别"是 AI 分身"的概率降低 50% → 你已经掌握了这门手艺
✅ 做完的样子：本地 06-分身/ 有 clip01 + clip02 两版 · 展示技术成长曲线

让数字人"不像假人"最关键的一招是？

A. 提高分辨率 B. 文稿里加 [微笑] [点头] [指向] 等表情动作标签 C. 训练更久 D. 付费会员

PART G · 🎯 本章产出 ⏱ 20 min

产出 · 1 分钟数字分身讲解视频终身复用素材

CLONE LAB · 交付"永远在线的另一个你" · 10 步走（20 分钟）

资产盘点（1 分钟）：打开 06-分身/文件夹，确认三件套齐活：
- ✓ train-raw.mp4（训练原片）
- ✓ clip01.mp4 + clip02.mp4（练习成果）
- ✓ 已保存的"克隆声音 v1"
- ✓ consent-signed.png（授权书）
✅ 做完的样子：文件夹里 4 个文件齐活 · 知道自己有什么资产
用 Prompt 出 60 秒文稿（3 分钟）：
- 把下方紫框"60 秒文稿 Prompt"整段复制
- 粘到豆包 / ChatGPT / Kimi
- 在 Prompt 开头加三句：
  - 主题：（你真实业务/兴趣/家人场景）
  - 身份：（你是谁 · 一句话）
  - 目标：（涨粉 / 带课 / 留资 / 家人陪伴）
- AI 返回带表情标签的文稿（180~220 字）
✅ 做完的样子：一段已经插好 5~8 个 [微笑][指向] 标签的 60 秒文稿
生成视频（5 分钟）：回腾讯智影：
- 新建作品 → 数字人视频
- 分身选 "[你的名字]-商务版"
- 声音选 克隆 v1
- 文稿粘进去 → 生成
- 等 3~10 分钟出片
进时间线微调（3 分钟）：
- 前 3 秒加大字字幕（直接打上你的一句话钩子 · 字号 60+）
- 结尾 5 秒加 "关注/点赞/私信 XX"贴纸
- 可选：加背景音乐（15% 音量，参考第 4 章 BGM 规则）
✅ 做完的样子：首帧抓眼球 · 尾帧引导行动 · 中间带 BGM
加"AI 数字人"合规角标（1 分钟）：这一步不能省。
- 时间线 → 贴纸库 → 搜 "AI 数字人"（平台自带模板）
- 贴到左上角，持续 3 秒（开头闪一下即可）
- 为什么要加：① 平台合规硬要求 ② 防被举报封号 ③ 诚信运营的底线
⚠ 2024 起国内所有平台硬性要求 AI 内容标注 · 不加角标可能被限流甚至封号
导出 final（1 分钟）：
- 右上 导出 → 1080P · MP4 · 无水印
- 命名 06-分身/final-v3.mp4
- 手机过一遍从头看到尾自查
盲测 3 人（2 分钟）：发给 3 个熟人先不说明，问：
"猜一猜这条视频是我本人录的还是 AI 分身？"
✅ 做完的样子：2 / 3 人无法辨别 · 你通过了"数字分身图灵测试"
选一个平台上线（2 分钟）：3 选 1：
- 🌟 做个人 IP：视频号 / 抖音 / 小红书 → 定期更
- 💼 做业务转化：微信工作群 / 客户群 · 带产品讲解
- 💝 做情感陪伴：发给父母 / 家人群 · 每天一条问候
✅ 做完的样子：视频已经在真实平台上 · 截图保留作为"处女作"
归档作品集（1 分钟）：新建 AI 作品集/06-数字分身/，放入：
- train-raw.mp4 / 克隆声音.mp3 / final-v3.mp4
- consent-signed.png / 发布平台截图
- README.md：简述"我用 [X] 小时做出了第一个会说话的我"
✅ 做完的样子：一个完整可展示的求职 / 业务作品集目录
一周回顾（1 分钟现在承诺 · 1 周后执行）：
- 在日历上标 +7 天 → 回来数"这周分身被我调用了几次"
- 每多用 1 次 = 你省下 1 次出镜 / 录音时间
- 目标：1 周内至少调用 3 次（发 3 条视频 / 发 3 条家人问候 / 发 3 条客户讲解）
"这是我今年做过的最高杠杆的 1 小时投入——此后每一次调用都是复利。"

✨ 数字人文稿 Prompt（让豆包一次写好带标签）你是短视频编剧。请为我写一条 1 分钟（约 180~220 字）的数字人口播文稿：主题：[你的主题] 身份：[你的身份] 目标：[涨粉 / 带课 / 留资私信] 要求： 1. 严格按 5 段结构： [0-5s] 钩子 / [5-15s] 痛点 / [15-45s] 3 个干货 / [45-55s] 案例 / [55-60s] 行动 2. 每句不超过 18 字，让口型更清晰 3. 自动插入 5~8 个表情/动作标签（[微笑][点头][指向右侧][思考][严肃][惊讶][双手展开][抿嘴]） 4. 结尾行动号召含一个可互动钩子（私信"XX"领 / 评论扣"XX"送） 5. 输出格式：纯文本 + 标签，便于直接粘贴到腾讯智影

🏆 产出验收标准

✅ 数字人已训练并可调用
✅ 克隆声音已保存
✅ 一段 60 秒视频 MP4，1080P
✅ 视频中至少能识别 3 个表情变化
✅ 加了"AI 数字人"声明
✅ 朋友圈 / 群打卡 1 次
✅ 归档「AI 作品集 / 06-数字分身」

💼 进阶玩法 · 家人专属"语音信箱"

用克隆声音每天给远方父母录一段 30 秒文稿（问候 / 天气 / 饭菜），通过微信发送。这不是替代真人，是把"你虽然在忙但心里有他们"的心意数字化地送出去。小雨就是这么做的。

PART I · 🎮 课堂 4 游戏 ⏱ 25 min

巩固关 · 4 个互动游戏让你"分身制作人肌肉上身" 边玩边会

分身这门手艺最难的不是技术，是识得出真假 · 写得出表情标签 · 判得出合规边界 · 想得出应用场景。下面 4 个游戏专门训练这 4 块肌肉。

🕵️ 游戏 1 · 真假分身侦探 · 4 个案例判断真假

给你 4 段视频描述。凭你刚学的知识判断是真人录 vs AI 分身。

📹 案例 1：某博主视频 · 整段他对着镜头说话 · 眨眼频率规律 · 头部纹丝不动 · 鼻孔完全不动 · 衣服在 60 秒内完全没有任何褶皱变化。

🧑 真人录

🤖 AI 分身

✅ AI 分身。真人鼻孔会微微动（呼吸）· 头部有自然小晃 · 衣服有呼吸带动的褶皱。"一动也不动"是分身最大破绽。PART F 的 B-roll 空镜就是用来掩盖这个问题。

📹 案例 2：讲课视频 · 偶尔笑 · 偶尔用手扶一下眼镜 · 口型与声音有 0.1 秒不同步 · 背景有模糊的书架和窗台上的绿植。

🧑 真人录

🤖 AI 分身

✅ 真人录。关键线索：无意识小动作（扶眼镜）+ 背景有真实生活痕迹（绿植）。AI 分身只会按标签做动作，不会"随手"扶一下。真实窗台角度的绿植远比 AI 背景真实。口型差 0.1s 可能只是视频压缩延迟。

📹 案例 3：网红带货视频 · 口型和声音完美同步 · 左上角有一个"AI 合成"小标识 · 讲了 8 分钟语气完全一致 · 背景纯色。

🧑 真人录

🤖 AI 分身

✅ AI 分身。三个信号全在：① 口型过分完美（真人反而会偶尔错位）② 左上角"AI 合成"角标（这就是 PART G 里必须加的合规标）③ 8 分钟语气零起伏 = TTS 特征。这条合规做得很到位。

📹 案例 4：朋友圈短视频 · 某人对镜头招手 · 手穿过了脸部 · 手指数错了 · 背景有局部扭曲。

🧑 真人录

🤖 AI 分身

✅ AI 分身（且是不合格版本）。三个硬伤：手穿脸 = 分层合成错误 · 手指数错 = AI 生成经典 bug · 背景扭曲 = 运动补偿失效。这种分身不能发布，必须回 PART F 重训或加 B-roll 掩盖。

🎯 答对 0 / 4 · 得分 0

🎭 游戏 2 · 表情标签编辑器 · 给文稿点上"活过来"标签

下面是一段 60 秒文稿。点中一行再点下方任意标签 → 自动插入。目标：让每一行都恰到好处带情绪。

🎬 文稿编辑器（点行 · 选标签）

😊 [微笑] 👍 [点头] 👉 [指向右侧] 🤔 [思考] 😐 [严肃] 😲 [惊讶] 🙌 [双手展开] 😏 [抿嘴]

大家好，我是 [你的名字]！今天给大家分享 3 个容易被忽视的社保冷知识。第一点：其实很多人都不知道——灵活就业缴费有补贴！数据显示，2024 年各省补贴范围在 30% 到 70%。第二点：断缴超过 3 个月，部分待遇清零！第三点：这一条连 HR 都很少说…… 如果对你有启发，点赞支持一下！

💡 推荐组合：问句→微笑 · 数字→指向右侧 · 高光→点头 · 转折→思考 · 结尾→双手展开

⚖ 游戏 3 · 授权风险判官 · 5 个场景判合规

分身最大的雷区不是技术是法律。下面 5 个真实场景，你判 ✅ 合规 / ❌ 违规。

🎬 场景 1：你用自己训练的分身 + 自己克隆的声音，在视频号带货自家淘宝店，视频左上角标"AI 数字人"。

✅ 完全合规。三个要素都满足：本人肖像 + 本人声音 + 合规角标 + 商品真实。这是标准用法。

🎬 场景 2：你偷偷用朋友一段 30 秒朋友圈视频的声音，做了一个克隆，给他微信里熟人发"借钱"消息。

❌ 严重违法。触犯侵犯肖像权 / 声音权 + 诈骗罪。未经授权克隆他人声音 = 民事侵权。用来骗钱 = 刑事诈骗罪（3 年起）。

🎬 场景 3：你用自己的分身帮公司老板在直播里"代班"讲产品，没加任何 AI 角标，产品信息都真实。

❌ 违反《生成式 AI 服务管理办法》。2024 起中国所有 AI 生成视频 必须标注（不加角标即违规）。即使内容真实，没加标识也会被平台限流 / 下架 / 处罚。

🎬 场景 4：你给父母生成一条"每天晚安视频"，不发布任何公开平台，只发家庭群。

✅ 合规。本人肖像 + 本人声音 + 家庭私用场景 + 无商业化。家庭陪伴是分身最温暖的场景，法律完全不管私域分享。

🎬 场景 5：客户让你用他公司代言人（已去世明星）的老视频训一个 AI 分身做品牌宣传。报价 50w。

❌ 拒单。即使已去世，肖像权依然由家属继承 40~50 年（《民法典》1019 条）。客户若没拿到家属签的书面授权，你做了 = 连带侵权。哪怕 500w 也要拒。正确做法：让客户先拿授权。

🎰 游戏 4 · 应用场景盲盒 · 抽出你的分身第一个任务

训完了不知道用在哪？点一下 · 3 秒给你一个具体的身份 + 任务 + 预期效果。

🎲 分身任务生成器 · 身份 × 场景 × 效果

点下面按钮 · 抽一个你分身的首秀任务 🎰

💡 连抽 3 次选一个最心动的 · 立刻回 PART G 用这个主题生成视频

PART J · 🚀 数字分身职业跃迁 ⏱ 20 min

会做数字分身的人 · 薪资多少 · 怎么变现可跳槽 · 可副业

数字人在 2025 年从"玩具"变成了生产力工具——电商平台官方流量倾斜 AI 直播、品牌方预算一半砸虚拟代言人、老师用分身批量上课月入 10w+。这个技能栈卡位极好。

💰 3 档岗位 · 3 档薪资

TIER 1 · 新人入门

🎬 AI 短视频剪辑 / 内容编辑

7~14k / 月

给 MCN / 品牌号 / 知识付费账号剪分身视频——文稿 / 标签 / 背景 / 字幕。会 AI 全套 = 干 2 个人的活。
0~2 年经验，文科 / 设计都能上。

💼 MCN 短视频岗 · 知识付费剪辑 · 品牌号运营助理 · 电商直播脚本

TIER 2 · 本章毕业位

🧬 数字人主理人 / AI IP 运营

18~50k / 月 + 分成

独立操盘一个 AI IP 账号（视频号 / 抖音 / 小红书）· 月产 30+ 条分身视频 · 粉丝 10w+ 可接广告 · 帮品牌 / 个人 IP 代运营。

💼 品牌数字人主理人 · AI IP 运营 · 代运营工作室合伙人 · 企业虚拟代言人 PM

TIER 3 · 进阶目标

🏆 AI IP 创始人 / 数字人 MCN

50k~50w / 月 + 股权

自有分身账号 50w+ 粉丝 + 孵化 10~100 个中小 IP · 或成立数字人 MCN · 接品牌定制单（单单 5w~50w）。

💼 抖音头部 AI IP 主理人 · 数字人 MCN 创始人 · 虚拟代言人团队 CEO

💸 6 条变现路径 · 副业 / 全职都成立

代运营

企业数字人代运营 · 月费 2~10w

1 个客户 1~3w · 同时 3~5 个客户 = 6~15w / 月

品牌老板 / 中小企业想做视频号但没时间 · 你包"训分身 + 月产 30 条内容 + 分发"。AI 让你 1 人顶 5 人小组。

带货

分身带货 · 佣金 10~30%

1 条爆款视频 = 1 个月工资

视频号 / 抖音 / 小红书都可以分身带货。知识付费课 / 书 / 工具软件佣金 20~30% · 1 期爆款能出几万单。

课程

分身制作课 · 单课 399~1999

自带 sales pitch · 复购高

"零基础 7 天做出你的 AI 分身"打包课 · 小鹅通 / 抖音私域卖 · 你自己就是最好的案例。爆款单课 10w+ 份。

定制

品牌虚拟代言人 · 单单 5~50w

做 1 单吃半年 · 高客单价

品牌方要做"虚拟代言人 / 虚拟客服 / AI 客服机器人"。你提供"人设 + 分身 + 声音 + 脚本库"全套。单单 5w 起。

教培

分身讲师批量授课

1 次训 → 终身讲 · 边际成本 0

教师 / 讲师用分身把 30 节课批量生成 · 上架知识星球 / 小鹅通。学员月老师张三"上百节课"拿 20w / 月 + 长尾收入。

陪伴

情感陪伴服务 · 订阅 99~399 / 月

老人陪伴 / 儿童教育 · 蓝海

帮留守家庭 / 独居老人做"子女 AI 陪聊分身" · 月订阅制。这是道德 + 商业双赢的蓝海赛道。

📄 简历 / 求职加分话术

                    应聘 AI 内容 / 短视频 / 数字人岗：

                    "独立训练 1 个专属数字人 + 1 个克隆声音 · 熟练使用 腾讯智影 + 豆包 + 剪映 + NotebookLM · 月产 30+ 条分身视频 · 运营 XX 账号粉丝 XX · 熟悉 AI 内容合规（角标 / 授权 / 平台规则）。"
                
                    应聘品牌 / MCN / 代运营：

                    "能为品牌设计虚拟代言人 / 虚拟客服 / 数字直播三档方案 · 过往代运营 XX 品牌账号 · 节省真人出镜成本 70% · 粉丝从 0 到 XXk。"
                
                    应聘 AI PM / 产品 / 战略：

                    "深度理解 AIGC 产品链——从素材采集 → 模型训练 → 内容生产 → 合规分发 · 能设计端到端数字人产品流程 · 熟悉腾讯 / 阿里 / 字节系工具栈。"
                
                    面试黄金回答（问到"AI 分身合规怎么做"）：

                    "我有一套三查三标原则：① 查肖像授权 · ② 查声音授权 · ③ 查商业使用边界 · ① 标平台合规角标 · ② 标商品真实性 · ③ 标 AI 生成声明。过去做的所有内容 0 投诉 0 下架。"

🎯 本章 5 张门票

门票 1 · 资产：训练完的专属分身 + 克隆声音 = 终身复用 · 每次调用都在省时间
门票 2 · 合规思维：授权 + 角标 + 边界 = 你在 AI 时代的保命符
门票 3 · 内容产能：1 次训 → 终身讲 · 从"人打内容"变"内容打人"
门票 4 · 业务杠杆：分身可以 7×24 小时服务客户 · 代替你讲课 / 带货 / 服务
门票 5 · 情感储蓄：给父母 / 孩子 / 爱人的"AI 版你" · 不能取代真实陪伴 · 但能填充空窗

PART H · 打卡 + 预告 ⏱ 10 min

本章 12 项打卡 · 解锁「数字分身主理人」徽章

🎬 下一章预告

第 7 章 · RAG 专属知识库：你会学会把几百份公司制度 / 产品手册 / 家庭资料喂给 AI，让它"只回答你的行业问题"——这是企业 AI 实战最硬的一章。

🧑‍🎤 AI 数字分身 + 声音克隆

🗺 学习地图（约 120 分钟 · 8 个小节）

A · 开场（10 min）

B · 工具横评（20 min）

C · 训练素材（20 min）

D · 声音克隆（20 min）

E · 分身说话（20 min）

F · 表情 / 口型 / 场景（20 min）

G · 🎯 产出 · 1 分钟讲解片（20 min）

H · 打卡 + 预告（10 min）

为什么"数字分身"是 2025 最有杠杆的个人资产？

> CLONE LAB v2.5 · HOLOGRAPHIC SCAN IN PROGRESS

数字分身 + 声音克隆 · 2025 主流工具横评

⚠️ 伦理红线 · 上手前必看

3 分钟训练视频 · 好素材决定分身"是否像你"

✅ 好素材清单

❌ 翻车素材

🔍 拍摄完毕 · 6 项自动质检（任何一项不过都请重拍）

📝 训练前请先签一份"给自己"的授权书（防将来麻烦）

CLONE LAB · 训练素材实录 · 10 步走（15 分钟）

30 秒录音 · 克隆出你的声音

> VOICEPRINT ANALYSIS · [你的名字]

CLONE LAB · 30 秒克隆你的声音 · 10 步走（10 分钟）

文稿 → 分身视频 · 一次训练，永远调用

CLONE LAB · 提交训练 + 生成第一条视频 · 10 步走（15 分钟）

表情 / 口型 / 背景 · 让分身"看起来不假"

① 口型同步精度

② 加表情标签

③ 加手势动作

④ 换背景

⑤ 加 B-roll 空镜

⑥ 声音情绪

CLONE LAB · 让分身"活过来"的 8 步走（10 分钟）

产出 · 1 分钟数字分身讲解视频 终身复用素材

CLONE LAB · 交付"永远在线的另一个你" · 10 步走（20 分钟）

🏆 产出验收标准

巩固关 · 4 个互动游戏让你"分身制作人肌肉上身" 边玩边会

🕵️ 游戏 1 · 真假分身侦探 · 4 个案例判断真假

🎭 游戏 2 · 表情标签编辑器 · 给文稿点上"活过来"标签

🎬 文稿编辑器（点行 · 选标签）

⚖ 游戏 3 · 授权风险判官 · 5 个场景判合规

🎰 游戏 4 · 应用场景盲盒 · 抽出你的分身第一个任务

🎲 分身任务生成器 · 身份 × 场景 × 效果

会做数字分身的人 · 薪资多少 · 怎么变现 可跳槽 · 可副业

💰 3 档岗位 · 3 档薪资

🎬 AI 短视频剪辑 / 内容编辑

🧬 数字人主理人 / AI IP 运营

🏆 AI IP 创始人 / 数字人 MCN

💸 6 条变现路径 · 副业 / 全职都成立

企业数字人代运营 · 月费 2~10w

分身带货 · 佣金 10~30%

分身制作课 · 单课 399~1999

品牌虚拟代言人 · 单单 5~50w

分身讲师批量授课

情感陪伴服务 · 订阅 99~399 / 月

📄 简历 / 求职加分话术

本章 12 项打卡 · 解锁「数字分身主理人」徽章

✅ 完成下面 12 项任务

数字分身主理人

产出 · 1 分钟数字分身讲解视频终身复用素材

会做数字分身的人 · 薪资多少 · 怎么变现可跳槽 · 可副业