第 7 章：RAG 专属知识库 · 让 AI 只回答你的问题

PART A · 开场 ⏱ 10 min

为什么 RAG 是企业 AI 最高价值的硬技能？

通用大模型再聪明，也不知道你公司的制度、不知道你产品的参数、不知道你家里的药盒。RAG（Retrieval-Augmented Generation，检索增强生成）就是解决这件事——把你的资料喂给 AI，让它"先查你的资料再回答"。

📖 学员 · 阿乐 · 32 岁 · 500 人公司 HR 主管

他把公司300 份制度文件 + 5 年员工问答邮件喂给 FastGPT，做了一个"HR 小助手"。员工问"年假怎么算""离职流程""住房补贴"直接@它。HR 每天咨询量减少 80%，他从每天救火变成思考战略。年底被提拔。

📖 学员 · 杜工 · 45 岁 · 设备工程师

他把 30 年攒的设备故障维修记录 + 说明书 PDF喂给 Coze 知识库。新徒弟遇到故障不用翻 20 本手册，直接问 Bot。班组平均排故时间从 3.2 小时降到 40 分钟，被写进集团标杆案例。

💡 核心洞察

市面上 80% 的 "AI 降本增效"故事，背后都是 RAG。它不是"更聪明的 ChatGPT"，而是把 AI 变成你团队里最了解业务的那个人。学会搭 RAG，你在公司里就是"AI 负责人"——这是 2025 年最值钱的身份之一。

RAG（检索增强生成）最核心的价值是？

A. 让 AI 回答更快 B. 让 AI 基于"你的资料"回答，而不是基于通用知识瞎编 C. 让 AI 免费使用 D. 让 AI 可以联网

PART B · 工具选型 ⏱ 20 min

5 款 RAG 工具横评 · 按你的资料量和分享需求选

工具	门槛	文件上限	可分享	推荐场景
Kimi 智能助手	极低（免注册）	单文件 100MB / 一次 50 个	❌ 仅自用	个人学习 / 单次文档
豆包智能体（字节）	低	单智能体 10 个知识文件	✅ 可发分享链接	个人助手 / 朋友圈卡片
扣子 Coze（字节）	中等	知识库可扩展大	✅ 扫码 / 嵌入	本章主线 · 团队用
FastGPT	较高 · 可自托管	无上限（按资源）	✅ API / 嵌入	企业内部 · 深度定制
Dify	较高 · 开发者向	无上限（按资源）	✅ 全套 API	技术团队 / 产品化
腾讯乐享 AI	中	企业级	✅ 企微集成	大中型企业 · 内网合规

🎯 本章选型

练手（10 分钟就能跑通）：Kimi——传几个文件直接问，最快手
主线（建可分享的 Bot）：扣子 Coze——国内访问流畅、免费够用、可扫码分享
进阶（企业大量资料）：FastGPT / Dify——需要服务器，本章会给入门指引

🛠 动手任务 · 5 分钟

打开 www.coze.cn（扣子）→ 手机号登录 → 进入"工作空间"→ 左侧"资源库"找到"知识库"入口。这就是本章的大本营。

PART C · 第一课 · 原理 ⏱ 20 min

RAG 原理 · 3 张"大白话图"看懂

RAG 不神秘。它就是 "先检索 · 再生成" 两步流程。记住下面这 3 张图（用文字画给你），你比 90% 的人懂 RAG。

> RAG PIPELINE · 数据在系统里的真实流向

📄

DOCS

PDF/Word/MD

▶

✂️

CHUNK

800/100

▶

🔢

EMBED

向量化

▶

💾

VECTOR-DB

Milvus/PG

🙋

QUERY

用户问题

▶

🔍

RETRIEVE

Top-K=5

▶

🧠

LLM

豆包/Kimi

▶

💬

ANSWER

+引用

1入库（资料变成"可搜索碎片"）
你上传的 PDF / Word / Excel / 网页，被系统切成 500~1000 字的小块（chunk），每块被转成一个"向量"（一串数字），存进向量数据库。就像图书馆把每本书拆成章节，并贴上"主题卡片"。

2检索（用户问一个问题）
用户提问时，系统先把问题也变成向量，在向量数据库里找出最相关的 3~5 块（Top-K 检索）。就像问图书管理员"我要查 A 问题"，她从卡片里找 5 张相关的给你。

3生成（大模型基于检索结果回答）
系统把这 3~5 块内容拼到 Prompt 里，大模型基于"用户问题 + 检索到的内容"生成答案。就像你把 5 张卡片+问题交给图书管理员，她读完卡片给你讲答案。

❌ 纯大模型

用户问："我公司 2024 年度培训预算是多少？" AI：根据通常情况，培训预算约占总预算 1~3%...（瞎编）

✅ RAG 后

检索到：《2024 培训管理办法》第 5 条"培训年度总预算 186.3 万..." AI：根据《2024 培训管理办法》第 5 条，2024 年度培训预算为 186.3 万元。

💡 RAG 为什么优于"直接把文件塞进长上下文"

Kimi / ChatGPT 现在都支持超长文档，为什么还要 RAG？
① 省钱：每次只召回相关的几千 token，而不是把 50 万字都塞进去
② 精准：长上下文里 AI 会"看后忘前"，RAG 只喂最相关的片段
③ 可扩展：资料再多也能搜得到，不受上下文窗口限制
④ 可多人共享：一份知识库，全团队问

RAG 的完整流程是？

A. 一步到位：AI 直接回答 B. AI 上网搜索后回答 C. AI 自己猜 D. 入库（切块+向量）→ 检索（Top-K 相关块）→ 生成（大模型基于检索结果答）

PART D · 第二课 · 资料 ⏱ 20 min

资料整理 + 切块策略 · 这一步做对，成败占 70%

RAG 失败的最常见原因不是模型，而是你喂的资料又脏又乱。下面这份整理清单请认真执行。

✅ 整理前 5 步

把扫描版 PDF 用 OCR 变成文字（推荐 Kimi / 豆包）
删除封面、目录、空白页、水印
把 Word / Excel 统一转成 Markdown 或 .txt
给每份文件加前缀元数据："[部门][2024][制度] xxx.md"
把图片里的关键信息用文字补充描述

❌ RAG 杀手

整本书 500 页直接上传（切出的块会失上下文）
图片扫描件没 OCR（AI 读不到文字）
多文件"一锅炖"没分类
文件名全叫"文档 1.pdf""新建文档.docx"
Excel 合并单元格（AI 读取错位）

切块参数黄金值（扣子 / FastGPT 通用）

chunk_size（每块字符数）：600~1200 chunk_overlap（重叠字符数）：80~150 分隔符优先级：1) ## 二级标题 → 2) 双换行 → 3) 单换行 → 4) 句号规则解释： - 块太小 → 缺上下文，AI 答不完整 - 块太大 → 检索不准，召回很多无关内容 - overlap 是相邻块的重叠字数，防止关键句被切断 - 分隔符用文档自己的结构（标题）效果最好

📖 阿乐整理 HR 资料的真实做法

300 份制度按"入职 / 薪酬 / 假勤 / 培训 / 离职 / 福利"分 6 个文件夹。每个文件顶部加 3 行：
① 标题：《2024 员工差旅管理办法》
② 适用范围：全员
③ 关键词：差旅、报销、出差标准、交通费
切块用 800/100——Bot 回答准确率从 45% 涨到 92%。

> CHUNK VISUALIZER · 同一段原文 / 3 种切法对比

第 5 条 · 培训预算：公司 2024 年度培训总预算为 186.3 万元，按部门分配：技术部 65 万、销售部 52 万、职能部 30 万，余下 39.3 万作为公司级专项预留，由人力资源部统筹安排。预算使用须遵循"先审批后执行"原则，单笔超过 5 万元的需总经理签字。超出预算部分不予报销，除非另申请预算追加。

Chunk 1（覆盖总额 + 分配） Overlap 重叠区（防断句） Chunk 2（使用规则） Chunk 3（超预算规则）

� 黄色重叠区是关键——如果没有 overlap，用户问"39.3 万怎么用"可能只召回 Chunk 2 没有金额，或只召回 Chunk 1 没有使用规则。overlap 让两块都能被命中。

ENGINEER LOG · 资料入库流水线 · 10 步从文件到可查询（25 分钟）

选定场景 ⏱ 1 min
- 3 选 1：① 工作域（公司制度 / 产品手册 / SOP）② 家庭域（保险单 / 药盒说明 / 体检报告 / 孩子错题本）③ 兴趣域（你读过的 20 本书笔记 / 你写过的日记）
- 在桌面新建 07-rag 文件夹 · 里面再建 raw/（原件）和 clean/（处理后）两个子目录
✅ 做完的样子：桌面上有 07-rag/raw/ · 07-rag/clean/ 两个空文件夹 · 场景写在便利贴上
收集 5~10 份原始文件 ⏱ 3 min
- 最少 5 份、最多 15 份 · 第一个知识库不要贪心
- 支持格式：PDF / Word / Excel / Markdown / TXT / 图片（要 OCR）· 单文件 < 30MB
- 全部拖到 07-rag/raw/
⚠ 别做的事：整本 500 页的书直接上传 · 整个硬盘文件夹一口气倒进去 · 混多种语言混多种业务
扫描版 PDF / 图片 → OCR 变纯文字 ⏱ 5 min
- 打开 kimi.moonshot.cn（或豆包网页版）· 拖入扫描 PDF
- 发一句：请把这份 PDF 逐页 OCR 成 Markdown，保留标题层级（#、##、###），表格转成 markdown 表格，图片用文字描述替换。
- Kimi 产出后点右上角复制 · 粘贴到新建的 xxx.md 文件
✅ 做完的样子：原来 20 页扫描 PDF · 现在变成一份 3~5 KB 的 Markdown · 标题层级清晰 · 可以 Ctrl+F 搜到任何关键词
统一命名规范 ⏱ 3 min
- 格式：[部门][年份][类型]-原标题.md
- 示例：[HR][2024][制度]-差旅管理办法.md · [产品][2024][手册]-滚筒洗衣机 XQG100.md
- 命名里的方括号标签 = AI 的"前排特征" · 命中率 +15%
⚠ 翻车点：文件名写"文档 1.pdf"、"新建文档.docx"、"最终版 v3 - 副本 - 副本.pdf" = 命中率直接 -20%
每份文件顶部加 3 行元数据 ⏱ 5 min
# 标题：2024 员工差旅管理办法 # 适用范围：全员 · 含实习生 · 不含外包 # 关键词：差旅、报销、出差标准、交通费、住宿标准、补贴、审批流程
💡 关键词写 5~10 个 · 尽量写同义词 / 俚语——员工可能问"出差能报多少"而不是"差旅标准"
清理脏内容 ⏱ 3 min
- 删除：封面页 / 目录页 / 页眉页脚 / 水印"公司内部请勿外传"
- Excel：解除合并单元格（开始 → 合并后居中 → 取消合并）· 填充空白单元格
- 所有 .docx 另存为 .md 或 .txt · .xlsx 另存为 .csv
⚠ 常见翻车：Excel 合并单元格没拆 → AI 读到的表格会错位 → 召回永远不准 · 这是 RAG 失败 Top3 原因
登录扣子 · 新建知识库 ⏱ 2 min
- 访问 coze.cn 登录 · 左边栏选 工作空间
- 顶部点 资源库 → 右上角 + 创建资源 → 选 知识库
- 命名 [你主题]-v1（v1 是版本号 · 后面调优会出 v2 v3）· 类型选 文本格式 · 保存
✅ 做完的样子：资源库列表里出现你的知识库卡片 · chunk 数为 0 · 状态"待上传"
上传 + 设切块参数 ⏱ 3 min
- 进入刚建的知识库 → 新增内容 → 本地文档 → 拖入 07-rag/clean/ 全部文件
- 下一步"分段设置"切换到 自定义：
  - chunk_size = 800
  - overlap = 100
  - 分隔符勾选 ## 标题 / \n\n
- 点 开始处理
💡 为什么这组数字：800 字约一段逻辑完整的话 · 100 字 overlap 够覆盖断句 · 标题优先保住章节结构
等待索引 · 喝口水 ⏱ 1~3 min / 100 页
- 进度条走完后卡片状态变 可用 · 右上会显示 分段数 XXX（这就是 chunk 总数）
- 把这个数字抄到记事本 07-rag/tuning.md：v1 · chunks=385 · size=800/overlap=100
✅ 做完的样子：卡片上显示 "已分段 385 条"；随便点开 3 个分段预览 · 每块都是一段完整意思 · 没有半句话
冒烟测试 · 3 题见分晓 ⏱ 2 min
- 扣子顶部 智能体 → 快速新建一个 Bot → 只绑定这个知识库 · 不加其他 · 系统 Prompt 留空
- 右侧预览窗口提 3 个问题：① 你最确定答案的 · ② 中等模糊的 · ③ 故意问知识库里没有的
- 观察：① 应该答对；② 看召回的原文片段对不对；③ AI 应该说"找不到"（若它瞎编 = 进 PART E 调优）
✅ 做完的样子：3 题中至少 2 题答对且附带正确原文片段 · 过不了就先别上线 · 立刻去 PART E

RAG 切块最合理的参数范围是？

A. 50~100 字，重叠 10 B. 5000 字，不重叠 C. 600~1200 字，重叠 80~150 D. 整个文档不切

PART E · 第三课 · 调优 ⏱ 20 min

AI 答非所问 · 5 个最常见的坑 + 对应解法

① 检索召回 Top-K 设错

症状：AI 只找到 1 块内容，答得残缺 / 找到 10 块，AI 混乱跑题
解法：Top-K 设 3~5，复杂场景 5~8

② 召回阈值（相似度分）太低

症状：把不相关的块也召回了，AI 胡说
解法：相似度阈值调到 0.65~0.75，低于阈值的块不送给 AI

③ 系统 Prompt 没"闭嘴约束"

症状：没找到资料 AI 也瞎编
解法：系统 Prompt 加一句"若检索结果无法回答，请直接说'我在现有资料里没找到相关信息'"

④ 问题太模糊

症状：用户问"那个是多少"，AI 找不到对应块
解法：系统提示用户"请包含部门 / 年份 / 关键词"，或加一层"问题改写"

⑤ 切块切错

症状：关键段落被砍成两半
解法：调 overlap 到 150，或用"按标题切"而不是"按字数切"

⑥ 底座模型太弱

症状：检索对了，但模型生成啰嗦 / 偏题
解法：切换到豆包 Pro / Kimi / DeepSeek 32B，模型越强 RAG 效果越好

知识库 Bot · 黄金系统 Prompt（直接抄）

你是【XX】团队的专属助手。请严格按下列规则回答用户问题： 1. 只基于【检索到的知识库内容】回答，不得加入外部知识 2. 每个核心论点必须在末尾【方括号】里注明来源文件名 3. 若检索结果无法完整回答，请主动说"我在现有资料里没找到 XX 的答案，建议您咨询 [具体人员]" 4. 不知道用户身份时先问："请问您是 [部门 / 岗位]？" 以便给出精准答案 5. 如果用户要求总结、对比、分析，先列出依据的原文，再给结论 6. 严禁输出任何"根据我所知"、"一般来说"类推测语言 7. 输出格式： - 直接结论 - 依据原文（带来源） - 如需进一步查询的建议

📖 杜工的"调优日志"

第 1 版 Bot 问"滚筒电机噪音大怎么修"→ AI 答了一堆通用建议。杜工把 Top-K 从 3 调到 5、加了"只基于资料回答"系统 Prompt、资料里加"故障码对照表"，一周后准确率从 40% 涨到 90%。调优比建库更重要。

> RETRIEVAL CONFIG · 调优控制台（推荐起始值）

chunk_size

800range 600~1200

overlap

100range 80~150

top_k

5range 3~8

threshold

0.70range 0.65~0.75

temperature

0.3低温 · 不发散

� AI 答非所问 · 诊断决策树（按出现频率排序）

Q1 · 答案一条都挂不上"来源"引用？

系统 Prompt 漏了"每条结论末尾用【来源：《XX》】标注" → 加上即可

Q2 · 没找到也瞎编？

加"若检索结果无法回答，请说'我在现有资料里没找到'" + 降 temperature 到 0.3

Q3 · 答案不完整 / 只讲一半？

top_k 从 3 调到 5 · overlap 从 50 调到 100~150

Q4 · 召回一堆无关内容混乱跑题？

threshold 从 0.5 调到 0.70 · top_k 降到 3~5

Q5 · 问"那个是多少"找不到？（问题太模糊）

系统 Prompt 加"不知道用户身份时先问部门/年份" · 或启用"问题改写"插件

Q6 · 检索对了，但生成啰嗦偏题？

换模型到豆包 Pro / Kimi / DeepSeek 32B · 加"请直接给结论，不超过 200 字"

ENGINEER LOG · 真实调优循环 · 9 步把准确率干到 85%（30 分钟）

进入 Bot 编辑页 · 定位参数面板 ⏱ 1 min
- 扣子首页 → 智能体 → 点你的 Bot → 点右上角 编辑
- 右侧中部找到 知识库 模块 → 点展开的 ⚙ 设置 图标
- 弹出的面板就是你的"调参控制台"
✅ 做完的样子：能看到 最大召回数 · 最小匹配度 · 搜索策略 三个可调选项
按 Tuner 推荐值先铺第 1 版参数 ⏱ 1 min
- 最大召回数 (top_k) = 5
- 最小匹配度 (threshold) = 0.70
- 搜索策略 = 混合检索（语义 + 关键词）· 权重默认
- 模型下拉切到 豆包 Pro / Kimi 128K 任选一个 · temperature 拖到 0.3
💡 为什么 0.3 不是 0：0 会过于死板 · 0.3 让答案自然但不乱发挥
准备 10 道真题（这一步最关键） ⏱ 8 min
- 新建 07-rag/qa-v1.md · 写 10 题分 3 类：
  - 事实查询（4 题）：答案在资料里能找到原句 · 如"差旅交通费标准是多少"
  - 对比分析（3 题）：需要跨 2~3 个文件综合 · 如"病假和事假的补贴差别"
  - 模糊指代 + 离轨题（3 题）：② 语言模糊 · ③ 资料里根本没有 · 如"那个补贴能报多少" · "去年国庆假怎么放"（假设资料里没）
- 每题旁边写 标准答案（你自己从原文复制）· 后面打分用
⚠ 不要拿"你自己也不知道答案"的题来测 · 那是验证不是调优 · 会让你怀疑人生
第 1 轮测试 · 只记录不改参数 ⏱ 5 min
- 打开 Bot 预览窗口 · 复制每道题粘进去
- 记 4 列：题号 | 预期答案 | 实际答案 | 是否准确 (✓/✗/半对)
- 对每个 ✗ 和半对 · 写一句失败原因归类（见下一步）
✅ 做完的样子：一张 10 行表 · 准确率可能在 40~60%（这个基线就是你的起点）
对照诊断树 · 归类失败原因 ⏱ 3 min
- 每个失败案例对应上面的 Q1~Q6 打一个标签：Q1 漏引用 / Q2 瞎编 / Q3 答不全 / Q4 召回乱 / Q5 指代模糊 / Q6 模型偏题
- 按标签频次排序 · 最多的那类先治
💡 90% 的新人 Bot 问题集中在 Q2（瞎编）和 Q4（召回乱）· 先治这两个杀伤最大
第 2 轮 · 每次只改 1 个参数 ⏱ 5 min
- 若主问题是 Q2 瞎编：加系统 Prompt 约束"若检索结果无法回答，请说'我在现有资料里没找到'" + temperature 降到 0.2
- 若主问题是 Q4 召回乱：threshold 0.70 → 0.75 · top_k 5 → 3
- 若主问题是 Q3 答不全：top_k 3 → 6 · overlap 100 → 150（需回 PART D 重新切块）
⚠ 铁律：一次只改 1 个参数 · 不然你永远不知道是哪改带来的变化
记版本日志到 tuning.md ⏱ 2 min
## v1 · 基线 chunk=800/overlap=100/top_k=5/threshold=0.70/temp=0.3 acc = 55% (6/10 对 · 4 错 · 其中 Q2 占 3 · Q4 占 1) ## v2 · 加闭嘴约束 + 降温改动：系统 Prompt 加"找不到就说找不到" + temp 0.3→0.2 acc = 70% (7/10 · Q2 消灭 2 个 · 新增 1 个 Q3) ## v3 · 放宽 top_k 改动：top_k 5→6 acc = 85% (8.5/10 · Q3 消灭 · 1 个半对)
💡 这份 tuning.md 是你"会调 RAG"的最硬证据 · 以后简历面试可以直接截图给面试官
再跑 1~2 轮 · 直到准确率 ≥ 85% ⏱ 5 min / 轮
- 一般 v3~v4 能稳定到 85% · 剩下的 15% 通常是资料本身就没答案 · 不是 Bot 的错
- 到 85% 就停 · 不要过拟合——再改参数可能把其他题改坏
✅ 做完的样子：tuning.md 至少 3 个版本 · 最新版 acc ≥ 85% · 每个版本都有明确改动说明
加一道"压力测试" ⏱ 2 min
- 故意问一道资料里确实没有的题（例 "公司 2030 年战略是什么"）
- 理想结果：Bot 说"我在现有资料里没找到相关信息，建议您咨询 XX"
- 如果它瞎编了 → Q2 没治好 · 回第 6 步继续加闭嘴约束
⚠ RAG 真正的门槛不是答对多少 · 是不瞎编 · 一个会瞎编的 Bot 比不回答更可怕

防止知识库 Bot 瞎编，最重要的系统 Prompt 约束是？

A. 让 AI 说话简短 B. "若检索结果无法回答，请说'我在现有资料里没找到'" C. 让 AI 用英文回答 D. 关闭联网

PART F · 第四课 · 引用 ⏱ 20 min

引用可追溯 · 每个答案都要指向"原文哪一段"

真正专业的知识库 Bot 回答时会给出"原文出处"——这是可信度的关键。下面教你怎么在扣子里开启"引用展示"。

扣子后台 → 智能体编辑页 → 右上角"知识库"→ 添加你的知识库
"最大召回数量"= 5、"最小匹配度"= 0.65（符合 PART E 的推荐）
勾选"开启引用展示"——每个回答末尾会自动列出 Top-K 原文片段
系统 Prompt 里写："每条结论末尾用【来源：《文件名》第 N 段】标注"
测试：问 3 个真问题，看每条结论是否都挂了引用
用户体验优化：引用链接可直接"点击跳到原文"——在 FastGPT 里支持，扣子需手动维护原文链接

❌ 无引用的 Bot

用户：请假超过 3 天需要什么审批？ Bot：一般由部门经理审批……（用户无法核实、敢用吗？）

✅ 有引用的 Bot

用户：请假超过 3 天需要什么审批？ Bot：根据《2024 假勤管理办法》第 7 条，连续请假 3 天以上（不含 3 天）需部门经理 + HR 双重审批；超过 7 天还需分管副总签字。【来源：《2024 假勤管理办法》第 7 条，第 12 页】

📖 阿乐的 HR Bot 上线心法

他的 Bot 上线前做了一件事：把所有文件编号（第 1 条 / 第 2 条）都写在原文里，让 Bot 引用时能精确到条。员工再也不信"听说可以"，都看"第 X 条"。HR 的权威性也被这个 Bot 反向加强——她现在是"懂系统最多的人"。

请假超过 3 天需要什么审批？

根据公司制度，连续请假超过 3 天（不含 3 天）需 部门经理 + HR 双重审批 [1]；超过 7 天还需分管副总签字 [2]；病假超过 10 天需同时提交三甲医院诊断证明 [3]。

REFERENCES
[1] 《2024 假勤管理办法》第 7 条 · 第 12 页 · similarity=0.89
[2] 《2024 假勤管理办法》第 7 条 · 第 12 页 · similarity=0.87
[3] 《病假证明与补贴管理细则》第 3 条 · 第 5 页 · similarity=0.81

↑ 每条引用都显示 similarity 分数——这是知识库 Bot 的"诚实度徽章"

ENGINEER LOG · 打开引用展示 · 7 步让每条答案都带出处（20 分钟）

开启引用展示开关 ⏱ 1 min
- 扣子 Bot 编辑页 → 右侧 知识库 模块 → 点 ⚙ 设置
- 向下滚动找到 显示召回引用 / Show Citations · 打开开关 · 保存
✅ 做完的样子：开关变绿 / 蓝 · 预览窗口测一题后答案底部会出现 📎 引用 3 可折叠区
在系统 Prompt 加"引用铁律" ⏱ 3 min
【引用铁律 · 必须遵守】 1. 每条独立结论后用【来源：《文件名》第 X 条 / 第 X 页】标注 2. 若同一结论来自多处，用 [1][2][3] 编号 · 末尾按顺序列出完整来源 3. 如果某条结论没有来源，请重新组织或直接说"资料里没找到" 4. 禁止省略【来源】· 禁止用"根据资料""一般来说"替代具体出处
💡 粘进 Prompt 最末尾 · 不要夹在中间 · AI 对"最后一句话"的遵从度最高
验证 3 道真题 · 看每句结论是否都挂来源 ⏱ 5 min
- 找 3 道"必有答案"的真题 · 粘到预览框
- 眼过每一行 · 每条结论末尾是否都有【来源：xxx】
- 点底部 📎 引用 展开 · 看召回的原文片段和结论是否对得上
⚠ 失败常见：AI 把多条结论的来源合并写在最末 · 这等于"等于没写" · 需要回第 2 步加一句 "每条结论必须单独标注，不可合并"
原文加"条款编号" · 把引用精度提一档 ⏱ 5 min
- 回到 07-rag/clean/ · 打开你最常被问的 3 份文件
- 给每条规则前加编号：第 1 条：... · 第 2 条：... · 第 3.1 款：...
- 保存 → 回知识库 → 找到这 3 份文件 → 点 重新处理
✅ 做完的样子：再提问时引用从 "第 12 页" 升级到 "第 7 条第 12 页" · 精度看齐法律条文
有引用 vs 无引用 · 双截图对比存档 ⏱ 3 min
- 在 Prompt 里临时注释掉"引用铁律" · 问 1 题 · 截图 A（无引用版）
- 恢复"引用铁律" · 同一题再问 · 截图 B（有引用版）
- 两图并排拼到一张 · 存到 AI 作品集/07-知识库 Bot/引用对比.png
💡 这张图以后是你"给老板展示 Bot 价值"的 0.5 秒杀手锏 · 一看就懂
设置"来源可点击跳转"（进阶可选） ⏱ 2 min
- 若资料是在线文档（飞书 / Notion / 石墨）· 在每份文件顶部加一行 # 原文链接：https://xxx
- 系统 Prompt 加："末尾列出【📎 原文链接】供点击"
- 效果：用户点 📎 直接跳到原文 · 信任感 +200%
冒烟 5 题 · 锁定"引用合格"基线 ⏱ 1 min
- 再问 5 题 · 数一下"有引用"的结论占比
- 目标：100% 结论都带引用 · 差一条都回第 2 步调 Prompt
✅ 做完的样子：5/5 全挂引用 · 每条都能点回原文 · 这才叫真正的 RAG Bot

专业 RAG Bot 和普通 AI 聊天最根本的区别是？

A. 每条结论都有"出自哪份文件哪一段"的引用 B. 回答更长 C. 更贵 D. 更慢

PART G · 🎯 本章产出 ⏱ 20 min

产出 · 一个喂了你资料的专属问答 Bot 可扫码使用 · 可发老板

ENGINEER LOG · 从 0 到可扫码上线 · 12 步交付作品集（30 分钟）

场景锁定 · 给 Bot 起"能卖钱的名字" ⏱ 1 min
- 不写"HR 助手" · 写 [你公司] 员工 HR 自助问答 · 7×24 答疑
- 不写"产品手册" · 写 滚筒洗衣机 XQG100 · 故障自诊助手
- 名字越具体 · 转发率越高 · 因为别人一眼知道"关我啥事"
✅ 做完的样子：Bot 名字长度 12~20 字 · 含"谁 × 做什么"两个信息
三项前置确认（必须都 ✅ 才能进第 3 步） ⏱ 2 min
- PART D · 知识库分段数 ≥ 50 · 冒烟 3 题至少 2 对
- PART E · tuning.md 到 v3 · acc ≥ 85% · 压力测试不瞎编
- PART F · 5/5 结论全挂引用 · 有引用对比截图
⚠ 任何一项没到位就发布 = 给自己挖坑 · 回去补
生成 Bot 头像 ⏱ 2 min
- 打开豆包网页版 · 发 Prompt：给一个叫【XX 自助问答】的 AI 机器人生成头像 · 扁平插画风 · 主色蓝 + 橙 · 圆形裁剪 · 512×512 · 不含文字
- 下载保存到 AI 作品集/07-知识库 Bot/avatar.png
扣子新建正式版智能体 ⏱ 2 min
- 扣子首页 → 左侧 智能体 → 右上 + 创建智能体
- 填：名字、头像（上传 avatar.png）、一句话介绍 · 点 创建
✅ 做完的样子：Bot 卡片出现 · 有头像和名字 · 状态"未发布"
绑定知识库 + 拷贝调优参数 ⏱ 3 min
- 进入 Bot 编辑页 → 右侧 知识库 → + 添加 → 选中你的 [主题]-v1
- ⚙ 设置打开 · 把 tuning.md 里 v3 的参数抄进来（top_k / threshold / temperature）
- 勾选 显示召回引用
粘贴"黄金系统 Prompt"并本地化 ⏱ 3 min
- 复制下方场景化 Prompt · 粘到 人设与回复逻辑 框
- 把 [XX 公司] · [HR 接口人] 替换为你真实的名字
- 末尾追加 PART F 的引用铁律
- 点 保存
开场白 + 推荐问题 · 让用户知道能问啥 ⏱ 2 min
- 编辑页找 开场白 · 写：您好，我是 XX 公司的 HR 助手。您可以问我关于差旅、请假、社保、绩效的任何问题～
- 下方 推荐问题 填 3 条高频真题 · 降低使用门槛
💡 "推荐问题"命中率决定用户是否愿意第二次用 · 别偷懒
10 题最终验收 ⏱ 5 min
- 用 PART E 的 10 题 · 在右侧预览框再跑一遍
- 目标：acc ≥ 85% · 引用覆盖 = 100% · 离轨题不瞎编
- 达不到 → 回 PART E / PART F 调 · 不要强行发布
发布到 Bot 商店 + 生成二维码 ⏱ 3 min
- 右上角 发布 → 选渠道 扣子 Bot 商店（免审核 · 最快）
- 填"分类"（如"效率办公"）· 填"使用说明" · 点 提交发布
- 1~3 分钟后页面显示 发布成功 · 下方有二维码和分享链接 · 全部下载
✅ 做完的样子：手机微信扫二维码 · 直接跳到 Bot 对话页 · 能问能答 · 有头像
48 小时公测 + 收集反馈 ⏱ 收集 2 天
- 把二维码贴在 工作群 / 朋友圈 / 小红书 · 文案：我做了一个【XX】AI 助手，扫码试试，帮我找 Bug～
- 新建 07-rag/feedback.md · 收 20 条真实提问 + 吐槽
- 按诊断树归类 · 出 v4 版本
💡 你收到的吐槽 = 下一版的金矿 · 一个"别人替你测 Bug"的机会
作品集归档（简历 / 求职用） ⏱ 5 min
AI 作品集/07-知识库 Bot/ ├── 01-知识库截图.png · 显示 chunk 总数 ├── 02-tuning.md · v1~v3 调优日志 ├── 03-system-prompt.md · 黄金 Prompt ├── 04-qa-10 题.md · 测试集 + 结果 ├── 05-引用对比.png · 无引用 vs 有引用 ├── 06-Bot 头像.png ├── 07-扫码二维码.png ├── 08-分享链接.txt ├── 09-feedback.md · 公测反馈 └── 10-README.md · 一页说明：场景 / 功能 / 数据 / 价值
💡 这套作品集 = 你以后跳槽涨薪 / 接外包 / 做咨询的敲门砖 · 小严靠这个 3 个月副业 8w
锁死"第 7 天回看"日历提醒 ⏱ 1 min
- 在手机日历 +7 天设提醒："回看 RAG Bot 数据 · 统计使用量 / 准确率变化"
- 目标：使用量 ≥ 50 次 / acc ≥ 90% · 达成就发朋友圈庆祝
✅ 做完的样子：7 天后你手里有一个真实使用数据的 RAG 作品 · 这是 99% 学 AI 的人都没有的东西

✨ 场景化系统 Prompt 示例（HR Bot）你是【XX 公司】专属 HR 助手，服务对象是全体员工。请严格遵守： 1. 只基于"公司制度知识库"回答，不要加入外部知识 2. 每条结论末尾用【来源：《文件名》第 X 条】标注 3. 不知道用户身份时先反问："您是哪个部门的员工？" 4. 涉及离职 / 劳动仲裁 / 敏感议题时，回答末尾统一加一句： "以上基于现有制度，具体个案请联系 HR 接口人：[姓名 / 企微]" 5. 若检索到的资料无法完整回答，请主动说"我在现有制度里没找到 XX 内容，建议您联系 HR 接口人" 6. 禁止输出"我猜""可能""一般情况下"等推测词 7. 输出格式： [结论] → [依据原文（带来源）] → [建议下一步（如需）]

🏆 产出验收标准

✅ 知识库至少包含 5 个整理过的文件
✅ Bot 已发布并获得扫码分享链接
✅ 测试 10 个问题，准确率 ≥80%
✅ 每条回答都有引用
✅ 至少 5 位朋友 / 同事扫过码试用
✅ 朋友圈 / 工作群打卡 1 次附二维码
✅ 归档「AI 作品集 / 07-知识库 Bot」

💼 企业实战 · RAG 的变现路径

很多自由职业者靠"给中小企业搭 RAG Bot"接单，单价 5~30k/个（按资料量）。技能门槛：扣子 + FastGPT。学员小严离职前是公司 IT，学完这章后靠副业接 RAG 项目，3 个月副业收入 8 万+，现在全职做"AI 知识库咨询"。

PART I · 🎮 RAG 工程师训练营 4 游戏 ⏱ 25 min

巩固关 · 4 个游戏让你"RAG 工程师肌肉上身" 边玩边会

RAG 这行手艺最难的不是工具，是切得对块 · 判得出召回 · 分得清幻觉 · 想得出落地场景。下面 4 个游戏专治这 4 个软肋。

🔪 游戏 1 · 切块大小侦探 · 4 段原文判最佳切法

给你 4 段不同类型的原文·判断哪种 chunk_size 最合理。

📄 场景 A：公司 100 条 FAQ · 每条 "问题 + 1~2 句回答" · 平均 80 字 · 彼此无关。

chunk=200 / overlap=0（一条一块）

chunk=150 / overlap=0 · 按"##"切

chunk=800 / overlap=100

chunk=2000 / overlap=200

✅ chunk=150 / overlap=0 · 按"##"切。FAQ 天然是"问答单位"·一条 = 一块·overlap 为 0 避免串味。800 太大会把 5~6 条 FAQ 粘到一起 · 召回会混乱。

📄 场景 B：产品使用手册 · 含 故障代码章节 · 每个故障 3~5 段文字 + 操作表格 · 章节间强关联（同一故障）· 不同故障要隔离。

chunk=100 / overlap=20

chunk=800 / overlap=100 · 按标题优先

chunk=3000 / 不切块

chunk=400 / overlap=0

✅ 800/100/按标题。按"##故障代码"标题切保证每故障独立一块 · 但 overlap 100 允许相关段落跨界。这是 RAG 最通用的"黄金组合"。

📄 场景 C：法律合同 · 每一条 1~3 段 · 前后强相关（"本条所指" / "前款规定"）。

chunk=400 / overlap=0

chunk=800 / overlap=100

chunk=1200 / overlap=200 · 按"第 X 条"切

chunk=100 / overlap=50

✅ 1200/200。法律文本前后代词指代强（"本条""前款"）· chunk 要大 · overlap 要高 · 否则 AI 会丢失"本条"的指向。

📄 场景 D：你的 20 本书读书笔记 · 每段 30~500 字 · 话题跳跃大 · 你想按"金句 / 观点"查询。

chunk=300 / overlap=50 · 按段落切

chunk=100 / overlap=0

chunk=1500 / overlap=200

chunk=5000 / 不切

✅ 300/50。读书笔记讲究"短而独立的观点"·太大的 chunk 会让查"金句"时召回一大团杂音。300 字 ≈ 一段完整思考 · 刚好。

🎯 答对 0 / 4 · 得分 0

🔍 游戏 2 · 召回质量判官 · 4 组"问题 + 召回片段"打分

给你问题和召回的 3 条内容 · 判断召回是 ✅ 可用 / ⚠ 部分可用 / ❌ 重调。

🙋 用户问：出差交通费报销标准是多少？

[召回 1 · sim=0.89] 《差旅管理办法》第 5 条：员工出差交通费...经济舱不限 / 高铁二等座不限
[召回 2 · sim=0.85] 同办法第 6 条：城市内交通报销上限 200/天
[召回 3 · sim=0.82] 同办法第 4 条：差旅申请需提前 3 天审批

✅ 可用（命中核心）

⚠ 部分可用

❌ 重调

✅ 可用。3 条相似度都 ≥ 0.82 · 都和交通费相关 · 核心条款命中。召回 3 虽然讲审批但属于"紧密相关"可保留。这是标准合格召回。

🙋 用户问：公司有没有人才推荐奖？

[召回 1 · sim=0.55] 《招聘流程制度》第 3 条：招聘经理负责发布职位...
[召回 2 · sim=0.51] 《入职流程》第 1 条：新员工报到需准备身份证...
[召回 3 · sim=0.48] 《试用期考核》第 2 条：试用期 3~6 个月...

✅ 可用

⚠ 部分可用

❌ 重调 / 资料缺失

❌ 重调 / 资料缺失。所有相似度 < 0.6 · 且都答非所问。说明资料里根本没有"人才推荐奖"。正确做法：① 资料缺 → 补文档；② 若 threshold=0.7 · Bot 会直接说"没找到" = OK；若 threshold 设太低把这些召回送 AI · Bot 会胡编答案。

🙋 用户问：生病请假 5 天需要医院证明吗？

[召回 1 · sim=0.88] 《假勤管理办法》第 7 条：病假 3 天以上需提交医院病假条
[召回 2 · sim=0.42] 《差旅管理》第 2 条：因公外出...
[召回 3 · sim=0.35] 《员工福利》第 1 条：节日福利发放...

✅ 可用

⚠ 部分可用（召回 1 对 · 2&3 噪音）

❌ 重调

⚠ 部分可用。召回 1 完美命中 · 2/3 是噪音（相似度 < 0.5）。解法：threshold 从 0.3 调到 0.65 · 只保留召回 1 送 AI · 答案会更干净。这是 RAG 调优里最常见的场景。

🙋 用户问：那个补贴能报多少？

[召回 1 · sim=0.71] 《差旅补贴》第 3 条：出差日均补贴 100~300
[召回 2 · sim=0.69] 《通讯补贴》第 1 条：月补 200
[召回 3 · sim=0.67] 《餐补制度》第 1 条：中餐补 25/天

✅ 可用（全答）

⚠ 部分可用 · 需问题改写

❌ 重调

⚠ 部分可用 · 需要问题改写 / 反问用户。"那个补贴"指代模糊 · 系统召回了 3 种补贴 · AI 可能全讲一遍把用户淹没。最佳做法：Bot 反问"您是指差旅 / 通讯 / 餐补？"再精准回答。

🚨 游戏 3 · 幻觉识别器 · 5 条回答判真假

资料给定 · 判断 Bot 回答是 ✅ 基于资料 / 👻 幻觉瞎编。

📚 资料：差旅住宿标准 · 一线城市 600 / 二线 400 / 其他 300。
🤖 Bot 回答：出差住宿上限为一线 600 元 / 二线 400 / 其他 300【来源：《差旅管理办法》第 8 条】。

✅ 基于资料

👻 幻觉

✅ 标准好回答。数字完全对齐资料 + 带出处。这就是理想 RAG。

📚 资料：差旅住宿标准 · 一线城市 600 / 二线 400 / 其他 300。
🤖 Bot 回答：一线城市 800 / 二线 500 · 北京上海可申请特批到 1200。

✅ 基于资料

👻 幻觉

👻 严重幻觉。数字全是编的 + 资料里根本没有"特批 1200"。典型 Q2 症状 · 解法：temperature 降到 0.2 + Prompt 加"找不到就说找不到"。

📚 资料：无任何关于"996 工作制"内容。
🤖 Bot 回答：我在现有资料里没找到关于 996 工作制的规定，建议您联系 HR 接口人：李姐 / hr@company.com。

✅ 合格（模范处理）

👻 幻觉

✅ 合格 · 这是比"答对"更难做到的能力——承认自己不知道。95% 的新手 Bot 会在这里瞎编。你的 Bot 能做到这样 = 通过最高考验。

📚 资料：年假 5~10 年工龄 10 天 · 10 年以上 15 天。
🤖 Bot 回答：根据资料，年假 10 天。根据劳动法一般还可以加 5 天探亲假。

✅ 基于资料

👻 半幻觉（掺外部知识）

👻 半幻觉。前半句对 · 后半句是 AI 自己的"劳动法知识"掺进来了——资料里根本没提探亲假。RAG 铁律：只基于资料 · 不得加外部知识。解法：Prompt 加"严禁引用外部知识 · 严禁'根据劳动法''一般来说'等表达"。

📚 资料：请假 3 天以上需部门经理审批。
🤖 Bot 回答：请假 3 天以上需部门经理审批【来源：《假勤管理办法》第 7 条】。若涉及项目交接 · 建议提前 3 天申请 · 避免影响团队进度。

✅ 合格（结论来自资料 · 贴心话术可接受）

👻 幻觉

✅ 合格。核心结论严格来自资料 + 带引用。第二句"建议提前 3 天"是行为提醒 · 不是事实编造 · 可以接受（严格模式可去掉）。区分关键：有没有编新事实。

🎰 游戏 4 · RAG 落地盲盒 · 抽一个立刻能做的项目

不知道 RAG 能干嘛？3 秒给你身份 + 知识库 + 上线渠道 + 能赚多少。

🎲 RAG 项目生成器 · 身份 × 知识库 × 渠道 × 变现

点下面按钮 · 抽一个你的第一个 RAG 项目 🎰

💡 连抽 3 次挑最心动的 · 立刻按 PART G 12 步上线

PART J · 🚀 RAG 工程师职业跃迁 ⏱ 20 min

会做 RAG 的人 · 薪资多少 · 怎么变现可跳槽 · 可副业

2025 年企业 AI 预算里 · RAG 是第一优先级——因为它是"AI 落地最具体、最能解释、最容易计算 ROI"的技术栈。每家中大型企业都在找会搭 RAG 的人。

💰 3 档岗位 · 3 档薪资

TIER 1 · 新人入门

🧩 AI 应用工程师 / 知识库运营

12~25k / 月

给企业搭 + 维护 RAG Bot · 日常工作：整理资料 / 切块 / 调参 / 写 Prompt / 迭代版本。产品公司 / 中大厂子公司都招。

💼 AI 应用工程师 · 知识库运营 · AIGC 内容运营 · 客服系统助理

TIER 2 · 本章毕业位

🧠 RAG 工程师 / AI 产品经理

25~60k / 月 + 股票

独立负责企业知识库从 0 到 1 · 设计分块策略 / 选模型 / 定 SOP / 上线多渠道。带 2~5 人小组或外包团队。

💼 企业 RAG 工程师 · AI PM · 智能客服负责人 · AIGC 解决方案架构师

TIER 3 · 进阶目标

🏆 AI 解决方案架构师 / 独立咨询

60k~100w / 月 + 项目分成

服务大客户 / 做行业 Top 案例 · 或独立做 RAG 咨询公司 · 单项目 20w~200w · 年流水 500w+。

💼 大厂 AI 架构师 · AI 咨询合伙人 · RAG SaaS 创始人

💸 6 条变现路径 · 副业 / 全职都成立

定制

企业 RAG 定制 · 单项目 5~30w

1 个月 1~2 单 = 10~60w / 月

中小企业想做客服 Bot / 知识库 / 培训助理 · 市场价 5~30w。小严模式：扣子 + 飞书 + 企微三件套 · 一周交付。

咨询

AI 咨询 · 按天 3~10k

每月 10 天 = 3~10w · 时间自由

给客户"看病"——帮他们诊断现有 Bot 为什么不准 / 定方案 / 培训团队。不交付代码也能收钱。

行业知识库 SaaS · 月费 99~1999

律师版 / 医生版 / 教培版

垂类行业打包"行业资料 + 定制 Bot" · 月订阅。100 个客户 × 399 = 月入 4w 被动收入。

课程

零基础搭 RAG 课 · 399~2999

自己的案例就是最好广告

"零基础 7 天搭一个能上线的 RAG Bot"打包课 · 小鹅通 / 抖音卖。你的扣子 Bot 本身就是 demo。

数据

数据清洗服务 · 200~2000 / GB

脏活累活 · 门槛低收入稳

很多企业想做 RAG 但资料脏得离谱。你包"OCR + 格式化 + 元数据" · 按 GB 计费。1 单 2~5w 常见。

私域

自媒体私域答疑 Bot · 月 99~599

知识博主刚需 · 复购极高

博主卖完课后都面临"学员问答解决不过来"。你搭个喂了他课件的 Bot 挂私域 · 收月费。

📄 简历 / 求职加分话术

                    应聘 AI 应用 / RAG 工程师岗：

                    "独立搭建过 从 0 到上线的 RAG 系统（扣子 + FastGPT）· 处理 XX 份文档 · XX 分段 · 准确率从 45% 调优到 90%+ · 熟悉 chunk 策略 / 召回调参 / 引用合规 · 作品已服务 XX 用户。"
                
                    应聘 AI 产品经理 / 解决方案：

                    "能为客户设计 端到端 RAG 方案——资料整理 → 切块 → 调参 → 引用 → 上线 → 反馈闭环。熟悉扣子 / FastGPT / Dify 三栈对比选型 · 独立交付过 XX 个企业级 Bot。"
                
                    应聘技术类 / 架构岗：

                    "深度理解 RAG 原理：Embedding 召回 → Rerank → Prompt 拼接 → 模型生成 → 引用追溯。能设计行业垂直知识库架构 · 优化 top_k / threshold / overlap · 诊断 6 类常见故障。"
                
                    面试黄金回答（问到"怎么解决 AI 幻觉"）：

                    "我有一套RAG 反幻觉三板斧：

                    ① 数据层——切块带 overlap + 元数据 + 条款编号；

                    ② 检索层——threshold ≥ 0.7 + top_k 3~5 + 混合检索；

                    ③ 生成层——temperature ≤ 0.3 + Prompt 强约束"找不到就说找不到" + 每条结论必挂引用。

                    过去做的 Bot 压力测试0 幻觉 · 100% 结论带出处。"

🎯 本章 5 张门票

门票 1 · 切块直觉：看一眼资料就知道 chunk_size 该定多少 · 这是 RAG 核心功夫
门票 2 · 调参能力：tuning.md 三板斧让准确率从 45% → 90% · 可复制可复用
门票 3 · 幻觉免疫：让 Bot 会说"我不知道" · 这比"答对"更值钱
门票 4 · 引用意识：每条答案都带出处 · 企业级 Bot 的标配
门票 5 · 企业视角：从"玩 AI"升级到"给企业卖 AI" · 这是单价跃迁的跳板

PART H · 打卡 + 预告 ⏱ 10 min

本章 12 项打卡 · 解锁「知识库工程师」徽章

🎬 下一章预告

第 8 章 · 零代码搭建 AI Bot：你会用扣子 Coze 把"知识库 + 工作流 + 插件"合体，搭出会查天气、会下订单、会查快递、会调用微信的真正智能体——这是整个课程最有成就感的一章。

📚 RAG 专属知识库 · 让 AI 只回答你的问题

🗺 学习地图（约 120 分钟 · 8 个小节）

A · 开场（10 min）

B · 工具横评（20 min）

C · 原理 · 3 张图看懂 RAG（20 min）

D · 资料整理 + 切块（20 min）

E · 调参调优（20 min）

F · 引用追溯（20 min）

G · 🎯 产出 · 你的专属问答 Bot（20 min）

H · 打卡 + 预告（10 min）

为什么 RAG 是企业 AI 最高价值的硬技能？

5 款 RAG 工具横评 · 按你的资料量和分享需求选

RAG 原理 · 3 张"大白话图"看懂

> RAG PIPELINE · 数据在系统里的真实流向

资料整理 + 切块策略 · 这一步做对，成败占 70%

✅ 整理前 5 步

❌ RAG 杀手

> CHUNK VISUALIZER · 同一段原文 / 3 种切法对比

ENGINEER LOG · 资料入库流水线 · 10 步从文件到可查询（25 分钟）

AI 答非所问 · 5 个最常见的坑 + 对应解法

① 检索召回 Top-K 设错

② 召回阈值（相似度分）太低

③ 系统 Prompt 没"闭嘴约束"

④ 问题太模糊

⑤ 切块切错

⑥ 底座模型太弱

> RETRIEVAL CONFIG · 调优控制台（推荐起始值）

� AI 答非所问 · 诊断决策树（按出现频率排序）

ENGINEER LOG · 真实调优循环 · 9 步把准确率干到 85%（30 分钟）

引用可追溯 · 每个答案都要指向"原文哪一段"

ENGINEER LOG · 打开引用展示 · 7 步让每条答案都带出处（20 分钟）

产出 · 一个喂了你资料的专属问答 Bot 可扫码使用 · 可发老板

ENGINEER LOG · 从 0 到可扫码上线 · 12 步交付作品集（30 分钟）

🏆 产出验收标准

巩固关 · 4 个游戏让你"RAG 工程师肌肉上身" 边玩边会

🔪 游戏 1 · 切块大小侦探 · 4 段原文判最佳切法

🔍 游戏 2 · 召回质量判官 · 4 组"问题 + 召回片段"打分

🚨 游戏 3 · 幻觉识别器 · 5 条回答判真假

🎰 游戏 4 · RAG 落地盲盒 · 抽一个立刻能做的项目

🎲 RAG 项目生成器 · 身份 × 知识库 × 渠道 × 变现

会做 RAG 的人 · 薪资多少 · 怎么变现 可跳槽 · 可副业

💰 3 档岗位 · 3 档薪资

🧩 AI 应用工程师 / 知识库运营

🧠 RAG 工程师 / AI 产品经理

🏆 AI 解决方案架构师 / 独立咨询

💸 6 条变现路径 · 副业 / 全职都成立

企业 RAG 定制 · 单项目 5~30w

AI 咨询 · 按天 3~10k

行业知识库 SaaS · 月费 99~1999

零基础搭 RAG 课 · 399~2999

数据清洗服务 · 200~2000 / GB

自媒体私域答疑 Bot · 月 99~599

📄 简历 / 求职加分话术

本章 12 项打卡 · 解锁「知识库工程师」徽章

✅ 完成下面 12 项任务

知识库工程师

会做 RAG 的人 · 薪资多少 · 怎么变现可跳槽 · 可副业