CHAPTER 07 / 10 · 2 小时实战课
📚 RAG 专属知识库 · 让 AI 只回答你的问题
3 张图看懂 RAG 原理 · 资料切块上传 · 调参调优 · 引用可追溯 · 产出一个喂了你资料的专属问答助手 + 可分享链接
完成下面 12 个任务,解锁「知识库工程师」徽章
🗺 学习地图(约 120 分钟 · 8 个小节)
A · 开场(10 min) 为什么 RAG 是企业 AI 最值钱的硬技能
B · 工具横评(20 min) Kimi / 豆包 / FastGPT / Coze / Dify
C · 原理 · 3 张图看懂 RAG(20 min) 切块 / 向量 / 检索 / 生成
D · 资料整理 + 切块(20 min) 怎么整理让 AI 能读懂
E · 调参调优(20 min) 为什么 AI 答非所问的 5 个坑
F · 引用追溯(20 min) 每个答案都要有出处
G · 🎯 产出 · 你的专属问答 Bot(20 min) 扫码可用 · 可发老板
H · 打卡 + 预告(10 min) 徽章 + 第 8 章预告
PART A · 开场
⏱ 10 min
为什么 RAG 是企业 AI 最高价值的硬技能?
通用大模型再聪明,也不知道你公司的制度、不知道你产品的参数、不知道你家里的药盒 。RAG(Retrieval-Augmented Generation,检索增强生成)就是解决这件事——把你的资料喂给 AI,让它"先查你的资料再回答" 。
📖 学员 · 阿乐 · 32 岁 · 500 人公司 HR 主管
他把公司300 份制度文件 + 5 年员工问答邮件 喂给 FastGPT,做了一个"HR 小助手"。员工问"年假怎么算""离职流程""住房补贴"直接@它。HR 每天咨询量减少 80%,他从每天救火变成思考战略 。年底被提拔。
📖 学员 · 杜工 · 45 岁 · 设备工程师
他把 30 年攒的设备故障维修记录 + 说明书 PDF 喂给 Coze 知识库。新徒弟遇到故障不用翻 20 本手册,直接问 Bot。班组平均排故时间从 3.2 小时降到 40 分钟 ,被写进集团标杆案例。
💡 核心洞察
市面上 80% 的 "AI 降本增效"故事,背后都是 RAG。它不是"更聪明的 ChatGPT",而是把 AI 变成你团队里最了解业务的那个人 。学会搭 RAG,你在公司里就是"AI 负责人"——这是 2025 年最值钱的身份之一。
PART B · 工具选型
⏱ 20 min
5 款 RAG 工具横评 · 按你的资料量和分享需求选
工具 门槛 文件上限 可分享 推荐场景
Kimi 智能助手 极低(免注册) 单文件 100MB / 一次 50 个 ❌ 仅自用 个人学习 / 单次文档
豆包智能体 (字节)低 单智能体 10 个知识文件 ✅ 可发分享链接 个人助手 / 朋友圈卡片
扣子 Coze (字节)中等 知识库可扩展大 ✅ 扫码 / 嵌入 本章主线 · 团队用
FastGPT 较高 · 可自托管 无上限(按资源) ✅ API / 嵌入 企业内部 · 深度定制
Dify 较高 · 开发者向 无上限(按资源) ✅ 全套 API 技术团队 / 产品化
腾讯乐享 AI 中 企业级 ✅ 企微集成 大中型企业 · 内网合规
🎯 本章选型
练手(10 分钟就能跑通):Kimi ——传几个文件直接问,最快手
主线(建可分享的 Bot):扣子 Coze ——国内访问流畅、免费够用、可扫码分享
进阶(企业大量资料):FastGPT / Dify ——需要服务器,本章会给入门指引
🛠 动手任务 · 5 分钟
打开 www.coze.cn (扣子)→ 手机号登录 → 进入"工作空间"→ 左侧"资源库"找到"知识库"入口。这就是本章的大本营 。
PART C · 第一课 · 原理
⏱ 20 min
RAG 原理 · 3 张"大白话图"看懂
RAG 不神秘。它就是 "先检索 · 再生成" 两步流程。记住下面这 3 张图(用文字画给你),你比 90% 的人懂 RAG。
> RAG PIPELINE · 数据在系统里的真实流向
1 入库(资料变成"可搜索碎片")
你上传的 PDF / Word / Excel / 网页,被系统切成 500~1000 字的小块(chunk) ,每块被转成一个"向量"(一串数字),存进向量数据库。就像图书馆把每本书拆成章节,并贴上"主题卡片"。
2 检索(用户问一个问题)
用户提问时,系统先把问题也变成向量,在向量数据库里找出最相关的 3~5 块 (Top-K 检索)。就像问图书管理员"我要查 A 问题",她从卡片里找 5 张相关的给你。
3 生成(大模型基于检索结果回答)
系统把这 3~5 块内容拼到 Prompt 里,大模型基于"用户问题 + 检索到的内容"生成答案。就像你把 5 张卡片+问题交给图书管理员,她读完卡片给你讲答案。
❌ 纯大模型
用户问:"我公司 2024 年度培训预算是多少?"
AI:根据通常情况,培训预算约占总预算 1~3%...(瞎编)
✅ RAG 后
检索到:《2024 培训管理办法》第 5 条"培训年度总预算 186.3 万..."
AI:根据《2024 培训管理办法》第 5 条,2024 年度培训预算为 186.3 万元。
💡 RAG 为什么优于"直接把文件塞进长上下文"
Kimi / ChatGPT 现在都支持超长文档,为什么还要 RAG?
① 省钱 :每次只召回相关的几千 token,而不是把 50 万字都塞进去
② 精准 :长上下文里 AI 会"看后忘前",RAG 只喂最相关的片段
③ 可扩展 :资料再多也能搜得到,不受上下文窗口限制
④ 可多人共享 :一份知识库,全团队问
PART D · 第二课 · 资料
⏱ 20 min
资料整理 + 切块策略 · 这一步做对,成败占 70%
RAG 失败的最常见原因不是模型,而是你喂的资料又脏又乱 。下面这份整理清单请认真执行。
✅ 整理前 5 步
把扫描版 PDF 用 OCR 变成文字(推荐 Kimi / 豆包)
删除封面、目录、空白页、水印
把 Word / Excel 统一转成 Markdown 或 .txt
给每份文件加前缀元数据:"[部门][2024][制度] xxx.md"
把图片里的关键信息用文字补充描述
❌ RAG 杀手
整本书 500 页直接上传(切出的块会失上下文)
图片扫描件没 OCR(AI 读不到文字)
多文件"一锅炖"没分类
文件名全叫"文档 1.pdf""新建文档.docx"
Excel 合并单元格(AI 读取错位)
📖 阿乐整理 HR 资料的真实做法
300 份制度按"入职 / 薪酬 / 假勤 / 培训 / 离职 / 福利"分 6 个文件夹。每个文件顶部加 3 行:
① 标题:《2024 员工差旅管理办法》
② 适用范围:全员
③ 关键词:差旅、报销、出差标准、交通费
切块用 800/100——Bot 回答准确率从 45% 涨到 92% 。
> CHUNK VISUALIZER · 同一段原文 / 3 种切法对比
第 5 条 · 培训预算:公司 2024 年度培训总预算为 186.3 万元,按部门分配:技术部 65 万、销售部 52 万、职能部 30 万, 余下 39.3 万作为公司级 专项预留,由人力资源部统筹安排。预算使用须遵循"先审批后执行"原则, 单笔超过 5 万元的需总经理签字。 超出预算部分不予报销,除非另申请预算追加。
Chunk 1(覆盖总额 + 分配)
Overlap 重叠区(防断句)
Chunk 2(使用规则)
Chunk 3(超预算规则)
� 黄色重叠区 是关键——如果没有 overlap,用户问"39.3 万怎么用"可能只召回 Chunk 2 没有金额,或只召回 Chunk 1 没有使用规则。overlap 让两块都能被命中 。
ENGINEER LOG · 资料入库流水线 · 10 步从文件到可查询(25 分钟)
选定场景 ⏱ 1 min
3 选 1:① 工作域 (公司制度 / 产品手册 / SOP)② 家庭域 (保险单 / 药盒说明 / 体检报告 / 孩子错题本)③ 兴趣域 (你读过的 20 本书笔记 / 你写过的日记)
在桌面新建 07-rag 文件夹 · 里面再建 raw/ (原件)和 clean/ (处理后)两个子目录
✅ 做完的样子 :桌面上有 07-rag/raw/ · 07-rag/clean/ 两个空文件夹 · 场景写在便利贴上
收集 5~10 份原始文件 ⏱ 3 min
最少 5 份、最多 15 份 · 第一个知识库不要贪心
支持格式:PDF / Word / Excel / Markdown / TXT / 图片(要 OCR)· 单文件 < 30MB
全部拖到 07-rag/raw/
⚠ 别做的事 :整本 500 页的书直接上传 · 整个硬盘文件夹一口气倒进去 · 混多种语言混多种业务
扫描版 PDF / 图片 → OCR 变纯文字 ⏱ 5 min
打开 kimi.moonshot.cn (或豆包网页版)· 拖入扫描 PDF
发一句:请把这份 PDF 逐页 OCR 成 Markdown,保留标题层级(#、##、###),表格转成 markdown 表格,图片用文字描述替换。
Kimi 产出后点右上角复制 · 粘贴到新建的 xxx.md 文件
✅ 做完的样子 :原来 20 页扫描 PDF · 现在变成一份 3~5 KB 的 Markdown · 标题层级清晰 · 可以 Ctrl+F 搜到任何关键词
统一命名规范 ⏱ 3 min
格式:[部门][年份][类型]-原标题.md
示例:[HR][2024][制度]-差旅管理办法.md · [产品][2024][手册]-滚筒洗衣机 XQG100.md
命名里的方括号标签 = AI 的"前排特征" · 命中率 +15%
⚠ 翻车点 :文件名写"文档 1.pdf"、"新建文档.docx"、"最终版 v3 - 副本 - 副本.pdf" = 命中率直接 -20%
每份文件顶部加 3 行元数据 ⏱ 5 min
# 标题:2024 员工差旅管理办法
# 适用范围:全员 · 含实习生 · 不含外包
# 关键词:差旅、报销、出差标准、交通费、住宿标准、补贴、审批流程
💡 关键词写 5~10 个 · 尽量写同义词 / 俚语 ——员工可能问"出差能报多少"而不是"差旅标准"
清理脏内容 ⏱ 3 min
删除:封面页 / 目录页 / 页眉页脚 / 水印"公司内部请勿外传"
Excel:解除合并单元格(开始 → 合并后居中 → 取消合并 )· 填充空白单元格
所有 .docx 另存为 .md 或 .txt · .xlsx 另存为 .csv
⚠ 常见翻车 :Excel 合并单元格没拆 → AI 读到的表格会错位 → 召回永远不准 · 这是 RAG 失败 Top3 原因
登录扣子 · 新建知识库 ⏱ 2 min
访问 coze.cn 登录 · 左边栏选 工作空间
顶部点 资源库 → 右上角 + 创建资源 → 选 知识库
命名 [你主题]-v1(v1 是版本号 · 后面调优会出 v2 v3)· 类型选 文本格式 · 保存
✅ 做完的样子 :资源库列表里出现你的知识库卡片 · chunk 数为 0 · 状态"待上传"
上传 + 设切块参数 ⏱ 3 min
进入刚建的知识库 → 新增内容 → 本地文档 → 拖入 07-rag/clean/ 全部文件
下一步"分段设置"切换到 自定义 :
chunk_size = 800
overlap = 100
分隔符勾选 ## 标题 / \n\n
点 开始处理
💡 为什么这组数字 :800 字约一段逻辑完整的话 · 100 字 overlap 够覆盖断句 · 标题优先保住章节结构
等待索引 · 喝口水 ⏱ 1~3 min / 100 页
进度条走完后卡片状态变 可用 · 右上会显示 分段数 XXX (这就是 chunk 总数)
把这个数字抄到记事本 07-rag/tuning.md:v1 · chunks=385 · size=800/overlap=100
✅ 做完的样子 :卡片上显示 "已分段 385 条";随便点开 3 个分段预览 · 每块都是一段完整意思 · 没有半句话
冒烟测试 · 3 题见分晓 ⏱ 2 min
扣子顶部 智能体 → 快速新建一个 Bot → 只绑定这个知识库 · 不加其他 · 系统 Prompt 留空
右侧预览窗口提 3 个问题:① 你最确定答案的 · ② 中等模糊的 · ③ 故意问知识库里没有的
观察:① 应该答对;② 看召回的原文片段对不对;③ AI 应该说"找不到"(若它瞎编 = 进 PART E 调优)
✅ 做完的样子 :3 题中至少 2 题答对且附带正确原文片段 · 过不了就先别上线 · 立刻去 PART E
PART E · 第三课 · 调优
⏱ 20 min
AI 答非所问 · 5 个最常见的坑 + 对应解法
① 检索召回 Top-K 设错
症状 :AI 只找到 1 块内容,答得残缺 / 找到 10 块,AI 混乱跑题解法 :Top-K 设 3~5 ,复杂场景 5~8
② 召回阈值(相似度分)太低
症状 :把不相关的块也召回了,AI 胡说解法 :相似度阈值调到 0.65~0.75 ,低于阈值的块不送给 AI
③ 系统 Prompt 没"闭嘴约束"
症状 :没找到资料 AI 也瞎编解法 :系统 Prompt 加一句"若检索结果无法回答,请直接说'我在现有资料里没找到相关信息'"
④ 问题太模糊
症状 :用户问"那个是多少",AI 找不到对应块解法 :系统提示用户"请包含部门 / 年份 / 关键词",或加一层"问题改写"
⑤ 切块切错
症状 :关键段落被砍成两半解法 :调 overlap 到 150,或用"按标题切"而不是"按字数切"
⑥ 底座模型太弱
症状 :检索对了,但模型生成啰嗦 / 偏题解法 :切换到豆包 Pro / Kimi / DeepSeek 32B ,模型越强 RAG 效果越好
📖 杜工的"调优日志"
第 1 版 Bot 问"滚筒电机噪音大怎么修"→ AI 答了一堆通用建议。杜工把 Top-K 从 3 调到 5、加了"只基于资料回答"系统 Prompt、资料里加"故障码对照表" ,一周后准确率从 40% 涨到 90%。调优比建库更重要 。
> RETRIEVAL CONFIG · 调优控制台(推荐起始值)
chunk_size
800 range 600~1200
threshold
0.70 range 0.65~0.75
� AI 答非所问 · 诊断决策树(按出现频率排序)
Q1 · 答案一条都挂不上"来源"引用?
系统 Prompt 漏了"每条结论末尾用【来源:《XX》】标注" → 加上即可
Q2 · 没找到也瞎编?
加"若检索结果无法回答,请说'我在现有资料里没找到'" + 降 temperature 到 0.3
Q3 · 答案不完整 / 只讲一半?
top_k 从 3 调到 5 · overlap 从 50 调到 100~150
Q4 · 召回一堆无关内容混乱跑题?
threshold 从 0.5 调到 0.70 · top_k 降到 3~5
Q5 · 问"那个是多少"找不到?(问题太模糊)
系统 Prompt 加"不知道用户身份时先问部门/年份" · 或启用"问题改写"插件
Q6 · 检索对了,但生成啰嗦偏题?
换模型到豆包 Pro / Kimi / DeepSeek 32B · 加"请直接给结论,不超过 200 字"
ENGINEER LOG · 真实调优循环 · 9 步把准确率干到 85%(30 分钟)
进入 Bot 编辑页 · 定位参数面板 ⏱ 1 min
扣子首页 → 智能体 → 点你的 Bot → 点右上角 编辑
右侧中部找到 知识库 模块 → 点展开的 ⚙ 设置 图标
弹出的面板就是你的"调参控制台"
✅ 做完的样子 :能看到 最大召回数 · 最小匹配度 · 搜索策略 三个可调选项
按 Tuner 推荐值先铺第 1 版参数 ⏱ 1 min
最大召回数 (top_k) = 5
最小匹配度 (threshold) = 0.70
搜索策略 = 混合检索 (语义 + 关键词)· 权重默认
模型下拉切到 豆包 Pro / Kimi 128K 任选一个 · temperature 拖到 0.3
💡 为什么 0.3 不是 0 :0 会过于死板 · 0.3 让答案自然但不乱发挥
准备 10 道真题(这一步最关键) ⏱ 8 min
新建 07-rag/qa-v1.md · 写 10 题分 3 类:
事实查询 (4 题):答案在资料里能找到原句 · 如"差旅交通费标准是多少"
对比分析 (3 题):需要跨 2~3 个文件综合 · 如"病假和事假的补贴差别"
模糊指代 + 离轨题 (3 题):② 语言模糊 · ③ 资料里根本没有 · 如"那个补贴能报多少" · "去年国庆假怎么放"(假设资料里没)
每题旁边写 标准答案 (你自己从原文复制)· 后面打分用
⚠ 不要拿"你自己也不知道答案"的题来测 · 那是验证不是调优 · 会让你怀疑人生
第 1 轮测试 · 只记录不改参数 ⏱ 5 min
打开 Bot 预览窗口 · 复制每道题粘进去
记 4 列:题号 | 预期答案 | 实际答案 | 是否准确 (✓/✗/半对)
对每个 ✗ 和半对 · 写一句失败原因归类 (见下一步)
✅ 做完的样子 :一张 10 行表 · 准确率可能在 40~60%(这个基线就是你的起点)
对照诊断树 · 归类失败原因 ⏱ 3 min
每个失败案例对应上面的 Q1~Q6 打一个标签:Q1 漏引用 / Q2 瞎编 / Q3 答不全 / Q4 召回乱 / Q5 指代模糊 / Q6 模型偏题
按标签频次排序 · 最多的那类先治
💡 90% 的新人 Bot 问题集中在 Q2(瞎编)和 Q4(召回乱)· 先治这两个杀伤最大
第 2 轮 · 每次只改 1 个参数 ⏱ 5 min
若主问题是 Q2 瞎编 :加系统 Prompt 约束"若检索结果无法回答,请说'我在现有资料里没找到'" + temperature 降到 0.2
若主问题是 Q4 召回乱 :threshold 0.70 → 0.75 · top_k 5 → 3
若主问题是 Q3 答不全 :top_k 3 → 6 · overlap 100 → 150 (需回 PART D 重新切块)
⚠ 铁律 :一次只改 1 个参数 · 不然你永远不知道是哪改带来的变化
记版本日志到 tuning.md ⏱ 2 min
## v1 · 基线
chunk=800/overlap=100/top_k=5/threshold=0.70/temp=0.3
acc = 55% (6/10 对 · 4 错 · 其中 Q2 占 3 · Q4 占 1)
## v2 · 加闭嘴约束 + 降温
改动:系统 Prompt 加"找不到就说找不到" + temp 0.3→0.2
acc = 70% (7/10 · Q2 消灭 2 个 · 新增 1 个 Q3)
## v3 · 放宽 top_k
改动:top_k 5→6
acc = 85% (8.5/10 · Q3 消灭 · 1 个半对)
💡 这份 tuning.md 是你"会调 RAG"的最硬证据 · 以后简历面试可以直接截图给面试官
再跑 1~2 轮 · 直到准确率 ≥ 85% ⏱ 5 min / 轮
一般 v3~v4 能稳定到 85% · 剩下的 15% 通常是资料本身就没答案 · 不是 Bot 的错
到 85% 就停 · 不要过拟合 ——再改参数可能把其他题改坏
✅ 做完的样子 :tuning.md 至少 3 个版本 · 最新版 acc ≥ 85% · 每个版本都有明确改动说明
加一道"压力测试" ⏱ 2 min
故意问一道资料里确实没有 的题(例 "公司 2030 年战略是什么")
理想结果:Bot 说"我在现有资料里没找到相关信息,建议您咨询 XX"
如果它瞎编了 → Q2 没治好 · 回第 6 步继续加闭嘴约束
⚠ RAG 真正的门槛 不是答对多少 · 是不瞎编 · 一个会瞎编的 Bot 比不回答更可怕
PART F · 第四课 · 引用
⏱ 20 min
引用可追溯 · 每个答案都要指向"原文哪一段"
真正专业的知识库 Bot 回答时会给出"原文出处" ——这是可信度的关键。下面教你怎么在扣子里开启"引用展示"。
扣子后台 → 智能体编辑页 → 右上角"知识库"→ 添加你的知识库
"最大召回数量"= 5、"最小匹配度"= 0.65 (符合 PART E 的推荐)
勾选"开启引用展示" ——每个回答末尾会自动列出 Top-K 原文片段
系统 Prompt 里写 :"每条结论末尾用【来源:《文件名》 第 N 段】标注"
测试 :问 3 个真问题,看每条结论是否都挂了引用
用户体验优化 :引用链接可直接"点击跳到原文"——在 FastGPT 里支持,扣子需手动维护原文链接
❌ 无引用的 Bot
用户:请假超过 3 天需要什么审批?
Bot:一般由部门经理审批……(用户无法核实、敢用吗?)
✅ 有引用的 Bot
用户:请假超过 3 天需要什么审批?
Bot:根据《2024 假勤管理办法》第 7 条,连续请假 3 天以上(不含 3 天)
需部门经理 + HR 双重审批;超过 7 天还需分管副总签字。
【来源:《2024 假勤管理办法》第 7 条,第 12 页】
📖 阿乐的 HR Bot 上线心法
他的 Bot 上线前做了一件事:把所有文件编号(第 1 条 / 第 2 条)都写在原文里 ,让 Bot 引用时能精确到条。员工再也不信"听说可以",都看"第 X 条"。HR 的权威性也被这个 Bot 反向加强 ——她现在是"懂系统最多的人"。
请假超过 3 天需要什么审批?
根据公司制度,连续请假超过 3 天(不含 3 天)需 部门经理 + HR 双重审批 [1] ;超过 7 天还需分管副总签字 [2] ;病假超过 10 天需同时提交三甲医院诊断证明 [3] 。
REFERENCES
[1] 《2024 假勤管理办法》第 7 条 · 第 12 页 · similarity=0.89
[2] 《2024 假勤管理办法》第 7 条 · 第 12 页 · similarity=0.87
[3] 《病假证明与补贴管理细则》第 3 条 · 第 5 页 · similarity=0.81
↑ 每条引用都显示 similarity 分数——这是知识库 Bot 的"诚实度徽章"
ENGINEER LOG · 打开引用展示 · 7 步让每条答案都带出处(20 分钟)
开启引用展示开关 ⏱ 1 min
扣子 Bot 编辑页 → 右侧 知识库 模块 → 点 ⚙ 设置
向下滚动找到 显示召回引用 / Show Citations · 打开开关 · 保存
✅ 做完的样子 :开关变绿 / 蓝 · 预览窗口测一题后答案底部会出现 📎 引用 3 可折叠区
在系统 Prompt 加"引用铁律" ⏱ 3 min
【引用铁律 · 必须遵守】
1. 每条独立结论后用【来源:《文件名》 第 X 条 / 第 X 页】标注
2. 若同一结论来自多处,用 [1][2][3] 编号 · 末尾按顺序列出完整来源
3. 如果某条结论没有来源,请重新组织或直接说"资料里没找到"
4. 禁止省略【来源】· 禁止用"根据资料""一般来说"替代具体出处
💡 粘进 Prompt 最末尾 · 不要夹在中间 · AI 对"最后一句话"的遵从度最高
验证 3 道真题 · 看每句结论是否都挂来源 ⏱ 5 min
找 3 道"必有答案"的真题 · 粘到预览框
眼过每一行 · 每条结论末尾是否都有【来源:xxx】
点底部 📎 引用 展开 · 看召回的原文片段和结论是否对得上
⚠ 失败常见 :AI 把多条结论的来源合并写在最末 · 这等于"等于没写" · 需要回第 2 步加一句 "每条结论必须单独标注,不可合并"
原文加"条款编号" · 把引用精度提一档 ⏱ 5 min
回到 07-rag/clean/ · 打开你最常被问的 3 份文件
给每条规则前加编号:第 1 条:... · 第 2 条:... · 第 3.1 款:...
保存 → 回知识库 → 找到这 3 份文件 → 点 重新处理
✅ 做完的样子 :再提问时引用从 "第 12 页" 升级到 "第 7 条 第 12 页" · 精度看齐法律条文
有引用 vs 无引用 · 双截图对比存档 ⏱ 3 min
在 Prompt 里临时注释掉"引用铁律" · 问 1 题 · 截图 A(无引用版)
恢复"引用铁律" · 同一题再问 · 截图 B(有引用版)
两图并排拼到一张 · 存到 AI 作品集/07-知识库 Bot/引用对比.png
💡 这张图以后是你"给老板展示 Bot 价值"的 0.5 秒杀手锏 · 一看就懂
设置"来源可点击跳转"(进阶可选) ⏱ 2 min
若资料是在线文档(飞书 / Notion / 石墨)· 在每份文件顶部加一行 # 原文链接:https://xxx
系统 Prompt 加:"末尾列出【📎 原文链接】供点击"
效果:用户点 📎 直接跳到原文 · 信任感 +200%
冒烟 5 题 · 锁定"引用合格"基线 ⏱ 1 min
再问 5 题 · 数一下"有引用"的结论占比
目标:100% 结论都带引用 · 差一条都回第 2 步调 Prompt
✅ 做完的样子 :5/5 全挂引用 · 每条都能点回原文 · 这才叫真正的 RAG Bot
PART G · 🎯 本章产出
⏱ 20 min
产出 · 一个喂了你资料的专属问答 Bot 可扫码使用 · 可发老板
ENGINEER LOG · 从 0 到可扫码上线 · 12 步交付作品集(30 分钟)
场景锁定 · 给 Bot 起"能卖钱的名字" ⏱ 1 min
不写"HR 助手" · 写 [你公司] 员工 HR 自助问答 · 7×24 答疑
不写"产品手册" · 写 滚筒洗衣机 XQG100 · 故障自诊助手
名字越具体 · 转发率越高 · 因为别人一眼知道"关我啥事"
✅ 做完的样子 :Bot 名字长度 12~20 字 · 含"谁 × 做什么"两个信息
三项前置确认(必须都 ✅ 才能进第 3 步) ⏱ 2 min
PART D · 知识库分段数 ≥ 50 · 冒烟 3 题至少 2 对
PART E · tuning.md 到 v3 · acc ≥ 85% · 压力测试不瞎编
PART F · 5/5 结论全挂引用 · 有引用对比截图
⚠ 任何一项没到位就发布 = 给自己挖坑 · 回去补
生成 Bot 头像 ⏱ 2 min
打开豆包网页版 · 发 Prompt:给一个叫【XX 自助问答】的 AI 机器人生成头像 · 扁平插画风 · 主色蓝 + 橙 · 圆形裁剪 · 512×512 · 不含文字
下载保存到 AI 作品集/07-知识库 Bot/avatar.png
扣子新建正式版智能体 ⏱ 2 min
扣子首页 → 左侧 智能体 → 右上 + 创建智能体
填:名字、头像(上传 avatar.png)、一句话介绍 · 点 创建
✅ 做完的样子 :Bot 卡片出现 · 有头像和名字 · 状态"未发布"
绑定知识库 + 拷贝调优参数 ⏱ 3 min
进入 Bot 编辑页 → 右侧 知识库 → + 添加 → 选中你的 [主题]-v1
⚙ 设置打开 · 把 tuning.md 里 v3 的参数抄进来(top_k / threshold / temperature)
勾选 显示召回引用
粘贴"黄金系统 Prompt"并本地化 ⏱ 3 min
复制下方场景化 Prompt · 粘到 人设与回复逻辑 框
把 [XX 公司] · [HR 接口人] 替换为你真实的名字
末尾追加 PART F 的引用铁律
点 保存
开场白 + 推荐问题 · 让用户知道能问啥 ⏱ 2 min
编辑页找 开场白 · 写:您好,我是 XX 公司的 HR 助手。您可以问我关于差旅、请假、社保、绩效的任何问题~
下方 推荐问题 填 3 条高频真题 · 降低使用门槛
💡 "推荐问题"命中率决定用户是否愿意第二次用 · 别偷懒
10 题最终验收 ⏱ 5 min
用 PART E 的 10 题 · 在右侧预览框再跑一遍
目标:acc ≥ 85% · 引用覆盖 = 100% · 离轨题不瞎编
达不到 → 回 PART E / PART F 调 · 不要强行发布
发布到 Bot 商店 + 生成二维码 ⏱ 3 min
右上角 发布 → 选渠道 扣子 Bot 商店 (免审核 · 最快)
填"分类"(如"效率办公")· 填"使用说明" · 点 提交发布
1~3 分钟后页面显示 发布成功 · 下方有二维码 和分享链接 · 全部下载
✅ 做完的样子 :手机微信扫二维码 · 直接跳到 Bot 对话页 · 能问能答 · 有头像
48 小时公测 + 收集反馈 ⏱ 收集 2 天
把二维码贴在 工作群 / 朋友圈 / 小红书 · 文案:我做了一个【XX】AI 助手,扫码试试,帮我找 Bug~
新建 07-rag/feedback.md · 收 20 条真实提问 + 吐槽
按诊断树归类 · 出 v4 版本
💡 你收到的吐槽 = 下一版的金矿 · 一个"别人替你测 Bug"的机会
作品集归档(简历 / 求职用) ⏱ 5 min
AI 作品集/07-知识库 Bot/
├── 01-知识库截图.png · 显示 chunk 总数
├── 02-tuning.md · v1~v3 调优日志
├── 03-system-prompt.md · 黄金 Prompt
├── 04-qa-10 题.md · 测试集 + 结果
├── 05-引用对比.png · 无引用 vs 有引用
├── 06-Bot 头像.png
├── 07-扫码二维码.png
├── 08-分享链接.txt
├── 09-feedback.md · 公测反馈
└── 10-README.md · 一页说明:场景 / 功能 / 数据 / 价值
💡 这套作品集 = 你以后跳槽涨薪 / 接外包 / 做咨询的敲门砖 · 小严靠这个 3 个月副业 8w
锁死"第 7 天回看"日历提醒 ⏱ 1 min
在手机日历 +7 天设提醒:"回看 RAG Bot 数据 · 统计使用量 / 准确率变化"
目标:使用量 ≥ 50 次 / acc ≥ 90% · 达成就发朋友圈庆祝
✅ 做完的样子 :7 天后你手里有一个真实使用数据 的 RAG 作品 · 这是 99% 学 AI 的人都没有的东西
✨ 场景化系统 Prompt 示例(HR Bot)
你是【XX 公司】专属 HR 助手,服务对象是全体员工。
请严格遵守:
1. 只基于"公司制度知识库"回答,不要加入外部知识
2. 每条结论末尾用【来源:《文件名》 第 X 条】标注
3. 不知道用户身份时先反问:"您是哪个部门的员工?"
4. 涉及离职 / 劳动仲裁 / 敏感议题时,回答末尾统一加一句:
"以上基于现有制度,具体个案请联系 HR 接口人:[姓名 / 企微]"
5. 若检索到的资料无法完整回答,请主动说"我在现有制度里没找到 XX 内容,
建议您联系 HR 接口人"
6. 禁止输出"我猜""可能""一般情况下"等推测词
7. 输出格式:
[结论] → [依据原文(带来源)] → [建议下一步(如需)]
🏆 产出验收标准
✅ 知识库至少包含 5 个整理过的文件
✅ Bot 已发布并获得扫码分享链接
✅ 测试 10 个问题,准确率 ≥80%
✅ 每条回答都有引用
✅ 至少 5 位朋友 / 同事扫过码试用
✅ 朋友圈 / 工作群打卡 1 次附二维码
✅ 归档「AI 作品集 / 07-知识库 Bot」
💼 企业实战 · RAG 的变现路径
很多自由职业者靠"给中小企业搭 RAG Bot "接单,单价 5~30k/个(按资料量)。技能门槛:扣子 + FastGPT。学员小严 离职前是公司 IT,学完这章后靠副业接 RAG 项目,3 个月副业收入 8 万+ ,现在全职做"AI 知识库咨询"。
PART I · 🎮 RAG 工程师训练营 4 游戏
⏱ 25 min
巩固关 · 4 个游戏让你"RAG 工程师肌肉上身" 边玩边会
RAG 这行手艺最难的不是工具,是切得对块 · 判得出召回 · 分得清幻觉 · 想得出落地场景 。下面 4 个游戏专治这 4 个软肋。
🔪 游戏 1 · 切块大小侦探 · 4 段原文判最佳切法
给你 4 段不同类型的原文·判断哪种 chunk_size 最合理。
📄 场景 A :公司 100 条 FAQ · 每条 "问题 + 1~2 句回答" · 平均 80 字 · 彼此无关。
chunk=200 / overlap=0(一条一块)
chunk=150 / overlap=0 · 按"##"切
chunk=800 / overlap=100
chunk=2000 / overlap=200
✅ chunk=150 / overlap=0 · 按"##"切。FAQ 天然是"问答单位"·一条 = 一块 ·overlap 为 0 避免串味。800 太大会把 5~6 条 FAQ 粘到一起 · 召回会混乱。
📄 场景 B :产品使用手册 · 含 故障代码章节 · 每个故障 3~5 段文字 + 操作表格 · 章节间强关联(同一故障)· 不同故障要隔离。
chunk=100 / overlap=20
chunk=800 / overlap=100 · 按标题优先
chunk=3000 / 不切块
chunk=400 / overlap=0
✅ 800/100/按标题。按"##故障代码"标题切 保证每故障独立一块 · 但 overlap 100 允许相关段落跨界。这是 RAG 最通用的"黄金组合"。
📄 场景 C :法律合同 · 每一条 1~3 段 · 前后强相关("本条所指" / "前款规定") 。
chunk=400 / overlap=0
chunk=800 / overlap=100
chunk=1200 / overlap=200 · 按"第 X 条"切
chunk=100 / overlap=50
✅ 1200/200。法律文本前后代词指代强 ("本条""前款")· chunk 要大 · overlap 要高 · 否则 AI 会丢失"本条"的指向。
📄 场景 D :你的 20 本书读书笔记 · 每段 30~500 字 · 话题跳跃大 · 你想按"金句 / 观点"查询。
chunk=300 / overlap=50 · 按段落切
chunk=100 / overlap=0
chunk=1500 / overlap=200
chunk=5000 / 不切
✅ 300/50。读书笔记讲究"短而独立的观点 "·太大的 chunk 会让查"金句"时召回一大团杂音。300 字 ≈ 一段完整思考 · 刚好。
🎯 答对 0 / 4 · 得分 0
🔍 游戏 2 · 召回质量判官 · 4 组"问题 + 召回片段"打分
给你问题和召回的 3 条内容 · 判断召回是 ✅ 可用 / ⚠ 部分可用 / ❌ 重调 。
🙋 用户问 :出差交通费报销标准是多少?
[召回 1 · sim=0.89] 《差旅管理办法》第 5 条:员工出差交通费...经济舱不限 / 高铁二等座不限
[召回 2 · sim=0.85] 同办法第 6 条:城市内交通报销上限 200/天
[召回 3 · sim=0.82] 同办法第 4 条:差旅申请需提前 3 天审批
✅ 可用。3 条相似度都 ≥ 0.82 · 都和交通费相关 · 核心条款命中 。召回 3 虽然讲审批但属于"紧密相关"可保留。这是标准合格召回。
🙋 用户问 :公司有没有人才推荐奖?
[召回 1 · sim=0.55] 《招聘流程制度》第 3 条:招聘经理负责发布职位...
[召回 2 · sim=0.51] 《入职流程》第 1 条:新员工报到需准备身份证...
[召回 3 · sim=0.48] 《试用期考核》第 2 条:试用期 3~6 个月...
❌ 重调 / 资料缺失。所有相似度 < 0.6 · 且都答非所问 。说明资料里根本没有"人才推荐奖"。正确做法:① 资料缺 → 补文档;② 若 threshold=0.7 · Bot 会直接说"没找到" = OK;若 threshold 设太低把这些召回送 AI · Bot 会胡编答案。
🙋 用户问 :生病请假 5 天需要医院证明吗?
[召回 1 · sim=0.88] 《假勤管理办法》第 7 条:病假 3 天以上需提交医院病假条
[召回 2 · sim=0.42] 《差旅管理》第 2 条:因公外出...
[召回 3 · sim=0.35] 《员工福利》第 1 条:节日福利发放...
✅ 可用
⚠ 部分可用(召回 1 对 · 2&3 噪音)
❌ 重调
⚠ 部分可用。召回 1 完美命中 · 2/3 是噪音(相似度 < 0.5) 。解法:threshold 从 0.3 调到 0.65 · 只保留召回 1 送 AI · 答案会更干净。这是 RAG 调优里最常见的场景。
🙋 用户问 :那个补贴能报多少?
[召回 1 · sim=0.71] 《差旅补贴》第 3 条:出差日均补贴 100~300
[召回 2 · sim=0.69] 《通讯补贴》第 1 条:月补 200
[召回 3 · sim=0.67] 《餐补制度》第 1 条:中餐补 25/天
✅ 可用(全答)
⚠ 部分可用 · 需问题改写
❌ 重调
⚠ 部分可用 · 需要问题改写 / 反问用户 。"那个补贴"指代模糊 · 系统召回了 3 种补贴 · AI 可能全讲一遍把用户淹没。最佳做法:Bot 反问"您是指差旅 / 通讯 / 餐补?"再精准回答。
🚨 游戏 3 · 幻觉识别器 · 5 条回答判真假
资料给定 · 判断 Bot 回答是 ✅ 基于资料 / 👻 幻觉瞎编 。
📚 资料 :差旅住宿标准 · 一线城市 600 / 二线 400 / 其他 300。
🤖 Bot 回答 :出差住宿上限为一线 600 元 / 二线 400 / 其他 300【来源:《差旅管理办法》第 8 条】。
✅ 标准好回答。数字完全对齐资料 + 带出处 。这就是理想 RAG。
📚 资料 :差旅住宿标准 · 一线城市 600 / 二线 400 / 其他 300。
🤖 Bot 回答 :一线城市 800 / 二线 500 · 北京上海可申请特批到 1200。
👻 严重幻觉。数字全是编的 + 资料里根本没有"特批 1200" 。典型 Q2 症状 · 解法:temperature 降到 0.2 + Prompt 加"找不到就说找不到"。
📚 资料 :无任何关于"996 工作制"内容。
🤖 Bot 回答 :我在现有资料里没找到关于 996 工作制的规定,建议您联系 HR 接口人:李姐 / hr@company.com。
✅ 合格 · 这是比"答对"更难做到的能力——承认自己不知道 。95% 的新手 Bot 会在这里瞎编。你的 Bot 能做到这样 = 通过最高考验。
📚 资料 :年假 5~10 年工龄 10 天 · 10 年以上 15 天。
🤖 Bot 回答 :根据资料,年假 10 天。根据劳动法一般还可以加 5 天探亲假 。
👻 半幻觉。前半句对 · 后半句是 AI 自己的"劳动法知识"掺进来了 ——资料里根本没提探亲假。RAG 铁律:只基于资料 · 不得加外部知识 。解法:Prompt 加"严禁引用外部知识 · 严禁'根据劳动法''一般来说'等表达"。
📚 资料 :请假 3 天以上需部门经理审批。
🤖 Bot 回答 :请假 3 天以上需部门经理审批 【来源:《假勤管理办法》第 7 条】。若涉及项目交接 · 建议提前 3 天申请 · 避免影响团队进度。
✅ 合格(结论来自资料 · 贴心话术可接受)
👻 幻觉
✅ 合格。核心结论严格来自资料 + 带引用 。第二句"建议提前 3 天"是行为提醒 · 不是事实编造 · 可以接受(严格模式可去掉)。区分关键:有没有编新事实 。
🎰 游戏 4 · RAG 落地盲盒 · 抽一个立刻能做的项目
不知道 RAG 能干嘛?3 秒给你身份 + 知识库 + 上线渠道 + 能赚多少 。
🎲 RAG 项目生成器 · 身份 × 知识库 × 渠道 × 变现
点下面按钮 · 抽一个你的第一个 RAG 项目 🎰
🎰 给我抽一个 RAG 项目
💡 连抽 3 次挑最心动的 · 立刻按 PART G 12 步上线
PART J · 🚀 RAG 工程师职业跃迁
⏱ 20 min
会做 RAG 的人 · 薪资多少 · 怎么变现 可跳槽 · 可副业
2025 年企业 AI 预算里 · RAG 是第一优先级 ——因为它是"AI 落地最具体、最能解释、最容易计算 ROI"的技术栈。每家中大型企业都在找会搭 RAG 的人。
💰 3 档岗位 · 3 档薪资
TIER 1 · 新人入门
🧩 AI 应用工程师 / 知识库运营
12~25k / 月
给企业搭 + 维护 RAG Bot · 日常工作:整理资料 / 切块 / 调参 / 写 Prompt / 迭代版本。产品公司 / 中大厂子公司都招。
💼 AI 应用工程师 · 知识库运营 · AIGC 内容运营 · 客服系统助理
TIER 2 · 本章毕业位
🧠 RAG 工程师 / AI 产品经理
25~60k / 月 + 股票
独立负责企业知识库从 0 到 1 · 设计分块策略 / 选模型 / 定 SOP / 上线多渠道。带 2~5 人小组或外包团队。
💼 企业 RAG 工程师 · AI PM · 智能客服负责人 · AIGC 解决方案架构师
TIER 3 · 进阶目标
🏆 AI 解决方案架构师 / 独立咨询
60k~100w / 月 + 项目分成
服务大客户 / 做行业 Top 案例 · 或独立做 RAG 咨询公司 · 单项目 20w~200w · 年流水 500w+。
💼 大厂 AI 架构师 · AI 咨询合伙人 · RAG SaaS 创始人
💸 6 条变现路径 · 副业 / 全职都成立
定制
企业 RAG 定制 · 单项目 5~30w
1 个月 1~2 单 = 10~60w / 月
中小企业想做客服 Bot / 知识库 / 培训助理 · 市场价 5~30w。小严模式:扣子 + 飞书 + 企微三件套 · 一周交付。
咨询
AI 咨询 · 按天 3~10k
每月 10 天 = 3~10w · 时间自由
给客户"看病"——帮他们诊断现有 Bot 为什么不准 / 定方案 / 培训团队。不交付代码也能收钱。
订阅
行业知识库 SaaS · 月费 99~1999
律师版 / 医生版 / 教培版
垂类行业打包"行业资料 + 定制 Bot" · 月订阅。100 个客户 × 399 = 月入 4w 被动收入。
课程
零基础搭 RAG 课 · 399~2999
自己的案例就是最好广告
"零基础 7 天搭一个能上线的 RAG Bot"打包课 · 小鹅通 / 抖音卖。你的扣子 Bot 本身就是 demo。
数据
数据清洗服务 · 200~2000 / GB
脏活累活 · 门槛低收入稳
很多企业想做 RAG 但资料脏得离谱。你包"OCR + 格式化 + 元数据" · 按 GB 计费。1 单 2~5w 常见。
私域
自媒体私域答疑 Bot · 月 99~599
知识博主刚需 · 复购极高
博主卖完课后都面临"学员问答解决不过来"。你搭个喂了他课件的 Bot 挂私域 · 收月费。
📄 简历 / 求职加分话术
应聘 AI 应用 / RAG 工程师岗:
"独立搭建过 从 0 到上线的 RAG 系统 (扣子 + FastGPT)· 处理 XX 份文档 · XX 分段 · 准确率从 45% 调优到 90%+ · 熟悉 chunk 策略 / 召回调参 / 引用合规 · 作品已服务 XX 用户。"
应聘 AI 产品经理 / 解决方案:
"能为客户设计 端到端 RAG 方案 ——资料整理 → 切块 → 调参 → 引用 → 上线 → 反馈闭环。熟悉扣子 / FastGPT / Dify 三栈对比选型 · 独立交付过 XX 个企业级 Bot。"
应聘技术类 / 架构岗:
"深度理解 RAG 原理:Embedding 召回 → Rerank → Prompt 拼接 → 模型生成 → 引用追溯 。能设计行业垂直知识库架构 · 优化 top_k / threshold / overlap · 诊断 6 类常见故障。"
面试黄金回答(问到"怎么解决 AI 幻觉"):
"我有一套RAG 反幻觉三板斧 :
① 数据层 ——切块带 overlap + 元数据 + 条款编号;
② 检索层 ——threshold ≥ 0.7 + top_k 3~5 + 混合检索;
③ 生成层 ——temperature ≤ 0.3 + Prompt 强约束"找不到就说找不到" + 每条结论必挂引用。
过去做的 Bot 压力测试0 幻觉 · 100% 结论带出处 。"
🎯 本章 5 张门票
门票 1 · 切块直觉 :看一眼资料就知道 chunk_size 该定多少 · 这是 RAG 核心功夫
门票 2 · 调参能力 :tuning.md 三板斧让准确率从 45% → 90% · 可复制可复用
门票 3 · 幻觉免疫 :让 Bot 会说"我不知道" · 这比"答对"更值钱
门票 4 · 引用意识 :每条答案都带出处 · 企业级 Bot 的标配
门票 5 · 企业视角 :从"玩 AI"升级到"给企业卖 AI" · 这是单价跃迁的跳板
📚
知识库工程师
Chapter 07 · 徽章解锁中
你已经拥有一个"只属于你 / 你公司 / 你家庭"的 AI 助手。 第 7 件 AI 作品:一个喂了你资料、带引用、可扫码分享的问答 Bot。 下一章,我们给它"装手装脚"——让它能做事,不只是会说。
🚀 进入第 8 章:零代码搭建 AI Bot