← 上一章 返回课程主页 下一章:零代码 AI Bot →
CHAPTER 07 / 10 · 2 小时实战课

📚 RAG 专属知识库 · 让 AI 只回答你的问题

3 张图看懂 RAG 原理 · 资料切块上传 · 调参调优 · 引用可追溯 · 产出一个喂了你资料的专属问答助手 + 可分享链接

完成下面 12 个任务,解锁「知识库工程师」徽章

🗺 学习地图(约 120 分钟 · 8 个小节)

A · 开场(10 min)

为什么 RAG 是企业 AI 最值钱的硬技能

B · 工具横评(20 min)

Kimi / 豆包 / FastGPT / Coze / Dify

C · 原理 · 3 张图看懂 RAG(20 min)

切块 / 向量 / 检索 / 生成

D · 资料整理 + 切块(20 min)

怎么整理让 AI 能读懂

E · 调参调优(20 min)

为什么 AI 答非所问的 5 个坑

F · 引用追溯(20 min)

每个答案都要有出处

G · 🎯 产出 · 你的专属问答 Bot(20 min)

扫码可用 · 可发老板

H · 打卡 + 预告(10 min)

徽章 + 第 8 章预告

PART A · 开场 ⏱ 10 min

为什么 RAG 是企业 AI 最高价值的硬技能?

通用大模型再聪明,也不知道你公司的制度、不知道你产品的参数、不知道你家里的药盒。RAG(Retrieval-Augmented Generation,检索增强生成)就是解决这件事——把你的资料喂给 AI,让它"先查你的资料再回答"

📖 学员 · 阿乐 · 32 岁 · 500 人公司 HR 主管

他把公司300 份制度文件 + 5 年员工问答邮件喂给 FastGPT,做了一个"HR 小助手"。员工问"年假怎么算""离职流程""住房补贴"直接@它。HR 每天咨询量减少 80%,他从每天救火变成思考战略。年底被提拔。

📖 学员 · 杜工 · 45 岁 · 设备工程师

他把 30 年攒的设备故障维修记录 + 说明书 PDF喂给 Coze 知识库。新徒弟遇到故障不用翻 20 本手册,直接问 Bot。班组平均排故时间从 3.2 小时降到 40 分钟,被写进集团标杆案例。

💡 核心洞察

市面上 80% 的 "AI 降本增效"故事,背后都是 RAG。它不是"更聪明的 ChatGPT",而是把 AI 变成你团队里最了解业务的那个人。学会搭 RAG,你在公司里就是"AI 负责人"——这是 2025 年最值钱的身份之一。

RAG(检索增强生成)最核心的价值是?
PART B · 工具选型 ⏱ 20 min

5 款 RAG 工具横评 · 按你的资料量和分享需求选

工具门槛文件上限可分享推荐场景
Kimi 智能助手极低(免注册)单文件 100MB / 一次 50 个❌ 仅自用个人学习 / 单次文档
豆包智能体(字节)单智能体 10 个知识文件✅ 可发分享链接个人助手 / 朋友圈卡片
扣子 Coze(字节)中等知识库可扩展大✅ 扫码 / 嵌入本章主线 · 团队用
FastGPT较高 · 可自托管无上限(按资源)✅ API / 嵌入企业内部 · 深度定制
Dify较高 · 开发者向无上限(按资源)✅ 全套 API技术团队 / 产品化
腾讯乐享 AI企业级✅ 企微集成大中型企业 · 内网合规
🎯 本章选型
  • 练手(10 分钟就能跑通):Kimi——传几个文件直接问,最快手
  • 主线(建可分享的 Bot):扣子 Coze——国内访问流畅、免费够用、可扫码分享
  • 进阶(企业大量资料):FastGPT / Dify——需要服务器,本章会给入门指引
🛠 动手任务 · 5 分钟

打开 www.coze.cn(扣子)→ 手机号登录 → 进入"工作空间"→ 左侧"资源库"找到"知识库"入口。这就是本章的大本营

PART C · 第一课 · 原理 ⏱ 20 min

RAG 原理 · 3 张"大白话图"看懂

RAG 不神秘。它就是 "先检索 · 再生成" 两步流程。记住下面这 3 张图(用文字画给你),你比 90% 的人懂 RAG。

> RAG PIPELINE · 数据在系统里的真实流向

📄
DOCS
PDF/Word/MD
✂️
CHUNK
800/100
🔢
EMBED
向量化
💾
VECTOR-DB
Milvus/PG
🙋
QUERY
用户问题
🔍
RETRIEVE
Top-K=5
🧠
LLM
豆包/Kimi
💬
ANSWER
+引用
1入库(资料变成"可搜索碎片")
你上传的 PDF / Word / Excel / 网页,被系统切成 500~1000 字的小块(chunk),每块被转成一个"向量"(一串数字),存进向量数据库。就像图书馆把每本书拆成章节,并贴上"主题卡片"。
2检索(用户问一个问题)
用户提问时,系统先把问题也变成向量,在向量数据库里找出最相关的 3~5 块(Top-K 检索)。就像问图书管理员"我要查 A 问题",她从卡片里找 5 张相关的给你。
3生成(大模型基于检索结果回答)
系统把这 3~5 块内容拼到 Prompt 里,大模型基于"用户问题 + 检索到的内容"生成答案。就像你把 5 张卡片+问题交给图书管理员,她读完卡片给你讲答案。
❌ 纯大模型
用户问:"我公司 2024 年度培训预算是多少?" AI:根据通常情况,培训预算约占总预算 1~3%...(瞎编)
✅ RAG 后
检索到:《2024 培训管理办法》第 5 条"培训年度总预算 186.3 万..." AI:根据《2024 培训管理办法》第 5 条,2024 年度培训预算为 186.3 万元。
💡 RAG 为什么优于"直接把文件塞进长上下文"

Kimi / ChatGPT 现在都支持超长文档,为什么还要 RAG?
省钱:每次只召回相关的几千 token,而不是把 50 万字都塞进去
精准:长上下文里 AI 会"看后忘前",RAG 只喂最相关的片段
可扩展:资料再多也能搜得到,不受上下文窗口限制
可多人共享:一份知识库,全团队问

RAG 的完整流程是?
PART D · 第二课 · 资料 ⏱ 20 min

资料整理 + 切块策略 · 这一步做对,成败占 70%

RAG 失败的最常见原因不是模型,而是你喂的资料又脏又乱。下面这份整理清单请认真执行。

✅ 整理前 5 步

  1. 把扫描版 PDF 用 OCR 变成文字(推荐 Kimi / 豆包)
  2. 删除封面、目录、空白页、水印
  3. 把 Word / Excel 统一转成 Markdown 或 .txt
  4. 给每份文件加前缀元数据:"[部门][2024][制度] xxx.md"
  5. 把图片里的关键信息用文字补充描述

❌ RAG 杀手

  • 整本书 500 页直接上传(切出的块会失上下文)
  • 图片扫描件没 OCR(AI 读不到文字)
  • 多文件"一锅炖"没分类
  • 文件名全叫"文档 1.pdf""新建文档.docx"
  • Excel 合并单元格(AI 读取错位)
切块参数黄金值(扣子 / FastGPT 通用)
chunk_size(每块字符数):600~1200 chunk_overlap(重叠字符数):80~150 分隔符优先级:1) ## 二级标题 → 2) 双换行 → 3) 单换行 → 4) 句号 规则解释: - 块太小 → 缺上下文,AI 答不完整 - 块太大 → 检索不准,召回很多无关内容 - overlap 是相邻块的重叠字数,防止关键句被切断 - 分隔符用文档自己的结构(标题)效果最好
📖 阿乐整理 HR 资料的真实做法

300 份制度按"入职 / 薪酬 / 假勤 / 培训 / 离职 / 福利"分 6 个文件夹。每个文件顶部加 3 行:
① 标题:《2024 员工差旅管理办法》
② 适用范围:全员
③ 关键词:差旅、报销、出差标准、交通费
切块用 800/100——Bot 回答准确率从 45% 涨到 92%

> CHUNK VISUALIZER · 同一段原文 / 3 种切法对比

第 5 条 · 培训预算:公司 2024 年度培训总预算为 186.3 万元,按部门分配:技术部 65 万、销售部 52 万、职能部 30 万,余下 39.3 万作为公司级专项预留,由人力资源部统筹安排。预算使用须遵循"先审批后执行"原则,单笔超过 5 万元的需总经理签字。超出预算部分不予报销,除非另申请预算追加。
Chunk 1(覆盖总额 + 分配) Overlap 重叠区(防断句) Chunk 2(使用规则) Chunk 3(超预算规则)

黄色重叠区是关键——如果没有 overlap,用户问"39.3 万怎么用"可能只召回 Chunk 2 没有金额,或只召回 Chunk 1 没有使用规则。overlap 让两块都能被命中

ENGINEER LOG · 资料入库流水线 · 10 步从文件到可查询(25 分钟)

  1. 选定场景 ⏱ 1 min
    • 3 选 1:① 工作域(公司制度 / 产品手册 / SOP)② 家庭域(保险单 / 药盒说明 / 体检报告 / 孩子错题本)③ 兴趣域(你读过的 20 本书笔记 / 你写过的日记)
    • 在桌面新建 07-rag 文件夹 · 里面再建 raw/(原件)和 clean/(处理后)两个子目录
    做完的样子:桌面上有 07-rag/raw/ · 07-rag/clean/ 两个空文件夹 · 场景写在便利贴上
  2. 收集 5~10 份原始文件 ⏱ 3 min
    • 最少 5 份、最多 15 份 · 第一个知识库不要贪心
    • 支持格式:PDF / Word / Excel / Markdown / TXT / 图片(要 OCR)· 单文件 < 30MB
    • 全部拖到 07-rag/raw/
    别做的事:整本 500 页的书直接上传 · 整个硬盘文件夹一口气倒进去 · 混多种语言混多种业务
  3. 扫描版 PDF / 图片 → OCR 变纯文字 ⏱ 5 min
    • 打开 kimi.moonshot.cn(或豆包网页版)· 拖入扫描 PDF
    • 发一句:请把这份 PDF 逐页 OCR 成 Markdown,保留标题层级(#、##、###),表格转成 markdown 表格,图片用文字描述替换。
    • Kimi 产出后点右上角复制 · 粘贴到新建的 xxx.md 文件
    做完的样子:原来 20 页扫描 PDF · 现在变成一份 3~5 KB 的 Markdown · 标题层级清晰 · 可以 Ctrl+F 搜到任何关键词
  4. 统一命名规范 ⏱ 3 min
    • 格式:[部门][年份][类型]-原标题.md
    • 示例:[HR][2024][制度]-差旅管理办法.md · [产品][2024][手册]-滚筒洗衣机 XQG100.md
    • 命名里的方括号标签 = AI 的"前排特征" · 命中率 +15%
    翻车点:文件名写"文档 1.pdf"、"新建文档.docx"、"最终版 v3 - 副本 - 副本.pdf" = 命中率直接 -20%
  5. 每份文件顶部加 3 行元数据 ⏱ 5 min
    # 标题:2024 员工差旅管理办法 # 适用范围:全员 · 含实习生 · 不含外包 # 关键词:差旅、报销、出差标准、交通费、住宿标准、补贴、审批流程
    💡 关键词写 5~10 个 · 尽量写同义词 / 俚语——员工可能问"出差能报多少"而不是"差旅标准"
  6. 清理脏内容 ⏱ 3 min
    • 删除:封面页 / 目录页 / 页眉页脚 / 水印"公司内部请勿外传"
    • Excel:解除合并单元格(开始合并后居中取消合并)· 填充空白单元格
    • 所有 .docx 另存为 .md 或 .txt · .xlsx 另存为 .csv
    常见翻车:Excel 合并单元格没拆 → AI 读到的表格会错位 → 召回永远不准 · 这是 RAG 失败 Top3 原因
  7. 登录扣子 · 新建知识库 ⏱ 2 min
    • 访问 coze.cn 登录 · 左边栏选 工作空间
    • 顶部点 资源库 → 右上角 + 创建资源 → 选 知识库
    • 命名 [你主题]-v1(v1 是版本号 · 后面调优会出 v2 v3)· 类型选 文本格式 · 保存
    做完的样子:资源库列表里出现你的知识库卡片 · chunk 数为 0 · 状态"待上传"
  8. 上传 + 设切块参数 ⏱ 3 min
    • 进入刚建的知识库 → 新增内容本地文档 → 拖入 07-rag/clean/ 全部文件
    • 下一步"分段设置"切换到 自定义
      • chunk_size = 800
      • overlap = 100
      • 分隔符勾选 ## 标题 / \n\n
    • 开始处理
    💡 为什么这组数字:800 字约一段逻辑完整的话 · 100 字 overlap 够覆盖断句 · 标题优先保住章节结构
  9. 等待索引 · 喝口水 ⏱ 1~3 min / 100 页
    • 进度条走完后卡片状态变 可用 · 右上会显示 分段数 XXX(这就是 chunk 总数)
    • 把这个数字抄到记事本 07-rag/tuning.mdv1 · chunks=385 · size=800/overlap=100
    做完的样子:卡片上显示 "已分段 385 条";随便点开 3 个分段预览 · 每块都是一段完整意思 · 没有半句话
  10. 冒烟测试 · 3 题见分晓 ⏱ 2 min
    • 扣子顶部 智能体 → 快速新建一个 Bot → 只绑定这个知识库 · 不加其他 · 系统 Prompt 留空
    • 右侧预览窗口提 3 个问题:① 你最确定答案的 · ② 中等模糊的 · ③ 故意问知识库里没有的
    • 观察:① 应该答对;② 看召回的原文片段对不对;③ AI 应该说"找不到"(若它瞎编 = 进 PART E 调优)
    做完的样子:3 题中至少 2 题答对且附带正确原文片段 · 过不了就先别上线 · 立刻去 PART E
RAG 切块最合理的参数范围是?
PART E · 第三课 · 调优 ⏱ 20 min

AI 答非所问 · 5 个最常见的坑 + 对应解法

① 检索召回 Top-K 设错

症状:AI 只找到 1 块内容,答得残缺 / 找到 10 块,AI 混乱跑题
解法:Top-K 设 3~5,复杂场景 5~8

② 召回阈值(相似度分)太低

症状:把不相关的块也召回了,AI 胡说
解法:相似度阈值调到 0.65~0.75,低于阈值的块不送给 AI

③ 系统 Prompt 没"闭嘴约束"

症状:没找到资料 AI 也瞎编
解法:系统 Prompt 加一句"若检索结果无法回答,请直接说'我在现有资料里没找到相关信息'"

④ 问题太模糊

症状:用户问"那个是多少",AI 找不到对应块
解法:系统提示用户"请包含部门 / 年份 / 关键词",或加一层"问题改写"

⑤ 切块切错

症状:关键段落被砍成两半
解法:调 overlap 到 150,或用"按标题切"而不是"按字数切"

⑥ 底座模型太弱

症状:检索对了,但模型生成啰嗦 / 偏题
解法:切换到豆包 Pro / Kimi / DeepSeek 32B,模型越强 RAG 效果越好

知识库 Bot · 黄金系统 Prompt(直接抄)
你是【XX】团队的专属助手。 请严格按下列规则回答用户问题: 1. 只基于【检索到的知识库内容】回答,不得加入外部知识 2. 每个核心论点必须在末尾【方括号】里注明来源文件名 3. 若检索结果无法完整回答,请主动说"我在现有资料里没找到 XX 的答案,建议您咨询 [具体人员]" 4. 不知道用户身份时先问:"请问您是 [部门 / 岗位]?" 以便给出精准答案 5. 如果用户要求总结、对比、分析,先列出依据的原文,再给结论 6. 严禁输出任何"根据我所知"、"一般来说"类推测语言 7. 输出格式: - 直接结论 - 依据原文(带来源) - 如需进一步查询的建议
📖 杜工的"调优日志"

第 1 版 Bot 问"滚筒电机噪音大怎么修"→ AI 答了一堆通用建议。杜工把 Top-K 从 3 调到 5、加了"只基于资料回答"系统 Prompt、资料里加"故障码对照表",一周后准确率从 40% 涨到 90%。调优比建库更重要

> RETRIEVAL CONFIG · 调优控制台(推荐起始值)

chunk_size
800range 600~1200
overlap
100range 80~150
top_k
5range 3~8
threshold
0.70range 0.65~0.75
temperature
0.3低温 · 不发散

� AI 答非所问 · 诊断决策树(按出现频率排序)

Q1 · 答案一条都挂不上"来源"引用?
系统 Prompt 漏了"每条结论末尾用【来源:《XX》】标注" → 加上即可
Q2 · 没找到也瞎编?
加"若检索结果无法回答,请说'我在现有资料里没找到'" + 降 temperature 到 0.3
Q3 · 答案不完整 / 只讲一半?
top_k 从 3 调到 5 · overlap 从 50 调到 100~150
Q4 · 召回一堆无关内容混乱跑题?
threshold 从 0.5 调到 0.70 · top_k 降到 3~5
Q5 · 问"那个是多少"找不到?(问题太模糊)
系统 Prompt 加"不知道用户身份时先问部门/年份" · 或启用"问题改写"插件
Q6 · 检索对了,但生成啰嗦偏题?
换模型到豆包 Pro / Kimi / DeepSeek 32B · 加"请直接给结论,不超过 200 字"

ENGINEER LOG · 真实调优循环 · 9 步把准确率干到 85%(30 分钟)

  1. 进入 Bot 编辑页 · 定位参数面板 ⏱ 1 min
    • 扣子首页 → 智能体 → 点你的 Bot → 点右上角 编辑
    • 右侧中部找到 知识库 模块 → 点展开的 ⚙ 设置 图标
    • 弹出的面板就是你的"调参控制台"
    做完的样子:能看到 最大召回数 · 最小匹配度 · 搜索策略 三个可调选项
  2. 按 Tuner 推荐值先铺第 1 版参数 ⏱ 1 min
    • 最大召回数 (top_k) = 5
    • 最小匹配度 (threshold) = 0.70
    • 搜索策略 = 混合检索(语义 + 关键词)· 权重默认
    • 模型下拉切到 豆包 Pro / Kimi 128K 任选一个 · temperature 拖到 0.3
    💡 为什么 0.3 不是 0:0 会过于死板 · 0.3 让答案自然但不乱发挥
  3. 准备 10 道真题(这一步最关键) ⏱ 8 min
    • 新建 07-rag/qa-v1.md · 写 10 题分 3 类:
      • 事实查询(4 题):答案在资料里能找到原句 · 如"差旅交通费标准是多少"
      • 对比分析(3 题):需要跨 2~3 个文件综合 · 如"病假和事假的补贴差别"
      • 模糊指代 + 离轨题(3 题):② 语言模糊 · ③ 资料里根本没有 · 如"那个补贴能报多少" · "去年国庆假怎么放"(假设资料里没)
    • 每题旁边写 标准答案(你自己从原文复制)· 后面打分用
    ⚠ 不要拿"你自己也不知道答案"的题来测 · 那是验证不是调优 · 会让你怀疑人生
  4. 第 1 轮测试 · 只记录不改参数 ⏱ 5 min
    • 打开 Bot 预览窗口 · 复制每道题粘进去
    • 记 4 列:题号 | 预期答案 | 实际答案 | 是否准确 (✓/✗/半对)
    • 对每个 ✗ 和半对 · 写一句失败原因归类(见下一步)
    做完的样子:一张 10 行表 · 准确率可能在 40~60%(这个基线就是你的起点)
  5. 对照诊断树 · 归类失败原因 ⏱ 3 min
    • 每个失败案例对应上面的 Q1~Q6 打一个标签:Q1 漏引用 / Q2 瞎编 / Q3 答不全 / Q4 召回乱 / Q5 指代模糊 / Q6 模型偏题
    • 按标签频次排序 · 最多的那类先治
    💡 90% 的新人 Bot 问题集中在 Q2(瞎编)和 Q4(召回乱)· 先治这两个杀伤最大
  6. 第 2 轮 · 每次只改 1 个参数 ⏱ 5 min
    • 若主问题是 Q2 瞎编:加系统 Prompt 约束"若检索结果无法回答,请说'我在现有资料里没找到'" + temperature 降到 0.2
    • 若主问题是 Q4 召回乱:threshold 0.70 → 0.75 · top_k 5 → 3
    • 若主问题是 Q3 答不全:top_k 3 → 6 · overlap 100 → 150(需回 PART D 重新切块)
    铁律:一次只改 1 个参数 · 不然你永远不知道是哪改带来的变化
  7. 记版本日志到 tuning.md ⏱ 2 min
    ## v1 · 基线 chunk=800/overlap=100/top_k=5/threshold=0.70/temp=0.3 acc = 55% (6/10 对 · 4 错 · 其中 Q2 占 3 · Q4 占 1) ## v2 · 加闭嘴约束 + 降温 改动:系统 Prompt 加"找不到就说找不到" + temp 0.3→0.2 acc = 70% (7/10 · Q2 消灭 2 个 · 新增 1 个 Q3) ## v3 · 放宽 top_k 改动:top_k 5→6 acc = 85% (8.5/10 · Q3 消灭 · 1 个半对)
    💡 这份 tuning.md 是你"会调 RAG"的最硬证据 · 以后简历面试可以直接截图给面试官
  8. 再跑 1~2 轮 · 直到准确率 ≥ 85% ⏱ 5 min / 轮
    • 一般 v3~v4 能稳定到 85% · 剩下的 15% 通常是资料本身就没答案 · 不是 Bot 的错
    • 到 85% 就停 · 不要过拟合——再改参数可能把其他题改坏
    做完的样子:tuning.md 至少 3 个版本 · 最新版 acc ≥ 85% · 每个版本都有明确改动说明
  9. 加一道"压力测试" ⏱ 2 min
    • 故意问一道资料里确实没有的题(例 "公司 2030 年战略是什么")
    • 理想结果:Bot 说"我在现有资料里没找到相关信息,建议您咨询 XX"
    • 如果它瞎编了 → Q2 没治好 · 回第 6 步继续加闭嘴约束
    RAG 真正的门槛不是答对多少 · 是不瞎编 · 一个会瞎编的 Bot 比不回答更可怕
防止知识库 Bot 瞎编,最重要的系统 Prompt 约束是?
PART F · 第四课 · 引用 ⏱ 20 min

引用可追溯 · 每个答案都要指向"原文哪一段"

真正专业的知识库 Bot 回答时会给出"原文出处"——这是可信度的关键。下面教你怎么在扣子里开启"引用展示"。

  1. 扣子后台 → 智能体编辑页 → 右上角"知识库"→ 添加你的知识库
  2. "最大召回数量"= 5、"最小匹配度"= 0.65(符合 PART E 的推荐)
  3. 勾选"开启引用展示"——每个回答末尾会自动列出 Top-K 原文片段
  4. 系统 Prompt 里写:"每条结论末尾用【来源:《文件名》 第 N 段】标注"
  5. 测试:问 3 个真问题,看每条结论是否都挂了引用
  6. 用户体验优化:引用链接可直接"点击跳到原文"——在 FastGPT 里支持,扣子需手动维护原文链接
❌ 无引用的 Bot
用户:请假超过 3 天需要什么审批? Bot:一般由部门经理审批……(用户无法核实、敢用吗?)
✅ 有引用的 Bot
用户:请假超过 3 天需要什么审批? Bot:根据《2024 假勤管理办法》第 7 条,连续请假 3 天以上(不含 3 天) 需部门经理 + HR 双重审批;超过 7 天还需分管副总签字。 【来源:《2024 假勤管理办法》第 7 条,第 12 页】
📖 阿乐的 HR Bot 上线心法

他的 Bot 上线前做了一件事:把所有文件编号(第 1 条 / 第 2 条)都写在原文里,让 Bot 引用时能精确到条。员工再也不信"听说可以",都看"第 X 条"。HR 的权威性也被这个 Bot 反向加强——她现在是"懂系统最多的人"。

请假超过 3 天需要什么审批?
根据公司制度,连续请假超过 3 天(不含 3 天)需 部门经理 + HR 双重审批 [1];超过 7 天还需分管副总签字 [2];病假超过 10 天需同时提交三甲医院诊断证明 [3]
REFERENCES
[1] 《2024 假勤管理办法》第 7 条 · 第 12 页 · similarity=0.89
[2] 《2024 假勤管理办法》第 7 条 · 第 12 页 · similarity=0.87
[3] 《病假证明与补贴管理细则》第 3 条 · 第 5 页 · similarity=0.81

↑ 每条引用都显示 similarity 分数——这是知识库 Bot 的"诚实度徽章"

ENGINEER LOG · 打开引用展示 · 7 步让每条答案都带出处(20 分钟)

  1. 开启引用展示开关 ⏱ 1 min
    • 扣子 Bot 编辑页 → 右侧 知识库 模块 → 点 ⚙ 设置
    • 向下滚动找到 显示召回引用 / Show Citations · 打开开关 · 保存
    做完的样子:开关变绿 / 蓝 · 预览窗口测一题后答案底部会出现 📎 引用 3 可折叠区
  2. 在系统 Prompt 加"引用铁律" ⏱ 3 min
    【引用铁律 · 必须遵守】 1. 每条独立结论后用【来源:《文件名》 第 X 条 / 第 X 页】标注 2. 若同一结论来自多处,用 [1][2][3] 编号 · 末尾按顺序列出完整来源 3. 如果某条结论没有来源,请重新组织或直接说"资料里没找到" 4. 禁止省略【来源】· 禁止用"根据资料""一般来说"替代具体出处
    💡 粘进 Prompt 最末尾 · 不要夹在中间 · AI 对"最后一句话"的遵从度最高
  3. 验证 3 道真题 · 看每句结论是否都挂来源 ⏱ 5 min
    • 找 3 道"必有答案"的真题 · 粘到预览框
    • 眼过每一行 · 每条结论末尾是否都有【来源:xxx】
    • 点底部 📎 引用 展开 · 看召回的原文片段和结论是否对得上
    失败常见:AI 把多条结论的来源合并写在最末 · 这等于"等于没写" · 需要回第 2 步加一句 "每条结论必须单独标注,不可合并"
  4. 原文加"条款编号" · 把引用精度提一档 ⏱ 5 min
    • 回到 07-rag/clean/ · 打开你最常被问的 3 份文件
    • 给每条规则前加编号:第 1 条:... · 第 2 条:... · 第 3.1 款:...
    • 保存 → 回知识库 → 找到这 3 份文件 → 点 重新处理
    做完的样子:再提问时引用从 "第 12 页" 升级到 "第 7 条 第 12 页" · 精度看齐法律条文
  5. 有引用 vs 无引用 · 双截图对比存档 ⏱ 3 min
    • 在 Prompt 里临时注释掉"引用铁律" · 问 1 题 · 截图 A(无引用版)
    • 恢复"引用铁律" · 同一题再问 · 截图 B(有引用版)
    • 两图并排拼到一张 · 存到 AI 作品集/07-知识库 Bot/引用对比.png
    💡 这张图以后是你"给老板展示 Bot 价值"的 0.5 秒杀手锏 · 一看就懂
  6. 设置"来源可点击跳转"(进阶可选) ⏱ 2 min
    • 若资料是在线文档(飞书 / Notion / 石墨)· 在每份文件顶部加一行 # 原文链接:https://xxx
    • 系统 Prompt 加:"末尾列出【📎 原文链接】供点击"
    • 效果:用户点 📎 直接跳到原文 · 信任感 +200%
  7. 冒烟 5 题 · 锁定"引用合格"基线 ⏱ 1 min
    • 再问 5 题 · 数一下"有引用"的结论占比
    • 目标:100% 结论都带引用 · 差一条都回第 2 步调 Prompt
    做完的样子:5/5 全挂引用 · 每条都能点回原文 · 这才叫真正的 RAG Bot
专业 RAG Bot 和普通 AI 聊天最根本的区别是?
PART G · 🎯 本章产出 ⏱ 20 min

产出 · 一个喂了你资料的专属问答 Bot 可扫码使用 · 可发老板

ENGINEER LOG · 从 0 到可扫码上线 · 12 步交付作品集(30 分钟)

  1. 场景锁定 · 给 Bot 起"能卖钱的名字" ⏱ 1 min
    • 不写"HR 助手" · 写 [你公司] 员工 HR 自助问答 · 7×24 答疑
    • 不写"产品手册" · 写 滚筒洗衣机 XQG100 · 故障自诊助手
    • 名字越具体 · 转发率越高 · 因为别人一眼知道"关我啥事"
    做完的样子:Bot 名字长度 12~20 字 · 含"谁 × 做什么"两个信息
  2. 三项前置确认(必须都 ✅ 才能进第 3 步) ⏱ 2 min
    • PART D · 知识库分段数 ≥ 50 · 冒烟 3 题至少 2 对
    • PART E · tuning.md 到 v3 · acc ≥ 85% · 压力测试不瞎编
    • PART F · 5/5 结论全挂引用 · 有引用对比截图
    ⚠ 任何一项没到位就发布 = 给自己挖坑 · 回去补
  3. 生成 Bot 头像 ⏱ 2 min
    • 打开豆包网页版 · 发 Prompt:给一个叫【XX 自助问答】的 AI 机器人生成头像 · 扁平插画风 · 主色蓝 + 橙 · 圆形裁剪 · 512×512 · 不含文字
    • 下载保存到 AI 作品集/07-知识库 Bot/avatar.png
  4. 扣子新建正式版智能体 ⏱ 2 min
    • 扣子首页 → 左侧 智能体 → 右上 + 创建智能体
    • 填:名字、头像(上传 avatar.png)、一句话介绍 · 点 创建
    做完的样子:Bot 卡片出现 · 有头像和名字 · 状态"未发布"
  5. 绑定知识库 + 拷贝调优参数 ⏱ 3 min
    • 进入 Bot 编辑页 → 右侧 知识库+ 添加 → 选中你的 [主题]-v1
    • ⚙ 设置打开 · 把 tuning.md 里 v3 的参数抄进来(top_k / threshold / temperature)
    • 勾选 显示召回引用
  6. 粘贴"黄金系统 Prompt"并本地化 ⏱ 3 min
    • 复制下方场景化 Prompt · 粘到 人设与回复逻辑
    • [XX 公司] · [HR 接口人] 替换为你真实的名字
    • 末尾追加 PART F 的引用铁律
    • 保存
  7. 开场白 + 推荐问题 · 让用户知道能问啥 ⏱ 2 min
    • 编辑页找 开场白 · 写:您好,我是 XX 公司的 HR 助手。您可以问我关于差旅、请假、社保、绩效的任何问题~
    • 下方 推荐问题 填 3 条高频真题 · 降低使用门槛
    💡 "推荐问题"命中率决定用户是否愿意第二次用 · 别偷懒
  8. 10 题最终验收 ⏱ 5 min
    • 用 PART E 的 10 题 · 在右侧预览框再跑一遍
    • 目标:acc ≥ 85% · 引用覆盖 = 100% · 离轨题不瞎编
    • 达不到 → 回 PART E / PART F 调 · 不要强行发布
  9. 发布到 Bot 商店 + 生成二维码 ⏱ 3 min
    • 右上角 发布 → 选渠道 扣子 Bot 商店(免审核 · 最快)
    • 填"分类"(如"效率办公")· 填"使用说明" · 点 提交发布
    • 1~3 分钟后页面显示 发布成功 · 下方有二维码分享链接 · 全部下载
    做完的样子:手机微信扫二维码 · 直接跳到 Bot 对话页 · 能问能答 · 有头像
  10. 48 小时公测 + 收集反馈 ⏱ 收集 2 天
    • 把二维码贴在 工作群 / 朋友圈 / 小红书 · 文案:我做了一个【XX】AI 助手,扫码试试,帮我找 Bug~
    • 新建 07-rag/feedback.md · 收 20 条真实提问 + 吐槽
    • 按诊断树归类 · 出 v4 版本
    💡 你收到的吐槽 = 下一版的金矿 · 一个"别人替你测 Bug"的机会
  11. 作品集归档(简历 / 求职用) ⏱ 5 min
    AI 作品集/07-知识库 Bot/ ├── 01-知识库截图.png · 显示 chunk 总数 ├── 02-tuning.md · v1~v3 调优日志 ├── 03-system-prompt.md · 黄金 Prompt ├── 04-qa-10 题.md · 测试集 + 结果 ├── 05-引用对比.png · 无引用 vs 有引用 ├── 06-Bot 头像.png ├── 07-扫码二维码.png ├── 08-分享链接.txt ├── 09-feedback.md · 公测反馈 └── 10-README.md · 一页说明:场景 / 功能 / 数据 / 价值
    💡 这套作品集 = 你以后跳槽涨薪 / 接外包 / 做咨询的敲门砖 · 小严靠这个 3 个月副业 8w
  12. 锁死"第 7 天回看"日历提醒 ⏱ 1 min
    • 在手机日历 +7 天设提醒:"回看 RAG Bot 数据 · 统计使用量 / 准确率变化"
    • 目标:使用量 ≥ 50 次 / acc ≥ 90% · 达成就发朋友圈庆祝
    做完的样子:7 天后你手里有一个真实使用数据的 RAG 作品 · 这是 99% 学 AI 的人都没有的东西
✨ 场景化系统 Prompt 示例(HR Bot) 你是【XX 公司】专属 HR 助手,服务对象是全体员工。 请严格遵守: 1. 只基于"公司制度知识库"回答,不要加入外部知识 2. 每条结论末尾用【来源:《文件名》 第 X 条】标注 3. 不知道用户身份时先反问:"您是哪个部门的员工?" 4. 涉及离职 / 劳动仲裁 / 敏感议题时,回答末尾统一加一句: "以上基于现有制度,具体个案请联系 HR 接口人:[姓名 / 企微]" 5. 若检索到的资料无法完整回答,请主动说"我在现有制度里没找到 XX 内容, 建议您联系 HR 接口人" 6. 禁止输出"我猜""可能""一般情况下"等推测词 7. 输出格式: [结论] → [依据原文(带来源)] → [建议下一步(如需)]

🏆 产出验收标准

  • ✅ 知识库至少包含 5 个整理过的文件
  • ✅ Bot 已发布并获得扫码分享链接
  • ✅ 测试 10 个问题,准确率 ≥80%
  • ✅ 每条回答都有引用
  • ✅ 至少 5 位朋友 / 同事扫过码试用
  • ✅ 朋友圈 / 工作群打卡 1 次附二维码
  • ✅ 归档「AI 作品集 / 07-知识库 Bot」
💼 企业实战 · RAG 的变现路径

很多自由职业者靠"给中小企业搭 RAG Bot"接单,单价 5~30k/个(按资料量)。技能门槛:扣子 + FastGPT。学员小严离职前是公司 IT,学完这章后靠副业接 RAG 项目,3 个月副业收入 8 万+,现在全职做"AI 知识库咨询"。

PART I · 🎮 RAG 工程师训练营 4 游戏 ⏱ 25 min

巩固关 · 4 个游戏让你"RAG 工程师肌肉上身" 边玩边会

RAG 这行手艺最难的不是工具,是切得对块 · 判得出召回 · 分得清幻觉 · 想得出落地场景。下面 4 个游戏专治这 4 个软肋。

🔪 游戏 1 · 切块大小侦探 · 4 段原文判最佳切法

给你 4 段不同类型的原文·判断哪种 chunk_size 最合理。

📄 场景 A:公司 100 条 FAQ · 每条 "问题 + 1~2 句回答" · 平均 80 字 · 彼此无关。
chunk=200 / overlap=0(一条一块)
chunk=150 / overlap=0 · 按"##"切
chunk=800 / overlap=100
chunk=2000 / overlap=200
✅ chunk=150 / overlap=0 · 按"##"切。FAQ 天然是"问答单位"·一条 = 一块·overlap 为 0 避免串味。800 太大会把 5~6 条 FAQ 粘到一起 · 召回会混乱。
📄 场景 B:产品使用手册 · 含 故障代码章节 · 每个故障 3~5 段文字 + 操作表格 · 章节间强关联(同一故障)· 不同故障要隔离。
chunk=100 / overlap=20
chunk=800 / overlap=100 · 按标题优先
chunk=3000 / 不切块
chunk=400 / overlap=0
✅ 800/100/按标题。按"##故障代码"标题切保证每故障独立一块 · 但 overlap 100 允许相关段落跨界。这是 RAG 最通用的"黄金组合"。
📄 场景 C:法律合同 · 每一条 1~3 段 · 前后强相关("本条所指" / "前款规定")
chunk=400 / overlap=0
chunk=800 / overlap=100
chunk=1200 / overlap=200 · 按"第 X 条"切
chunk=100 / overlap=50
✅ 1200/200。法律文本前后代词指代强("本条""前款")· chunk 要大 · overlap 要高 · 否则 AI 会丢失"本条"的指向。
📄 场景 D:你的 20 本书读书笔记 · 每段 30~500 字 · 话题跳跃大 · 你想按"金句 / 观点"查询。
chunk=300 / overlap=50 · 按段落切
chunk=100 / overlap=0
chunk=1500 / overlap=200
chunk=5000 / 不切
✅ 300/50。读书笔记讲究"短而独立的观点"·太大的 chunk 会让查"金句"时召回一大团杂音。300 字 ≈ 一段完整思考 · 刚好。
🎯 答对 0 / 4 · 得分 0

🔍 游戏 2 · 召回质量判官 · 4 组"问题 + 召回片段"打分

给你问题和召回的 3 条内容 · 判断召回是 ✅ 可用 / ⚠ 部分可用 / ❌ 重调

🙋 用户问:出差交通费报销标准是多少?
[召回 1 · sim=0.89] 《差旅管理办法》第 5 条:员工出差交通费...经济舱不限 / 高铁二等座不限
[召回 2 · sim=0.85] 同办法第 6 条:城市内交通报销上限 200/天
[召回 3 · sim=0.82] 同办法第 4 条:差旅申请需提前 3 天审批
✅ 可用(命中核心)
⚠ 部分可用
❌ 重调
✅ 可用。3 条相似度都 ≥ 0.82 · 都和交通费相关 · 核心条款命中。召回 3 虽然讲审批但属于"紧密相关"可保留。这是标准合格召回。
🙋 用户问:公司有没有人才推荐奖?
[召回 1 · sim=0.55] 《招聘流程制度》第 3 条:招聘经理负责发布职位...
[召回 2 · sim=0.51] 《入职流程》第 1 条:新员工报到需准备身份证...
[召回 3 · sim=0.48] 《试用期考核》第 2 条:试用期 3~6 个月...
✅ 可用
⚠ 部分可用
❌ 重调 / 资料缺失
❌ 重调 / 资料缺失。所有相似度 < 0.6 · 且都答非所问。说明资料里根本没有"人才推荐奖"。正确做法:① 资料缺 → 补文档;② 若 threshold=0.7 · Bot 会直接说"没找到" = OK;若 threshold 设太低把这些召回送 AI · Bot 会胡编答案。
🙋 用户问:生病请假 5 天需要医院证明吗?
[召回 1 · sim=0.88] 《假勤管理办法》第 7 条:病假 3 天以上需提交医院病假条
[召回 2 · sim=0.42] 《差旅管理》第 2 条:因公外出...
[召回 3 · sim=0.35] 《员工福利》第 1 条:节日福利发放...
✅ 可用
⚠ 部分可用(召回 1 对 · 2&3 噪音)
❌ 重调
⚠ 部分可用。召回 1 完美命中 · 2/3 是噪音(相似度 < 0.5)。解法:threshold 从 0.3 调到 0.65 · 只保留召回 1 送 AI · 答案会更干净。这是 RAG 调优里最常见的场景。
🙋 用户问:那个补贴能报多少?
[召回 1 · sim=0.71] 《差旅补贴》第 3 条:出差日均补贴 100~300
[召回 2 · sim=0.69] 《通讯补贴》第 1 条:月补 200
[召回 3 · sim=0.67] 《餐补制度》第 1 条:中餐补 25/天
✅ 可用(全答)
⚠ 部分可用 · 需问题改写
❌ 重调
⚠ 部分可用 · 需要问题改写 / 反问用户。"那个补贴"指代模糊 · 系统召回了 3 种补贴 · AI 可能全讲一遍把用户淹没。最佳做法:Bot 反问"您是指差旅 / 通讯 / 餐补?"再精准回答。

🚨 游戏 3 · 幻觉识别器 · 5 条回答判真假

资料给定 · 判断 Bot 回答是 ✅ 基于资料 / 👻 幻觉瞎编

📚 资料:差旅住宿标准 · 一线城市 600 / 二线 400 / 其他 300。
🤖 Bot 回答:出差住宿上限为一线 600 元 / 二线 400 / 其他 300【来源:《差旅管理办法》第 8 条】。
✅ 基于资料
👻 幻觉
✅ 标准好回答。数字完全对齐资料 + 带出处。这就是理想 RAG。
📚 资料:差旅住宿标准 · 一线城市 600 / 二线 400 / 其他 300。
🤖 Bot 回答:一线城市 800 / 二线 500 · 北京上海可申请特批到 1200。
✅ 基于资料
👻 幻觉
👻 严重幻觉。数字全是编的 + 资料里根本没有"特批 1200"。典型 Q2 症状 · 解法:temperature 降到 0.2 + Prompt 加"找不到就说找不到"。
📚 资料:无任何关于"996 工作制"内容。
🤖 Bot 回答:我在现有资料里没找到关于 996 工作制的规定,建议您联系 HR 接口人:李姐 / hr@company.com。
✅ 合格(模范处理)
👻 幻觉
✅ 合格 · 这是比"答对"更难做到的能力——承认自己不知道。95% 的新手 Bot 会在这里瞎编。你的 Bot 能做到这样 = 通过最高考验。
📚 资料:年假 5~10 年工龄 10 天 · 10 年以上 15 天。
🤖 Bot 回答:根据资料,年假 10 天。根据劳动法一般还可以加 5 天探亲假
✅ 基于资料
👻 半幻觉(掺外部知识)
👻 半幻觉。前半句对 · 后半句是 AI 自己的"劳动法知识"掺进来了——资料里根本没提探亲假。RAG 铁律:只基于资料 · 不得加外部知识。解法:Prompt 加"严禁引用外部知识 · 严禁'根据劳动法''一般来说'等表达"。
📚 资料:请假 3 天以上需部门经理审批。
🤖 Bot 回答:请假 3 天以上需部门经理审批【来源:《假勤管理办法》第 7 条】。若涉及项目交接 · 建议提前 3 天申请 · 避免影响团队进度。
✅ 合格(结论来自资料 · 贴心话术可接受)
👻 幻觉
✅ 合格。核心结论严格来自资料 + 带引用。第二句"建议提前 3 天"是行为提醒 · 不是事实编造 · 可以接受(严格模式可去掉)。区分关键:有没有编新事实

🎰 游戏 4 · RAG 落地盲盒 · 抽一个立刻能做的项目

不知道 RAG 能干嘛?3 秒给你身份 + 知识库 + 上线渠道 + 能赚多少

🎲 RAG 项目生成器 · 身份 × 知识库 × 渠道 × 变现

点下面按钮 · 抽一个你的第一个 RAG 项目 🎰

💡 连抽 3 次挑最心动的 · 立刻按 PART G 12 步上线

PART J · 🚀 RAG 工程师职业跃迁 ⏱ 20 min

会做 RAG 的人 · 薪资多少 · 怎么变现 可跳槽 · 可副业

2025 年企业 AI 预算里 · RAG 是第一优先级——因为它是"AI 落地最具体、最能解释、最容易计算 ROI"的技术栈。每家中大型企业都在找会搭 RAG 的人。

💰 3 档岗位 · 3 档薪资

TIER 1 · 新人入门
🧩 AI 应用工程师 / 知识库运营
12~25k / 月
给企业搭 + 维护 RAG Bot · 日常工作:整理资料 / 切块 / 调参 / 写 Prompt / 迭代版本。产品公司 / 中大厂子公司都招。
💼 AI 应用工程师 · 知识库运营 · AIGC 内容运营 · 客服系统助理
TIER 2 · 本章毕业位
🧠 RAG 工程师 / AI 产品经理
25~60k / 月 + 股票
独立负责企业知识库从 0 到 1 · 设计分块策略 / 选模型 / 定 SOP / 上线多渠道。带 2~5 人小组或外包团队。
💼 企业 RAG 工程师 · AI PM · 智能客服负责人 · AIGC 解决方案架构师
TIER 3 · 进阶目标
🏆 AI 解决方案架构师 / 独立咨询
60k~100w / 月 + 项目分成
服务大客户 / 做行业 Top 案例 · 或独立做 RAG 咨询公司 · 单项目 20w~200w · 年流水 500w+。
💼 大厂 AI 架构师 · AI 咨询合伙人 · RAG SaaS 创始人

💸 6 条变现路径 · 副业 / 全职都成立

定制
企业 RAG 定制 · 单项目 5~30w
1 个月 1~2 单 = 10~60w / 月

中小企业想做客服 Bot / 知识库 / 培训助理 · 市场价 5~30w。小严模式:扣子 + 飞书 + 企微三件套 · 一周交付。

咨询
AI 咨询 · 按天 3~10k
每月 10 天 = 3~10w · 时间自由

给客户"看病"——帮他们诊断现有 Bot 为什么不准 / 定方案 / 培训团队。不交付代码也能收钱。

订阅
行业知识库 SaaS · 月费 99~1999
律师版 / 医生版 / 教培版

垂类行业打包"行业资料 + 定制 Bot" · 月订阅。100 个客户 × 399 = 月入 4w 被动收入。

课程
零基础搭 RAG 课 · 399~2999
自己的案例就是最好广告

"零基础 7 天搭一个能上线的 RAG Bot"打包课 · 小鹅通 / 抖音卖。你的扣子 Bot 本身就是 demo。

数据
数据清洗服务 · 200~2000 / GB
脏活累活 · 门槛低收入稳

很多企业想做 RAG 但资料脏得离谱。你包"OCR + 格式化 + 元数据" · 按 GB 计费。1 单 2~5w 常见。

私域
自媒体私域答疑 Bot · 月 99~599
知识博主刚需 · 复购极高

博主卖完课后都面临"学员问答解决不过来"。你搭个喂了他课件的 Bot 挂私域 · 收月费。

📄 简历 / 求职加分话术

应聘 AI 应用 / RAG 工程师岗:
"独立搭建过 从 0 到上线的 RAG 系统(扣子 + FastGPT)· 处理 XX 份文档 · XX 分段 · 准确率从 45% 调优到 90%+ · 熟悉 chunk 策略 / 召回调参 / 引用合规 · 作品已服务 XX 用户。"
应聘 AI 产品经理 / 解决方案:
"能为客户设计 端到端 RAG 方案——资料整理 → 切块 → 调参 → 引用 → 上线 → 反馈闭环。熟悉扣子 / FastGPT / Dify 三栈对比选型 · 独立交付过 XX 个企业级 Bot。"
应聘技术类 / 架构岗:
"深度理解 RAG 原理:Embedding 召回 → Rerank → Prompt 拼接 → 模型生成 → 引用追溯。能设计行业垂直知识库架构 · 优化 top_k / threshold / overlap · 诊断 6 类常见故障。"
面试黄金回答(问到"怎么解决 AI 幻觉"):
"我有一套RAG 反幻觉三板斧
数据层——切块带 overlap + 元数据 + 条款编号;
检索层——threshold ≥ 0.7 + top_k 3~5 + 混合检索;
生成层——temperature ≤ 0.3 + Prompt 强约束"找不到就说找不到" + 每条结论必挂引用。
过去做的 Bot 压力测试0 幻觉 · 100% 结论带出处。"
🎯 本章 5 张门票
  • 门票 1 · 切块直觉:看一眼资料就知道 chunk_size 该定多少 · 这是 RAG 核心功夫
  • 门票 2 · 调参能力:tuning.md 三板斧让准确率从 45% → 90% · 可复制可复用
  • 门票 3 · 幻觉免疫:让 Bot 会说"我不知道" · 这比"答对"更值钱
  • 门票 4 · 引用意识:每条答案都带出处 · 企业级 Bot 的标配
  • 门票 5 · 企业视角:从"玩 AI"升级到"给企业卖 AI" · 这是单价跃迁的跳板
PART H · 打卡 + 预告 ⏱ 10 min

本章 12 项打卡 · 解锁「知识库工程师」徽章

✅ 完成下面 12 项任务

🎬 下一章预告

第 8 章 · 零代码搭建 AI Bot:你会用扣子 Coze 把"知识库 + 工作流 + 插件"合体,搭出会查天气、会下订单、会查快递、会调用微信的真正智能体——这是整个课程最有成就感的一章。

📚

知识库工程师

Chapter 07 · 徽章解锁中

你已经拥有一个"只属于你 / 你公司 / 你家庭"的 AI 助手。
第 7 件 AI 作品:一个喂了你资料、带引用、可扫码分享的问答 Bot。
下一章,我们给它"装手装脚"——让它能做事,不只是会说。

🚀 进入第 8 章:零代码搭建 AI Bot
← 上一章 下一章 →