模块二:记忆与知识 — 让 AI 学会「读书」
模块二 · 3 周 预计 10 小时模块概述
纯 LLM 有两个致命问题:
- 数据过时:ChatGPT 的知识截止到训练日期,它不知道今天发生了什么
- 会「幻觉」:没有答案时它会编造,而且编得跟真的一样
RAG(检索增强生成,Retrieval-Augmented Generation)就是解决这两个问题的核心技术。
🎯
RAG 的本质:让 AI 在回答之前先去「翻书」——先从你的文档库里找到相关内容,再基于找到的内容生成回答。相当于把开卷考试变成了 AI 的默认工作模式。
你将学到什么
你将做出的项目
2
技术栈
PythonStreamlitChromaClaude API / OpenAI API
为什么 RAG 是变现的关键
变现视角 · 三视角复盘
纯聊天产品卷到免费了,但 RAG + 垂直领域知识 = 能收钱的产品。客服机器人 = 产品手册 RAG + 聊天界面。法律助手 = 法条库 RAG + 聊天界面。医疗咨询 = 医学文献 RAG + 聊天界面。
整个 B 端 AI 市场基本就是这个公式的变体。你不需要训练模型,你只需要整理好某个领域的文档,然后用 RAG 让 AI 学会这个领域。
教育视角 · 三视角复盘
RAG 就像一个会考试的学生——他不是把所有答案背下来,而是学会了「翻书找答案」。教孩子用 AI 也是一样:重要的不是让 AI 记住所有知识,而是学会问对问题、找到对的信息源。
三周路线
1
第一周:Embedding 入门
理解 Embedding 的直观含义,动手把文字转成向量,可视化感受「意思相近的词语坐标也相近」。调用 Embedding API,计算余弦相似度。
2
第二周:向量数据库
搭建 Chroma 向量数据库。学习文档分块策略。把所有文档转成向量存起来,实现语义搜索。
3
第三周:RAG 实战
把检索和生成连起来,完成端到端的 RAG 系统。上传你的 PDF/笔记,AI 能基于它们回答问题,并标注信息来源。
准备开始
在进入第一周之前,确保你已经:
- 完成了模块一的项目(可运行的聊天应用)
- 安装了
chromadb:pip install chromadb - 准备了一些测试文档(PDF 或 Markdown 文件)