模块二:记忆与知识 — 让 AI 学会「读书」

模块二 · 3 周 预计 10 小时

模块概述

纯 LLM 有两个致命问题:

  1. 数据过时:ChatGPT 的知识截止到训练日期,它不知道今天发生了什么
  2. 会「幻觉」:没有答案时它会编造,而且编得跟真的一样

RAG(检索增强生成,Retrieval-Augmented Generation)就是解决这两个问题的核心技术。

🎯

RAG 的本质:让 AI 在回答之前先去「翻书」——先从你的文档库里找到相关内容,再基于找到的内容生成回答。相当于把开卷考试变成了 AI 的默认工作模式。

你将学到什么

Embedding(嵌入向量)
第 1 周

把文字变成高维空间中的坐标。意思相近的词坐标也相近——「猫」和「小猫」离得近,「猫」和「汽车」离得远。这是 AI「理解」语义的基础。

向量数据库
第 2 周

专门存储和检索向量的数据库。核心能力是「找最近的向量」——在海量文档中毫秒级找到和你的问题最相关的内容。

RAG 完整管线
第 3 周

用户提问 → 向量检索相关文档 → 把文档+问题一起给 LLM → 生成有据可查的回答。这是 90% 企业级 AI 应用的底层架构。

你将做出的项目

2
会读文档的 AI 问答机器人

上传你的 PDF、笔记、文档,AI 能基于它们回答问题,并标注每条回答的信息来源。不再是「我觉得」,而是「根据你的文档第 3 页」。

技术栈

PythonStreamlitChromaClaude API / OpenAI API

为什么 RAG 是变现的关键

变现视角 · 三视角复盘

纯聊天产品卷到免费了,但 RAG + 垂直领域知识 = 能收钱的产品。客服机器人 = 产品手册 RAG + 聊天界面。法律助手 = 法条库 RAG + 聊天界面。医疗咨询 = 医学文献 RAG + 聊天界面。

整个 B 端 AI 市场基本就是这个公式的变体。你不需要训练模型,你只需要整理好某个领域的文档,然后用 RAG 让 AI 学会这个领域。

教育视角 · 三视角复盘

RAG 就像一个会考试的学生——他不是把所有答案背下来,而是学会了「翻书找答案」。教孩子用 AI 也是一样:重要的不是让 AI 记住所有知识,而是学会问对问题、找到对的信息源。

三周路线

1

第一周:Embedding 入门

理解 Embedding 的直观含义,动手把文字转成向量,可视化感受「意思相近的词语坐标也相近」。调用 Embedding API,计算余弦相似度。

2

第二周:向量数据库

搭建 Chroma 向量数据库。学习文档分块策略。把所有文档转成向量存起来,实现语义搜索。

3

第三周:RAG 实战

把检索和生成连起来,完成端到端的 RAG 系统。上传你的 PDF/笔记,AI 能基于它们回答问题,并标注信息来源。

准备开始

在进入第一周之前,确保你已经:

  • 完成了模块一的项目(可运行的聊天应用)
  • 安装了 chromadbpip install chromadb
  • 准备了一些测试文档(PDF 或 Markdown 文件)

开始第一周 →