模块二：记忆与知识 — 让 AI 学会「读书」

模块二 · 3 周预计 10 小时

模块概述

纯 LLM 有两个致命问题：

RAG（检索增强生成，Retrieval-Augmented Generation）就是解决这两个问题的核心技术。

🎯

RAG 的本质：让 AI 在回答之前先去「翻书」——先从你的文档库里找到相关内容，再基于找到的内容生成回答。相当于把开卷考试变成了 AI 的默认工作模式。

Embedding（嵌入向量）

第 1 周

把文字变成高维空间中的坐标。意思相近的词坐标也相近——「猫」和「小猫」离得近，「猫」和「汽车」离得远。这是 AI「理解」语义的基础。

向量数据库

第 2 周

专门存储和检索向量的数据库。核心能力是「找最近的向量」——在海量文档中毫秒级找到和你的问题最相关的内容。

RAG 完整管线

第 3 周

用户提问 → 向量检索相关文档 → 把文档+问题一起给 LLM → 生成有据可查的回答。这是 90% 企业级 AI 应用的底层架构。

会读文档的 AI 问答机器人

上传你的 PDF、笔记、文档，AI 能基于它们回答问题，并标注每条回答的信息来源。不再是「我觉得」，而是「根据你的文档第 3 页」。

PythonStreamlitChromaClaude API / OpenAI API

变现视角 · 三视角复盘

纯聊天产品卷到免费了，但 RAG + 垂直领域知识 = 能收钱的产品。客服机器人 = 产品手册 RAG + 聊天界面。法律助手 = 法条库 RAG + 聊天界面。医疗咨询 = 医学文献 RAG + 聊天界面。

整个 B 端 AI 市场基本就是这个公式的变体。你不需要训练模型，你只需要整理好某个领域的文档，然后用 RAG 让 AI 学会这个领域。

教育视角 · 三视角复盘

RAG 就像一个会考试的学生——他不是把所有答案背下来，而是学会了「翻书找答案」。教孩子用 AI 也是一样：重要的不是让 AI 记住所有知识，而是学会问对问题、找到对的信息源。

理解 Embedding 的直观含义，动手把文字转成向量，可视化感受「意思相近的词语坐标也相近」。调用 Embedding API，计算余弦相似度。

搭建 Chroma 向量数据库。学习文档分块策略。把所有文档转成向量存起来，实现语义搜索。

把检索和生成连起来，完成端到端的 RAG 系统。上传你的 PDF/笔记，AI 能基于它们回答问题，并标注信息来源。

在进入第一周之前，确保你已经：