Part IV 向量、检索与知识工程¶
本部分目标¶
企业 Agent 需要从文档、知识库、图片、表格和业务实体中找到可靠证据。Part IV 讨论向量表示、检索、文档解析、RAG 和知识图谱的工程边界。重点不在“接一个向量库”,而在于让证据可召回、可过滤、可引用、可评估。
本部分章节¶
| 章 | 主题 | 读完应能回答的问题 |
|---|---|---|
| 第16章 嵌入模型 | 文本、多模态 embedding 与评测基线 | 怎样选择 embedding 模型,怎样用内部评测集避免选型很快过期 |
| 第17章 嵌入微调与重排 | hard negative、reranker、版本灰度 | 什么时候需要微调或重排,怎样把召回问题和排序问题分开 |
| 第18章 向量数据库与索引算法 | Milvus、Qdrant、HNSW、IVF、PQ | 向量库怎样同时处理召回、权限过滤、版本治理和成本 |
| 第19章 文档解析与多模态 OCR | PDF、表格、版面、OCR、VLM | 文档进入检索前怎样解析,哪些错误会直接污染后续 RAG |
| 第20章 RAG 工程与高级检索 | 分块、混合检索、重排、引用校验 | RAG 怎样从“能答”变成“有证据、可复盘、可治理” |
| 第21章 知识工程:本体、抽取与知识图谱 | 本体、实体链接、GraphRAG | 知识图谱怎样补足向量检索的关系推理和实体消歧能力 |
阅读路径¶
第16章至第18章建立检索的向量底座,第19章处理文档进入底座前的解析质量,第20章把召回结果组织成可引用证据,第21章再把实体、关系和规则接入知识工程。读到 Part VI 的 DataAgent 时,本部分提供的是“证据从哪里来、为什么可信”的答案。