LLM Wiki 入门:为什么它不是 RAG,也不是普通笔记软件
从 Karpathy 的 LLM Wiki 模式出发,理解一种新的个人知识库做法:人负责选资料和提问题,LLM Agent 负责整理、交叉引用、更新和维护 Wiki。
Tag
#RAG 标签文章合集,收录 Diors.tech 中与 RAG 相关的 AI 学习笔记、技术拆解和工程实践。
22 篇文章从 Karpathy 的 LLM Wiki 模式出发,理解一种新的个人知识库做法:人负责选资料和提问题,LLM Agent 负责整理、交叉引用、更新和维护 Wiki。
LLM Wiki 一开始不需要向量数据库。本文讲从 index.md、ripgrep、Obsidian 搜索到 BM25 / vector / qmd 的渐进路线,以及什么时候该加搜索。
2025–2026 最热概念:不只写好 prompt,而是系统编排进入模型的信息——组件、budget、质量与评估一次讲清
当向量检索遇到知识图谱,Graph RAG 用实体、关系与图遍历补足纯向量 RAG 在多跳推理和结构化知识上的短板。
百万 token 上下文来了,RAG 还有必要吗?答案不是替代,而是分工:长上下文解决“能看多长”,RAG 解决“该看什么”
超越纯文本:当知识存在于 PDF、表格、图表、扫描件和图片中,多模态 RAG 如何重建检索与理解链路
RAG 好不好,不能只看答案像不像对:从检索、忠实度、引用、线上反馈到回归测试,建立一套真正能指导迭代的评测框架
从 Demo 到 Production,拆解生产级 RAG 的可靠性、可扩展性、可观测性、权限、评估与成本控制设计。
解释 Agent 为什么需要记忆,梳理短期记忆、长期记忆、用户档案、工具状态与 MemGPT 虚拟内存等实现策略。
解释 Self-RAG 如何让模型自主决定何时检索、如何评估证据与回答质量,以及它相对传统固定检索管线的价值和边界。
当 LLM 开始主导检索流程:从固定管道到动态决策,理解 Agentic RAG 的能力、代价与工程边界
Bi-encoder 与 Cross-encoder 的取舍,两阶段检索模式,以及 Rerank 在 RAG 中的实战价值
Chunking 是 RAG 的基础:切太大引入噪声,切太小丢失上下文。本文详解各类切分策略与最佳实践
从知识截止、幻觉和私有数据三大痛点出发,理解 Retrieval-Augmented Generation 的本质与价值
拆解从 Query 到 Response 的完整 RAG 流水线,覆盖离线索引、在线查询、检索增强、上下文组装与回答生成。
为什么需要向量数据库、ANN 算法原理、主流产品对比,以及何时用专用向量 DB 何时用 pgvector
从文本到向量:Embedding 如何将语义编码成数字,以及 Cosine Similarity、主流模型与实战应用
Context Window 如何工作、对话记忆如何维护、RAG 如何扩展知识边界——LLM 记忆全景图
从前端到模型层:AI 应用典型技术栈、各层职责、Orchestration 层详解,以及如何根据场景选架构
从结构化输出、模板管理、多轮状态到分层 System Prompt,讲清生产级 Prompt 系统如何设计、测试与维护。
综合 Prompt、RAG、Tool Calling,手把手搭建一个可运行的 AI 助手:系统设计、技术栈、代码结构、常见坑
系统讲解 Sparse、Dense、Hybrid 检索、多阶段召回、Query 变换与评估调优,帮助生产级 RAG 提升检索质量。