Tag

#RAG

#RAG 标签文章合集，收录 Diors.tech 中与 RAG 相关的 AI 学习笔记、技术拆解和工程实践。

23 篇文章

2026/06/10 工程与生产

AI Engineer 知识地图 2026：从基础设施工程师到 AI Builder

基于 AI Engineer Knowledge Map 2026 这张能力地图，重新整理现代 AI Engineer 的知识结构：基础设施、数据、LLM、推理、RAG、Agent、安全、评测、FinOps 与业务理解。

2026/04/25 知识系统

LLM Wiki 入门：为什么它不是 RAG，也不是普通笔记软件

从 Karpathy 的 LLM Wiki 模式出发，理解一种新的个人知识库做法：人负责选资料和提问题，LLM Agent 负责整理、交叉引用、更新和维护 Wiki。

2026/04/25 知识系统

搜索层：当 index.md 不够用时，怎么给 LLM Wiki 加检索

LLM Wiki 一开始不需要向量数据库。本文讲从 index.md、ripgrep、Obsidian 搜索到 BM25 / vector / qmd 的渐进路线，以及什么时候该加搜索。

2026/04/01 基础概念

Context Engineering：从 Prompt 到上下文的范式升级

2025–2026 最热概念：不只写好 prompt，而是系统编排进入模型的信息——组件、budget、质量与评估一次讲清

2026/03/22 检索增强 (RAG)

Graph RAG

当向量检索遇到知识图谱，Graph RAG 用实体、关系与图遍历补足纯向量 RAG 在多跳推理和结构化知识上的短板。

2026/03/22 检索增强 (RAG)

长上下文模型与 RAG 的关系

百万 token 上下文来了，RAG 还有必要吗？答案不是替代，而是分工：长上下文解决“能看多长”，RAG 解决“该看什么”

2026/03/22 检索增强 (RAG)

图片与文档 RAG

超越纯文本：当知识存在于 PDF、表格、图表、扫描件和图片中，多模态 RAG 如何重建检索与理解链路

2026/03/22 检索增强 (RAG)

RAG 评测体系

RAG 好不好，不能只看答案像不像对：从检索、忠实度、引用、线上反馈到回归测试，建立一套真正能指导迭代的评测框架

2026/03/22 检索增强 (RAG)

生产级 RAG 系统架构

从 Demo 到 Production，拆解生产级 RAG 的可靠性、可扩展性、可观测性、权限、评估与成本控制设计。

2026/03/22 智能体 (Agents)

Agent Memory 系统

解释 Agent 为什么需要记忆，梳理短期记忆、长期记忆、用户档案、工具状态与 MemGPT 虚拟内存等实现策略。

2026/03/21 检索增强 (RAG)

Self-RAG

解释 Self-RAG 如何让模型自主决定何时检索、如何评估证据与回答质量，以及它相对传统固定检索管线的价值和边界。

2026/03/21 检索增强 (RAG)

Agentic RAG

当 LLM 开始主导检索流程：从固定管道到动态决策，理解 Agentic RAG 的能力、代价与工程边界

2026/03/20 检索增强 (RAG)

Rerank 模型

Bi-encoder 与 Cross-encoder 的取舍，两阶段检索模式，以及 Rerank 在 RAG 中的实战价值

2026/03/19 检索增强 (RAG)

文档切分策略

Chunking 是 RAG 的基础：切太大引入噪声，切太小丢失上下文。本文详解各类切分策略与最佳实践

2026/03/18 检索增强 (RAG)

RAG 是什么

从知识截止、幻觉和私有数据三大痛点出发，理解 Retrieval-Augmented Generation 的本质与价值

2026/03/18 检索增强 (RAG)

RAG 系统架构详解

拆解从 Query 到 Response 的完整 RAG 流水线，覆盖离线索引、在线查询、检索增强、上下文组装与回答生成。

2026/03/17 基础概念

向量数据库

为什么需要向量数据库、ANN 算法原理、主流产品对比，以及何时用专用向量 DB 何时用 pgvector

2026/03/17 基础概念

Embedding 原理

从文本到向量：Embedding 如何将语义编码成数字，以及 Cosine Similarity、主流模型与实战应用

2026/03/17 基础概念

上下文窗口与 LLM 记忆机制

Context Window 如何工作、对话记忆如何维护、RAG 如何扩展知识边界——LLM 记忆全景图

2026/03/17 基础概念

AI 应用系统架构

从前端到模型层：AI 应用典型技术栈、各层职责、Orchestration 层详解，以及如何根据场景选架构

2026/03/17 基础概念

Prompt 系统设计

从结构化输出、模板管理、多轮状态到分层 System Prompt，讲清生产级 Prompt 系统如何设计、测试与维护。

2026/03/17 基础概念

从 0 到 1 构建 AI 助手

综合 Prompt、RAG、Tool Calling，手把手搭建一个可运行的 AI 助手：系统设计、技术栈、代码结构、常见坑

2026/03/16 检索增强 (RAG)

检索质量优化

系统讲解 Sparse、Dense、Hybrid 检索、多阶段召回、Query 变换与评估调优，帮助生产级 RAG 提升检索质量。