Notes

Apr 01, 2026 基础概念

CoT 深度：从 Zero-shot 到 Tree-of-Thought

梳理 Chain-of-Thought 的演进：Zero-shot / Few-shot、结构化 CoT、ToT / GoT、推理模型内化，以及反直觉坑与实战选型。

#AI#CoT#推理

Apr 01, 2026 智能体 (Agents)

持久记忆：让 Agent 真正「记住」

跨会话记忆的三层架构、Letta/MemGPT 实战、Mem0 与 Zep 对比、图谱与向量混合、Memory as a Service 与隐私合规

#Agent#Memory#Letta

Apr 01, 2026 智能体 (Agents)

Self-Verification：Agent 如何自我验证

验证链、Critic Agent、形式化与事实性验证、Constitutional AI、Guardrail 与成本权衡——从「好用」到「可信」

#Agent#Self-Verification#Verification Chain

Apr 01, 2026 智能体 (Agents)

AI Coding Agent 全景

从 Copilot 到自主 Agent 的跃迁；Cursor、Devin、Windsurf、OpenHands、SWE-agent、Aider、Claude Code 对比；SWE-bench、架构循环与 Agent-Native 工作流

#Agent#Coding#SWE-bench

Apr 01, 2026 工程与生产

Eval Harness 实战：从工具到自建评估体系

用漏斗式视角理解 Eval Harness：工具选型、lm-eval 与 promptfoo 实战、自建四支柱、Flaky Eval 处理，以及与 Agent Harness 的关系。

#AI#评估#Eval Harness

#AI Research#MoE#Reasoning

新一代模型

MoE、Reasoning Models、SSM、多模态原生——2026 年模型架构与前沿趋势全解析

#AI Research#Multimodal#VLM

Multimodal AI

从文本到视觉、音频、视频——多模态 AI 的技术架构、应用场景与挑战

LLM Agents 研究前沿

ReAct、Reflexion、Voyager、CAMEL——Agent 学术研究的关键论文、Benchmark 与未来方向

#AI Research#Agent#ReAct

AI 系统未来形态

从 AGI 时间线到基础设施演进，从社会影响到监管格局——AI 未来的多维度展望

#AI Research#AGI#未来

OpenClaw 是什么

从定位、架构到边界，理解 GitHub 热门开源个人 AI 助手 OpenClaw

#OpenClaw#AI 助手#开源

快速上手

从安装到发送第一条消息，OpenClaw 快速上手指南

#OpenClaw#安装#Onboarding

系统架构详解

深入理解 OpenClaw 的 Gateway、Pi Agent、WebSocket 与会话模型

#OpenClaw#架构#Gateway

频道配置大全

WhatsApp、Telegram、Slack、Discord 等 20+ 消息频道的配置与路由

#OpenClaw#频道#WhatsApp

Agent 与 Skills 系统

Agent Runtime、Workspace、Skills、ClawHub 与聊天命令详解

#OpenClaw#Agent#Skills

#OpenClaw#工具#Browser Control

工具与自动化

Browser Control、Canvas、Nodes、Cron、Webhooks、Voice 与媒体管道

部署方案详解

Docker、Podman、Remote Gateway、Tailscale、Nix 与云部署完整指南

#OpenClaw#部署#Docker

安全模型与最佳实践

DM Pairing、Sandbox、openclaw doctor 与生产部署安全清单

#OpenClaw#安全#DM Pairing

MCP 与插件生态

mcporter 桥接、Plugin API、Memory 插件，以及 Skills / Plugins / MCP 的边界与选型

#OpenClaw#MCP#mcporter

实战案例与工作流

个人助理、开发、团队协作、家居自动化、内容创作与常用模式

#OpenClaw#实战#工作流

社区与未来

贡献指南、Vision 优先级、不会合并的边界与长期方向

#OpenClaw#社区#贡献

AI 交互设计

从对话式 UI 到信任设计，掌握 AI 产品交互的核心模式与反模式

#AI Product#交互设计#UX

#AI Product#Copilot#Agent

AI 产品模式图谱

Copilot、Agent、Automation 三大模式详解，以及如何为产品选择与演进

AI 产品增长策略

数据飞轮、网络效应、病毒传播——AI 产品的独特增长逻辑与实战案例

#AI Product#增长#数据飞轮

AI 商业化

从定价模型到单位经济，系统理解 AI 产品的商业化挑战与可持续路径

#AI Product#商业化#定价

#RAG#Graph RAG#Knowledge Graph

Graph RAG

当向量检索遇到知识图谱：用实体、关系与图遍历，补足纯向量 RAG 在多跳推理上的天然短板

长上下文模型与 RAG 的关系

百万 token 上下文来了，RAG 还有必要吗？答案不是替代，而是分工：长上下文解决“能看多长”，RAG 解决“该看什么”

#RAG#长上下文#Long Context

图片与文档 RAG

超越纯文本：当知识存在于 PDF、表格、图表、扫描件和图片中，多模态 RAG 如何重建检索与理解链路

#RAG#Multimodal#PDF

RAG 评测体系

RAG 好不好，不能只看答案像不像对：从检索、忠实度、引用、线上反馈到回归测试，建立一套真正能指导迭代的评测框架

#RAG#Evaluation#RAGAS

#RAG#Production#Architecture

生产级 RAG 系统架构

从 Demo 到 Production：可靠性、可扩展性、可观测性与成本控制

Agent 是什么

从定义、与 Chatbot 的差异、核心能力到真实案例，理解 AI Agent 的本质与边界

#Agent#AI#LLM

ReAct 模式

Reasoning + Acting 如何交织、ReAct 循环的运作方式、优势与局限，以及实践中的实现要点

#Agent#ReAct#Reasoning

#Agent#Plan & Execute#Planner

Plan & Execute

先规划再执行的两阶段架构、Replanning 机制、与 ReAct 的对比，以及 LangGraph 等实现方式

Agent 系统组成

Planner、Executor、Memory、Tools 四大支柱如何协同，以及 Agent 循环与架构模式

#Agent#架构#Planner

Multi-Agent 系统

多 Agent 协作的通信模式、角色分工、编排策略，以及 CrewAI、AutoGen 等框架与实战考量

#Agent#Multi-Agent#协作

Agent Memory 系统

为什么 Agent 需要记忆、五种记忆类型、MemGPT 虚拟内存、以及实现策略

#Agent#Memory#RAG

#Agent#Self-improvement#Voyager

Self-improving Agents

让 Agent 越用越好的愿景、技能库、Prompt 进化、人机反馈循环与当前局限

#Agent#LangGraph#LangChain

LangGraph

用图结构构建有状态的多步骤 Agent 工作流 —— LangGraph 核心概念、设计模式与实战

AutoGPT

点燃 Agent 革命的先驱、架构与局限、遗产与教训、自主性谱系

#Agent#AutoGPT#自主系统

#Agent#CrewAI#Multi-Agent

CrewAI

基于角色协作的多 Agent 框架 —— 核心概念、工作流设计、Flows 演进与实战对比

AI 工作流自动化

从单 Agent 到端到端流程、文档/代码/数据/客服工作流、编排工具与监控

#Agent#工作流#自动化

AI 系统架构设计

AI 系统与传统软件的本质差异、分层架构设计、微服务 vs 单体、核心组件选型，以及从 MVP 到企业级的部署演进

#AI#架构#微服务

模型推理优化

推理延迟与成本是 AI 应用的两大痛点。Batching、KV Cache、量化、Speculative Decoding 等优化技术详解，以及 vLLM、TGI、TensorRT-LLM 等推理框架的工程取舍

#AI#推理#vLLM

AI 成本优化

Token 成本拆解、Prompt 优化、缓存策略、模型路由、Cascade 模式、自托管 vs API 成本分析，以及预算监控与告警

#AI#成本#缓存

模型选型策略

2026 年模型 landscape、评估维度、能力矩阵、场景映射、开源 vs 闭源、多模型策略，以及如何规避 vendor lock-in

#AI#模型选型#LLM

AI 评估体系

为什么评估是 AI 工程最被低估的环节。Benchmark、离线评估、在线评估、LLM-as-judge、评估流水线与持续监控

#AI#评估#Benchmark

AI 系统监控

AI 可观测性与传统 APM 的差异。Trace、指标、评估三支柱，关键指标定义，日志最佳实践，以及 LangSmith、Langfuse 等工具

#AI#监控#可观测性

AI 安全与防护

AI 专属安全威胁：Prompt Injection、数据泄露、内容安全。防御策略、Guardrails、访问控制与 Red Teaming

#AI#安全#Prompt Injection

#AI Product#产品设计#AI-first

Mar 22, 2026 产品与设计

AI 产品设计方法

从 AI-first 思维到用户价值框架，系统掌握 AI 产品设计的核心方法论

Mar 21, 2026 检索增强 (RAG)

Self-RAG

让模型自己决定何时检索、如何评估检索质量，突破传统 RAG 的固定检索模式

#RAG#Self-RAG#自适应检索

#RAG#Agentic RAG#LangGraph

Mar 21, 2026 检索增强 (RAG)

Agentic RAG

当 LLM 开始主导检索流程：从固定管道到动态决策，理解 Agentic RAG 的能力、代价与工程边界

#RAG#Rerank#Cross-encoder

Mar 20, 2026 检索增强 (RAG)

Rerank 模型

Bi-encoder 与 Cross-encoder 的取舍，两阶段检索模式，以及 Rerank 在 RAG 中的实战价值

Mar 19, 2026 检索增强 (RAG)

文档切分策略

Chunking 是 RAG 的基础：切太大引入噪声，切太小丢失上下文。本文详解各类切分策略与最佳实践

#RAG#Chunking#文档切分

Mar 18, 2026 检索增强 (RAG)

RAG 是什么

从知识截止、幻觉和私有数据三大痛点出发，理解 Retrieval-Augmented Generation 的本质与价值

#RAG#LLM#检索增强

Mar 18, 2026 检索增强 (RAG)

RAG 系统架构详解

从 Query 到 Response 的完整 RAG 流水线，以及索引与查询两条主线的设计要点

#RAG#Pipeline#架构

向量数据库

为什么需要向量数据库、ANN 算法原理、主流产品对比，以及何时用专用向量 DB 何时用 pgvector

#AI#向量数据库#RAG

Embedding 原理

从文本到向量：Embedding 如何将语义编码成数字，以及 Cosine Similarity、主流模型与实战应用

#AI#Embedding#向量

上下文窗口与 LLM 记忆机制

Context Window 如何工作、对话记忆如何维护、RAG 如何扩展知识边界——LLM 记忆全景图

#AI#LLM#Context Window

Prompt 工程入门

角色设定、Few-shot、指令设计、Chain-of-Thought——从零到写出高质量 Prompt 的完整指南

#AI#LLM#Prompt

#AI#Tool Calling#Function Calling

Tool Calling 原理

为什么 LLM 需要工具、Function Calling 与 Tool Use 的区别、MCP 协议，以及如何安全地让模型调用外部能力

AI 应用系统架构

从前端到模型层：AI 应用典型技术栈、各层职责、Orchestration 层详解，以及如何根据场景选架构

#AI#架构#RAG

Prompt 系统设计

结构化输出、模板管理、多轮设计、分层 System Prompt——生产级 Prompt 架构实战

#AI#LLM#Prompt

从 0 到 1 构建 AI 助手

综合 Prompt、RAG、Tool Calling，手把手搭建一个可运行的 AI 助手：系统设计、技术栈、代码结构、常见坑

#AI#实战#RAG

Mar 16, 2026 基础概念

推理能力从哪里来

预训练、微调、RLHF、推理模型——从 Base Model 到 ChatGPT 的完整训练链路

#AI#LLM#预训练

Mar 16, 2026 检索增强 (RAG)

检索质量优化

Sparse、Dense、Hybrid 检索，多阶段检索架构、Query 变换与评估调优实践

#RAG#检索#BM25

Mar 16, 2026 智能体 (Agents)

Reflection

Agent 如何通过自我评估与修正提升输出、Reflexion 模式、实现方式与适用场景

#Agent#Reflection#Reflexion

Mar 16, 2026 工程与生产

Prompt 版本管理

Prompt 即代码：版本控制、测试、A/B、Registry、模板化。Prompt 生命周期与团队协作，以及 Humanloop、LangSmith Hub 等工具

#AI#Prompt#版本管理

Mar 16, 2026 OpenClaw

多平台客户端

macOS App、iOS Node、Android Node 与 Gateway 协议详解

#OpenClaw#macOS#iOS

Mar 15, 2026 基础概念

大语言模型是如何“思考”的

从 Transformer 架构、Attention 机制、Token 预测到 Scaling Law，拆解 LLM 的底层运作逻辑

#AI#LLM#Transformer

Mar 14, 2026 基础概念

AI 黑话通关手册

30+ AI 核心术语，一篇全搞定。不讲废话，每个词给你一句人话 + 原理 + 真实案例。读完你就能看懂大多数 AI 讨论。

#AI#LLM#入门