Tag

#Agent

#Agent 标签文章合集，收录 Diors.tech 中与 Agent 相关的 AI 学习笔记、技术拆解和工程实践。

38 篇文章

2026/05/25 工程与生产

Claude Code 构建经验：为什么 Prompt Caching 是 Agent 的地基

基于 Claude Code 团队关于 prompt caching 的工程经验，拆解长任务 Agent 为什么必须围绕缓存来设计：静态前缀、工具集合、模型切换、compaction 和缓存命中率监控。

2026/05/25 工程与生产

Claude Code 构建经验：像 Agent 一样设计工具

基于 Claude Code 团队的工具设计经验，讨论 Agent harness 里最难的一件事：不是工具越多越好，而是给模型一个它真的会理解、会使用、会自我校正的行动空间。

2026/05/25 工程与生产

Claude Code 构建经验：Skills 不是 Markdown，而是能力包

基于 Claude Code 团队关于 Skills 的实践经验，梳理什么样的 skill 值得做、如何写出高信号密度的 skill、如何用文件系统和脚本做渐进披露，以及团队如何分发和衡量 skill。

2026/04/25 知识系统

LLM Wiki 入门：为什么它不是 RAG，也不是普通笔记软件

从 Karpathy 的 LLM Wiki 模式出发，理解一种新的个人知识库做法：人负责选资料和提问题，LLM Agent 负责整理、交叉引用、更新和维护 Wiki。

2026/04/25 知识系统

LLM Wiki 目录结构：从空文件夹搭出可维护的知识库

手把手搭建 LLM Wiki 的第一版目录结构，讲清 raw、wiki、index、log、AGENTS.md 分别放什么，以及为什么一开始不要把结构设计得太复杂。

2026/04/25 知识系统

写好 AGENTS.md：让 LLM 像知识库维护者一样工作

LLM Wiki 最关键的一篇：完整讲解 AGENTS.md 应该写什么，包括目录规则、页面模板、ingest、query、lint、引用、冲突处理和安全边界。

2026/04/25 知识系统

Ingest 教程：把一篇文章变成一组互相连接的 Wiki 页面

LLM Wiki 的第一个核心操作：如何把 raw 里的原始资料吸收到 wiki 里，生成 source summary、concept page、question page、synthesis，并更新 index 和 log。

2026/04/25 知识系统

Query 教程：如何向自己的 LLM Wiki 提问，并把好答案写回去

LLM Wiki 的第二个核心操作：基于 index 和 wiki 页面提问，生成带依据的回答，并把有长期价值的比较、综述、问题和结论沉淀回知识库。

2026/04/25 知识系统

Lint 教程：让 Agent 定期体检你的 LLM Wiki

LLM Wiki 的第三个核心操作：检查孤岛页面、重复概念、缺引用、过时结论、冲突说法和 index/log 漏更新，让知识库越长越清楚。

2026/04/25 知识系统

Git 工作流：把你的 LLM Wiki 当代码库维护

LLM Wiki 是一堆 Markdown 文件，天然适合 Git。本文讲 commit、diff、branch、rollback、review 和 Agent 修改报告，让知识库可回滚、可审查、可长期维护。

2026/04/25 知识系统

完整项目：用 LLM Wiki 从 0 到 1 学一个新领域

LLM Wiki 系列收官项目：选一个主题，收集 20 篇资料，完成 ingest、query、lint、Obsidian 浏览、Git 管理和搜索升级，最终形成一个可长期维护的知识库。

2026/04/21 产品与设计

AI-Native 浏览器 2026 H1：Comet / ChatGPT Atlas / Dia 三家如何重做 Web

Perplexity Comet 已扩展到桌面和移动端，OpenAI ChatGPT Atlas、The Browser Company Dia 等产品也在重做浏览器入口。和「Chrome + 插件 + ChatGPT 标签页」不是一回事——AI-native browser 把 LLM 当一等公民，URL 退到次位。本文是这条新赛道的产品与功能切片。

2026/04/09 工程与生产

Vibe Coding 与 Spec-Driven Development：2026 Q2 软件开发的两条新文化线

讨论 2026 Q2 软件开发的两条文化线：自然语言驱动的 vibe coding 与大公司推崇的 spec-driven development，以及团队该如何在速度和可维护性之间取舍。

2026/04/08 工程与生产

Agent Benchmark 2026 H1 综合横评：SWE-bench / OSWorld / WebArena / SWE-Lancer

横评 2026 H1 主流 Agent benchmark，包括 SWE-bench、OSWorld、WebArena、SWE-Lancer 与 GDPval，分析它们各自测什么、不测什么，以及刷榜见顶后的评估方向。

2026/04/05 工程与生产

MCP 生态 2026 Q2 现状：从协议到事实标准

梳理 MCP 在 2026 Q2 的生态现状：主流主机支持、OAuth 2.1 PKCE、权限模型、第三方 server 可信度，以及企业部署 MCP 网关的关键问题。

2026/04/03 智能体 (Agents)

Computer Use Agents：让模型直接操作你的电脑

拆解 Computer Use Agent 如何用截图、视觉理解、鼠标键盘动作直接操作软件，对比 Function Calling Agent，并梳理 OSWorld、Claude、Operator 与 Manus 的工程取舍。

2026/04/02 智能体 (Agents)

Hermes Agent：一个会自己长出技能的 24/7 个人 AI

Nous Research 在 2026 年 2 月开源的 Hermes Agent 不到两个月就拿到接近十万 stars。它不是又一个 ReAct 包装器，而是一个把 skills、记忆、网关、模型路由全部塞进同一个进程的「常驻 Agent」。本文拆解它的架构、闭环学习机制，以及它为什么是 2026 上半年最值得关注的开源 Agent 项目。

2026/04/01 基础概念