Agent Runtime:为什么下一代 AI 产品像一个小操作系统
从 Responses API、Agents SDK、MCP、Computer Use、WebSocket agent loop 和 Claude Agent SDK 出发,梳理 Agent Runtime 为什么会成为 AI 产品的核心底座,以及团队该怎样设计状态、工具、权限、沙箱、评测和可观测性。
Tag
#Agent 工程 标签文章合集,收录 Diors.tech 中与 Agent 工程 相关的 AI 学习笔记、技术拆解和工程实践。
2 篇文章从 Responses API、Agents SDK、MCP、Computer Use、WebSocket agent loop 和 Claude Agent SDK 出发,梳理 Agent Runtime 为什么会成为 AI 产品的核心底座,以及团队该怎样设计状态、工具、权限、沙箱、评测和可观测性。
用漏斗式视角理解 Eval Harness:工具选型、lm-eval 与 promptfoo 实战、自建四支柱、Flaky Eval 处理,以及与 Agent Harness 的关系。