Context Engineering:从 Prompt 到上下文的范式升级
2025–2026 最热概念:不只写好 prompt,而是系统编排进入模型的信息——组件、budget、质量与评估一次讲清
Tag
#AI 标签文章合集,收录 Diors.tech 中与 AI 相关的 AI 学习笔记、技术拆解和工程实践。
23 篇文章2025–2026 最热概念:不只写好 prompt,而是系统编排进入模型的信息——组件、budget、质量与评估一次讲清
梳理 Chain-of-Thought 的演进:Zero-shot / Few-shot、结构化 CoT、ToT / GoT、推理模型内化,以及反直觉坑与实战选型。
用漏斗式视角理解 Eval Harness:工具选型、lm-eval 与 promptfoo 实战、自建四支柱、Flaky Eval 处理,以及与 Agent Harness 的关系。
从定义、核心能力、和 Chatbot 的差异到真实案例,系统理解 AI Agent 的本质、边界和工程落地方式。
AI 系统与传统软件的本质差异、分层架构设计、微服务 vs 单体、核心组件选型,以及从 MVP 到企业级的部署演进
推理延迟与成本是 AI 应用的两大痛点。Batching、KV Cache、量化、Speculative Decoding 等优化技术详解,以及 vLLM、TGI、TensorRT-LLM 等推理框架的工程取舍
Token 成本拆解、Prompt 优化、缓存策略、模型路由、Cascade 模式、自托管 vs API 成本分析,以及预算监控与告警
2026 年模型 landscape、评估维度、能力矩阵、场景映射、开源 vs 闭源、多模型策略,以及如何规避 vendor lock-in
为什么评估是 AI 工程最被低估的环节。Benchmark、离线评估、在线评估、LLM-as-judge、评估流水线与持续监控
AI 可观测性与传统 APM 的差异。Trace、指标、评估三支柱,关键指标定义,日志最佳实践,以及 LangSmith、Langfuse 等工具
AI 专属安全威胁:Prompt Injection、数据泄露、内容安全。防御策略、Guardrails、访问控制与 Red Teaming
为什么需要向量数据库、ANN 算法原理、主流产品对比,以及何时用专用向量 DB 何时用 pgvector
从文本到向量:Embedding 如何将语义编码成数字,以及 Cosine Similarity、主流模型与实战应用
Context Window 如何工作、对话记忆如何维护、RAG 如何扩展知识边界——LLM 记忆全景图
角色设定、Few-shot、指令设计、Chain-of-Thought——从零到写出高质量 Prompt 的完整指南
为什么 LLM 需要工具、Function Calling 与 Tool Use 的区别、MCP 协议,以及如何安全地让模型调用外部能力
从前端到模型层:AI 应用典型技术栈、各层职责、Orchestration 层详解,以及如何根据场景选架构
从结构化输出、模板管理、多轮状态到分层 System Prompt,讲清生产级 Prompt 系统如何设计、测试与维护。
综合 Prompt、RAG、Tool Calling,手把手搭建一个可运行的 AI 助手:系统设计、技术栈、代码结构、常见坑
从预训练、微调、RLHF/DPO 到推理模型,拆解大语言模型能力形成路径,理解 Base Model、ChatGPT 与 reasoning model 的关系。
Prompt 即代码:版本控制、测试、A/B、Registry、模板化。Prompt 生命周期与团队协作,以及 Humanloop、LangSmith Hub 等工具
从 Transformer 架构、Attention 机制、Token 预测到 Scaling Law,拆解 LLM 的底层运作逻辑
30+ AI 核心术语,一篇全搞定。不讲废话,每个词给你一句人话 + 原理 + 真实案例。读完你就能看懂大多数 AI 讨论。