← 全部标签

Tag

#LLM

#LLM 标签文章合集，收录 Diors.tech 中与 LLM 相关的 AI 学习笔记、技术拆解和工程实践。

14 篇文章

2026/06/10 工程与生产

AI Engineer 知识地图 2026：从基础设施工程师到 AI Builder

基于 AI Engineer Knowledge Map 2026 这张能力地图，重新整理现代 AI Engineer 的知识结构：基础设施、数据、LLM、推理、RAG、Agent、安全、评测、FinOps 与业务理解。

2026/06/03 工程与生产

模型路由 2026：不要把所有任务都交给同一个模型

结合 GPT-5.5、Claude、Gemini、开源模型、OpenRouter 与私有评测，梳理 2026 年为什么 AI 产品需要模型路由，以及怎样按任务风险、成本、延迟和能力做自动切换。

2026/04/13 前沿探索

开源 LLM 2026 H1 格局：从「追赶」到「分轨竞争」

2026 H1 是开放权重 / 开源 LLM 第一次在多个赛道逼近 frontier 闭源模型的半年。Llama 4、DeepSeek、Qwen、GLM、Gemma 等模型在 reasoning、coding、Agent、小型本地等维度形成分轨竞争。本文按六条赛道梳理现状，给出选型决策树与本地部署成本参考。

2026/04/01 基础概念

Context Engineering：从 Prompt 到上下文的范式升级

2025–2026 最热概念：不只写好 prompt，而是系统编排进入模型的信息——组件、budget、质量与评估一次讲清

2026/03/22 智能体 (Agents)

Agent 是什么

从定义、核心能力、和 Chatbot 的差异到真实案例，系统理解 AI Agent 的本质、边界和工程落地方式。

2026/03/22 智能体 (Agents)

ReAct 模式

Reasoning + Acting 如何交织、ReAct 循环的运作方式、优势与局限，以及实践中的实现要点

2026/03/22 工程与生产

模型选型策略

2026 年模型 landscape、评估维度、能力矩阵、场景映射、开源 vs 闭源、多模型策略，以及如何规避 vendor lock-in

2026/03/18 检索增强 (RAG)

RAG 是什么

从知识截止、幻觉和私有数据三大痛点出发，理解 Retrieval-Augmented Generation 的本质与价值

2026/03/17 基础概念

上下文窗口与 LLM 记忆机制

Context Window 如何工作、对话记忆如何维护、RAG 如何扩展知识边界——LLM 记忆全景图

2026/03/17 基础概念

Prompt 工程入门

角色设定、Few-shot、指令设计、Chain-of-Thought——从零到写出高质量 Prompt 的完整指南

2026/03/17 基础概念

Prompt 系统设计

从结构化输出、模板管理、多轮状态到分层 System Prompt，讲清生产级 Prompt 系统如何设计、测试与维护。

2026/03/16 基础概念

推理能力从哪里来

从预训练、微调、RLHF/DPO 到推理模型，拆解大语言模型能力形成路径，理解 Base Model、ChatGPT 与 reasoning model 的关系。

2026/03/15 基础概念

大语言模型是如何“思考”的

从 Transformer 架构、Attention 机制、Token 预测到 Scaling Law，拆解 LLM 的底层运作逻辑

2026/03/14 基础概念

AI 黑话通关手册

30+ AI 核心术语，一篇全搞定。不讲废话，每个词给你一句人话 + 原理 + 真实案例。读完你就能看懂大多数 AI 讨论。