ACI (1)
-
2026-07-07 07. SWE-agent:把真实 GitHub Issue 变成 Agent 的任务
AI (3)
-
2024-08-23 LobeChat 部署系列——鉴权篇
-
2024-08-22 LobeChat 部署系列——进阶篇
-
2024-08-21 LobeChat 部署系列——基础篇
AI Agent (1)
-
2025-11-18 LLM应用开发——Agent智能体
AI SDK (1)
-
2026-04-19 构建你的第一个 AI 聊天应用
AI Safety (1)
-
2026-05-03 11. 一张照片骗过所有人的眼睛
AI 协作 (1)
-
2026-04-25 我不会 Swift,但还是想做个 iPhone app
AI入门 (22)
-
2026-05-16 番外 16:uvicorn --reload 与本地大模型的相处难题
-
2026-05-15 番外 15:RAG 评估方法,把感觉变成数字
-
2026-05-13 番外 13:文本切分策略与 chunk_size 选择
-
2026-05-12 番外 12:Embedding 模型选型实战
-
2026-05-11 番外 11:从 One-Hot 到 LLM,自然语言处理三十年的完整演化
-
2026-05-09 番外 9:Embedding 的来龙去脉
-
2026-04-25 番外 1:LLM 简史——从 Transformer 到今天
-
2026-04-23 Embedding 与向量:把文字变成数字
-
2026-04-22 结构化输出:用 Pydantic 把 LLM 变成稳定的函数
-
2026-04-21 调用大模型 API:从 requests 到流式响应
-
2026-04-21 Prompt 工程:让模型稳定输出你要的结果
-
2026-04-20 AI 入门:Python 新手的第一课
-
2026-04-19 进阶方向:多模态、本地部署与成本优化
-
2026-04-18 Agent 入门:从对话到自主行动
-
2026-04-18 MCP 协议:Agent 的通用接口
-
2026-04-17 RAG:让 AI 回答你的专属数据
-
2026-04-17 Function Calling:让 AI 调用你的 API
-
2026-04-16 Prompt 工程:让 AI 听懂你的话
-
2026-04-16 Embedding 与向量:把文字变成数字
-
2026-04-15 AI 入门:前端开发者的第一课
-
2026-04-15 调用大模型 API:从 fetch 到流式响应
AI写作 (1)
-
2025-09-17 LLM应用开发——AI写作助手实战
AI搜索 (1)
-
2025-09-26 LLM应用开发——AI搜索引擎实战
AI编程 (1)
-
2026-04-20 从 Copilot 到 Claude Code:为什么值得换
ALiBi (2)
-
2026-05-25 项目 3-8:位置、注意力与 Transformer Block
ANN (2)
-
2026-05-24 FAISS实战
-
2026-05-22 近似最近邻ANN算法
API (5)
-
2026-05-11 API 调用没你想的那么简单
-
2026-05-02 番外 2:API 参数全解,temperature 到 logprobs
-
2026-04-25 番外 2:API 参数全解——从 temperature 到 logprobs
-
2026-04-21 调用大模型 API:从 requests 到流式响应
-
2026-04-15 调用大模型 API:从 fetch 到流式响应
ASR (2)
-
2026-05-08 番外 8:多模态入门,图像、语音与视频
-
2025-09-29 LLM应用开发——语音交互系统实战
AWQ (2)
-
2026-05-30 模型量化INT8与INT4
-
2026-05-27 项目 26:数字的炼金术:模型量化(Quantization)深度解密
Action Space (1)
-
2026-07-05 05. CodeAct:把代码执行变成通用 Agent 的动作空间
Adam (1)
-
2026-04-24 02. 雪夜下山的瞎子
Adapter (1)
-
2026-05-26 项目 31:多模态视觉语言桥接器(Vision-Language Adapter)
Adversarial Examples (1)
-
2026-05-03 11. 一张照片骗过所有人的眼睛
Agent (55)
-
2026-07-20 20. 模型自身能力对 Agent 表现的影响
-
2026-07-19 19. Agent 框架横向对比:LangGraph、AutoGen、CrewAI、OpenHands
-
2026-07-18 18. 多模态代码 Agent:视觉输入加入代码生成的工作流
-
2026-07-17 17. 代码 Agent 评测方法的设计反思
-
2026-07-16 16. 大代码库的上下文管理:Agent 如何在百万行代码里找路
-
2026-07-15 15. 代码 Agent 的安全边界:沙箱、权限与提示注入
-
2026-07-14 14. 代码 Agent 的设计模式:前 13 篇的横向梳理
-
2026-07-13 13. InterCode:把交互式编程环境变成强化学习的训练场
-
2026-07-12 12. MapCoder:用类比和检索辅助代码生成
-
2026-07-11 11. AgentCoder:拆分角色,让代码生成和测试设计分开
-
2026-07-10 10. AlphaCodium:用测试驱动的迭代流程生成代码
-
2026-07-09 09. LATS:把树搜索和语言反思结合起来
-
2026-07-08 08. Reflexion:用语言反思替代梯度更新
-
2026-07-07 07. SWE-agent:把真实 GitHub Issue 变成 Agent 的任务
-
2026-07-06 06. Self-Debugging:让模型自己读报错、自己改代码
-
2026-07-05 05. CodeAct:把代码执行变成通用 Agent 的动作空间
-
2026-07-04 04. Voyager:用代码探索开放世界的终身学习 Agent
-
2026-07-03 03. 从执行反馈中学习:CodeRL 与迭代自修正
-
2026-07-02 02. 代码还是文字?CodeSteer 与推理模式的动态选择
-
2026-07-01 01. 代码是推理的外包地:Program of Thoughts 与 Chain of Code
-
2026-06-10 23. Agent 失败模式分类学:为什么它总在你不期待的地方崩
-
2026-06-09 22. Agent 安全边界:Prompt Injection、权限最小化、沙箱逃逸
-
2026-06-08 21. Benchmark 全景:SWE-bench、AgentBench、τ-bench 怎么读
-
2026-06-07 20. LlamaIndex 数据侧深度
-
2026-06-06 19. LangGraph 状态机编排
-
2026-05-25 项目 17-33:MoE、数据、后训练、评测、RAG、Agent 与安全
-
2026-05-25 项目 30:构建 Tool Use 与 Agent Loop
-
2026-05-17 MCP:自己动手写一个 Server
-
2026-05-16 Agent 不只是套个循环
-
2026-05-15 Function Calling 用好了才叫工具调用
-
2026-05-13 01. 评判一个 Agent,你到底在评判什么
-
2026-05-08 18. 框架世界观对比:Claude Agent SDK、LangGraph、CrewAI、Pydantic AI
-
2026-05-07 17. 生产化:上下文压缩、成本、延迟、失败恢复、安全边界
-
2026-05-07 番外 7:提示词注入与防御
-
2026-05-06 16. 可观测性与评测:Agent 的 trace、replay 与回归测试
-
2026-05-05 15. Human-in-the-Loop:什么时候让 Agent 停下来问人
-
2026-05-04 14. Browser & Computer Use:让 Agent 看屏幕、点鼠标
-
2026-05-03 13. Code Execution Agent:让 Agent 真的能写代码、跑代码
-
2026-05-02 12. 多 Agent 协作:Orchestrator、Debate、Handoff 与它们的陷阱
-
2026-05-01 11. 开源 Agent 全家桶:Hermes 3 + 向量库的离线 RAG-Agent
-
2026-04-30 10. Hermes 3 实战:在 Ollama 上跑一个本地工具调用 Agent
-
2026-04-29 09. 工具调用协议的分裂:OpenAI、Anthropic、Hermes
-
2026-04-28 08. 上下文工程:Agent 最难的不是推理,是喂什么进去
-
2026-04-27 07. 记忆系统:短期对话、长期事实、过程记忆
-
2026-04-27 MCP 协议:Agent 的通用接口
-
2026-04-26 06. Tree of Thoughts:从线性循环到搜索式推理
-
2026-04-26 Agent 入门:从工具调用到自主循环
-
2026-04-25 05. Reflection:让 Agent 自己挑毛病、自己改
-
2026-04-25 Function Calling:让 LLM 调用你的 Python 函数
-
2026-04-24 04. Plan-and-Execute:先规划,再执行,失败时重规划
-
2026-04-23 03. 工具设计的艺术:粒度、命名、错误反馈与工具爆炸
-
2026-04-22 02. ReAct:把 Agent 的思考显式化
-
2026-04-21 01. Agent 是什么:从一次性 Function Call 到自主循环
-
2026-04-18 Agent 入门:从对话到自主行动
-
2026-04-18 MCP 协议:Agent 的通用接口
AgentBench (1)
AgentCoder (1)
-
2026-07-11 11. AgentCoder:拆分角色,让代码生成和测试设计分开
AlphaCode (1)
-
2026-07-10 10. AlphaCodium:用测试驱动的迭代流程生成代码
AlphaCodium (1)
-
2026-07-10 10. AlphaCodium:用测试驱动的迭代流程生成代码
Analogy (1)
-
2026-07-12 12. MapCoder:用类比和检索辅助代码生成
Anthropic (2)
-
2026-05-12 20. 一支笔里藏着五种颜色
-
2026-04-29 09. 工具调用协议的分裂:OpenAI、Anthropic、Hermes
Approval (1)
-
2026-05-05 15. Human-in-the-Loop:什么时候让 Agent 停下来问人
Attention (6)
-
2026-05-26 项目 05:从单头到多头注意力
-
2026-05-26 项目 12:架构的进化:MQA、GQA 与 MLA 深度解析
-
2026-05-25 项目 3-8:位置、注意力与 Transformer Block
-
2026-05-25 项目 04:手写 scaled dot-product attention
-
2026-04-26 番外 4:上下文窗口进化史——KV Cache 与长上下文
-
2026-04-23 01. 图书馆里的低语
AutoGen (1)
BERT (1)
-
2026-05-26 项目 08:训练目标对比:Causal、Masked 与 Prefix LM
BGE (1)
-
2026-05-16 番外 16:uvicorn --reload 与本地大模型的相处难题
BM25 (1)
-
2026-05-14 你的 RAG 为什么回答得不好
BPE (4)
-
2026-05-25 项目 1-2:Tokenizer、词表与 Embedding
-
2026-05-25 项目 01:从零实现 tokenizer
-
2026-05-03 番外 3:Token 的秘密,BPE、中文为什么更贵
-
2026-04-26 番外 3:Token 的秘密——BPE、中文更贵、怎么省
Bash (1)
-
2026-07-13 13. InterCode:把交互式编程环境变成强化学习的训练场
Bayes (1)
-
2026-04-28 06. 在雾中看潮水的渔夫
Bayesian (1)
-
2026-04-28 06. 在雾中看潮水的渔夫
Benchmark (4)
-
2026-07-17 17. 代码 Agent 评测方法的设计反思
-
2026-07-13 13. InterCode:把交互式编程环境变成强化学习的训练场
-
2026-06-08 21. Benchmark 全景:SWE-bench、AgentBench、τ-bench 怎么读
-
2026-05-27 项目 28:拒绝虚假繁荣:构建严谨的模型评测(Evaluation Harness)
Browser (1)
-
2026-05-04 14. Browser & Computer Use:让 Agent 看屏幕、点鼠标
Bug Fix (1)
-
2026-07-07 07. SWE-agent:把真实 GitHub Issue 变成 Agent 的任务
CLAUDE.md (2)
-
2026-04-26 搭场子:装 Xcode、注册账号、写一份 CLAUDE.md
-
2026-04-22 初次见面:项目初始化与 CLAUDE.md
CLIP (1)
-
2026-05-26 项目 31:多模态视觉语言桥接器(Vision-Language Adapter)
CNN (1)
-
2026-04-30 08. 同一双眼睛走遍全村
CPU 推理 (1)
-
2026-05-31 GGUF与llamacpp
Capstone (2)
-
2026-05-27 项目 34:终极试炼:构建你的私有化大模型系统(Capstone Project)
-
2026-05-25 项目 34:十二周执行计划与 Capstone
Catastrophic Forgetting (1)
-
2026-05-01 09. 学新手艺就忘旧的画师
Chain of Code (1)
Chain of Thought (1)
-
2026-05-11 19. 会大声自言自语的棋手
ChatGPT (1)
-
2026-05-25 从迷你 GPT 到 ChatGPT:预训练之后还经历了什么
Checkpoint (1)
-
2026-06-06 19. LangGraph 状态机编排
Chinchilla (2)
-
2026-05-27 项目 23:预测未来的算力账本:缩放法则(Scaling Laws)与曲线拟合
-
2026-05-10 18. 够大的雨终会灌满湖
Chroma (2)
-
2026-05-25 Chroma轻量入门
-
2026-05-01 11. 开源 Agent 全家桶:Hermes 3 + 向量库的离线 RAG-Agent
Chunking (1)
-
2026-05-13 番外 13:文本切分策略与 chunk_size 选择
Claude (1)
-
2026-07-20 20. 模型自身能力对 Agent 表现的影响
Claude Agent SDK (1)
Claude Code (11)
-
2026-04-27 第一次发牌:从一句话到模拟器亮屏
-
2026-04-26 搭场子:装 Xcode、注册账号、写一份 CLAUDE.md
-
2026-04-25 我不会 Swift,但还是想做个 iPhone app
-
2026-04-24 进阶武器:Slash Commands、Hooks、Subagents、MCP
-
2026-04-24 避坑与省钱:上下文管理与常见问题
-
2026-04-23 高效沟通:跳出 Copilot 式补全思维
-
2026-04-23 日常工作流:Bug 修复、新功能、重构、测试
-
2026-04-22 初次见面:项目初始化与 CLAUDE.md
-
2026-04-22 核心心智模型:上下文、权限与计划模式
-
2026-04-21 安装 Claude Code 并完成首次登录
-
2026-04-20 从 Copilot 到 Claude Code:为什么值得换
Code Action (1)
-
2026-07-04 04. Voyager:用代码探索开放世界的终身学习 Agent
Code Execution (3)
-
2026-07-15 15. 代码 Agent 的安全边界:沙箱、权限与提示注入
-
2026-07-05 05. CodeAct:把代码执行变成通用 Agent 的动作空间
-
2026-05-03 13. Code Execution Agent:让 Agent 真的能写代码、跑代码
Code Generation (7)
-
2026-07-18 18. 多模态代码 Agent:视觉输入加入代码生成的工作流
-
2026-07-14 14. 代码 Agent 的设计模式:前 13 篇的横向梳理
-
2026-07-12 12. MapCoder:用类比和检索辅助代码生成
-
2026-07-11 11. AgentCoder:拆分角色,让代码生成和测试设计分开
-
2026-07-10 10. AlphaCodium:用测试驱动的迭代流程生成代码
-
2026-07-09 09. LATS:把树搜索和语言反思结合起来
-
2026-07-03 03. 从执行反馈中学习:CodeRL 与迭代自修正
Code Quality (1)
-
2026-07-17 17. 代码 Agent 评测方法的设计反思
Code Reasoning (2)
-
2026-07-02 02. 代码还是文字?CodeSteer 与推理模式的动态选择
-
2026-07-01 01. 代码是推理的外包地:Program of Thoughts 与 Chain of Code
Code Repair (1)
-
2026-07-06 06. Self-Debugging:让模型自己读报错、自己改代码
Code Search (1)
-
2026-07-16 16. 大代码库的上下文管理:Agent 如何在百万行代码里找路
CodeAct (1)
-
2026-07-05 05. CodeAct:把代码执行变成通用 Agent 的动作空间
CodeRL (1)
-
2026-07-03 03. 从执行反馈中学习:CodeRL 与迭代自修正
CodeSteer (1)
-
2026-07-02 02. 代码还是文字?CodeSteer 与推理模式的动态选择
Comparison (2)
-
2026-07-19 19. Agent 框架横向对比:LangGraph、AutoGen、CrewAI、OpenHands
-
2026-07-14 14. 代码 Agent 的设计模式:前 13 篇的横向梳理
Compression (1)
-
2026-04-28 08. 上下文工程:Agent 最难的不是推理,是喂什么进去
Computer Use (1)
-
2026-05-04 14. Browser & Computer Use:让 Agent 看屏幕、点鼠标
Computer Vision (1)
-
2026-04-30 08. 同一双眼睛走遍全村
Context (1)
-
2026-04-28 08. 上下文工程:Agent 最难的不是推理,是喂什么进去
Context Management (1)
-
2026-07-16 16. 大代码库的上下文管理:Agent 如何在百万行代码里找路
Continual Learning (1)
-
2026-05-01 09. 学新手艺就忘旧的画师
Convolution (1)
-
2026-04-30 08. 同一双眼睛走遍全村
Copilot (1)
-
2026-04-20 从 Copilot 到 Claude Code:为什么值得换
Cost (1)
-
2026-05-07 17. 生产化:上下文压缩、成本、延迟、失败恢复、安全边界
CrewAI (3)
-
2026-07-19 19. Agent 框架横向对比:LangGraph、AutoGen、CrewAI、OpenHands
-
2026-05-08 18. 框架世界观对比:Claude Agent SDK、LangGraph、CrewAI、Pydantic AI
-
2026-05-02 12. 多 Agent 协作:Orchestrator、Debate、Handoff 与它们的陷阱
DDPM (1)
-
2026-05-09 17. 能把尘土还原成瓷瓶的人
DPO (1)
-
2026-05-27 项目 24:灵魂的对齐:SFT、指令微调与偏好优化(DPO)
Debug (1)
-
2026-06-10 23. Agent 失败模式分类学:为什么它总在你不期待的地方崩
Decoder (1)
-
2026-05-26 项目 06:构建完整的 Transformer Decoder Block
DeepSeek (4)
-
2026-06-04 开源大模型上线
-
2026-05-27 项目 25:理性的驯化:从 RLHF、PPO 到 GRPO 的进化史
-
2026-05-05 番外 5:幻觉与开源崛起
-
2026-04-27 番外 5:幻觉与开源崛起——LLM 的两个关键议题
Dense (1)
-
2026-05-26 项目 18:计算的权衡:稠密(Dense)与稀疏(MoE)模型的全方位对比
Design Patterns (1)
-
2026-07-14 14. 代码 Agent 的设计模式:前 13 篇的横向梳理
DevOps (1)
-
2025-09-11 LLM应用开发——Prompt版本管理与工程化
Diffusion (2)
-
2026-05-26 项目 20:文本的扩散:扩散语言模型(Diffusion LM)初探
-
2026-05-09 17. 能把尘土还原成瓷瓶的人
Docker (1)
-
2026-01-11 企业级RAG应用系列(2):环境搭建与基础设施
Dropout (1)
-
2026-04-25 03. 完美的临摹学徒
E2B (1)
-
2026-05-03 13. Code Execution Agent:让 Agent 真的能写代码、跑代码
Embedding (13)
-
2026-07-16 16. 大代码库的上下文管理:Agent 如何在百万行代码里找路
-
2026-05-25 项目 1-2:Tokenizer、词表与 Embedding
-
2026-05-25 项目 02:embedding 与语义几何
-
2026-05-21 向量数据库到底是什么
-
2026-05-13 Embedding 这水比你想的深
-
2026-05-12 番外 12:Embedding 模型选型实战
-
2026-05-11 番外 11:从 One-Hot 到 LLM,自然语言处理三十年的完整演化
-
2026-05-09 番外 9:Embedding 的来龙去脉
-
2026-04-26 04. 把世界搬上书架的图书管理员
-
2026-04-23 Embedding 与向量:把文字变成数字
-
2026-04-16 Embedding 与向量:把文字变成数字
-
2025-11-01 LLM应用开发——Embedding嵌入向量
Emergence (1)
-
2026-04-27 05. 学了三年突然顿悟的少年
Emergent Abilities (1)
-
2026-05-10 18. 够大的雨终会灌满湖
Eval (2)
-
2026-06-08 21. Benchmark 全景:SWE-bench、AgentBench、τ-bench 怎么读
-
2026-05-06 16. 可观测性与评测:Agent 的 trace、replay 与回归测试
Evaluation (3)
-
2026-07-17 17. 代码 Agent 评测方法的设计反思
-
2026-05-27 项目 28:拒绝虚假繁荣:构建严谨的模型评测(Evaluation Harness)
-
2026-05-13 01. 评判一个 Agent,你到底在评判什么
Execution Feedback (1)
-
2026-07-06 06. Self-Debugging:让模型自己读报错、自己改代码
Exploration (1)
-
2026-04-29 07. 十口井的旅人
FAISS (2)
-
2026-05-24 FAISS实战
-
2026-05-23 IVF与乘积量化PQ
FLOPS (1)
-
2026-05-26 项目 16:硬件精算:显存带宽、算力与硬件预算(Hardware Budget)
Failure (1)
-
2026-06-10 23. Agent 失败模式分类学:为什么它总在你不期待的地方崩
FastAPI (2)
-
2026-05-16 番外 16:uvicorn --reload 与本地大模型的相处难题
-
2026-01-11 企业级RAG应用系列(1):架构总览
Few-shot (1)
-
2026-05-12 Prompt 不是玄学,是工程
Fine-tuning (1)
-
2026-05-25 项目 17-33:MoE、数据、后训练、评测、RAG、Agent 与安全
FlashAttention (2)
-
2026-05-26 项目 15:IO 感知的艺术:FlashAttention 的硬件级优化
-
2026-05-25 项目 9-16:Decoding、KV Cache、长上下文与推理系统
Flow Engineering (1)
-
2026-07-10 10. AlphaCodium:用测试驱动的迭代流程生成代码
Framework (2)
-
2026-07-19 19. Agent 框架横向对比:LangGraph、AutoGen、CrewAI、OpenHands
-
2026-05-08 18. 框架世界观对比:Claude Agent SDK、LangGraph、CrewAI、Pydantic AI
Function Calling (8)
-
2026-05-25 项目 30:构建 Tool Use 与 Agent Loop
-
2026-05-17 MCP:自己动手写一个 Server
-
2026-05-15 Function Calling 用好了才叫工具调用
-
2026-04-25 Function Calling:让 LLM 调用你的 Python 函数
-
2026-04-23 03. 工具设计的艺术:粒度、命名、错误反馈与工具爆炸
-
2026-04-21 01. Agent 是什么:从一次性 Function Call 到自主循环
-
2026-04-17 Function Calling:让 AI 调用你的 API
-
2025-11-20 LLM应用开发——Function Calling
GAN (2)
-
2026-05-02 10. 画赝品的人和他的宿敌
-
2025-10-15 机器学习基础系列——生成对抗网络
GGUF (2)
-
2026-05-31 GGUF与llamacpp
-
2026-05-27 项目 26:数字的炼金术:模型量化(Quantization)深度解密
GPT (9)
-
2026-07-20 20. 模型自身能力对 Agent 表现的影响
-
2026-05-26 项目 07:Mini-former 训练实战:从随机扰动到文本预测
-
2026-05-26 项目 08:训练目标对比:Causal、Masked 与 Prefix LM
-
2026-05-24 完整训练:从随机输出到通顺文字
-
2026-05-23 构建完整的 GPT 结构
-
2026-05-20 最简单的模型:先让训练循环运转起来
-
2026-05-19 把文字变成数字:分词与编码
-
2026-05-18 模型到底在学什么
-
2026-04-25 番外 1:LLM 简史——从 Transformer 到今天
GPT-4V (1)
-
2025-10-24 LLM应用开发——多模态LLM应用
GPTQ (1)
-
2026-05-30 模型量化INT8与INT4
GPU 架构 (1)
-
2026-05-26 项目 15:IO 感知的艺术:FlashAttention 的硬件级优化
GQA (2)
-
2026-05-26 项目 05:从单头到多头注意力
-
2026-05-26 项目 12:架构的进化:MQA、GQA 与 MLA 深度解析
GRPO (1)
-
2026-05-27 项目 25:理性的驯化:从 RLHF、PPO 到 GRPO 的进化史
Generalization (1)
-
2026-04-27 05. 学了三年突然顿悟的少年
Generative Adversarial Network (1)
-
2026-05-02 10. 画赝品的人和他的宿敌
GitHub (1)
-
2026-07-07 07. SWE-agent:把真实 GitHub Issue 变成 Agent 的任务
Goodhart 定律 (1)
-
2026-05-06 14. 山神的三个承诺
Gradient Descent (1)
-
2026-04-24 02. 雪夜下山的瞎子
GraphRAG (1)
-
2025-09-21 LLM应用开发——GraphRAG与知识图谱
Grokking (1)
-
2026-04-27 05. 学了三年突然顿悟的少年
HITL (1)
-
2026-05-05 15. Human-in-the-Loop:什么时候让 Agent 停下来问人
HNSW (1)
-
2026-05-22 近似最近邻ANN算法
Helm (1)
-
2026-05-27 Milvus分布式向量库
Hermes (3)
-
2026-05-01 11. 开源 Agent 全家桶:Hermes 3 + 向量库的离线 RAG-Agent
-
2026-04-30 10. Hermes 3 实战:在 Ollama 上跑一个本地工具调用 Agent
-
2026-04-29 09. 工具调用协议的分裂:OpenAI、Anthropic、Hermes
Hooks (1)
-
2026-04-24 进阶武器:Slash Commands、Hooks、Subagents、MCP
HumanEval (1)
-
2026-07-17 17. 代码 Agent 评测方法的设计反思
HyDE (1)
-
2026-05-14 你的 RAG 为什么回答得不好
Hybrid (1)
-
2026-07-02 02. 代码还是文字?CodeSteer 与推理模式的动态选择
ICLR (1)
-
2026-07-02 02. 代码还是文字?CodeSteer 与推理模式的动态选择
IVF (1)
-
2026-05-23 IVF与乘积量化PQ
Index (1)
-
2026-06-07 20. LlamaIndex 数据侧深度
InterCode (1)
-
2026-07-13 13. InterCode:把交互式编程环境变成强化学习的训练场
Interactive Coding (1)
-
2026-07-13 13. InterCode:把交互式编程环境变成强化学习的训练场
Interrupt (1)
-
2026-05-05 15. Human-in-the-Loop:什么时候让 Agent 停下来问人
Iterative Debugging (1)
-
2026-07-03 03. 从执行反馈中学习:CodeRL 与迭代自修正
Iterative Refinement (1)
-
2026-07-06 06. Self-Debugging:让模型自己读报错、自己改代码
JSON Mode (1)
-
2026-05-12 Prompt 不是玄学,是工程
KL 散度 (1)
-
2026-06-02 知识蒸馏
KV Cache (6)
-
2026-05-29 推理为什么慢
-
2026-05-26 项目 05:从单头到多头注意力
-
2026-05-26 项目 11:显存的吞噬者:KV Cache 机制与显存预算
-
2026-05-25 项目 9-16:Decoding、KV Cache、长上下文与推理系统
-
2026-05-04 番外 4:上下文窗口进化史与 KV Cache
-
2026-04-26 番外 4:上下文窗口进化史——KV Cache 与长上下文
Knowledge Distillation (1)
-
2026-05-05 13. 把老匠人装进一个孩子的梦里
LATS (1)
-
2026-07-09 09. LATS:把树搜索和语言反思结合起来
LLM (16)
-
2026-07-20 20. 模型自身能力对 Agent 表现的影响
-
2026-07-01 01. 代码是推理的外包地:Program of Thoughts 与 Chain of Code
-
2026-05-27 项目 21:文明的数字工业化:构建大规模预训练数据管线
-
2026-05-27 项目 22:自我进化的循环:合成数据(Synthetic Data)的生成、过滤与证明
-
2026-05-27 项目 23:预测未来的算力账本:缩放法则(Scaling Laws)与曲线拟合
-
2026-05-26 项目 10:打破串行咒语:投机解码(Speculative Decoding)
-
2026-05-25 LLM 工程路线图:从概念理解到可运行系统
-
2026-05-25 34 个 LLM 工程项目验收清单
-
2026-05-13 01. 评判一个 Agent,你到底在评判什么
-
2026-05-11 番外 11:从 One-Hot 到 LLM,自然语言处理三十年的完整演化
-
2026-05-01 番外 1:LLM 简史,从 Transformer 到 2026
-
2026-04-21 01. Agent 是什么:从一次性 Function Call 到自主循环
-
2026-04-21 调用大模型 API:从 requests 到流式响应
-
2026-04-20 AI 入门:Python 新手的第一课
-
2026-04-15 AI 入门:前端开发者的第一课
-
2026-04-15 调用大模型 API:从 fetch 到流式响应
LLM 工程 (1)
-
2026-05-25 项目 30:构建 Tool Use 与 Agent Loop
LLM 项目 (3)
-
2026-05-25 项目 01:从零实现 tokenizer
-
2026-05-25 项目 02:embedding 与语义几何
-
2026-05-25 项目 04:手写 scaled dot-product attention
LLM-as-a-Judge (1)
-
2026-05-27 项目 28:拒绝虚假繁荣:构建严谨的模型评测(Evaluation Harness)
LLM应用 (39)
-
2025-11-24 LLM应用开发——安全防护
-
2025-11-22 LLM应用开发——部署与优化
-
2025-11-20 LLM应用开发——Function Calling
-
2025-11-18 LLM应用开发——Agent智能体
-
2025-11-16 LLM应用开发——LangChain框架
-
2025-11-14 LLM应用开发——Prompt Engineering
-
2025-11-10 LLM应用开发——RAG检索增强生成
-
2025-11-05 LLM应用开发——向量数据库
-
2025-11-01 LLM应用开发——Embedding嵌入向量
-
2025-10-29 LLM应用开发——监控与可观测性
-
2025-10-28 LLM应用开发——成本优化指南
-
2025-10-27 LLM应用开发——缓存策略详解
-
2025-10-26 LLM应用开发——多模型路由与协作
-
2025-10-25 LLM应用开发——LLM评估与测试
-
2025-10-24 LLM应用开发——多模态LLM应用
-
2025-10-23 LLM应用开发——结构化输出
-
2025-10-22 LLM应用开发——LlamaIndex框架
-
2025-10-21 LLM应用开发——Streaming流式输出
-
2025-10-20 LLM应用开发——对话记忆管理
-
2025-09-29 LLM应用开发——语音交互系统实战
-
2025-09-28 LLM应用开发——文档智能处理实战
-
2025-09-27 LLM应用开发——代码生成与沙箱执行
-
2025-09-26 LLM应用开发——AI搜索引擎实战
-
2025-09-25 LLM应用开发——MCP协议开发
-
2025-09-24 LLM应用开发——本地模型部署
-
2025-09-23 LLM应用开发——微调实战指南
-
2025-09-22 LLM应用开发——长上下文处理策略
-
2025-09-21 LLM应用开发——GraphRAG与知识图谱
-
2025-09-20 LLM应用开发——高级RAG技术详解
-
2025-09-19 LLM应用开发——边缘计算与端侧部署
-
2025-09-18 LLM应用开发——实时协作与流式交互
-
2025-09-17 LLM应用开发——AI写作助手实战
-
2025-09-16 LLM应用开发——高质量知识库构建指南
-
2025-09-15 LLM应用开发——AI个性化推荐系统
-
2025-09-14 LLM应用开发——内容审核与安全过滤
-
2025-09-13 LLM应用开发——对话系统设计模式
-
2025-09-12 LLM应用开发——混合检索策略深度解析
-
2025-09-11 LLM应用开发——Prompt版本管理与工程化
-
2025-09-10 LLM应用开发——多租户架构设计
LLM系统 (1)
-
2026-05-25 项目 34:十二周执行计划与 Capstone
LLM进阶 (7)
-
2026-05-17 MCP:自己动手写一个 Server
-
2026-05-16 Agent 不只是套个循环
-
2026-05-15 Function Calling 用好了才叫工具调用
-
2026-05-14 你的 RAG 为什么回答得不好
-
2026-05-13 Embedding 这水比你想的深
-
2026-05-12 Prompt 不是玄学,是工程
-
2026-05-11 API 调用没你想的那么简单
LLM部署 (1)
-
2026-05-27 项目 34:终极试炼:构建你的私有化大模型系统(Capstone Project)
LLaMA (1)
-
2026-04-27 番外 5:幻觉与开源崛起——LLM 的两个关键议题
LangChain (4)
-
2026-06-06 19. LangGraph 状态机编排
-
2026-05-25 Chroma轻量入门
-
2026-04-30 进阶方向:评测、监控、成本与微调
-
2025-11-16 LLM应用开发——LangChain框架
LangGraph (6)
-
2026-07-19 19. Agent 框架横向对比:LangGraph、AutoGen、CrewAI、OpenHands
-
2026-06-06 19. LangGraph 状态机编排
-
2026-05-16 Agent 不只是套个循环
-
2026-05-08 18. 框架世界观对比:Claude Agent SDK、LangGraph、CrewAI、Pydantic AI
-
2026-04-26 Agent 入门:从工具调用到自主循环
-
2026-04-24 04. Plan-and-Execute:先规划,再执行,失败时重规划
LangSmith (1)
-
2026-05-06 16. 可观测性与评测:Agent 的 trace、replay 与回归测试
Langfuse (1)
-
2026-05-06 16. 可观测性与评测:Agent 的 trace、replay 与回归测试
Large Codebase (1)
-
2026-07-16 16. 大代码库的上下文管理:Agent 如何在百万行代码里找路
Latency (1)
-
2026-05-07 17. 生产化:上下文压缩、成本、延迟、失败恢复、安全边界
Letta (1)
-
2026-04-27 07. 记忆系统:短期对话、长期事实、过程记忆
Lifelong Learning (1)
-
2026-07-04 04. Voyager:用代码探索开放世界的终身学习 Agent
LightGBM (1)
-
2024-11-25 机器学习基础系列——XGBoost与LightGBM
Linux (2)
-
2024-12-28 Linux LVM 系列 1
-
2024-12-28 Linux LVM 系列 2
LlamaIndex (3)
-
2026-06-07 20. LlamaIndex 数据侧深度
-
2026-04-30 进阶方向:评测、监控、成本与微调
-
2025-10-22 LLM应用开发——LlamaIndex框架
LoRA (3)
-
2026-06-01 LoRA与QLoRA微调
-
2026-05-27 项目 24:灵魂的对齐:SFT、指令微调与偏好优化(DPO)
-
2025-09-23 LLM应用开发——微调实战指南
Long Context (1)
-
2026-05-26 项目 13:跨越万词鸿沟:长上下文(Long Context)的系统性挑战与解法
Lottery Ticket Hypothesis (1)
-
2026-05-08 16. 天生注定的那张彩票
MCP (6)
-
2026-05-17 MCP:自己动手写一个 Server
-
2026-04-27 MCP 协议:Agent 的通用接口
-
2026-04-24 进阶武器:Slash Commands、Hooks、Subagents、MCP
-
2026-04-18 MCP 协议:Agent 的通用接口
-
2026-01-11 企业级RAG应用系列(1):架构总览
-
2025-09-25 LLM应用开发——MCP协议开发
MCTS (2)
-
2026-07-09 09. LATS:把树搜索和语言反思结合起来
-
2026-04-26 06. Tree of Thoughts:从线性循环到搜索式推理
MLA (1)
-
2026-05-26 项目 12:架构的进化:MQA、GQA 与 MLA 深度解析
MQA (1)
-
2026-05-26 项目 12:架构的进化:MQA、GQA 与 MLA 深度解析
Mamba (1)
-
2026-05-26 项目 19:线性序列的回归:状态空间模型(SSM)与线性注意力
MapCoder (1)
-
2026-07-12 12. MapCoder:用类比和检索辅助代码生成
Mem0 (1)
-
2026-04-27 07. 记忆系统:短期对话、长期事实、过程记忆
Memory (3)
-
2026-07-08 08. Reflexion:用语言反思替代梯度更新
-
2026-04-27 07. 记忆系统:短期对话、长期事实、过程记忆
-
2025-10-20 LLM应用开发——对话记忆管理
Milvus (1)
-
2026-05-27 Milvus分布式向量库
Minecraft (1)
-
2026-07-04 04. Voyager:用代码探索开放世界的终身学习 Agent
Mistral (1)
-
2026-06-04 开源大模型上线
Mixture of Experts (1)
-
2026-05-07 15. 守门人和十个专家
MoE (5)
-
2026-05-26 项目 17:稀疏性的调度艺术:实现双专家 MoE 路由(MoE Router)
-
2026-05-26 项目 18:计算的权衡:稠密(Dense)与稀疏(MoE)模型的全方位对比
-
2026-05-25 项目 17-33:MoE、数据、后训练、评测、RAG、Agent 与安全
-
2026-05-07 15. 守门人和十个专家
-
2025-09-15 机器学习基础系列——混合专家模型
Model Comparison (1)
-
2026-07-20 20. 模型自身能力对 Agent 表现的影响
Multi-Agent (3)
-
2026-07-12 12. MapCoder:用类比和检索辅助代码生成
-
2026-07-11 11. AgentCoder:拆分角色,让代码生成和测试设计分开
-
2026-05-02 12. 多 Agent 协作:Orchestrator、Debate、Handoff 与它们的陷阱
Multi-Head (1)
-
2026-05-26 项目 05:从单头到多头注意力
Multi-armed Bandit (1)
-
2026-04-29 07. 十口井的旅人
Multimodal (1)
-
2026-07-18 18. 多模态代码 Agent:视觉输入加入代码生成的工作流
NLP (1)
-
2026-05-11 番外 11:从 One-Hot 到 LLM,自然语言处理三十年的完整演化
NVLink (1)
-
2026-05-26 项目 16:硬件精算:显存带宽、算力与硬件预算(Hardware Budget)
Next.js (1)
-
2026-04-19 构建你的第一个 AI 聊天应用
Node (1)
-
2026-04-21 WSL 开发环境搭建:Node、Git、zsh、VS Code
OCR (1)
-
2025-09-28 LLM应用开发——文档智能处理实战
Observability (1)
-
2026-05-06 16. 可观测性与评测:Agent 的 trace、replay 与回归测试
Ollama (4)
-
2026-05-01 11. 开源 Agent 全家桶:Hermes 3 + 向量库的离线 RAG-Agent
-
2026-04-30 10. Hermes 3 实战:在 Ollama 上跑一个本地工具调用 Agent
-
2026-04-28 本地模型:用 Ollama 跑开源 LLM
-
2025-09-24 LLM应用开发——本地模型部署
OpenAI (1)
-
2026-04-29 09. 工具调用协议的分裂:OpenAI、Anthropic、Hermes
OpenHands (1)
Optimization (1)
-
2026-04-24 02. 雪夜下山的瞎子
Orchestrator (1)
Overfitting (1)
-
2026-04-25 03. 完美的临摹学徒
PEFT (1)
-
2026-06-01 LoRA与QLoRA微调
PPO (1)
-
2026-05-27 项目 25:理性的驯化:从 RLHF、PPO 到 GRPO 的进化史
PQ (1)
-
2026-05-23 IVF与乘积量化PQ
Permission (1)
-
2026-07-15 15. 代码 Agent 的安全边界:沙箱、权限与提示注入
Planning (1)
-
2026-04-24 04. Plan-and-Execute:先规划,再执行,失败时重规划
Playwright (1)
-
2026-05-04 14. Browser & Computer Use:让 Agent 看屏幕、点鼠标
PoT (1)
Production (1)
-
2026-05-07 17. 生产化:上下文压缩、成本、延迟、失败恢复、安全边界
Program of Thoughts (1)
Prompt (4)
-
2026-04-28 08. 上下文工程:Agent 最难的不是推理,是喂什么进去
-
2026-04-23 高效沟通:跳出 Copilot 式补全思维
-
2026-04-22 02. ReAct:把 Agent 的思考显式化
-
2026-04-16 Prompt 工程:让 AI 听懂你的话
Prompt Engineering (2)
-
2026-05-11 19. 会大声自言自语的棋手
-
2025-11-14 LLM应用开发——Prompt Engineering
Prompt Injection (3)
-
2026-07-15 15. 代码 Agent 的安全边界:沙箱、权限与提示注入
-
2026-06-09 22. Agent 安全边界:Prompt Injection、权限最小化、沙箱逃逸
-
2026-05-26 项目 33:防线与红队:构建 LLM 安全评估体系
Prompt工程 (3)
-
2026-05-12 Prompt 不是玄学,是工程
-
2026-04-21 Prompt 工程:让模型稳定输出你要的结果
-
2025-09-11 LLM应用开发——Prompt版本管理与工程化
PyTorch (7)
-
2026-05-26 项目 07:Mini-former 训练实战:从随机扰动到文本预测
-
2026-05-24 完整训练:从随机输出到通顺文字
-
2026-05-23 构建完整的 GPT 结构
-
2026-05-22 注意力机制:让模型看见上下文
-
2026-05-21 反向传播:模型如何确定参数的调整方向
-
2026-05-20 最简单的模型:先让训练循环运转起来
-
2026-05-18 模型到底在学什么
Pydantic (1)
-
2026-04-22 结构化输出:用 Pydantic 把 LLM 变成稳定的函数
Pydantic AI (1)
Pyodide (1)
-
2026-05-03 13. Code Execution Agent:让 Agent 真的能写代码、跑代码
Python (43)
-
2026-07-05 05. CodeAct:把代码执行变成通用 Agent 的动作空间
-
2026-05-25 Chroma轻量入门
-
2026-05-24 FAISS实战
-
2026-05-21 反向传播:模型如何确定参数的调整方向
-
2026-05-20 最简单的模型:先让训练循环运转起来
-
2026-05-19 把文字变成数字:分词与编码
-
2026-05-18 模型到底在学什么
-
2026-05-17 MCP:自己动手写一个 Server
-
2026-05-16 番外 16:uvicorn --reload 与本地大模型的相处难题
-
2026-05-15 番外 15:RAG 评估方法,把感觉变成数字
-
2026-05-15 Function Calling 用好了才叫工具调用
-
2026-05-14 番外 14:向量数据库 Qdrant 实战、混合检索与 Reranker
-
2026-05-13 番外 13:文本切分策略与 chunk_size 选择
-
2026-05-13 Embedding 这水比你想的深
-
2026-05-12 番外 12:Embedding 模型选型实战
-
2026-05-12 Prompt 不是玄学,是工程
-
2026-05-11 番外 11:从 One-Hot 到 LLM,自然语言处理三十年的完整演化
-
2026-05-11 API 调用没你想的那么简单
-
2026-05-09 番外 9:Embedding 的来龙去脉
-
2026-05-08 番外 8:多模态入门,图像、语音与视频
-
2026-05-07 番外 7:提示词注入与防御
-
2026-05-06 番外 6:异步与并发,批量调用 LLM 的工程模式
-
2026-05-05 番外 5:幻觉与开源崛起
-
2026-05-04 番外 4:上下文窗口进化史与 KV Cache
-
2026-05-03 番外 3:Token 的秘密,BPE、中文为什么更贵
-
2026-05-02 番外 2:API 参数全解,temperature 到 logprobs
-
2026-05-01 番外 1:LLM 简史,从 Transformer 到 2026
-
2026-04-30 进阶方向:评测、监控、成本与微调
-
2026-04-29 用 Streamlit 构建 AI 聊天应用
-
2026-04-28 本地模型:用 Ollama 跑开源 LLM
-
2026-04-27 MCP 协议:Agent 的通用接口
-
2026-04-26 Agent 入门:从工具调用到自主循环
-
2026-04-25 Function Calling:让 LLM 调用你的 Python 函数
-
2026-04-24 RAG 实战:搭建一个能回答你文档的本地知识库
-
2026-04-23 Embedding 与向量:把文字变成数字
-
2026-04-22 结构化输出:用 Pydantic 把 LLM 变成稳定的函数
-
2026-04-21 调用大模型 API:从 requests 到流式响应
-
2026-04-21 Prompt 工程:让模型稳定输出你要的结果
-
2026-04-20 AI 入门:Python 新手的第一课
-
2024-09-21 Python 依赖包安装方式概述
-
2024-09-21 Python分析微信数据库
-
2024-09-21 Python&PIP安装问题总结
QLoRA (1)
-
2026-06-01 LoRA与QLoRA微调
Qdrant (2)
-
2026-05-26 Qdrant与Weaviate
-
2026-05-14 番外 14:向量数据库 Qdrant 实战、混合检索与 Reranker
Quantization (1)
-
2026-05-27 项目 26:数字的炼金术:模型量化(Quantization)深度解密
Qwen (2)
-
2026-06-04 开源大模型上线
-
2026-05-05 番外 5:幻觉与开源崛起
RAG (23)
-
2026-07-16 16. 大代码库的上下文管理:Agent 如何在百万行代码里找路
-
2026-06-07 20. LlamaIndex 数据侧深度
-
2026-05-28 向量数据库选型与生产实践
-
2026-05-27 项目 29:检索增强生成的艺术:工业级 RAG 架构拆解
-
2026-05-25 项目 17-33:MoE、数据、后训练、评测、RAG、Agent 与安全
-
2026-05-25 Chroma轻量入门
-
2026-05-21 向量数据库到底是什么
-
2026-05-15 番外 15:RAG 评估方法,把感觉变成数字
-
2026-05-14 番外 14:向量数据库 Qdrant 实战、混合检索与 Reranker
-
2026-05-14 你的 RAG 为什么回答得不好
-
2026-05-13 番外 13:文本切分策略与 chunk_size 选择
-
2026-05-12 番外 12:Embedding 模型选型实战
-
2026-05-01 11. 开源 Agent 全家桶:Hermes 3 + 向量库的离线 RAG-Agent
-
2026-04-27 07. 记忆系统:短期对话、长期事实、过程记忆
-
2026-04-24 RAG 实战:搭建一个能回答你文档的本地知识库
-
2026-04-17 RAG:让 AI 回答你的专属数据
-
2026-01-11 企业级RAG应用系列(1):架构总览
-
2025-11-10 LLM应用开发——RAG检索增强生成
-
2025-10-22 LLM应用开发——LlamaIndex框架
-
2025-09-26 LLM应用开发——AI搜索引擎实战
-
2025-09-20 LLM应用开发——高级RAG技术详解
-
2025-09-16 LLM应用开发——高质量知识库构建指南
-
2025-09-12 LLM应用开发——混合检索策略深度解析
RLHF (3)
-
2026-05-27 项目 24:灵魂的对齐:SFT、指令微调与偏好优化(DPO)
-
2026-05-27 项目 25:理性的驯化:从 RLHF、PPO 到 GRPO 的进化史
-
2026-05-25 从迷你 GPT 到 ChatGPT:预训练之后还经历了什么
RLTF (1)
-
2026-07-03 03. 从执行反馈中学习:CodeRL 与迭代自修正
RNN (1)
-
2026-05-26 项目 19:线性序列的回归:状态空间模型(SSM)与线性注意力
Ragas (1)
-
2026-05-15 番外 15:RAG 评估方法,把感觉变成数字
ReAct (6)
-
2026-05-25 项目 30:构建 Tool Use 与 Agent Loop
-
2026-05-16 Agent 不只是套个循环
-
2026-04-26 Agent 入门:从工具调用到自主循环
-
2026-04-24 04. Plan-and-Execute:先规划,再执行,失败时重规划
-
2026-04-22 02. ReAct:把 Agent 的思考显式化
-
2026-04-21 01. Agent 是什么:从一次性 Function Call 到自主循环
React (1)
-
2026-04-19 构建你的第一个 AI 聊天应用
Reasoning (2)
-
2026-07-20 20. 模型自身能力对 Agent 表现的影响
-
2026-04-22 02. ReAct:把 Agent 的思考显式化
Reasoning Model (1)
-
2026-05-27 项目 25:理性的驯化:从 RLHF、PPO 到 GRPO 的进化史
Reflection (2)
-
2026-07-09 09. LATS:把树搜索和语言反思结合起来
-
2026-04-25 05. Reflection:让 Agent 自己挑毛病、自己改
Reflexion (2)
-
2026-07-08 08. Reflexion:用语言反思替代梯度更新
-
2026-04-25 05. Reflection:让 Agent 自己挑毛病、自己改
Regularization (1)
-
2026-04-25 03. 完美的临摹学徒
Reinforcement Learning (4)
-
2026-07-13 13. InterCode:把交互式编程环境变成强化学习的训练场
-
2026-07-08 08. Reflexion:用语言反思替代梯度更新
-
2026-07-03 03. 从执行反馈中学习:CodeRL 与迭代自修正
-
2026-04-29 07. 十口井的旅人
Reliability (1)
-
2026-06-10 23. Agent 失败模式分类学:为什么它总在你不期待的地方崩
Representation Learning (1)
-
2026-04-26 04. 把世界搬上书架的图书管理员
Rerank (2)
-
2026-05-27 项目 29:检索增强生成的艺术:工业级 RAG 架构拆解
-
2026-05-14 你的 RAG 为什么回答得不好
Reranker (1)
-
2026-05-14 番外 14:向量数据库 Qdrant 实战、混合检索与 Reranker
ResNet (1)
-
2026-05-04 12. 翻山送信的邮差
Residual Connection (1)
-
2026-05-04 12. 翻山送信的邮差
Retrieval (1)
-
2026-07-12 12. MapCoder:用类比和检索辅助代码生成
Retriever (1)
-
2026-06-07 20. LlamaIndex 数据侧深度
Reward Hacking (1)
-
2026-05-06 14. 山神的三个承诺
RoPE (3)
-
2026-05-25 项目 3-8:位置、注意力与 Transformer Block
Role Separation (1)
-
2026-07-11 11. AgentCoder:拆分角色,让代码生成和测试设计分开
SAE (1)
SFT (2)
-
2026-05-27 项目 24:灵魂的对齐:SFT、指令微调与偏好优化(DPO)
-
2026-05-25 从迷你 GPT 到 ChatGPT:预训练之后还经历了什么
SGLang (2)
-
2026-06-03 推理引擎横评
-
2026-05-27 项目 27:吞吐量之王:Serving Stack 与推理引擎横评
SQL (1)
-
2026-07-13 13. InterCode:把交互式编程环境变成强化学习的训练场
SSM (1)
-
2026-05-26 项目 19:线性序列的回归:状态空间模型(SSM)与线性注意力
SWE-agent (1)
-
2026-07-07 07. SWE-agent:把真实 GitHub Issue 变成 Agent 的任务
SWE-bench (3)
-
2026-07-17 17. 代码 Agent 评测方法的设计反思
-
2026-07-07 07. SWE-agent:把真实 GitHub Issue 变成 Agent 的任务
-
2026-06-08 21. Benchmark 全景:SWE-bench、AgentBench、τ-bench 怎么读
Sandbox (3)
-
2026-07-15 15. 代码 Agent 的安全边界:沙箱、权限与提示注入
-
2026-06-09 22. Agent 安全边界:Prompt Injection、权限最小化、沙箱逃逸
-
2026-05-03 13. Code Execution Agent:让 Agent 真的能写代码、跑代码
Scaling Laws (2)
-
2026-05-27 项目 23:预测未来的算力账本:缩放法则(Scaling Laws)与曲线拟合
-
2026-05-10 18. 够大的雨终会灌满湖
Screenshot (1)
-
2026-07-18 18. 多模态代码 Agent:视觉输入加入代码生成的工作流
Search (1)
-
2026-04-26 06. Tree of Thoughts:从线性循环到搜索式推理
Security (3)
-
2026-07-15 15. 代码 Agent 的安全边界:沙箱、权限与提示注入
-
2026-06-09 22. Agent 安全边界:Prompt Injection、权限最小化、沙箱逃逸
-
2026-05-07 17. 生产化:上下文压缩、成本、延迟、失败恢复、安全边界
Self-Attention (1)
-
2026-05-22 注意力机制:让模型看见上下文
Self-Critique (1)
-
2026-04-25 05. Reflection:让 Agent 自己挑毛病、自己改
Self-Debugging (1)
-
2026-07-06 06. Self-Debugging:让模型自己读报错、自己改代码
Self-Instruct (1)
-
2026-05-27 项目 22:自我进化的循环:合成数据(Synthetic Data)的生成、过滤与证明
Self-Reflection (1)
-
2026-07-08 08. Reflexion:用语言反思替代梯度更新
SentencePiece (2)
-
2026-05-25 项目 1-2:Tokenizer、词表与 Embedding
-
2026-05-25 项目 01:从零实现 tokenizer
Server (1)
-
2026-05-17 MCP:自己动手写一个 Server
Skill Library (1)
-
2026-07-04 04. Voyager:用代码探索开放世界的终身学习 Agent
Slash Commands (1)
-
2026-04-24 进阶武器:Slash Commands、Hooks、Subagents、MCP
Softmax (1)
-
2026-05-25 项目 04:手写 scaled dot-product attention
Software Engineering (1)
-
2026-07-07 07. SWE-agent:把真实 GitHub Issue 变成 Agent 的任务
Speculative Decoding (1)
-
2026-05-25 项目 9-16:Decoding、KV Cache、长上下文与推理系统
State Machine (1)
-
2026-06-06 19. LangGraph 状态机编排
Streaming (1)
-
2025-10-21 LLM应用开发——Streaming流式输出
Streamlit (1)
-
2026-04-29 用 Streamlit 构建 AI 聊天应用
Superposition (1)
-
2026-05-12 20. 一支笔里藏着五种颜色
Survey (1)
-
2026-07-14 14. 代码 Agent 的设计模式:前 13 篇的横向梳理
Swarm (1)
SwiftUI (1)
-
2026-04-27 第一次发牌:从一句话到模拟器亮屏
T5 (1)
-
2026-05-26 项目 08:训练目标对比:Causal、Masked 与 Prefix LM
TGI (1)
-
2026-06-03 推理引擎横评
TTS (2)
-
2026-05-08 番外 8:多模态入门,图像、语音与视频
-
2025-09-29 LLM应用开发——语音交互系统实战
Teacher-Student (1)
-
2026-06-02 知识蒸馏
TensorRT-LLM (1)
-
2026-06-03 推理引擎横评
Test Generation (1)
-
2026-07-11 11. AgentCoder:拆分角色,让代码生成和测试设计分开
Test-Driven (1)
-
2026-07-10 10. AlphaCodium:用测试驱动的迭代流程生成代码
Text Reasoning (1)
-
2026-07-02 02. 代码还是文字?CodeSteer 与推理模式的动态选择
Token (3)
-
2026-05-03 番外 3:Token 的秘密,BPE、中文为什么更贵
-
2026-04-26 番外 3:Token 的秘密——BPE、中文更贵、怎么省
-
2025-10-28 LLM应用开发——成本优化指南
Tokenizer (3)
-
2026-05-25 项目 1-2:Tokenizer、词表与 Embedding
-
2026-05-25 项目 01:从零实现 tokenizer
-
2026-05-19 把文字变成数字:分词与编码
Tool Calling (1)
-
2026-04-29 09. 工具调用协议的分裂:OpenAI、Anthropic、Hermes
Tool Use (2)
-
2026-07-20 20. 模型自身能力对 Agent 表现的影响
-
2026-07-05 05. CodeAct:把代码执行变成通用 Agent 的动作空间
Tools (5)
-
2026-05-15 Function Calling 用好了才叫工具调用
-
2026-04-27 MCP 协议:Agent 的通用接口
-
2026-04-25 Function Calling:让 LLM 调用你的 Python 函数
-
2026-04-23 03. 工具设计的艺术:粒度、命名、错误反馈与工具爆炸
-
2026-04-17 Function Calling:让 AI 调用你的 API
Trace (1)
-
2026-06-10 23. Agent 失败模式分类学:为什么它总在你不期待的地方崩
Transformer (12)
-
2026-05-26 项目 05:从单头到多头注意力
-
2026-05-26 项目 06:构建完整的 Transformer Decoder Block
-
2026-05-25 LLM 工程路线图:从概念理解到可运行系统
-
2026-05-25 项目 3-8:位置、注意力与 Transformer Block
-
2026-05-25 项目 04:手写 scaled dot-product attention
-
2026-05-23 构建完整的 GPT 结构
-
2026-05-22 注意力机制:让模型看见上下文
-
2026-05-11 番外 11:从 One-Hot 到 LLM,自然语言处理三十年的完整演化
-
2026-05-01 番外 1:LLM 简史,从 Transformer 到 2026
-
2026-04-25 番外 1:LLM 简史——从 Transformer 到今天
-
2026-04-23 01. 图书馆里的低语
Tree Search (1)
-
2026-07-09 09. LATS:把树搜索和语言反思结合起来
Tree of Thoughts (1)
-
2026-04-26 06. Tree of Thoughts:从线性循环到搜索式推理
Trial and Error (1)
-
2026-07-08 08. Reflexion:用语言反思替代梯度更新
TypeScript (1)
-
2026-05-04 14. Browser & Computer Use:让 Agent 看屏幕、点鼠标
UI (2)
-
2026-07-18 18. 多模态代码 Agent:视觉输入加入代码生成的工作流
-
2026-04-29 用 Streamlit 构建 AI 聊天应用
Ubuntu (1)
-
2026-04-20 安装 WSL2:Windows 下的 Linux 开发环境
VLLM (1)
-
2026-01-11 企业级RAG应用系列(4):模型服务与推理
VLM (1)
-
2026-05-26 项目 31:多模态视觉语言桥接器(Vision-Language Adapter)
VS Code (1)
-
2026-04-21 WSL 开发环境搭建:Node、Git、zsh、VS Code
Vanishing Gradient (1)
-
2026-05-04 12. 翻山送信的邮差
Vibe Coding (1)
-
2026-04-25 我不会 Swift,但还是想做个 iPhone app
Vision (3)
-
2026-07-18 18. 多模态代码 Agent:视觉输入加入代码生成的工作流
-
2026-05-08 番外 8:多模态入门,图像、语音与视频
-
2026-05-04 14. Browser & Computer Use:让 Agent 看屏幕、点鼠标
Voyager (1)
-
2026-07-04 04. Voyager:用代码探索开放世界的终身学习 Agent
WSL (2)
-
2026-04-21 WSL 开发环境搭建:Node、Git、zsh、VS Code
-
2026-04-20 安装 WSL2:Windows 下的 Linux 开发环境
Weaviate (1)
-
2026-05-26 Qdrant与Weaviate
Word2Vec (1)
-
2026-05-25 项目 02:embedding 与语义几何
XGBoost (1)
-
2024-11-25 机器学习基础系列——XGBoost与LightGBM
Xcode (1)
-
2026-04-26 搭场子:装 Xcode、注册账号、写一份 CLAUDE.md
ai (6)
-
2026-01-20 文档处理与训练数据生成详解
-
2025-06-29 MCP:模型上下文协议详解
-
2025-03-15 机器学习基础系列——前馈神经网络
-
2025-02-01 DeepRAG 论文解读
-
2025-01-19 DeepSeek 微调实战(Unsloth)
-
2025-01-04 Ollama 部署系列——离线安装
asyncio (1)
-
2026-05-06 番外 6:异步与并发,批量调用 LLM 的工程模式
bitsandbytes (1)
-
2026-05-30 模型量化INT8与INT4
deep-learning (1)
-
2025-03-15 机器学习基础系列——前馈神经网络
docker (3)
-
2025-11-20 Docker 系列——测试数据库部署
-
2025-11-19 Docker 系列——Golang 项目容器化
-
2025-11-18 Docker 系列——基础入门
document-processing (1)
-
2026-01-20 文档处理与训练数据生成详解
fine-tuning (1)
-
2026-01-20 文档处理与训练数据生成详解
golang (1)
-
2025-11-19 Docker 系列——Golang 项目容器化
iOS (3)
-
2026-04-27 第一次发牌:从一句话到模拟器亮屏
-
2026-04-26 搭场子:装 Xcode、注册账号、写一份 CLAUDE.md
-
2026-04-25 我不会 Swift,但还是想做个 iPhone app
jekyll (1)
-
2021-12-22 H2O-ac theme for Jekyll
llama.cpp (2)
-
2026-05-31 GGUF与llamacpp
-
2026-05-27 项目 27:吞吐量之王:Serving Stack 与推理引擎横评
math (1)
-
2025-03-15 机器学习基础系列——前馈神经网络
mathjax (1)
-
2022-04-29 Test en
next-token (1)
-
2026-05-25 项目 02:embedding 与语义几何
ollama (1)
-
2025-01-04 Ollama 部署系列——离线安装
pgvector (2)
-
2026-05-28 向量数据库选型与生产实践
-
2026-01-11 企业级RAG应用系列(3):数据库与向量存储
tech (1)
-
2024-07-06 ncdu
temperature (2)
-
2026-05-02 番外 2:API 参数全解,temperature 到 logprobs
-
2026-04-25 番外 2:API 参数全解——从 temperature 到 logprobs
tiktoken (2)
-
2026-05-25 项目 01:从零实现 tokenizer
-
2026-05-03 番外 3:Token 的秘密,BPE、中文为什么更贵
top_p (2)
-
2026-05-02 番外 2:API 参数全解,temperature 到 logprobs
-
2026-04-25 番外 2:API 参数全解——从 temperature 到 logprobs
training-data (1)
-
2026-01-20 文档处理与训练数据生成详解
transformers (1)
-
2026-05-29 推理为什么慢
trip (4)
uvicorn (1)
-
2026-05-16 番外 16:uvicorn --reload 与本地大模型的相处难题
vLLM (4)
-
2026-06-03 推理引擎横评
-
2026-05-29 推理为什么慢
-
2026-05-27 项目 27:吞吐量之王:Serving Stack 与推理引擎横评
-
2025-09-24 LLM应用开发——本地模型部署
word2vec (1)
-
2026-04-26 04. 把世界搬上书架的图书管理员
xcodegen (1)
-
2026-04-27 第一次发牌:从一句话到模拟器亮屏
zsh (1)
-
2026-04-21 WSL 开发环境搭建:Node、Git、zsh、VS Code
上下文 (1)
-
2026-04-22 核心心智模型:上下文、权限与计划模式
上下文压缩 (1)
-
2025-09-22 LLM应用开发——长上下文处理策略
上下文窗口 (2)
-
2026-05-04 番外 4:上下文窗口进化史与 KV Cache
-
2026-04-26 番外 4:上下文窗口进化史——KV Cache 与长上下文
专业技术 (4)
-
2024-07-06 logstash
-
2024-06-15 iSCSI target 系列 3
-
2024-06-12 iSCSI target 系列 2
-
2024-06-10 iSCSI target 系列1
云原生 (1)
-
2025-09-10 LLM应用开发——多租户架构设计
人工智能 (84)
-
2025-11-25 机器学习基础系列——模型量化与剪枝
-
2025-11-24 LLM应用开发——安全防护
-
2025-11-22 LLM应用开发——部署与优化
-
2025-11-20 LLM应用开发——Function Calling
-
2025-11-20 机器学习基础系列——LoRA与参数高效微调
-
2025-11-18 LLM应用开发——Agent智能体
-
2025-11-16 LLM应用开发——LangChain框架
-
2025-11-15 机器学习基础系列——知识蒸馏
-
2025-11-14 LLM应用开发——Prompt Engineering
-
2025-11-10 LLM应用开发——RAG检索增强生成
-
2025-11-10 机器学习基础系列——自监督学习
-
2025-11-05 LLM应用开发——向量数据库
-
2025-11-01 LLM应用开发——Embedding嵌入向量
-
2025-11-01 机器学习基础系列——强化学习基础
-
2025-10-29 LLM应用开发——监控与可观测性
-
2025-10-28 LLM应用开发——成本优化指南
-
2025-10-27 LLM应用开发——缓存策略详解
-
2025-10-26 LLM应用开发——多模型路由与协作
-
2025-10-25 LLM应用开发——LLM评估与测试
-
2025-10-24 LLM应用开发——多模态LLM应用
-
2025-10-23 LLM应用开发——结构化输出
-
2025-10-22 LLM应用开发——LlamaIndex框架
-
2025-10-21 LLM应用开发——Streaming流式输出
-
2025-10-20 LLM应用开发——对话记忆管理
-
2025-10-20 机器学习基础系列——图神经网络
-
2025-10-15 机器学习基础系列——生成对抗网络
-
2025-10-01 机器学习基础系列——自编码器
-
2025-09-29 LLM应用开发——语音交互系统实战
-
2025-09-28 LLM应用开发——文档智能处理实战
-
2025-09-27 LLM应用开发——代码生成与沙箱执行
-
2025-09-26 LLM应用开发——AI搜索引擎实战
-
2025-09-25 LLM应用开发——MCP协议开发
-
2025-09-24 LLM应用开发——本地模型部署
-
2025-09-23 LLM应用开发——微调实战指南
-
2025-09-22 LLM应用开发——长上下文处理策略
-
2025-09-21 LLM应用开发——GraphRAG与知识图谱
-
2025-09-20 LLM应用开发——高级RAG技术详解
-
2025-09-19 LLM应用开发——边缘计算与端侧部署
-
2025-09-18 LLM应用开发——实时协作与流式交互
-
2025-09-17 LLM应用开发——AI写作助手实战
-
2025-09-16 LLM应用开发——高质量知识库构建指南
-
2025-09-15 LLM应用开发——AI个性化推荐系统
-
2025-09-15 机器学习基础系列——混合专家模型
-
2025-09-14 LLM应用开发——内容审核与安全过滤
-
2025-09-13 LLM应用开发——对话系统设计模式
-
2025-09-12 LLM应用开发——混合检索策略深度解析
-
2025-09-11 LLM应用开发——Prompt版本管理与工程化
-
2025-09-10 LLM应用开发——多租户架构设计
-
2025-09-01 机器学习基础系列——实战项目
-
2025-08-31 VS Code Copilot 系统提示词解析
-
2025-08-15 机器学习基础系列——迁移学习
-
2025-08-01 机器学习基础系列——Transformer
-
2025-07-15 机器学习基础系列——注意力机制
-
2025-07-01 机器学习基础系列——循环神经网络
-
2025-06-15 机器学习基础系列——卷积神经网络
-
2025-06-01 机器学习基础系列——Dropout详解
-
2025-05-15 机器学习基础系列——批归一化
-
2025-05-01 机器学习基础系列——优化算法详解
-
2025-04-15 机器学习基础系列——反向传播
-
2025-04-01 机器学习基础系列——激活函数
-
2025-03-01 机器学习基础系列——神经网络基础
-
2025-02-15 机器学习基础系列——超参数调优
-
2025-02-01 机器学习基础系列——过拟合与欠拟合
-
2025-01-15 机器学习基础系列——交叉验证
-
2025-01-01 机器学习基础系列——模型评估指标
-
2024-12-20 机器学习基础系列——降维技术
-
2024-12-15 机器学习基础系列——聚类算法
-
2024-12-01 机器学习基础系列——支持向量机
-
2024-11-25 机器学习基础系列——XGBoost与LightGBM
-
2024-11-20 机器学习基础系列——集成学习
-
2024-11-15 机器学习基础系列——梯度提升
-
2024-11-01 机器学习基础系列——随机森林
-
2024-10-15 机器学习基础系列——决策树
-
2024-10-01 机器学习基础系列——朴素贝叶斯
-
2024-09-15 机器学习基础系列——K近邻算法
-
2024-09-01 机器学习基础系列——逻辑回归
-
2024-08-15 机器学习基础系列——多项式回归与正则化
-
2024-08-01 机器学习基础系列——线性回归
-
2024-07-20 机器学习基础系列——损失函数与优化
-
2024-07-10 机器学习基础系列——数学基础:微积分
-
2024-07-01 机器学习基础系列——数学基础:概率统计
-
2024-06-20 机器学习基础系列——数学基础:线性代数
-
2024-06-10 机器学习基础系列——核心概念
-
2024-06-01 机器学习基础系列——学习资源
代码生成 (1)
-
2025-09-27 LLM应用开发——代码生成与沙箱执行
企业应用 (4)
-
2026-01-11 企业级RAG应用系列(1):架构总览
-
2026-01-11 企业级RAG应用系列(2):环境搭建与基础设施
-
2026-01-11 企业级RAG应用系列(3):数据库与向量存储
-
2026-01-11 企业级RAG应用系列(4):模型服务与推理
位置编码 (2)
全栈实战 (1)
-
2026-05-27 项目 34:终极试炼:构建你的私有化大模型系统(Capstone Project)
内容审核 (1)
-
2025-09-14 LLM应用开发——内容审核与安全过滤
分布式 (1)
-
2024-12-02 PolarDB-X
分布式系统 (1)
-
2026-05-27 Milvus分布式向量库
分词 (1)
-
2026-05-19 把文字变成数字:分词与编码
创意写作 (1)
-
2025-09-17 LLM应用开发——AI写作助手实战
前端 (1)
-
2026-04-15 AI 入门:前端开发者的第一课
协议开发 (1)
-
2025-09-25 LLM应用开发——MCP协议开发
历史 (2)
-
2026-05-01 番外 1:LLM 简史,从 Transformer 到 2026
-
2026-04-25 番外 1:LLM 简史——从 Transformer 到今天
去重 (1)
-
2026-05-27 项目 21:文明的数字工业化:构建大规模预训练数据管线
参数 (2)
-
2026-05-02 番外 2:API 参数全解,temperature 到 logprobs
-
2026-04-25 番外 2:API 参数全解——从 temperature 到 logprobs
反向传播 (1)
-
2026-05-21 反向传播:模型如何确定参数的调整方向
可观测性 (1)
-
2025-10-29 LLM应用开发——监控与可观测性
可解释性 (1)
合成数据 (1)
-
2026-05-27 项目 22:自我进化的循环:合成数据(Synthetic Data)的生成、过滤与证明
后端 (1)
-
2024-08-23 Windows将命令封装为后台服务
向量 (6)
-
2026-05-25 项目 1-2:Tokenizer、词表与 Embedding
-
2026-05-09 番外 9:Embedding 的来龙去脉
-
2026-04-23 Embedding 与向量:把文字变成数字
-
2026-04-17 RAG:让 AI 回答你的专属数据
-
2026-04-16 Embedding 与向量:把文字变成数字
向量压缩 (1)
-
2026-05-23 IVF与乘积量化PQ
向量存储 (1)
-
2026-01-11 企业级RAG应用系列(3):数据库与向量存储
向量数据库 (9)
-
2026-05-28 向量数据库选型与生产实践
-
2026-05-27 项目 29:检索增强生成的艺术:工业级 RAG 架构拆解
-
2026-05-27 Milvus分布式向量库
-
2026-05-21 向量数据库到底是什么
-
2026-05-14 番外 14:向量数据库 Qdrant 实战、混合检索与 Reranker
-
2026-05-13 Embedding 这水比你想的深
-
2026-04-24 RAG 实战:搭建一个能回答你文档的本地知识库
-
2025-11-05 LLM应用开发——向量数据库
-
2025-09-12 LLM应用开发——混合检索策略深度解析
向量检索 (3)
-
2026-05-24 FAISS实战
-
2026-05-22 近似最近邻ANN算法
-
2025-09-15 LLM应用开发——AI个性化推荐系统
向量空间 (1)
-
2026-05-25 项目 02:embedding 与语义几何
回退策略 (1)
-
2026-05-15 Function Calling 用好了才叫工具调用
图神经网络 (1)
-
2025-10-20 机器学习基础系列——图神经网络
基础设施 (1)
-
2026-01-11 企业级RAG应用系列(2):环境搭建与基础设施
多Agent (1)
-
2026-05-16 Agent 不只是套个循环
多头注意力 (1)
-
2026-05-23 构建完整的 GPT 结构
多模型 (1)
-
2026-05-11 API 调用没你想的那么简单
多模型协作 (1)
-
2025-10-26 LLM应用开发——多模型路由与协作
多模态 (4)
-
2026-05-26 项目 31:多模态视觉语言桥接器(Vision-Language Adapter)
-
2026-05-08 番外 8:多模态入门,图像、语音与视频
-
2026-04-19 进阶方向:多模态、本地部署与成本优化
-
2025-10-24 LLM应用开发——多模态LLM应用
多租户 (1)
-
2025-09-10 LLM应用开发——多租户架构设计
大模型微调 (1)
-
2025-11-20 机器学习基础系列——LoRA与参数高效微调
学习计划 (2)
-
2026-05-25 项目 34:十二周执行计划与 Capstone
-
2026-05-25 34 个 LLM 工程项目验收清单
学习资源 (1)
-
2024-06-01 机器学习基础系列——学习资源
学习路线 (1)
-
2026-05-25 LLM 工程路线图:从概念理解到可运行系统
安全 (8)
-
2026-05-26 项目 33:防线与红队:构建 LLM 安全评估体系
-
2026-05-07 番外 7:提示词注入与防御
-
2025-11-24 LLM应用开发——安全防护
-
2025-09-14 LLM应用开发——内容审核与安全过滤
-
2025-02-17 如何保护你部署的服务
-
2024-12-02 DDoS攻击
-
2024-11-12 如何备份你的数据
-
2024-06-08 Protect your VPS from being hijacked.
安装 (1)
-
2026-04-21 安装 Claude Code 并完成首次登录
实战 (3)
-
2026-05-25 项目 30:构建 Tool Use 与 Agent Loop
-
2026-04-23 日常工作流:Bug 修复、新功能、重构、测试
-
2026-04-19 构建你的第一个 AI 聊天应用
实时协作 (1)
-
2025-09-18 LLM应用开发——实时协作与流式交互
实时响应 (1)
-
2025-10-21 LLM应用开发——Streaming流式输出
寓言 (20)
-
2026-05-12 20. 一支笔里藏着五种颜色
-
2026-05-11 19. 会大声自言自语的棋手
-
2026-05-10 18. 够大的雨终会灌满湖
-
2026-05-09 17. 能把尘土还原成瓷瓶的人
-
2026-05-08 16. 天生注定的那张彩票
-
2026-05-07 15. 守门人和十个专家
-
2026-05-06 14. 山神的三个承诺
-
2026-05-05 13. 把老匠人装进一个孩子的梦里
-
2026-05-04 12. 翻山送信的邮差
-
2026-05-03 11. 一张照片骗过所有人的眼睛
-
2026-05-02 10. 画赝品的人和他的宿敌
-
2026-05-01 09. 学新手艺就忘旧的画师
-
2026-04-30 08. 同一双眼睛走遍全村
-
2026-04-29 07. 十口井的旅人
-
2026-04-28 06. 在雾中看潮水的渔夫
-
2026-04-27 05. 学了三年突然顿悟的少年
-
2026-04-26 04. 把世界搬上书架的图书管理员
-
2026-04-25 03. 完美的临摹学徒
-
2026-04-24 02. 雪夜下山的瞎子
-
2026-04-23 01. 图书馆里的低语
对话系统 (2)
-
2025-10-20 LLM应用开发——对话记忆管理
-
2025-09-13 LLM应用开发——对话系统设计模式
对齐 (2)
-
2026-05-27 项目 24:灵魂的对齐:SFT、指令微调与偏好优化(DPO)
-
2026-05-06 14. 山神的三个承诺
层归一化 (1)
-
2026-05-26 项目 06:构建完整的 Transformer Decoder Block
工作流 (1)
-
2026-04-23 日常工作流:Bug 修复、新功能、重构、测试
工具 (3)
-
2025-01-02 Linux 服务器压测
-
2024-08-26 mac使用windows的硬盘空间
-
2024-08-26 Mac和Windows之间实现键鼠自由
工程化 (1)
-
2026-06-05 推理服务工程化
工程实践 (5)
-
2026-05-27 项目 27:吞吐量之王:Serving Stack 与推理引擎横评
-
2026-05-27 项目 29:检索增强生成的艺术:工业级 RAG 架构拆解
-
2026-05-25 LLM 工程路线图:从概念理解到可运行系统
-
2026-05-25 项目 34:十二周执行计划与 Capstone
-
2026-05-25 34 个 LLM 工程项目验收清单
并发 (2)
-
2026-05-11 API 调用没你想的那么简单
-
2026-05-06 番外 6:异步与并发,批量调用 LLM 的工程模式
幻觉 (2)
-
2026-05-05 番外 5:幻觉与开源崛起
-
2026-04-27 番外 5:幻觉与开源崛起——LLM 的两个关键议题
开源 (5)
-
2026-05-05 番外 5:幻觉与开源崛起
-
2026-05-01 11. 开源 Agent 全家桶:Hermes 3 + 向量库的离线 RAG-Agent
-
2026-04-30 10. Hermes 3 实战:在 Ollama 上跑一个本地工具调用 Agent
-
2026-04-28 本地模型:用 Ollama 跑开源 LLM
-
2026-04-27 番外 5:幻觉与开源崛起——LLM 的两个关键议题
强化学习 (1)
-
2025-11-01 机器学习基础系列——强化学习基础
微调 (5)
-
2026-06-01 LoRA与QLoRA微调
-
2026-04-30 进阶方向:评测、监控、成本与微调
-
2026-01-11 企业级RAG应用系列(1):架构总览
-
2026-01-11 企业级RAG应用系列(4):模型服务与推理
-
2025-09-23 LLM应用开发——微调实战指南
性能优化 (1)
-
2025-10-27 LLM应用开发——缓存策略详解
性能分析 (1)
-
2026-05-26 项目 18:计算的权衡:稠密(Dense)与稀疏(MoE)模型的全方位对比
成本 (2)
-
2026-04-26 番外 3:Token 的秘密——BPE、中文更贵、怎么省
-
2026-04-24 避坑与省钱:上下文管理与常见问题
成本优化 (2)
-
2026-04-19 进阶方向:多模态、本地部署与成本优化
-
2025-10-28 LLM应用开发——成本优化指南
扩散模型 (1)
-
2026-05-26 项目 20:文本的扩散:扩散语言模型(Diffusion LM)初探
批量处理 (1)
-
2026-05-06 番外 6:异步与并发,批量调用 LLM 的工程模式
技巧 (1)
-
2026-04-23 高效沟通:跳出 Copilot 式补全思维
技术 (4)
-
2024-12-02 对象存储的域名详解
-
2024-07-26 linux启动进入救援模式
-
2021-01-23 vscode中的snippet使用
-
2021-01-21 vscode配置远程ssh开发环境
技术细节 (1)
技术/部署 (23)
-
2025-11-20 Docker 系列——测试数据库部署
-
2025-11-19 Docker 系列——Golang 项目容器化
-
2025-11-18 Docker 系列——基础入门
-
2025-04-09 LobeChat 部署系列——Docker 镜像构建
-
2025-01-23 vLLM 高性能推理系列——多模态模型部署
-
2025-01-22 vLLM 高性能推理系列——投机解码加速
-
2025-01-21 vLLM 高性能推理系列——LoRA 动态加载
-
2025-01-20 vLLM 高性能推理系列——入门篇
-
2025-01-17 Ray 分布式训练实践
-
2025-01-16 Python 本地知识库部署(仅 CPU)
-
2025-01-15 Python 数据科学系列——特征工程
-
2025-01-03 Cursor AI 编程助手体验
-
2025-01-02 Ollama 部署系列——本地安装
-
2024-12-24 CPU 环境下的模型微调
-
2024-08-24 MinIO 本地安装配置
-
2024-08-23 LobeChat 部署系列——鉴权篇
-
2024-08-22 LobeChat 部署系列——进阶篇
-
2024-08-21 LobeChat 部署系列——基础篇
-
2024-05-02 人工智能术语中英文对照表
-
2023-12-02 Python 数据科学系列——数据分析库
-
2023-12-01 Python 数据科学系列——概述篇
-
2023-11-03 Python 数据科学系列——探索性数据分析
-
2023-11-02 Python 数据科学系列——数据清洗与预处理
投机解码 (1)
-
2026-05-26 项目 10:打破串行咒语:投机解码(Speculative Decoding)
损失函数 (1)
-
2026-05-26 项目 07:Mini-former 训练实战:从随机扰动到文本预测
探针 (1)
推理 (2)
-
2026-05-29 推理为什么慢
-
2026-05-11 19. 会大声自言自语的棋手
推理优化 (3)
-
2026-05-27 项目 26:数字的炼金术:模型量化(Quantization)深度解密
-
2026-05-26 项目 11:显存的吞噬者:KV Cache 机制与显存预算
-
2026-05-25 项目 9-16:Decoding、KV Cache、长上下文与推理系统
推理加速 (2)
-
2026-05-26 项目 10:打破串行咒语:投机解码(Speculative Decoding)
-
2026-05-26 项目 15:IO 感知的艺术:FlashAttention 的硬件级优化
推理引擎 (1)
-
2026-05-27 项目 27:吞吐量之王:Serving Stack 与推理引擎横评
推荐系统 (1)
-
2025-09-15 LLM应用开发——AI个性化推荐系统
提示词注入 (1)
-
2026-05-07 番外 7:提示词注入与防御
数学 (3)
-
2024-07-10 机器学习基础系列——数学基础:微积分
-
2024-07-01 机器学习基础系列——数学基础:概率统计
-
2024-06-20 机器学习基础系列——数学基础:线性代数
数学原理 (1)
数据工程 (1)
-
2026-05-27 项目 21:文明的数字工业化:构建大规模预训练数据管线
数据库 (2)
-
2025-11-20 Docker 系列——测试数据库部署
-
2024-08-19 LobeChat 部署系列——数据备份
数据库设计 (1)
-
2026-01-11 企业级RAG应用系列(3):数据库与向量存储
数据提取 (1)
-
2025-10-23 LLM应用开发——结构化输出
文本分块 (1)
-
2026-05-13 Embedding 这水比你想的深
文本处理 (1)
-
2026-05-13 番外 13:文本切分策略与 chunk_size 选择
文本生成 (1)
-
2026-05-26 项目 20:文本的扩散:扩散语言模型(Diffusion LM)初探
文档处理 (1)
-
2025-09-28 LLM应用开发——文档智能处理实战
显存带宽 (1)
-
2026-05-26 项目 16:硬件精算:显存带宽、算力与硬件预算(Hardware Budget)
显存管理 (1)
-
2026-05-26 项目 11:显存的吞噬者:KV Cache 机制与显存预算
本地模型 (2)
-
2026-05-16 番外 16:uvicorn --reload 与本地大模型的相处难题
-
2026-04-30 10. Hermes 3 实战:在 Ollama 上跑一个本地工具调用 Agent
本地部署 (3)
-
2026-04-28 本地模型:用 Ollama 跑开源 LLM
-
2026-04-19 进阶方向:多模态、本地部署与成本优化
-
2025-09-24 LLM应用开发——本地模型部署
机器学习 (29)
-
2025-09-01 机器学习基础系列——实战项目
-
2025-08-15 机器学习基础系列——迁移学习
-
2025-08-01 机器学习基础系列——Transformer
-
2025-07-15 机器学习基础系列——注意力机制
-
2025-07-01 机器学习基础系列——循环神经网络
-
2025-06-15 机器学习基础系列——卷积神经网络
-
2025-06-01 机器学习基础系列——Dropout详解
-
2025-05-15 机器学习基础系列——批归一化
-
2025-05-01 机器学习基础系列——优化算法详解
-
2025-04-15 机器学习基础系列——反向传播
-
2025-04-01 机器学习基础系列——激活函数
-
2025-03-01 机器学习基础系列——神经网络基础
-
2025-02-15 机器学习基础系列——超参数调优
-
2025-02-01 机器学习基础系列——过拟合与欠拟合
-
2025-01-15 机器学习基础系列——交叉验证
-
2025-01-01 机器学习基础系列——模型评估指标
-
2024-12-20 机器学习基础系列——降维技术
-
2024-12-15 机器学习基础系列——聚类算法
-
2024-12-01 机器学习基础系列——支持向量机
-
2024-11-25 机器学习基础系列——XGBoost与LightGBM
-
2024-11-20 机器学习基础系列——集成学习
-
2024-11-15 机器学习基础系列——梯度提升
-
2024-11-01 机器学习基础系列——随机森林
-
2024-10-15 机器学习基础系列——决策树
-
2024-10-01 机器学习基础系列——朴素贝叶斯
-
2024-09-15 机器学习基础系列——K近邻算法
-
2024-09-01 机器学习基础系列——逻辑回归
-
2024-08-15 机器学习基础系列——多项式回归与正则化
-
2024-08-01 机器学习基础系列——线性回归
机械可解释性 (1)
-
2026-05-12 20. 一支笔里藏着五种颜色
权限 (1)
-
2026-04-22 核心心智模型:上下文、权限与计划模式
权限最小化 (1)
-
2026-06-09 22. Agent 安全边界:Prompt Injection、权限最小化、沙箱逃逸
架构 (1)
-
2026-05-26 项目 08:训练目标对比:Causal、Masked 与 Prefix LM
架构演进 (1)
-
2026-05-26 项目 12:架构的进化:MQA、GQA 与 MLA 深度解析
架构设计 (1)
-
2025-09-10 LLM应用开发——多租户架构设计
核心概念 (1)
-
2024-06-10 机器学习基础系列——核心概念
核采样 (1)
-
2026-05-26 项目 09:概率的剪裁:解码策略与采样 Dashboard
梯度下降 (1)
-
2026-05-21 反向传播:模型如何确定参数的调整方向
检索 (1)
-
2026-05-13 Embedding 这水比你想的深
检索增强 (1)
-
2025-09-20 LLM应用开发——高级RAG技术详解
概率推断 (1)
-
2026-04-28 06. 在雾中看潮水的渔夫
模型优化 (1)
-
2025-11-25 机器学习基础系列——模型量化与剪枝
模型压缩 (3)
-
2026-06-02 知识蒸馏
-
2026-05-05 13. 把老匠人装进一个孩子的梦里
-
2025-11-15 机器学习基础系列——知识蒸馏
模型崩溃 (1)
-
2026-05-27 项目 22:自我进化的循环:合成数据(Synthetic Data)的生成、过滤与证明
模型推理 (1)
-
2026-01-11 企业级RAG应用系列(4):模型服务与推理
模型架构 (1)
-
2026-05-26 项目 19:线性序列的回归:状态空间模型(SSM)与线性注意力
模型规模 (1)
-
2026-05-27 项目 23:预测未来的算力账本:缩放法则(Scaling Laws)与曲线拟合
模型训练 (8)
-
2026-05-25 从迷你 GPT 到 ChatGPT:预训练之后还经历了什么
-
2026-05-24 完整训练:从随机输出到通顺文字
-
2026-05-23 构建完整的 GPT 结构
-
2026-05-22 注意力机制:让模型看见上下文
-
2026-05-21 反向传播:模型如何确定参数的调整方向
-
2026-05-20 最简单的模型:先让训练循环运转起来
-
2026-05-19 把文字变成数字:分词与编码
-
2026-05-18 模型到底在学什么
模型路由 (1)
-
2025-10-26 LLM应用开发——多模型路由与协作
模型选型 (1)
-
2026-05-26 项目 18:计算的权衡:稠密(Dense)与稀疏(MoE)模型的全方位对比
残差连接 (1)
-
2026-05-26 项目 06:构建完整的 Transformer Decoder Block
沙箱执行 (1)
-
2025-09-27 LLM应用开发——代码生成与沙箱执行
注意力机制 (2)
-
2026-05-26 项目 13:跨越万词鸿沟:长上下文(Long Context)的系统性挑战与解法
-
2026-05-22 注意力机制:让模型看见上下文
流式输出 (3)
-
2026-04-21 调用大模型 API:从 requests 到流式响应
-
2026-04-15 调用大模型 API:从 fetch 到流式响应
-
2025-09-18 LLM应用开发——实时协作与流式交互
深度学习 (20)
-
2026-05-02 10. 画赝品的人和他的宿敌
-
2026-04-23 01. 图书馆里的低语
-
2025-10-20 机器学习基础系列——图神经网络
-
2025-10-15 机器学习基础系列——生成对抗网络
-
2025-10-01 机器学习基础系列——自编码器
-
2025-09-15 LLM应用开发——AI个性化推荐系统
-
2025-09-15 机器学习基础系列——混合专家模型
-
2025-09-01 机器学习基础系列——实战项目
-
2025-08-15 机器学习基础系列——迁移学习
-
2025-08-01 机器学习基础系列——Transformer
-
2025-07-15 机器学习基础系列——注意力机制
-
2025-07-01 机器学习基础系列——循环神经网络
-
2025-06-15 机器学习基础系列——卷积神经网络
-
2025-06-01 机器学习基础系列——Dropout详解
-
2025-05-15 机器学习基础系列——批归一化
-
2025-05-01 机器学习基础系列——优化算法详解
-
2025-04-15 机器学习基础系列——反向传播
-
2025-04-01 机器学习基础系列——激活函数
-
2025-03-01 机器学习基础系列——神经网络基础
-
2024-07-20 机器学习基础系列——损失函数与优化
深度学习入门 (1)
-
2026-05-18 模型到底在学什么
混合专家模型 (1)
-
2026-05-26 项目 17:稀疏性的调度艺术:实现双专家 MoE 路由(MoE Router)
混合检索 (4)
-
2026-05-27 项目 29:检索增强生成的艺术:工业级 RAG 架构拆解
-
2026-05-26 Qdrant与Weaviate
-
2026-05-14 番外 14:向量数据库 Qdrant 实战、混合检索与 Reranker
-
2025-09-12 LLM应用开发——混合检索策略深度解析
温度调节 (1)
-
2026-05-26 项目 09:概率的剪裁:解码策略与采样 Dashboard
激活分析 (1)
灰度发布 (1)
-
2026-06-05 推理服务工程化
版本管理 (1)
-
2025-09-11 LLM应用开发——Prompt版本管理与工程化
状态管理 (1)
-
2025-09-13 LLM应用开发——对话系统设计模式
环境搭建 (2)
-
2026-04-20 AI 入门:Python 新手的第一课
-
2026-04-20 安装 WSL2:Windows 下的 Linux 开发环境
环境配置 (1)
-
2026-01-11 企业级RAG应用系列(2):环境搭建与基础设施
生产实践 (1)
-
2026-05-28 向量数据库选型与生产实践
生成模型 (1)
-
2026-05-09 17. 能把尘土还原成瓷瓶的人
监控 (3)
-
2026-06-05 推理服务工程化
-
2026-04-30 进阶方向:评测、监控、成本与微调
-
2025-10-29 LLM应用开发——监控与可观测性
知识图谱 (1)
-
2025-09-21 LLM应用开发——GraphRAG与知识图谱
知识库 (2)
-
2026-04-24 RAG 实战:搭建一个能回答你文档的本地知识库
-
2025-09-16 LLM应用开发——高质量知识库构建指南
知识蒸馏 (1)
-
2026-06-02 知识蒸馏
硬件预算 (1)
-
2026-05-26 项目 16:硬件精算:显存带宽、算力与硬件预算(Hardware Budget)
神经网络 (1)
离线安装 (1)
-
2025-01-04 Ollama 部署系列——离线安装
稀疏激活 (1)
-
2026-05-07 15. 守门人和十个专家
稀疏计算 (1)
-
2026-05-26 项目 17:稀疏性的调度艺术:实现双专家 MoE 路由(MoE Router)
端侧部署 (1)
-
2025-09-19 LLM应用开发——边缘计算与端侧部署
算子优化 (1)
-
2026-05-26 项目 15:IO 感知的艺术:FlashAttention 的硬件级优化
算法优化 (1)
-
2026-05-26 项目 10:打破串行咒语:投机解码(Speculative Decoding)
系统优化 (1)
-
2026-05-26 项目 13:跨越万词鸿沟:长上下文(Long Context)的系统性挑战与解法
系统工程 (1)
-
2026-05-27 项目 34:终极试炼:构建你的私有化大模型系统(Capstone Project)
系统架构 (1)
-
2026-05-26 项目 11:显存的吞噬者:KV Cache 机制与显存预算
系统设计 (2)
-
2026-05-26 项目 16:硬件精算:显存带宽、算力与硬件预算(Hardware Budget)
-
2026-05-26 项目 18:计算的权衡:稠密(Dense)与稀疏(MoE)模型的全方位对比
索引算法 (1)
-
2026-05-22 近似最近邻ANN算法
红队测试 (1)
-
2026-05-26 项目 33:防线与红队:构建 LLM 安全评估体系
线性注意力 (1)
-
2026-05-26 项目 19:线性序列的回归:状态空间模型(SSM)与线性注意力
结构化输出 (2)
-
2026-04-22 结构化输出:用 Pydantic 把 LLM 变成稳定的函数
-
2025-10-23 LLM应用开发——结构化输出
缓存 (1)
-
2025-10-27 LLM应用开发——缓存策略详解
网络剪枝 (1)
-
2026-05-08 16. 天生注定的那张彩票
聊天应用 (1)
-
2026-04-29 用 Streamlit 构建 AI 聊天应用
自监督学习 (1)
-
2025-11-10 机器学习基础系列——自监督学习
自编码器 (1)
-
2025-10-01 机器学习基础系列——自编码器
视觉编码器 (1)
-
2026-05-26 项目 31:多模态视觉语言桥接器(Vision-Language Adapter)
解码策略 (1)
-
2026-05-26 项目 09:概率的剪裁:解码策略与采样 Dashboard
计算预算 (1)
-
2026-05-27 项目 23:预测未来的算力账本:缩放法则(Scaling Laws)与曲线拟合
训练循环 (2)
-
2026-05-26 项目 07:Mini-former 训练实战:从随机扰动到文本预测
-
2026-05-20 最简单的模型:先让训练循环运转起来
训练目标 (2)
-
2026-05-26 项目 08:训练目标对比:Causal、Masked 与 Prefix LM
-
2026-05-25 项目 3-8:位置、注意力与 Transformer Block
记忆系统 (1)
-
2026-05-16 Agent 不只是套个循环
设计 (1)
-
2026-04-23 03. 工具设计的艺术:粒度、命名、错误反馈与工具爆炸
评估 (4)
-
2026-05-26 项目 33:防线与红队:构建 LLM 安全评估体系
-
2026-05-15 番外 15:RAG 评估方法,把感觉变成数字
-
2026-05-14 你的 RAG 为什么回答得不好
-
2026-05-12 Prompt 不是玄学,是工程
评估测试 (1)
-
2025-10-25 LLM应用开发——LLM评估与测试
评测 (5)
-
2026-05-27 项目 28:拒绝虚假繁荣:构建严谨的模型评测(Evaluation Harness)
-
2026-05-25 项目 17-33:MoE、数据、后训练、评测、RAG、Agent 与安全
-
2026-05-25 项目 34:十二周执行计划与 Capstone
-
2026-05-13 01. 评判一个 Agent,你到底在评判什么
-
2026-04-30 进阶方向:评测、监控、成本与微调
语义检索 (1)
-
2026-05-21 向量数据库到底是什么
语音交互 (1)
-
2025-09-29 LLM应用开发——语音交互系统实战
质量保障 (1)
-
2025-10-25 LLM应用开发——LLM评估与测试
质量评估 (1)
-
2026-05-27 项目 22:自我进化的循环:合成数据(Synthetic Data)的生成、过滤与证明
质量过滤 (1)
-
2026-05-27 项目 21:文明的数字工业化:构建大规模预训练数据管线
超参数 (1)
-
2026-05-24 完整训练:从随机输出到通顺文字
路由算法 (1)
-
2026-05-26 项目 17:稀疏性的调度艺术:实现双专家 MoE 路由(MoE Router)
路线图 (1)
-
2026-05-25 LLM 工程路线图:从概念理解到可运行系统
边缘计算 (1)
-
2025-09-19 LLM应用开发——边缘计算与端侧部署
过拟合 (1)
-
2026-05-24 完整训练:从随机输出到通顺文字
过滤检索 (1)
-
2026-05-26 Qdrant与Weaviate
选型 (1)
-
2026-05-12 番外 12:Embedding 模型选型实战
避坑 (1)
-
2026-04-24 避坑与省钱:上下文管理与常见问题
部署 (1)
-
2026-06-04 开源大模型上线
部署优化 (1)
-
2025-11-22 LLM应用开发——部署与优化
采样 (1)
-
2026-05-26 项目 09:概率的剪裁:解码策略与采样 Dashboard
重试 (1)
-
2026-05-11 API 调用没你想的那么简单
量化 (3)
-
2026-05-31 GGUF与llamacpp
-
2026-05-30 模型量化INT8与INT4
-
2026-05-27 项目 26:数字的炼金术:模型量化(Quantization)深度解密
长上下文 (5)
-
2026-05-26 项目 13:跨越万词鸿沟:长上下文(Long Context)的系统性挑战与解法
-
2026-05-25 项目 9-16:Decoding、KV Cache、长上下文与推理系统
-
2026-05-04 番外 4:上下文窗口进化史与 KV Cache
-
2025-09-22 LLM应用开发——长上下文处理策略
长度外推 (1)
防御 (1)
-
2026-05-26 项目 33:防线与红队:构建 LLM 安全评估体系
降维 (1)
-
2024-12-20 机器学习基础系列——降维技术
限流 (1)
-
2026-06-05 推理服务工程化
集成学习 (1)
-
2024-11-20 机器学习基础系列——集成学习
非自回归生成 (1)
-
2026-05-26 项目 20:文本的扩散:扩散语言模型(Diffusion LM)初探
项目初始化 (1)
-
2026-04-22 初次见面:项目初始化与 CLAUDE.md
项目总结 (1)
-
2026-05-27 项目 34:终极试炼:构建你的私有化大模型系统(Capstone Project)
项目清单 (1)
-
2026-05-25 34 个 LLM 工程项目验收清单
预训练 (2)
-
2026-05-27 项目 21:文明的数字工业化:构建大规模预训练数据管线
-
2026-05-25 从迷你 GPT 到 ChatGPT:预训练之后还经历了什么
验收标准 (1)
-
2026-05-25 34 个 LLM 工程项目验收清单