AI 入门：前端开发者的第一课

写在前面

如果你是一名前端开发者，每天在 React、Vue、TypeScript 里打转，突然看到铺天盖地的"LLM""Agent""RAG"——别慌。这个系列会用你已经熟悉的语言（JS/TS、HTTP、API、JSON）一步一步拆解整个 AI 应用的全貌。

学完这个系列你会具备：

调用各家大模型 API 的能力
用 Prompt 工程引导模型给出想要的结果
搭建一个能回答你自己数据的小型知识库（RAG）
实现 Agent：让 AI 自己调用工具解决复杂问题
用 React 写出带流式输出的 AI 聊天应用

什么是 LLM（大语言模型）

一句话：一个超大的、会"续写"文本的函数。

// 你可以把它想成这样一个纯函数
function llm(inputText: string): string {
 // 内部是一个几千亿参数的神经网络
 // 它的全部能力就是：给定一段文本，预测下一个最可能的词
 return continuation
}

把这个 llm 函数反复调用，把每次的输出拼回去再调用下一次，就形成了"生成一段完整回答"的效果。

所以本质上，LLM 不是在"思考"，它是在做基于海量语料训练出来的概率预测。理解这一点非常关键，能帮你避免很多错误预期。

Token：AI 世界的基本单位

LLM 不是按"字"处理文本，而是按Token。一个 Token 大约等于：

英文：0.75 个单词
中文：1~2 个汉字

// 粗略估算
const tokens = Math.ceil(chineseText.length * 1.5)

为什么要关心 Token？因为所有费用都按 Token 算，所有模型都有上下文窗口限制（比如 GPT-4o 是 128K Tokens，Claude 是 200K Tokens）。

可以在 OpenAI Tokenizer 在线看一段文字会被切成什么样的 Token。

主流模型速览（2026 年初）

厂商	代表模型	特点
OpenAI	GPT-4o / GPT-4.1	综合能力强，生态最成熟
Anthropic	Claude Opus 4 / Sonnet 4	长文本、写代码强
Google	Gemini 2.0 Pro	多模态、超长上下文
DeepSeek	DeepSeek-V3 / R1	开源、性价比极高
阿里	Qwen 系列	中文好、开源

对前端开发者来说：先学用，不用深究模型原理。就像你不用懂 V8 引擎也能写 JS 一样。

AI 应用的典型分层

我画一张图你就懂了（脑补一下）：

┌─────────────────────────────────────┐
│ UI 层（React / Vue / 移动端） │ ← 你现在的位置
├─────────────────────────────────────┤
│ 应用层（Prompt / Agent / RAG） │ ← 这个系列重点讲
├─────────────────────────────────────┤
│ 模型接入层（OpenAI SDK / 自部署） │
├─────────────────────────────────────┤
│ 模型层（LLM 本身） │
└─────────────────────────────────────┘

大多数产品型 AI 应用（Cursor、Perplexity、ChatGPT 桌面版……）都在上面两层做工作，模型本身是底座。前端开发者完全可以深度参与"应用层"的构建。

几个必须打破的错觉

LLM 真的理解我 —— 并没有，它只是基于训练数据做概率预测，遇到训练里没见过的东西就会编造，这就是幻觉的来源。

同样的问题得到同样的答案 —— 默认情况下有随机性（由 temperature 参数控制），相同输入也可能有不同输出。

越大的模型越好 —— 要看场景。简单分类任务用小模型又快又便宜；只有复杂推理才需要上旗舰模型。

AI 能自己联网和运行代码 —— 原生 LLM 只会生成文本。联网、调工具是靠后面要讲的 Function Calling / Agent 框架实现的。

你需要准备什么

-Node.js 20+：跑所有代码示例 -一个 API Key：建议从 DeepSeek 开始，几毛钱能跑完整个系列；想用 OpenAI 也行 -基础的 fetch / Promise / async-await 知识：你已经有了 -一点好奇心：够用

下一步

下一篇我们会立刻动手，用十几行代码调通第一个大模型 API，并实现"流式输出"（就是 ChatGPT 那种一个字一个字蹦出来的效果）。

参考资料

What Is ChatGPT Doing ... and Why Does It Work? — Wolfram 的经典科普
3Blue1Brown: 神经网络可视化系列 — 用动画讲清 Transformer
Andrej Karpathy: Intro to LLMs — 前特斯拉 AI 总监的 1 小时入门演讲
OpenAI API Docs
Anthropic API Docs

（采用 CC BY-NC-SA 4.0 许可协议进行授权）

本文标题:AI 入门：前端开发者的第一课

本文链接:https://www.sshipanoo.com/blog/ai/ai-for-frontend/01-AI入门/

本文最后一次更新为天前，文章中的某些内容可能已过时！