什么是 AI API？新手必读的价格与 Token 指南

什么是 AI API？—— 新手指南：价格、Token、模型选择与网页对话的区别

1. ChatGPT 每月 20 美元 —— API 可能只要 2 美元（或者相反）
2. 网页对话 vs API —— 五个具体差异
3. 什么是 Token？—— 最小的计价单位
4. 主要 API 价格 —— Claude vs GPT vs Gemini
5. 模型选择 —— 四类用途地图
6. 每个新手都会掉进的三个计价陷阱
7. 你的第一次 API 调用 —— 5 分钟搞定 curl 与 Python
总结
常见问题

"我每月付 20 美元用 ChatGPT，直接调 API 会不会更便宜？"这是 AI 新手经常提出的问题。简短回答：有时是，有时正相反。分界线取决于"你每月调用 AI 多少次"以及"输入有多长"。

举个例子，每天问 10 个短问题？API 一个月只花你 1–2 美元。但每天分析一份 10 万 token 的文档？API 账单立刻飙到 每月 50–200 美元。网页对话的固定月费很稳；轻度使用时 API 便宜得多 —— 但要是搞错了这个反转关系，月底账单会让你大吃一惊。

先把我的看法摆在前面："想把 AI 嵌入自家应用的开发者"、"想取消 ChatGPT/Claude 订阅、轻度使用 AI 的个人"以及"想对比多个模型的人" —— 这三类人明显会从 API 中获益。反过来，如果你"想在网页 UI 里保留对话"、"经常用图像生成或语音输入"，或者"讨厌看账单"，那么继续订阅网页对话才是正解。本文将从新手视角讲解网页对话与 API 的根本差异、token 与计价的原理、2026 年 5 月主要 API 的价格、模型选择方法、新手都会掉进去的三个陷阱，以及你的第一次调用。

AI API · 2026 年 5 月

网页对话的固定月费 vs API 的按量付费

—— 同样的 AI 模型，完全不同的成本结构和使用体验

网页对话

每月固定 20 美元

完整 UI，支持图像

适合"想直接用 AI"的用户

API

每次调用 0.005–0.05 美元

可编程访问

适合自动化／应用集成

轻度使用（每天 10 次调用）→ API 每月 1–2 美元。
重度使用（每天 10 万 token 的输入）→ API 每月 50–200 美元；这时网页对话的固定月费反而更划算。

1. ChatGPT 每月 20 美元 —— API 可能只要 2 美元（或者相反）

来算一笔具体的账。"每天 10 个短问题。"每次调用：输入 200 token + 输出 200 token（大致相当于 130–160 个英文单词）。用 Claude Sonnet 4.6（输入每百万 token 3 美元 / 输出 15 美元），一次调用花 0.0036 美元，一个月约 1.10 美元。这是 ChatGPT Plus 每月 20 美元的 1/18。

再来看反面。"每天分析一份 10 万 token 的文档。"用 Claude Opus 4.7（输入 5 美元 / 输出 25 美元），一次调用输入 10 万 + 输出 5K = 0.625 美元。每月 30 次 = 18.75 美元；100 次 = 62.50 美元。OpenAI 的 GPT-5.5 在输入超过 27.2 万 token 时输入价格翻倍，长上下文任务的花销跳得更猛。

大致分界线："每月调用低于 200–300 次时，API 更便宜。"重度用户（每天大量调用、输入很长）通常用网页对话的固定月费反而更划算。这就是"固定月费"（网页对话）与"按量付费"（API）之间的根本张力。

2. 网页对话 vs API —— 五个具体差异

除了价格，网页对话和 API 在使用方式上也有根本差别。五个要点：

维度	网页对话（claude.ai / chatgpt.com）	API
调用方式	浏览器内对话	从代码发出 HTTP 请求
计费方式	每月固定约 20 美元	按所用 token 计费
界面	完整功能（历史、附件、图像生成）	需自行开发
会话管理	自动保留历史	每次请求都要自己重发历史
功能	语音、图像、Memory、Canvas 等	主要是文本／图像的文字指令

关键点："API 不会记得对话历史。"在网页对话里，过去的对话会自动保留；走 API 时，每次请求都是独立的。如果你想要"记得上一轮"的效果，必须自己重发完整历史，token 消耗会迅速攀升。这是新手抱怨"API 比想象中贵"的头号原因。

另外，API 本质上是一个文本接口。网页对话的图像生成、语音输入、Code Interpreter、Canvas、Memory 等功能，在 API 上要么不存在，要么放在独立的端点。人们以为"ChatGPT 80% 的功能都在 API 里"，但很快会发现实际只有 50–60%。

3. 什么是 Token？—— 最小的计价单位

要理解 API 的计价，你必须先理解 "token"。所有厂商的价格都写成 "每 100 万（1M）token 多少美元"。

Token 基础 × 3

读懂价格表的最低门槛

① 1 个 token 有多大？

英文约 0.75 词／token；中日韩文约 1–1.5 token／字。"Hello there" 约 3 个 token。代码因为缩进和符号容易膨胀。

② 输入与输出价格不同

输出比输入贵 5–10 倍。Claude Sonnet 4.6 是输入 3 美元 / 输出 15 美元 —— 5 倍比例。只要叮嘱一句"简短回答"，就能真金白银地省钱。

③ 系统提示也要花钱

"你是 X 领域的专家"这种前置语每次调用都会消耗 token。冗长的系统提示让账单膨胀。提示缓存可以缓解（见下文）。

发送前估算 token 数，可用 OpenAI 的 tiktoken 库或 Anthropic 的 countTokens() 同类 API。
更多内容，请参阅什么是 AI 上下文窗口。

4. 主要 API 价格 —— Claude vs GPT vs Gemini

2026 年 5 月主要模型的 API 价格（输入／输出，每 100 万 token）。价格每季度都会变动，决策前请先到厂商官方价格页面确认最新数值。

模型	输入	输出	备注
Claude Opus 4.7	5 美元	25 美元	1M 统一价，质量顶尖
Claude Sonnet 4.6	3 美元	15 美元	1M 统一价，性价比最佳
Claude Haiku 4.5	1 美元	5 美元	轻量级，上限 200K
GPT-5.5	5 美元	30 美元	超过 272K 后输入加价 2 倍
GPT-5.4	2.5 美元	15 美元	同样的长上下文加价
Gemini 3.1 Pro	2 美元	12 美元	2M 上下文，Batch API 价格减半
Gemini 2.5 Flash-Lite	0.10 美元	0.40 美元	大量调用场景的最低档
DeepSeek V4-Pro	0.55 美元	2.20 美元	开放权重，性价比顶级

仅从这张表就能看出：输出比输入贵 5–10 倍。每次调用都会同时产生输入和输出，所以输出量大的任务（总结、文章生成、代码生成）更贵。输出量小的任务（分类、短答）在 API 上跑起来非常便宜。

同样重要的还有"折扣机制"：

提示缓存（Anthropic / OpenAI）：复用同一个系统提示，从第二次调用起输入价格最多下降 90%
Batch API（OpenAI / Google）：异步批量在 24 小时内处理完，5 折优惠
缓存写入成本：Anthropic 缓存写入按 1.25 倍收费；读取是 0.1 倍

忽略这些机制，本可以付 1/3 到 1/5 价格的事情就只能按全价付。详见 AI token 与会话省钱方法。

5. 模型选择 —— 四类用途地图

"该选哪个模型？"是新手最大的疑问。截至 2026 年 5 月，分成四类能让决策简单很多。

4 种用途 × 推荐模型

按用途的选择地图

① 高端／复杂任务

→ Claude Opus 4.7 / GPT-5.5

复杂推理、代码评审、长文档分析。质量优先。Opus 在语感细节上占优，GPT-5.5 在严密逻辑上更强。

② 性价比最佳 —— 主力

→ Claude Sonnet 4.6 / GPT-5.4 / Gemini 3.1 Pro

日常主力模型。质量与价格的平衡。Sonnet 在 1M 内统一价；Gemini 配合 Batch API 再打 5 折。

③ 大量／轻量任务

→ Claude Haiku 4.5 / Gemini 2.5 Flash-Lite

分类、抽取、简单问答、摘要。输入 0.10–1 美元 —— 极其便宜。最适合批处理与常规任务。

④ 开放权重／本地部署

→ DeepSeek V4-Pro / Llama 4 等

价格触底（0.55 / 2.20 美元），或在自己的 GPU 上完全免费运行。目标是保密性／成本压缩。质量与 ② 持平或略低。

我个人的最佳实践：② 主力 + ③ 大量任务搭配。
复杂任务升级到 ①，机密数据走 ④。仅此一项就能在实战中让月度成本减半。

6. 每个新手都会掉进的三个计价陷阱

开始用 API 的头 3 个月里，几乎所有人都会撞上以下三个计价陷阱之一。逐个来看。

陷阱 ①：每次都重发整个对话历史

API 不会记住任何东西。为了营造"像聊天一样"的体验，你必须每次调用都重发完整的对话。放任不管的话，到第 10 轮时单次调用就要发超过 1 万个输入 token。解决办法：重发前先对旧对话做摘要，或者把话题切换当作新会话开启。

陷阱 ②：系统提示越写越长

"你是 X 领域的专家。""请遵守下面 20 条规则。""输出格式必须是……" —— 写一长串前置语是典型的新手做法。2000 token 的系统提示每天调用 100 次，单这一项每月就要花 30 美元。启用提示缓存，第二次以后的调用价格直降 90%。在代码里通常只是给某一块加上 cache_control: { type: "ephemeral" } 而已。

陷阱 ③：忘了设置费率／消费上限

新手最可怕的结局是："代码有个 Bug 进入死循环，月底账单 500 美元。"预防方法是给每个 API key 设置消费上限（hard cap）。Anthropic Console 和 OpenAI Platform 都支持封顶月度消费；创建 key 时就设好。新手安全档位是 20–50 美元。

最重要的一点：千万不要把 API key 提交到 GitHub 或任何公开位置。泄漏的 key 会在几秒内被机器人扫到，几小时内就能产生数百美元的未授权调用。把 key 放在环境变量（.env）里并加进 .gitignore，或者使用 Secret Manager。

7. 你的第一次 API 调用 —— 5 分钟搞定 curl 与 Python

理论先放一边，下面是给 Anthropic Claude API 发送 "Hello" 的最小代码。

准备工作（3 步）

在 Anthropic Console 注册账号（或者用 OpenAI 的话去 platform.openai.com）
申请 API key（左侧菜单 "API Keys" → "Create Key"）。只显示一次 —— 立刻保存
在 Settings 里把 Spending Limit 设到 20 美元左右（新手必做）

最小 curl 调用

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-4-6",
    "max_tokens": 100,
    "messages": [
      {"role": "user", "content": "Hello from the AI API world"}
    ]
  }'

会返回 JSON。AI 的回答在 content[0].text；消耗的 token 在 usage.input_tokens 和 usage.output_tokens 里。"这次实际用了多少 token？" —— 响应每次都会告诉你。

Python（推荐）

pip install anthropic

import os
from anthropic import Anthropic

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=100,
    messages=[
        {"role": "user", "content": "Hello from the AI API world"}
    ]
)

print(response.content[0].text)
print(f"Used: input {response.usage.input_tokens} / output {response.usage.output_tokens}")

这段最小代码跑通之后，你就已经完成了一半。剩下的是对话历史管理、工具调用（function calling）和流式输出 —— 按顺序学下来，你就能搭出大多数 AI 应用了。另请参阅新手能用 AI 做出应用吗？。

总结

回顾要点：

网页对话是固定月费，API 是按量付费。轻度使用（约每天 10 次）API 每月 1–2 美元；重度使用可能飙到每月 50–200 美元
五个差异：调用方式／计费／界面／会话／功能。API 不记忆历史，需要自己重发
Token 是计价单位。英文约 0.75 词／token；输出比输入贵 5–10 倍
2026 年 5 月价格：Sonnet 3/15 美元、Opus 5/25 美元、GPT-5.5 5/30 美元、Gemini 3.1 Pro 2/12 美元（每 100 万 token）
用四类模型地图（高端／主力／轻量／开放）。② 主力 + ③ 轻量搭配是实战答案
三个计价陷阱：历史堆积／系统提示过长／没设消费上限。第一天就设好上限可以避开绝大多数
第一次调用：用 curl 或 Python，5 分钟就够。不要把 key 提交到 GitHub，先设消费上限 —— 就这些

网页对话订阅很方便，但当你想"把 AI 嵌入到自己的工具、自动化或工作流里"的那一刻，API 就成了真正的选项。一开始会觉得有门槛，不过先设一个低消费上限、跑上一两次，亲自感受每次调用约 0.01 美元，等到月底账单只有 1.50 美元时，你就悄悄地越过了从"使用 AI"到"用 AI 构建"的那条线。

常见问题

Q1. 该退订 ChatGPT Plus 改用 API 吗？

看使用情况。如果你每月调用 AI 约 200 次、几乎不用图像生成或语音，API 更便宜（每月 2–5 美元）。如果你每天用 10 次以上，或者依赖图像生成／Memory，那继续保留 Plus 更舒服。并行跑一个月，对比账单 —— 这是最稳妥的答案。

Q2. 不绑信用卡能试用吗？

OpenAI 没有免费额度计划；Anthropic 注册时偶尔给约 5 美元的试用额度。Google AI Studio（Gemini）有真正的 Free Tier，可以在配额内免费试用 Gemini 2.5 Flash 等模型。"只想免费摸一下 API" → 从 Gemini AI Studio 开始。

Q3. 不懂编程也能用 API 吗？

需要基础的代码复制与执行能力。但因为一行 curl 或五行 Python 就能跑起来，"复制粘贴运行"的门槛很低。在 2026 年，让 Claude / ChatGPT 自己写一句"请用 Python 写 Anthropic API 的第一次调用，加上注释"，几乎都能直接拿到可运行代码。

Q4. API 速度慢吗？

同样的模型，速度和网页对话差不多。打开流式输出后，响应就像网页对话里那种打字机效果。规模上来后可能撞到速率限制，不过限制会根据使用历史按层级提升（OpenAI 和 Anthropic 都有 Tier 计划）。

Q5. 该从哪个模型开始？

Claude Sonnet 4.6 或 Gemini 3.1 Pro。前者英文自然流畅且 1M 内统一定价；后者有免费额度，配合 Batch API 还能打 5 折。Opus / GPT-5.5 质量顶尖但更贵；轻量模型（Haiku / Flash-Lite）对刚学的人来说回答太简略可能会让人困惑。先定一个主力模型，按需求慢慢添加其他 —— 这是标准做法。

什么是 AI API？—— 新手指南：价格、Token、模型选择与网页对话的区别