目录
"我每月付 20 美元用 ChatGPT,直接调 API 会不会更便宜?"这是 AI 新手经常提出的问题。简短回答:有时是,有时正相反。分界线取决于"你每月调用 AI 多少次"以及"输入有多长"。
举个例子,每天问 10 个短问题?API 一个月只花你 1–2 美元。但每天分析一份 10 万 token 的文档?API 账单立刻飙到 每月 50–200 美元。网页对话的固定月费很稳;轻度使用时 API 便宜得多 —— 但要是搞错了这个反转关系,月底账单会让你大吃一惊。
先把我的看法摆在前面:"想把 AI 嵌入自家应用的开发者"、"想取消 ChatGPT/Claude 订阅、轻度使用 AI 的个人"以及"想对比多个模型的人" —— 这三类人明显会从 API 中获益。反过来,如果你"想在网页 UI 里保留对话"、"经常用图像生成或语音输入",或者"讨厌看账单",那么继续订阅网页对话才是正解。本文将从新手视角讲解网页对话与 API 的根本差异、token 与计价的原理、2026 年 5 月主要 API 的价格、模型选择方法、新手都会掉进去的三个陷阱,以及你的第一次调用。
网页对话的固定月费 vs API 的按量付费
—— 同样的 AI 模型,完全不同的成本结构和使用体验
轻度使用(每天 10 次调用)→ API 每月 1–2 美元。
重度使用(每天 10 万 token 的输入)→ API 每月 50–200 美元;这时网页对话的固定月费反而更划算。
1. ChatGPT 每月 20 美元 —— API 可能只要 2 美元(或者相反)
来算一笔具体的账。"每天 10 个短问题。"每次调用:输入 200 token + 输出 200 token(大致相当于 130–160 个英文单词)。用 Claude Sonnet 4.6(输入每百万 token 3 美元 / 输出 15 美元),一次调用花 0.0036 美元,一个月约 1.10 美元。这是 ChatGPT Plus 每月 20 美元的 1/18。
再来看反面。"每天分析一份 10 万 token 的文档。"用 Claude Opus 4.7(输入 5 美元 / 输出 25 美元),一次调用输入 10 万 + 输出 5K = 0.625 美元。每月 30 次 = 18.75 美元;100 次 = 62.50 美元。OpenAI 的 GPT-5.5 在输入超过 27.2 万 token 时输入价格翻倍,长上下文任务的花销跳得更猛。
大致分界线:"每月调用低于 200–300 次时,API 更便宜。"重度用户(每天大量调用、输入很长)通常用网页对话的固定月费反而更划算。这就是"固定月费"(网页对话)与"按量付费"(API)之间的根本张力。
2. 网页对话 vs API —— 五个具体差异
除了价格,网页对话和 API 在使用方式上也有根本差别。五个要点:
| 维度 | 网页对话(claude.ai / chatgpt.com) | API |
|---|---|---|
| 调用方式 | 浏览器内对话 | 从代码发出 HTTP 请求 |
| 计费方式 | 每月固定约 20 美元 | 按所用 token 计费 |
| 界面 | 完整功能(历史、附件、图像生成) | 需自行开发 |
| 会话管理 | 自动保留历史 | 每次请求都要自己重发历史 |
| 功能 | 语音、图像、Memory、Canvas 等 | 主要是文本/图像的文字指令 |
关键点:"API 不会记得对话历史。"在网页对话里,过去的对话会自动保留;走 API 时,每次请求都是独立的。如果你想要"记得上一轮"的效果,必须自己重发完整历史,token 消耗会迅速攀升。这是新手抱怨"API 比想象中贵"的头号原因。
另外,API 本质上是一个文本接口。网页对话的图像生成、语音输入、Code Interpreter、Canvas、Memory 等功能,在 API 上要么不存在,要么放在独立的端点。人们以为"ChatGPT 80% 的功能都在 API 里",但很快会发现实际只有 50–60%。
3. 什么是 Token?—— 最小的计价单位
要理解 API 的计价,你必须先理解 "token"。所有厂商的价格都写成 "每 100 万(1M)token 多少美元"。
读懂价格表的最低门槛
发送前估算 token 数,可用 OpenAI 的 tiktoken 库或 Anthropic 的 countTokens() 同类 API。
更多内容,请参阅 什么是 AI 上下文窗口。
4. 主要 API 价格 —— Claude vs GPT vs Gemini
2026 年 5 月主要模型的 API 价格(输入/输出,每 100 万 token)。价格每季度都会变动,决策前请先到厂商官方价格页面确认最新数值。
| 模型 | 输入 | 输出 | 备注 |
|---|---|---|---|
| Claude Opus 4.7 | 5 美元 | 25 美元 | 1M 统一价,质量顶尖 |
| Claude Sonnet 4.6 | 3 美元 | 15 美元 | 1M 统一价,性价比最佳 |
| Claude Haiku 4.5 | 1 美元 | 5 美元 | 轻量级,上限 200K |
| GPT-5.5 | 5 美元 | 30 美元 | 超过 272K 后输入加价 2 倍 |
| GPT-5.4 | 2.5 美元 | 15 美元 | 同样的长上下文加价 |
| Gemini 3.1 Pro | 2 美元 | 12 美元 | 2M 上下文,Batch API 价格减半 |
| Gemini 2.5 Flash-Lite | 0.10 美元 | 0.40 美元 | 大量调用场景的最低档 |
| DeepSeek V4-Pro | 0.55 美元 | 2.20 美元 | 开放权重,性价比顶级 |
仅从这张表就能看出:输出比输入贵 5–10 倍。每次调用都会同时产生输入和输出,所以输出量大的任务(总结、文章生成、代码生成)更贵。输出量小的任务(分类、短答)在 API 上跑起来非常便宜。
同样重要的还有"折扣机制":
- 提示缓存(Anthropic / OpenAI):复用同一个系统提示,从第二次调用起输入价格最多下降 90%
- Batch API(OpenAI / Google):异步批量在 24 小时内处理完,5 折优惠
- 缓存写入成本:Anthropic 缓存写入按 1.25 倍收费;读取是 0.1 倍
忽略这些机制,本可以付 1/3 到 1/5 价格的事情就只能按全价付。详见 AI token 与会话省钱方法。
5. 模型选择 —— 四类用途地图
"该选哪个模型?"是新手最大的疑问。截至 2026 年 5 月,分成四类能让决策简单很多。
按用途的选择地图
我个人的最佳实践:② 主力 + ③ 大量任务搭配。
复杂任务升级到 ①,机密数据走 ④。仅此一项就能在实战中让月度成本减半。
6. 每个新手都会掉进的三个计价陷阱
开始用 API 的头 3 个月里,几乎所有人都会撞上以下三个计价陷阱之一。逐个来看。
陷阱 ①:每次都重发整个对话历史
API 不会记住任何东西。为了营造"像聊天一样"的体验,你必须每次调用都重发完整的对话。放任不管的话,到第 10 轮时单次调用就要发超过 1 万个输入 token。解决办法:重发前先对旧对话做摘要,或者把话题切换当作新会话开启。
陷阱 ②:系统提示越写越长
"你是 X 领域的专家。""请遵守下面 20 条规则。""输出格式必须是……" —— 写一长串前置语是典型的新手做法。2000 token 的系统提示每天调用 100 次,单这一项每月就要花 30 美元。启用提示缓存,第二次以后的调用价格直降 90%。在代码里通常只是给某一块加上 cache_control: { type: "ephemeral" } 而已。
陷阱 ③:忘了设置费率/消费上限
新手最可怕的结局是:"代码有个 Bug 进入死循环,月底账单 500 美元。"预防方法是给每个 API key 设置消费上限(hard cap)。Anthropic Console 和 OpenAI Platform 都支持封顶月度消费;创建 key 时就设好。新手安全档位是 20–50 美元。
7. 你的第一次 API 调用 —— 5 分钟搞定 curl 与 Python
理论先放一边,下面是给 Anthropic Claude API 发送 "Hello" 的最小代码。
准备工作(3 步)
- 在 Anthropic Console 注册账号(或者用 OpenAI 的话去 platform.openai.com)
- 申请 API key(左侧菜单 "API Keys" → "Create Key")。只显示一次 —— 立刻保存
- 在 Settings 里把 Spending Limit 设到 20 美元左右(新手必做)
最小 curl 调用
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-4-6",
"max_tokens": 100,
"messages": [
{"role": "user", "content": "Hello from the AI API world"}
]
}'
会返回 JSON。AI 的回答在 content[0].text;消耗的 token 在 usage.input_tokens 和 usage.output_tokens 里。"这次实际用了多少 token?" —— 响应每次都会告诉你。
Python(推荐)
pip install anthropic
import os
from anthropic import Anthropic
client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=100,
messages=[
{"role": "user", "content": "Hello from the AI API world"}
]
)
print(response.content[0].text)
print(f"Used: input {response.usage.input_tokens} / output {response.usage.output_tokens}")
这段最小代码跑通之后,你就已经完成了一半。剩下的是对话历史管理、工具调用(function calling)和流式输出 —— 按顺序学下来,你就能搭出大多数 AI 应用了。另请参阅 新手能用 AI 做出应用吗?。
总结
回顾要点:
- 网页对话是固定月费,API 是按量付费。轻度使用(约每天 10 次)API 每月 1–2 美元;重度使用可能飙到每月 50–200 美元
- 五个差异:调用方式/计费/界面/会话/功能。API 不记忆历史,需要自己重发
- Token 是计价单位。英文约 0.75 词/token;输出比输入贵 5–10 倍
- 2026 年 5 月价格:Sonnet 3/15 美元、Opus 5/25 美元、GPT-5.5 5/30 美元、Gemini 3.1 Pro 2/12 美元(每 100 万 token)
- 用四类模型地图(高端/主力/轻量/开放)。② 主力 + ③ 轻量搭配是实战答案
- 三个计价陷阱:历史堆积/系统提示过长/没设消费上限。第一天就设好上限可以避开绝大多数
- 第一次调用:用 curl 或 Python,5 分钟就够。不要把 key 提交到 GitHub,先设消费上限 —— 就这些
网页对话订阅很方便,但当你想"把 AI 嵌入到自己的工具、自动化或工作流里"的那一刻,API 就成了真正的选项。一开始会觉得有门槛,不过先设一个低消费上限、跑上一两次,亲自感受每次调用约 0.01 美元,等到月底账单只有 1.50 美元时,你就悄悄地越过了从"使用 AI"到"用 AI 构建"的那条线。
常见问题
看使用情况。如果你每月调用 AI 约 200 次、几乎不用图像生成或语音,API 更便宜(每月 2–5 美元)。如果你每天用 10 次以上,或者依赖图像生成/Memory,那继续保留 Plus 更舒服。并行跑一个月,对比账单 —— 这是最稳妥的答案。
OpenAI 没有免费额度计划;Anthropic 注册时偶尔给约 5 美元的试用额度。Google AI Studio(Gemini)有真正的 Free Tier,可以在配额内免费试用 Gemini 2.5 Flash 等模型。"只想免费摸一下 API" → 从 Gemini AI Studio 开始。
需要基础的代码复制与执行能力。但因为一行 curl 或五行 Python 就能跑起来,"复制粘贴运行"的门槛很低。在 2026 年,让 Claude / ChatGPT 自己写一句"请用 Python 写 Anthropic API 的第一次调用,加上注释",几乎都能直接拿到可运行代码。
同样的模型,速度和网页对话差不多。打开流式输出后,响应就像网页对话里那种打字机效果。规模上来后可能撞到速率限制,不过限制会根据使用历史按层级提升(OpenAI 和 Anthropic 都有 Tier 计划)。
Claude Sonnet 4.6 或 Gemini 3.1 Pro。前者英文自然流畅且 1M 内统一定价;后者有免费额度,配合 Batch API 还能打 5 折。Opus / GPT-5.5 质量顶尖但更贵;轻量模型(Haiku / Flash-Lite)对刚学的人来说回答太简略可能会让人困惑。先定一个主力模型,按需求慢慢添加其他 —— 这是标准做法。