AI API क्या है? कीमत और टोकन की शुरुआती गाइड

AI API क्या है? — कीमत, टोकन, मॉडल चयन और वेब चैट से अंतर की शुरुआती गाइड

विषय-सूची

1. ChatGPT $20/महीना है — API शायद $2 हो (या इसका उल्टा)
2. वेब चैट बनाम API — पाँच ठोस अंतर
3. टोकन क्या है? — सबसे छोटी मूल्य-इकाई
4. प्रमुख API कीमतें — Claude बनाम GPT बनाम Gemini
5. मॉडल चयन — चार उपयोग-प्रकार का मानचित्र
6. हर शुरुआती जिन तीन कीमत-जालों में फँसता है
7. आपकी पहली API कॉल — 5 मिनट में curl और Python
सारांश
अक्सर पूछे जाने वाले प्रश्न

"मैं ChatGPT के लिए $20/महीना दे रहा हूँ — क्या सीधे API हिट करना सस्ता होगा?" यह सवाल AI शुरुआती अक्सर उठाते हैं। संक्षिप्त उत्तर: कभी हाँ, कभी इसका उल्टा। सीमा इस पर निर्भर करती है कि "आप महीने में AI को कितनी बार कॉल करते हैं" और "आपके इनपुट कितने लंबे हैं।"

उदाहरण के लिए, दिन में दस छोटे सवाल? API आपको $1–2/महीना पड़ेगा। लेकिन रोज़ 100K-टोकन का दस्तावेज़ विश्लेषण? API का बिल $50–200/महीना तक उछल जाता है। वेब चैट का फ्लैट शुल्क सुरक्षित है; हल्के उपयोग के लिए API नाटकीय रूप से सस्ता है — पर इस उलटाव को गलत समझो, और महीने के अंत के बिल पर अप्रिय आश्चर्य मिलेगा।

मेरा दृष्टिकोण पहले बता दूँ: "डेवलपर्स जो अपने ऐप्स में AI एम्बेड कर रहे हैं," "वे व्यक्ति जो ChatGPT/Claude सब्सक्रिप्शन छोड़कर AI का हल्का उपयोग करना चाहते हैं," और "जो कई मॉडलों की तुलना करना चाहते हैं" — इन तीन पैटर्नों को स्पष्ट रूप से API से लाभ होता है। इसके विपरीत, यदि आप "बातचीत वेब UI में रखना" चाहते हैं, "इमेज जनरेशन या वॉइस इनपुट अक्सर उपयोग करते हैं," या "बिल देखने से नफरत करते हैं," तो वेब चैट सब्सक्रिप्शन पर बने रहना सही उत्तर है। यह लेख वेब चैट और API के मूलभूत अंतर, टोकन और कीमत कैसे काम करते हैं, मई 2026 की प्रमुख API कीमतें, मॉडल कैसे चुनें, तीन शुरुआती जाल जिनमें सब फँसते हैं, और आपकी पहली कॉल — सब कुछ शुरुआती दृष्टिकोण से कवर करता है।

AI API · मई 2026

वेब चैट का फ्लैट शुल्क बनाम API का पे-एज़-यू-गो

— एक ही AI मॉडल, पूरी तरह अलग लागत संरचना और UX

वेब चैट

फ्लैट $20/महीना

पूर्ण UI, इमेज-तैयार

"बस AI का उपयोग करना है" उपयोगकर्ताओं के लिए

API

$0.005–$0.05 प्रति कॉल

प्रोग्रामेटिक एक्सेस

ऑटोमेशन / ऐप इंटीग्रेशन के लिए

हल्का उपयोग (10 कॉल/दिन) → API पर $1–2/महीना।
भारी उपयोग (रोज़ 100K-टोकन इनपुट) → API पर $50–200/महीना; वेब चैट का फ्लैट शुल्क सस्ता हो सकता है।

1. ChatGPT $20/महीना है — API शायद $2 हो (या इसका उल्टा)

ठोस गणित। "दिन में दस छोटे सवाल।" हर कॉल: 200 टोकन इन + 200 टोकन आउट (लगभग 130–160 अंग्रेज़ी शब्द)। Claude Sonnet 4.6 के साथ (इनपुट $3 / आउटपुट $15 प्रति 1M टोकन), एक कॉल की लागत $0.0036, मासिक ~$1.10। यह ChatGPT Plus के $20/महीने का 1/18 है।

अब इसका उल्टा। "रोज़ 100K-टोकन दस्तावेज़ का विश्लेषण।" Claude Opus 4.7 (इनपुट $5 / आउटपुट $25), 100K इनपुट + 5K आउटपुट के साथ एक कॉल = $0.625। 30 कॉल/महीना = $18.75; 100 = $62.50। OpenAI का GPT-5.5 272K टोकन से ऊपर इनपुट कीमत दोगुनी करता है, तो लंबे-संदर्भ कार्य और भी ज़ोर से उछलते हैं।

मोटी सीमा: "200–300 कॉल/महीना से कम पर, API सस्ता है।" भारी उपयोगकर्ता (बहुत दैनिक ट्रैफ़िक, लंबे इनपुट) अक्सर वेब चैट के फ्लैट शुल्क पर बेहतर पाते हैं। यही "फ्लैट" (वेब चैट) और "पे-एज़-यू-गो" (API) के बीच मूलभूत तनाव है।

2. वेब चैट बनाम API — पाँच ठोस अंतर

कीमत से परे, वेब चैट और API आप उन्हें कैसे उपयोग करते हैं, इसमें मूलभूत रूप से भिन्न हैं। पाँच बिंदु:

आयाम	वेब चैट (claude.ai / chatgpt.com)	API
कैसे कॉल करते हैं	ब्राउज़र में चैट	आपके कोड से HTTP रिक्वेस्ट
बिलिंग	फ्लैट ~$20/महीना	उपयोग किए गए टोकन के अनुसार
UI	पूर्ण (इतिहास, अटैचमेंट, इमेज जनरेशन)	आप अपना बनाते हैं
सेशन प्रबंधन	स्वतः-संरक्षित इतिहास	हर रिक्वेस्ट पर आप पिछला इतिहास दोबारा भेजते हैं
फ़ीचर्स	वॉइस, इमेज, Memory, Canvas, आदि	मुख्यतः टेक्स्ट/इमेज टेक्स्ट-निर्देश

मुख्य बात: "API बातचीत का इतिहास याद नहीं रखता।" वेब चैट में, पिछले बातचीत के टर्न स्वतः बने रहते हैं; API पर, हर रिक्वेस्ट स्वतंत्र है। यदि आप "पिछला टर्न याद रखें" व्यवहार चाहते हैं, तो आपको पूरा इतिहास खुद दोबारा भेजना होगा, जो जल्दी टोकन खर्च करता है। नए उपयोगकर्ताओं के "API अपेक्षा से अधिक महंगा था" कहने का यह #1 कारण है।

साथ ही, API मूलतः एक टेक्स्ट इंटरफ़ेस है। वेब-चैट फ़ीचर्स जैसे इमेज जनरेशन, वॉइस इनपुट, Code Interpreter, Canvas, और Memory या तो API पर मौजूद नहीं हैं या अलग एंडपॉइंट के पीछे रहते हैं। लोग मानते हैं कि "ChatGPT के 80% फ़ीचर्स API में हैं" पर एहसास होता है कि यह 50–60% के करीब है।

3. टोकन क्या है? — सबसे छोटी मूल्य-इकाई

API कीमत समझने के लिए, आपको "टोकन" समझना चाहिए। हर विक्रेता की कीमत "$X प्रति 1M (दस लाख) टोकन" के रूप में लिखी जाती है।

टोकन की मूल बातें × 3

कीमत पढ़ने के लिए न्यूनतम आवश्यक

① 1 टोकन कितना है?

प्रति टोकन ~0.75 अंग्रेज़ी शब्द; CJK ~1–1.5 टोकन प्रति वर्ण। "Hello there" लगभग 3 टोकन है। कोड इंडेंटेशन और प्रतीकों से फूल जाता है।

② इनपुट बनाम आउटपुट कीमतें अलग हैं

आउटपुट इनपुट से 5–10 गुना अधिक महंगा है। Claude Sonnet 4.6 $3 इनपुट / $15 आउटपुट है — 5x अनुपात। केवल "संक्षेप में उत्तर दें" निर्देश देकर असली पैसे बचते हैं।

③ सिस्टम प्रॉम्प्ट की भी कीमत है

"आप X में विशेषज्ञ हैं" प्रस्तावना हर कॉल पर टोकन खपत करती है। लंबे सिस्टम प्रॉम्प्ट बिल बढ़ाते हैं। प्रॉम्प्ट कैशिंग मदद करती है (नीचे देखें)।

भेजने से पहले अनुमान लगाने के लिए, OpenAI की tiktoken लाइब्रेरी या Anthropic की countTokens()-तुल्य API का उपयोग करें।
अधिक के लिए, देखें AI कॉन्टेक्स्ट विंडो क्या है।

4. प्रमुख API कीमतें — Claude बनाम GPT बनाम Gemini

मई 2026 की प्रमुख मॉडलों के लिए API कीमतें (इनपुट / आउटपुट, प्रति 1M टोकन)। कीमत परिवर्तन तिमाही होते हैं, इसलिए निर्णय लेने से पहले विक्रेता के आधिकारिक मूल्य पृष्ठ पर नवीनतम सत्यापित करें।

मॉडल	इनपुट	आउटपुट	नोट्स
Claude Opus 4.7	$5	$25	फ्लैट 1M, शीर्ष गुणवत्ता
Claude Sonnet 4.6	$3	$15	फ्लैट 1M, सर्वश्रेष्ठ मूल्य/प्रदर्शन
Claude Haiku 4.5	$1	$5	हल्का, 200K सीमा
GPT-5.5	$5	$30	272K से ऊपर 2x इनपुट सरचार्ज
GPT-5.4	$2.50	$15	वही लंबे-संदर्भ सरचार्ज
Gemini 3.1 Pro	$2	$12	2M संदर्भ, Batch API आधा करता है
Gemini 2.5 Flash-Lite	$0.10	$0.40	उच्च मात्रा के लिए न्यूनतम टियर
DeepSeek V4-Pro	$0.55	$2.20	ओपन-वेट, शीर्ष लागत/प्रदर्शन

केवल तालिका से ही दिखता है: आउटपुट इनपुट से 5–10 गुना अधिक खर्च करता है। हर कॉल दोनों उत्पन्न करती है, इसलिए आउटपुट-भारी उपयोग (सारांश, लेख जनरेशन, कोड जनरेशन) में अधिक लागत आती है। आउटपुट-हल्के कार्य (वर्गीकरण, छोटे उत्तर) API पर बहुत सस्ते चलते हैं।

समान रूप से महत्वपूर्ण: "छूट तंत्र":

प्रॉम्प्ट कैशिंग (Anthropic / OpenAI): वही सिस्टम प्रॉम्प्ट दोबारा उपयोग करें और दूसरी कॉल से इनपुट कीमत 90% तक गिर जाती है
Batch API (OpenAI / Google): 24 घंटे के भीतर असिंक्रोनस बैच प्रसंस्करण, 50% छूट
कैश राइट लागत: Anthropic कैश राइट के लिए 1.25x लेता है; रीड 0.1x हैं

इन्हें छोड़ें और आप पूरी कीमत देंगे जब आप 1/3 से 1/5 दे सकते थे। अधिक के लिए AI टोकन और सेशन लागत बचत देखें।

5. मॉडल चयन — चार उपयोग-प्रकार का मानचित्र

"मुझे कौन सा मॉडल चुनना चाहिए?" सबसे बड़ा शुरुआती सवाल है। मई 2026 तक, चार प्रकारों में विभाजित करना निर्णय सरल बनाता है।

4 उपयोग-प्रकार × अनुशंसित मॉडल

उद्देश्य के अनुसार चयन मानचित्र

① प्रीमियम / जटिल कार्य

→ Claude Opus 4.7 / GPT-5.5

जटिल तर्क, कोड समीक्षा, लंबे-दस्तावेज़ विश्लेषण। गुणवत्ता पहले। Opus की सूक्ष्मता में बढ़त; GPT-5.5 की कठोर तर्क में।

② सर्वश्रेष्ठ मूल्य/प्रदर्शन — मुख्य कार्यबल

→ Claude Sonnet 4.6 / GPT-5.4 / Gemini 3.1 Pro

आपका दैनिक-ड्राइवर मॉडल। गुणवत्ता और कीमत का संतुलन। Sonnet 1M पर फ्लैट-रेट करता है; Gemini Batch API के साथ आधा।

③ बल्क / हल्के कार्य

→ Claude Haiku 4.5 / Gemini 2.5 Flash-Lite

वर्गीकरण, निष्कर्षण, सरल प्रश्नोत्तर, सारांश। इनपुट $0.10–$1 — नाटकीय रूप से सस्ता। बैच प्रसंस्करण और नियमित कार्यों के लिए आदर्श।

④ ओपन-वेट / लोकल

→ DeepSeek V4-Pro / Llama 4 आदि

रॉक-बॉटम कीमतें ($0.55 / $2.20), या अपने GPU पर पूर्णतः मुफ़्त। गोपनीयता / लागत संपीड़न लक्ष्य के रूप में। गुणवत्ता ② के बराबर या थोड़ी नीचे।

मेरी व्यक्तिगत श्रेष्ठ रणनीति: ② (मुख्य कार्यबल) + ③ (बल्क) जोड़ें।
जटिल कार्यों के लिए ① तक एस्केलेट करें, गोपनीय डेटा ④ के माध्यम से रूट करें। यह अकेले व्यवहार में मासिक लागत आधी कर देता है।

6. हर शुरुआती जिन तीन कीमत-जालों में फँसता है

API से शुरुआत करने के 3 महीनों के भीतर, लगभग हर कोई तीन में से एक कीमत-जाल में फँसता है। यहाँ वे हैं।

जाल ①: हर बार पूरा बातचीत इतिहास दोबारा भेजना

API याद नहीं रखता। "चैट जैसा लगे" व्यवहार बनाने के लिए, आपको हर कॉल पर पूरा वार्तालाप दोबारा भेजना होगा। इसे अप्रबंधित छोड़ें और 10वें टर्न तक आप प्रति कॉल 10,000+ इनपुट टोकन भेज रहे हैं। समाधान: दोबारा भेजने से पहले पुराने वार्तालाप का सारांश बनाएँ, या विषय परिवर्तन को नए सेशन के रूप में मानें।

जाल ②: सिस्टम प्रॉम्प्ट को फूला देना

"आप X में विशेषज्ञ हैं।" "इन 20 नियमों का पालन करें।" "आउटपुट प्रारूप होना चाहिए…" — एक लंबी प्रस्तावना क्लासिक शुरुआती सामग्री है। दिन में 100 बार कॉल किया गया 2,000-टोकन सिस्टम प्रॉम्प्ट अकेले $30/महीना खर्च करता है। प्रॉम्प्ट कैशिंग सक्षम करें और दूसरी और आगे की कॉलें 90% गिरती हैं। कोड में, अक्सर एक ब्लॉक पर cache_control: { type: "ephemeral" } जोड़ना ही होता है।

जाल ③: रेट / खर्च सीमा सेट करना भूल जाना

सबसे डरावना शुरुआती परिणाम: "एक बग कोड को अनंत लूप में डालता है और महीने के अंत का बिल $500 है।" इसे प्रति-कुंजी खर्च सीमा (हार्ड कैप) सेट करके रोकें। Anthropic Console और OpenAI Platform दोनों आपको मासिक खर्च कैप करने देते हैं; कुंजी बनाते समय यह सेट करें। शुरुआती लोगों के लिए, $20–50 एक सुरक्षित कैप है।

सबसे महत्वपूर्ण: API कुंजी को GitHub या किसी सार्वजनिक स्थान पर कभी कमिट न करें। बॉट लीक हुई कुंजियों को सेकंडों में स्क्रैप करते हैं और घंटों के भीतर सैकड़ों डॉलर का अनधिकृत उपयोग कर लेते हैं। कुंजियों को एनवायरनमेंट वेरिएबल्स (.env) में रखें और .gitignore में जोड़ें, या Secret Manager का उपयोग करें।

7. आपकी पहली API कॉल — 5 मिनट में curl और Python

सिद्धांत एक तरफ, यहाँ Anthropic के Claude API को "Hello" भेजने का न्यूनतम कोड है।

सेटअप (3 चरण)

Anthropic Console पर अकाउंट बनाएँ (या OpenAI के लिए platform.openai.com)
API कुंजी जारी करें (बायाँ मेनू "API Keys" → "Create Key")। केवल एक बार दिखाया गया — अभी सहेजें
Settings में, लगभग $20 की Spending Limit सेट करें (शुरुआती लोगों के लिए अनिवार्य)

न्यूनतम curl कॉल

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-4-6",
    "max_tokens": 100,
    "messages": [
      {"role": "user", "content": "Hello from the AI API world"}
    ]
  }'

आपको JSON वापस मिलता है। AI का उत्तर content[0].text पर है; खपत किए गए टोकन usage.input_tokens और usage.output_tokens पर हैं। "यह वास्तव में कितने टोकन ने उपयोग किए?" — वह उत्तर आपको हर बार बताता है।

Python (अनुशंसित)

pip install anthropic

import os
from anthropic import Anthropic

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=100,
    messages=[
        {"role": "user", "content": "Hello from the AI API world"}
    ]
)

print(response.content[0].text)
print(f"Used: input {response.usage.input_tokens} / output {response.usage.output_tokens}")

एक बार यह न्यूनतम कोड काम करता है, आप पहले से ही आधे रास्ते पर हैं। बाकी बातचीत इतिहास प्रबंधन, टूल उपयोग (फ़ंक्शन कॉलिंग), और स्ट्रीमिंग है — उन्हें क्रम में सीखें और आप अधिकांश AI ऐप्स बना सकते हैं। यह भी देखें क्या शुरुआती AI के साथ ऐप्स बना सकते हैं?।

सारांश

पुनरावलोकन:

वेब चैट फ्लैट-शुल्क है, API पे-एज़-यू-गो है। हल्का उपयोग (~10/दिन) API पर $1–2/महीना है; भारी उपयोग $50–200/महीना तक पहुँच सकता है
पाँच अंतर: आह्वान / बिलिंग / UI / सेशन / फ़ीचर्स। API इतिहास याद नहीं रखता, इसलिए आप उसे खुद दोबारा भेजते हैं
टोकन मूल्य इकाई हैं। प्रति टोकन ~0.75 अंग्रेज़ी शब्द; आउटपुट इनपुट से 5–10 गुना खर्च करता है
मई 2026 कीमतें: Sonnet $3/$15, Opus $5/$25, GPT-5.5 $5/$30, Gemini 3.1 Pro $2/$12 (प्रति 1M टोकन)
एक 4-प्रकार मॉडल मानचित्र उपयोग करें (प्रीमियम / कार्यबल / हल्का / ओपन)। ② कार्यबल + ③ हल्का जोड़ना व्यावहारिक उत्तर है
तीन कीमत जाल: इतिहास संचय / अति-आकारित सिस्टम प्रॉम्प्ट / गायब खर्च सीमा। पहले दिन सीमा सेट करना अधिकांश को रोकता है
पहली कॉल: curl या Python के साथ 5 मिनट। कुंजियाँ GitHub पर कमिट न करें और पहले खर्च सीमा सेट करें — बस इतना

वेब चैट सब्सक्रिप्शन सुविधाजनक हैं, लेकिन जिस क्षण आप सोचते हैं "मैं AI को अपने टूल, ऑटोमेशन, या वर्कफ़्लो में एम्बेड करना चाहता हूँ," API एक वास्तविक विकल्प बन जाता है। पहले डरावना लगता है, लेकिन कम खर्च सीमा सेट करें, इसे एक-दो बार चलाएँ, और महसूस करें कि हर कॉल लगभग $0.01 खर्च करती है। जब महीने के अंत का बिल $1.50 आता है, तो आप चुपचाप उस रेखा को पार कर जाते हैं जहाँ AI उस चीज़ से बदलता है जिसे आप "उपयोग करते हैं" उस चीज़ में जिसके साथ आप "निर्माण करते हैं।"

अक्सर पूछे जाने वाले प्रश्न

Q1. क्या मुझे ChatGPT Plus रद्द करके API पर स्विच करना चाहिए?

उपयोग पर निर्भर। यदि आप AI को महीने में ~200 बार कॉल करते हैं और इमेज जनरेशन या वॉइस फ़ीचर्स कम उपयोग करते हैं, तो API सस्ता है ($2–5/महीना)। यदि आप दिन में 10+ बार उपयोग करते हैं या इमेज जनरेशन / Memory पर निर्भर हैं, सुविधा के लिए Plus रखें। एक महीने दोनों समानांतर चलाएँ और बिलों की तुलना करें — यह सबसे निश्चित उत्तर है।

Q2. क्या मैं क्रेडिट कार्ड के बिना कोशिश कर सकता हूँ?

OpenAI के पास मुफ़्त क्रेडिट कार्यक्रम नहीं है; Anthropic कभी-कभी साइनअप पर ~$5 ट्रायल क्रेडिट देता है। Google AI Studio (Gemini) में एक वास्तविक Free Tier है जहाँ आप सीमाओं के भीतर Gemini 2.5 Flash और समान मॉडलों को मुफ़्त में आज़मा सकते हैं। "बस API को मुफ़्त में छूना है" → Gemini AI Studio से शुरू करें।

Q3. क्या मैं बिना प्रोग्रामिंग ज्ञान के API उपयोग कर सकता हूँ?

कुछ कोड कॉपी और चलाने की बुनियादी क्षमता आवश्यक है। पर चूँकि यह curl की एक पंक्ति या Python की पाँच पंक्तियों में काम करता है, "कॉपी करो और चलाओ" के लिए बार कम है। 2026 में, Claude / ChatGPT से ही पूछना "मुझे टिप्पणियों के साथ Python में पहली Anthropic API कॉल लिखो" लगभग हमेशा काम करने वाला कोड लौटाता है।

Q4. क्या API धीमा है?

समान मॉडल के लिए वेब चैट के लगभग समान गति। स्ट्रीमिंग चालू करने पर, उत्तर वेब चैट में दिखने वाले टाइपराइटर प्रभाव जैसा महसूस होता है। बड़े पैमाने पर, आप रेट सीमाओं से टकरा सकते हैं, पर ये उपयोग इतिहास के आधार पर टियर अप करते हैं (OpenAI और Anthropic दोनों के पास Tier कार्यक्रम हैं)।

Q5. मुझे किस मॉडल से शुरू करना चाहिए?

Claude Sonnet 4.6 या Gemini 3.1 Pro। पहला प्राकृतिक अंग्रेज़ी और फ्लैट 1M कीमत देता है; दूसरे के पास मुफ़्त टियर और Batch API के माध्यम से 50% छूट है। Opus / GPT-5.5 शीर्ष-गुणवत्ता हैं पर महंगे; हल्के मॉडल (Haiku / Flash-Lite) पहली बार सीखने वालों के लिए भ्रामक रूप से संक्षिप्त हो सकते हैं। एक मुख्य मॉडल पिन करें, ज़रूरतें आने पर अन्य जोड़ें — यह मानक रणनीति है।

AI API क्या है? — कीमत, टोकन, मॉडल चयन और वेब चैट से अंतर की शुरुआती गाइड