विषय-सूची
- 1. ChatGPT $20/महीना है — API शायद $2 हो (या इसका उल्टा)
- 2. वेब चैट बनाम API — पाँच ठोस अंतर
- 3. टोकन क्या है? — सबसे छोटी मूल्य-इकाई
- 4. प्रमुख API कीमतें — Claude बनाम GPT बनाम Gemini
- 5. मॉडल चयन — चार उपयोग-प्रकार का मानचित्र
- 6. हर शुरुआती जिन तीन कीमत-जालों में फँसता है
- 7. आपकी पहली API कॉल — 5 मिनट में curl और Python
- सारांश
- अक्सर पूछे जाने वाले प्रश्न
"मैं ChatGPT के लिए $20/महीना दे रहा हूँ — क्या सीधे API हिट करना सस्ता होगा?" यह सवाल AI शुरुआती अक्सर उठाते हैं। संक्षिप्त उत्तर: कभी हाँ, कभी इसका उल्टा। सीमा इस पर निर्भर करती है कि "आप महीने में AI को कितनी बार कॉल करते हैं" और "आपके इनपुट कितने लंबे हैं।"
उदाहरण के लिए, दिन में दस छोटे सवाल? API आपको $1–2/महीना पड़ेगा। लेकिन रोज़ 100K-टोकन का दस्तावेज़ विश्लेषण? API का बिल $50–200/महीना तक उछल जाता है। वेब चैट का फ्लैट शुल्क सुरक्षित है; हल्के उपयोग के लिए API नाटकीय रूप से सस्ता है — पर इस उलटाव को गलत समझो, और महीने के अंत के बिल पर अप्रिय आश्चर्य मिलेगा।
मेरा दृष्टिकोण पहले बता दूँ: "डेवलपर्स जो अपने ऐप्स में AI एम्बेड कर रहे हैं," "वे व्यक्ति जो ChatGPT/Claude सब्सक्रिप्शन छोड़कर AI का हल्का उपयोग करना चाहते हैं," और "जो कई मॉडलों की तुलना करना चाहते हैं" — इन तीन पैटर्नों को स्पष्ट रूप से API से लाभ होता है। इसके विपरीत, यदि आप "बातचीत वेब UI में रखना" चाहते हैं, "इमेज जनरेशन या वॉइस इनपुट अक्सर उपयोग करते हैं," या "बिल देखने से नफरत करते हैं," तो वेब चैट सब्सक्रिप्शन पर बने रहना सही उत्तर है। यह लेख वेब चैट और API के मूलभूत अंतर, टोकन और कीमत कैसे काम करते हैं, मई 2026 की प्रमुख API कीमतें, मॉडल कैसे चुनें, तीन शुरुआती जाल जिनमें सब फँसते हैं, और आपकी पहली कॉल — सब कुछ शुरुआती दृष्टिकोण से कवर करता है।
वेब चैट का फ्लैट शुल्क बनाम API का पे-एज़-यू-गो
— एक ही AI मॉडल, पूरी तरह अलग लागत संरचना और UX
हल्का उपयोग (10 कॉल/दिन) → API पर $1–2/महीना।
भारी उपयोग (रोज़ 100K-टोकन इनपुट) → API पर $50–200/महीना; वेब चैट का फ्लैट शुल्क सस्ता हो सकता है।
1. ChatGPT $20/महीना है — API शायद $2 हो (या इसका उल्टा)
ठोस गणित। "दिन में दस छोटे सवाल।" हर कॉल: 200 टोकन इन + 200 टोकन आउट (लगभग 130–160 अंग्रेज़ी शब्द)। Claude Sonnet 4.6 के साथ (इनपुट $3 / आउटपुट $15 प्रति 1M टोकन), एक कॉल की लागत $0.0036, मासिक ~$1.10। यह ChatGPT Plus के $20/महीने का 1/18 है।
अब इसका उल्टा। "रोज़ 100K-टोकन दस्तावेज़ का विश्लेषण।" Claude Opus 4.7 (इनपुट $5 / आउटपुट $25), 100K इनपुट + 5K आउटपुट के साथ एक कॉल = $0.625। 30 कॉल/महीना = $18.75; 100 = $62.50। OpenAI का GPT-5.5 272K टोकन से ऊपर इनपुट कीमत दोगुनी करता है, तो लंबे-संदर्भ कार्य और भी ज़ोर से उछलते हैं।
मोटी सीमा: "200–300 कॉल/महीना से कम पर, API सस्ता है।" भारी उपयोगकर्ता (बहुत दैनिक ट्रैफ़िक, लंबे इनपुट) अक्सर वेब चैट के फ्लैट शुल्क पर बेहतर पाते हैं। यही "फ्लैट" (वेब चैट) और "पे-एज़-यू-गो" (API) के बीच मूलभूत तनाव है।
2. वेब चैट बनाम API — पाँच ठोस अंतर
कीमत से परे, वेब चैट और API आप उन्हें कैसे उपयोग करते हैं, इसमें मूलभूत रूप से भिन्न हैं। पाँच बिंदु:
| आयाम | वेब चैट (claude.ai / chatgpt.com) | API |
|---|---|---|
| कैसे कॉल करते हैं | ब्राउज़र में चैट | आपके कोड से HTTP रिक्वेस्ट |
| बिलिंग | फ्लैट ~$20/महीना | उपयोग किए गए टोकन के अनुसार |
| UI | पूर्ण (इतिहास, अटैचमेंट, इमेज जनरेशन) | आप अपना बनाते हैं |
| सेशन प्रबंधन | स्वतः-संरक्षित इतिहास | हर रिक्वेस्ट पर आप पिछला इतिहास दोबारा भेजते हैं |
| फ़ीचर्स | वॉइस, इमेज, Memory, Canvas, आदि | मुख्यतः टेक्स्ट/इमेज टेक्स्ट-निर्देश |
मुख्य बात: "API बातचीत का इतिहास याद नहीं रखता।" वेब चैट में, पिछले बातचीत के टर्न स्वतः बने रहते हैं; API पर, हर रिक्वेस्ट स्वतंत्र है। यदि आप "पिछला टर्न याद रखें" व्यवहार चाहते हैं, तो आपको पूरा इतिहास खुद दोबारा भेजना होगा, जो जल्दी टोकन खर्च करता है। नए उपयोगकर्ताओं के "API अपेक्षा से अधिक महंगा था" कहने का यह #1 कारण है।
साथ ही, API मूलतः एक टेक्स्ट इंटरफ़ेस है। वेब-चैट फ़ीचर्स जैसे इमेज जनरेशन, वॉइस इनपुट, Code Interpreter, Canvas, और Memory या तो API पर मौजूद नहीं हैं या अलग एंडपॉइंट के पीछे रहते हैं। लोग मानते हैं कि "ChatGPT के 80% फ़ीचर्स API में हैं" पर एहसास होता है कि यह 50–60% के करीब है।
3. टोकन क्या है? — सबसे छोटी मूल्य-इकाई
API कीमत समझने के लिए, आपको "टोकन" समझना चाहिए। हर विक्रेता की कीमत "$X प्रति 1M (दस लाख) टोकन" के रूप में लिखी जाती है।
कीमत पढ़ने के लिए न्यूनतम आवश्यक
भेजने से पहले अनुमान लगाने के लिए, OpenAI की tiktoken लाइब्रेरी या Anthropic की countTokens()-तुल्य API का उपयोग करें।
अधिक के लिए, देखें AI कॉन्टेक्स्ट विंडो क्या है।
4. प्रमुख API कीमतें — Claude बनाम GPT बनाम Gemini
मई 2026 की प्रमुख मॉडलों के लिए API कीमतें (इनपुट / आउटपुट, प्रति 1M टोकन)। कीमत परिवर्तन तिमाही होते हैं, इसलिए निर्णय लेने से पहले विक्रेता के आधिकारिक मूल्य पृष्ठ पर नवीनतम सत्यापित करें।
| मॉडल | इनपुट | आउटपुट | नोट्स |
|---|---|---|---|
| Claude Opus 4.7 | $5 | $25 | फ्लैट 1M, शीर्ष गुणवत्ता |
| Claude Sonnet 4.6 | $3 | $15 | फ्लैट 1M, सर्वश्रेष्ठ मूल्य/प्रदर्शन |
| Claude Haiku 4.5 | $1 | $5 | हल्का, 200K सीमा |
| GPT-5.5 | $5 | $30 | 272K से ऊपर 2x इनपुट सरचार्ज |
| GPT-5.4 | $2.50 | $15 | वही लंबे-संदर्भ सरचार्ज |
| Gemini 3.1 Pro | $2 | $12 | 2M संदर्भ, Batch API आधा करता है |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | उच्च मात्रा के लिए न्यूनतम टियर |
| DeepSeek V4-Pro | $0.55 | $2.20 | ओपन-वेट, शीर्ष लागत/प्रदर्शन |
केवल तालिका से ही दिखता है: आउटपुट इनपुट से 5–10 गुना अधिक खर्च करता है। हर कॉल दोनों उत्पन्न करती है, इसलिए आउटपुट-भारी उपयोग (सारांश, लेख जनरेशन, कोड जनरेशन) में अधिक लागत आती है। आउटपुट-हल्के कार्य (वर्गीकरण, छोटे उत्तर) API पर बहुत सस्ते चलते हैं।
समान रूप से महत्वपूर्ण: "छूट तंत्र":
- प्रॉम्प्ट कैशिंग (Anthropic / OpenAI): वही सिस्टम प्रॉम्प्ट दोबारा उपयोग करें और दूसरी कॉल से इनपुट कीमत 90% तक गिर जाती है
- Batch API (OpenAI / Google): 24 घंटे के भीतर असिंक्रोनस बैच प्रसंस्करण, 50% छूट
- कैश राइट लागत: Anthropic कैश राइट के लिए 1.25x लेता है; रीड 0.1x हैं
इन्हें छोड़ें और आप पूरी कीमत देंगे जब आप 1/3 से 1/5 दे सकते थे। अधिक के लिए AI टोकन और सेशन लागत बचत देखें।
5. मॉडल चयन — चार उपयोग-प्रकार का मानचित्र
"मुझे कौन सा मॉडल चुनना चाहिए?" सबसे बड़ा शुरुआती सवाल है। मई 2026 तक, चार प्रकारों में विभाजित करना निर्णय सरल बनाता है।
उद्देश्य के अनुसार चयन मानचित्र
मेरी व्यक्तिगत श्रेष्ठ रणनीति: ② (मुख्य कार्यबल) + ③ (बल्क) जोड़ें।
जटिल कार्यों के लिए ① तक एस्केलेट करें, गोपनीय डेटा ④ के माध्यम से रूट करें। यह अकेले व्यवहार में मासिक लागत आधी कर देता है।
6. हर शुरुआती जिन तीन कीमत-जालों में फँसता है
API से शुरुआत करने के 3 महीनों के भीतर, लगभग हर कोई तीन में से एक कीमत-जाल में फँसता है। यहाँ वे हैं।
जाल ①: हर बार पूरा बातचीत इतिहास दोबारा भेजना
API याद नहीं रखता। "चैट जैसा लगे" व्यवहार बनाने के लिए, आपको हर कॉल पर पूरा वार्तालाप दोबारा भेजना होगा। इसे अप्रबंधित छोड़ें और 10वें टर्न तक आप प्रति कॉल 10,000+ इनपुट टोकन भेज रहे हैं। समाधान: दोबारा भेजने से पहले पुराने वार्तालाप का सारांश बनाएँ, या विषय परिवर्तन को नए सेशन के रूप में मानें।
जाल ②: सिस्टम प्रॉम्प्ट को फूला देना
"आप X में विशेषज्ञ हैं।" "इन 20 नियमों का पालन करें।" "आउटपुट प्रारूप होना चाहिए…" — एक लंबी प्रस्तावना क्लासिक शुरुआती सामग्री है। दिन में 100 बार कॉल किया गया 2,000-टोकन सिस्टम प्रॉम्प्ट अकेले $30/महीना खर्च करता है। प्रॉम्प्ट कैशिंग सक्षम करें और दूसरी और आगे की कॉलें 90% गिरती हैं। कोड में, अक्सर एक ब्लॉक पर cache_control: { type: "ephemeral" } जोड़ना ही होता है।
जाल ③: रेट / खर्च सीमा सेट करना भूल जाना
सबसे डरावना शुरुआती परिणाम: "एक बग कोड को अनंत लूप में डालता है और महीने के अंत का बिल $500 है।" इसे प्रति-कुंजी खर्च सीमा (हार्ड कैप) सेट करके रोकें। Anthropic Console और OpenAI Platform दोनों आपको मासिक खर्च कैप करने देते हैं; कुंजी बनाते समय यह सेट करें। शुरुआती लोगों के लिए, $20–50 एक सुरक्षित कैप है।
7. आपकी पहली API कॉल — 5 मिनट में curl और Python
सिद्धांत एक तरफ, यहाँ Anthropic के Claude API को "Hello" भेजने का न्यूनतम कोड है।
सेटअप (3 चरण)
- Anthropic Console पर अकाउंट बनाएँ (या OpenAI के लिए platform.openai.com)
- API कुंजी जारी करें (बायाँ मेनू "API Keys" → "Create Key")। केवल एक बार दिखाया गया — अभी सहेजें
- Settings में, लगभग $20 की Spending Limit सेट करें (शुरुआती लोगों के लिए अनिवार्य)
न्यूनतम curl कॉल
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-4-6",
"max_tokens": 100,
"messages": [
{"role": "user", "content": "Hello from the AI API world"}
]
}'
आपको JSON वापस मिलता है। AI का उत्तर content[0].text पर है; खपत किए गए टोकन usage.input_tokens और usage.output_tokens पर हैं। "यह वास्तव में कितने टोकन ने उपयोग किए?" — वह उत्तर आपको हर बार बताता है।
Python (अनुशंसित)
pip install anthropic
import os
from anthropic import Anthropic
client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=100,
messages=[
{"role": "user", "content": "Hello from the AI API world"}
]
)
print(response.content[0].text)
print(f"Used: input {response.usage.input_tokens} / output {response.usage.output_tokens}")
एक बार यह न्यूनतम कोड काम करता है, आप पहले से ही आधे रास्ते पर हैं। बाकी बातचीत इतिहास प्रबंधन, टूल उपयोग (फ़ंक्शन कॉलिंग), और स्ट्रीमिंग है — उन्हें क्रम में सीखें और आप अधिकांश AI ऐप्स बना सकते हैं। यह भी देखें क्या शुरुआती AI के साथ ऐप्स बना सकते हैं?।
सारांश
पुनरावलोकन:
- वेब चैट फ्लैट-शुल्क है, API पे-एज़-यू-गो है। हल्का उपयोग (~10/दिन) API पर $1–2/महीना है; भारी उपयोग $50–200/महीना तक पहुँच सकता है
- पाँच अंतर: आह्वान / बिलिंग / UI / सेशन / फ़ीचर्स। API इतिहास याद नहीं रखता, इसलिए आप उसे खुद दोबारा भेजते हैं
- टोकन मूल्य इकाई हैं। प्रति टोकन ~0.75 अंग्रेज़ी शब्द; आउटपुट इनपुट से 5–10 गुना खर्च करता है
- मई 2026 कीमतें: Sonnet $3/$15, Opus $5/$25, GPT-5.5 $5/$30, Gemini 3.1 Pro $2/$12 (प्रति 1M टोकन)
- एक 4-प्रकार मॉडल मानचित्र उपयोग करें (प्रीमियम / कार्यबल / हल्का / ओपन)। ② कार्यबल + ③ हल्का जोड़ना व्यावहारिक उत्तर है
- तीन कीमत जाल: इतिहास संचय / अति-आकारित सिस्टम प्रॉम्प्ट / गायब खर्च सीमा। पहले दिन सीमा सेट करना अधिकांश को रोकता है
- पहली कॉल: curl या Python के साथ 5 मिनट। कुंजियाँ GitHub पर कमिट न करें और पहले खर्च सीमा सेट करें — बस इतना
वेब चैट सब्सक्रिप्शन सुविधाजनक हैं, लेकिन जिस क्षण आप सोचते हैं "मैं AI को अपने टूल, ऑटोमेशन, या वर्कफ़्लो में एम्बेड करना चाहता हूँ," API एक वास्तविक विकल्प बन जाता है। पहले डरावना लगता है, लेकिन कम खर्च सीमा सेट करें, इसे एक-दो बार चलाएँ, और महसूस करें कि हर कॉल लगभग $0.01 खर्च करती है। जब महीने के अंत का बिल $1.50 आता है, तो आप चुपचाप उस रेखा को पार कर जाते हैं जहाँ AI उस चीज़ से बदलता है जिसे आप "उपयोग करते हैं" उस चीज़ में जिसके साथ आप "निर्माण करते हैं।"
अक्सर पूछे जाने वाले प्रश्न
उपयोग पर निर्भर। यदि आप AI को महीने में ~200 बार कॉल करते हैं और इमेज जनरेशन या वॉइस फ़ीचर्स कम उपयोग करते हैं, तो API सस्ता है ($2–5/महीना)। यदि आप दिन में 10+ बार उपयोग करते हैं या इमेज जनरेशन / Memory पर निर्भर हैं, सुविधा के लिए Plus रखें। एक महीने दोनों समानांतर चलाएँ और बिलों की तुलना करें — यह सबसे निश्चित उत्तर है।
OpenAI के पास मुफ़्त क्रेडिट कार्यक्रम नहीं है; Anthropic कभी-कभी साइनअप पर ~$5 ट्रायल क्रेडिट देता है। Google AI Studio (Gemini) में एक वास्तविक Free Tier है जहाँ आप सीमाओं के भीतर Gemini 2.5 Flash और समान मॉडलों को मुफ़्त में आज़मा सकते हैं। "बस API को मुफ़्त में छूना है" → Gemini AI Studio से शुरू करें।
कुछ कोड कॉपी और चलाने की बुनियादी क्षमता आवश्यक है। पर चूँकि यह curl की एक पंक्ति या Python की पाँच पंक्तियों में काम करता है, "कॉपी करो और चलाओ" के लिए बार कम है। 2026 में, Claude / ChatGPT से ही पूछना "मुझे टिप्पणियों के साथ Python में पहली Anthropic API कॉल लिखो" लगभग हमेशा काम करने वाला कोड लौटाता है।
समान मॉडल के लिए वेब चैट के लगभग समान गति। स्ट्रीमिंग चालू करने पर, उत्तर वेब चैट में दिखने वाले टाइपराइटर प्रभाव जैसा महसूस होता है। बड़े पैमाने पर, आप रेट सीमाओं से टकरा सकते हैं, पर ये उपयोग इतिहास के आधार पर टियर अप करते हैं (OpenAI और Anthropic दोनों के पास Tier कार्यक्रम हैं)।
Claude Sonnet 4.6 या Gemini 3.1 Pro। पहला प्राकृतिक अंग्रेज़ी और फ्लैट 1M कीमत देता है; दूसरे के पास मुफ़्त टियर और Batch API के माध्यम से 50% छूट है। Opus / GPT-5.5 शीर्ष-गुणवत्ता हैं पर महंगे; हल्के मॉडल (Haiku / Flash-Lite) पहली बार सीखने वालों के लिए भ्रामक रूप से संक्षिप्त हो सकते हैं। एक मुख्य मॉडल पिन करें, ज़रूरतें आने पर अन्य जोड़ें — यह मानक रणनीति है।