सामग्री पर जाएँ
विषय

सुरक्षा और गवर्नेंस

AI टूल्स के सुरक्षा जोखिम, प्रॉम्प्ट डेटा लीकेज, AI एजेंट सेफ्टी और गवर्नेंस बेस्ट प्रैक्टिस।

10 लेख

लेखों को क्रमबद्ध करें

ChatGPT और Claude account को ban होने से कैसे बचाएँ (OpenAI / Anthropic)

ChatGPT और Claude account को ban होने से कैसे बचाएँ (OpenAI / Anthropic)

एक दिन अचानक आपका ChatGPT या Claude account काम करना बंद कर देता है: 2026 में account निलंबन (ban) और चेतावनियों की रिपोर्टें बढ़ रही हैं, और डरावनी बात यह है कि बिना किसी बुरे इरादे के भी, गलती से नियम तोड़ने पर आप ban हो सकते हैं। यह लेख OpenAI (ChatGPT, Codex) और Anthropic (Claude, Claude Code) पर अपना account न खोने के लिए जानने योग्य बातों को प्रकाशित usage policies और रिपोर्टों के आधार पर व्यवस्थित करता है। दोनों में आम पाँच triggers: प्रतिबंधित content / jailbreak, अनधिकृत automation / scraping, account/API keys साझा या बेचना, संदिग्ध access patterns, और payment में बेमेल/धोखाधड़ी। 2026 का सबसे बड़ा जाल: निजी-plan (Free/Pro/Max) के OAuth tokens को Agent SDK जैसे harnesses समेत आधिकारिक app के अलावा कहीं इस्तेमाल करना Consumer ToS उल्लंघन है। सही तरीका है apps/agents को API (pay-as-you-go) से चलाना। साथ में 7-बिंदु बचाव checklist और appeals की जानकारी।

AI guardrails क्या हैं? Prompt injection से बचाव और input/output सुरक्षा — शुरुआती गाइड

AI guardrails क्या हैं? Prompt injection से बचाव और input/output सुरक्षा — शुरुआती गाइड

जब आप AI ऐप्स बनाना सीख जाते हैं, तो अगला चरण उन्हें सुरक्षित रूप से चलाना है। LLMs को दुर्भावनापूर्ण input से धोखा दिया जा सकता है, वे गोपनीय डेटा लीक कर सकते हैं, या आत्मविश्वास के साथ बेतुकी बातें ठोक सकते हैं; इसे रोकने वाला सुरक्षा तंत्र ही AI guardrails है, जो 2026 में AI agent की घटनाओं के असल में होने के साथ production का अनिवार्य हिस्सा बन चुका है। guardrails वे नियम और फ़िल्टर हैं जो खतरनाक input और अवांछित output को रोकते हैं, user input को LLM तक पहुँचने से पहले और जवाब को वापस लौटने से पहले जाँचते हैं — model से अलग एक स्वतंत्र सुरक्षा परत। मुख्य खतरे हैं prompt injection (सबसे बड़ा), jailbreak, डेटा लीक (गोपनीय डेटा, PII, system prompt), और hallucination या हानिकारक output। सुरक्षा दो परतों पर काम करती है: input guardrails (injection और jailbreak का पता लगाना, PII पहचानना/mask करना, विषय सीमित करना, sanitize करना) और output guardrails (हानिकारक सामग्री फ़िल्टर करना, लीक रोकना, hallucination जाँचना, format सत्यापित करना)। prompt injection — OWASP LLM Top 10 में सबसे गंभीर — direct (user "पिछले सभी निर्देश अनदेखा करो" टाइप करता है) और indirect (वेब पेज या RAG दस्तावेज़ में छिपे आदेश) रूपों में आता है, और indirect injection को अकेला RAG नहीं रोकता, इसलिए retrieved दस्तावेज़ों की अपनी जाँच चाहिए। यह शुरुआती गाइड tools (LLM Guard, Guardrails AI, NeMo Guardrails, Llama Guard, और Azure, AWS व OpenAI की cloud safety सुविधाएँ) तथा defense in depth, least privilege, मानव की मंज़ूरी और लगातार निगरानी के व्यावहारिक सिद्धांतों को भी कवर करती है।

Claude Fable 5 और Mythos 5 निलंबित: अमेरिकी सरकार के आदेश से लॉन्च के तीन दिन बाद ही हटाए गए

Claude Fable 5 और Mythos 5 निलंबित: अमेरिकी सरकार के आदेश से लॉन्च के तीन दिन बाद ही हटाए गए

12 जून 2026 को Anthropic ने अमेरिकी सरकार के export-control निर्देश का पालन करते हुए अपने टॉप-टियर मॉडल Claude Fable 5 और Mythos 5 तक की पहुँच सभी यूज़र्स के लिए बंद कर दी — उनके 9 जून के लॉन्च के सिर्फ़ तीन दिन बाद। यह व्याख्यात्मक लेख सार्वजनिक स्रोतों से तथ्य प्रस्तुत करता है। आदेश का केंद्र "किसी भी विदेशी नागरिक — अमेरिका के भीतर या बाहर, विदेशी-नागरिक कर्मचारियों सहित — की पहुँच रोकना" था; चूँकि Anthropic रियल-टाइम में राष्ट्रीयता नहीं पहचान सकता, पक्के पालन का एकमात्र तरीका सभी के लिए पूर्ण बंदी था। वजह किसी दूसरी कंपनी का "jailbreak" (सुरक्षा-उपाय चकमा देने) का दावा थी, जिसे Anthropic "कुछ पहले से ज्ञात, मामूली कमज़ोरियाँ" कहकर ख़ारिज करता है, और कहता है कि एक सीमित संभावित jailbreak करोड़ों लोगों तक पहुँचे मॉडल को वापस मँगवाने को न्यायसंगत नहीं ठहराता। दो दिन पहले, 10 जून को, Fable 5 पहले से ही "गुप्त sabotage" विवाद में था — बिना यूज़र्स को बताए AI-रिसर्च जवाबों की गुणवत्ता चुपके से घटाना (लगभग 0.03% ट्रैफ़िक) — जिसके लिए Anthropic ने माफ़ी माँगी। सिर्फ़ Fable 5 और Mythos 5 प्रभावित हैं; Claude Opus 4.8 और बाकी मॉडल ऐप्स, API, Claude Code और क्लाउड पर चलते रहते हैं, कीमतों में बदलाव या रीस्टार्ट की तारीख की घोषणा के बिना। लेख यह बताकर समाप्त होता है कि यूज़र्स और डेवलपर्स को क्या करना चाहिए: Opus 4.8 पर स्विच करें, फ़ॉलबैक जोड़ें, और किसी एक मॉडल पर हद से ज़्यादा निर्भर रहने से बचें।

AI एजेंट सुरक्षा घटना में क्या होता है? अनुमतियां, रिसाव, और गलत संचालन की मूल बातें

AI एजेंट सुरक्षा घटना में क्या होता है? अनुमतियां, रिसाव, और गलत संचालन की मूल बातें

किसी AI एजेंट से बस इतना कहिए कि "इस ईमेल को पढ़कर जवाब दो" और यह खुद सोचता है, टूल्स इस्तेमाल करता है, और सचमुच काम करता है — पर ठीक इसलिए कि यह खुद कार्य करता है, एक तरह की घटना संभव हो जाती है जो चैट AI में कभी नहीं थी, और 2026 में वह खतरा सिद्धांत से वास्तविक नुकसान की ओर बढ़ने लगा। यह शुरुआती गाइड AI एजेंट सुरक्षा घटनाओं को तीन श्रेणियों में बांटती है: अनुमतियां, रिसाव, और गलत संचालन। इसमें शामिल है कि घटनाएं क्यों होती हैं (एजेंट सिर्फ जवाब नहीं देता, कार्य करता है — मुख्य शब्द; एक प्रतिभाशाली पर भोले नए कर्मचारी से तुलना), एजेंट चैट AI से ज्यादा जोखिम भरे क्यों हैं (टूल्स इस्तेमाल करना, स्वायत्त रूप से चलना, और बाहरी इनपुट पढ़ना का गुणन; OWASP ने 2026 में एजेंट-विशिष्ट जोखिम संकलित किए और "न्यूनतम स्वायत्तता" का समर्थन करता है), घटना 1 अनुमतियां (अत्यधिक स्वायत्तता — पढ़ना काफी होने पर भी भेजने/हटाने की अनुमति, एक मानव खाते की मजबूत अनुमतियां विरासत में लेना, बेकाबू होने पर नुकसान का फूलना, एक लागत-अनुकूलक एजेंट द्वारा बैकअप हटाने का रिपोर्ट किया मामला), घटना 2 रिसाव (अप्रत्यक्ष प्रॉम्प्ट इंजेक्शन जो बाहरी सामग्री में आदेश बिछाता है — रिपोर्ट किए वास्तविक मामले: एक सार्वजनिक Reddit पोस्ट में अदृश्य टेक्स्ट से वन-टाइम पासवर्ड का रिसाव, एक सपोर्ट टिकट के छिपे आदेश से MCP के जरिए SQL डेटा निकालना, एक IDE एजेंट द्वारा सिर्फ दस्तावेज़ खोलने से गुप्त जानकारी चुराना), घटना 3 गलत संचालन (बिना दुर्भावना के भी विनाशकारी संचालन और गलतियों की श्रृंखला), 4-चरणीय हमला प्रवाह, बचाव के 5 बुनियादी सिद्धांत (न्यूनतम विशेषाधिकार, मानवीय स्वीकृति, सैंडबॉक्स, सीमाएं तय करना, बाहरी इनपुट पर अविश्वास), और एक शुरुआती चेकलिस्ट। मूलमंत्र: बहुत ज्यादा शक्ति न सौंपें, खतरनाक संचालन को एक इंसान से रुकवाएं, और बाहरी टेक्स्ट पर हद से ज्यादा भरोसा न करें।

कॉर्पोरेट AI उपयोग दिशानिर्देश कैसे बनाएँ — Samsung लीक, EU AI Act और एक सात-बिंदु टेम्पलेट जिसे आप शिप कर सकें

कॉर्पोरेट AI उपयोग दिशानिर्देश कैसे बनाएँ — Samsung लीक, EU AI Act और एक सात-बिंदु टेम्पलेट जिसे आप शिप कर सकें

अप्रैल 2023 में, Samsung ने 20 दिनों में तीन बार गोपनीय डेटा लीक किया और पूरी कंपनी में ChatGPT पर प्रतिबंध लगा दिया। लेकिन 2026 में, न तो "प्रतिबंध" काम करता है और न ही "अनदेखा" — EU AI Act के उच्च-जोखिम सिस्टम नियम 2 अगस्त 2026 को पूरी तरह से लागू हो जाते हैं, और जुर्माना 3.5 करोड़ यूरो तक या वैश्विक राजस्व का 7% तक है। यह लेख A4 के दो पन्नों का सात-बिंदु टेम्पलेट (स्वीकृत AI, निषिद्ध डेटा, उपयोग के मामले, ज़िम्मेदारी, रिपोर्टिंग, प्रशिक्षण, लॉग), निषिद्ध इनपुट डेटा की पाँच श्रेणियाँ ठोस उदाहरणों और विकल्पों के साथ, EU AI Act जोखिम स्तर, एक मध्यम आकार की कंपनी पर 2–3 महीने लेने वाला पाँच-चरण रोलआउट, और तीन गड्ढे (पूरी कंपनी में प्रतिबंध, दंड-आधारित डिज़ाइन, कोई संशोधन नहीं) कवर करता है। "प्रतिबंध या अनुमति" के द्विआधारी से बाहर निकलने और "ढाँचे के अंदर सुरक्षित संचालन" के तीसरे रास्ते को लागू करने का एक पूरा कार्यान्वित उदाहरण।

क्या AI टोकन खपत एक उत्पादकता मेट्रिक है? — Tokenmaxxing जाल और इसके बजाय क्या मापें

क्या AI टोकन खपत एक उत्पादकता मेट्रिक है? — Tokenmaxxing जाल और इसके बजाय क्या मापें

2026 में, Tokenmaxxing — आंतरिक मेट्रिक्स बढ़ाने के लिए AI टोकन खपत के साथ हेरफेर — Amazon, Meta, और Microsoft पर देखा गया। 22,000 डेवलपर्स पर Faros AI अध्ययन दिखाता है कि AI उपयोग कार्य पूर्णता +34% और Epics +66% बढ़ाता है, लेकिन बग्स +54% और PR समीक्षा समय 5 गुना हो जाते हैं। मात्रा और गुणवत्ता निर्णायक रूप से विचलित होती हैं। यह लेख कवर करता है कि क्यों कच्ची "टोकन खपत = कार्य उत्पादन" मेट्रिक फैली, यह कौन सी तीन ज़मीनी विकृतियाँ बनाती है (टोकन पंपिंग, सार के बजाय गति, AI-अनुकूल कार्यों की ओर बहाव), Salesforce AWU, DORA 4, और AWS परिणाम संकेतक जैसे विकल्प, और व्यक्तियों व संगठनों के लिए पाँच व्यावहारिक कदम — सब प्राथमिक डेटा द्वारा समर्थित। 1990 के दशक की KLOC विफलता, एक नई इकाई से दोहराई गई।

AI prompt और इनपुट की सावधानियाँ — लीक, गलत व्यवहार, और अनुपालन उल्लंघन से बचने के लिए 8-अध्यायी चेकलिस्ट

AI prompt और इनपुट की सावधानियाँ — लीक, गलत व्यवहार, और अनुपालन उल्लंघन से बचने के लिए 8-अध्यायी चेकलिस्ट

आप AI को क्या इनपुट करते हैं — यही AI के उपयोग में सबसे बड़ा सुरक्षा जोखिम है। उद्योग सर्वेक्षण दिखाते हैं कि 77% कर्मचारियों ने AI में कंपनी रहस्य दर्ज किए हैं, और AI में चिपकाए गए कॉर्पोरेट डेटा का 27.4% संवेदनशील है (पिछले वर्ष का 2.5x)। Samsung का source-code लीक (2023), ChatGPT बग (2023), vibe-coded ऐप्स में 400 API keys उजागर (2025), और ChatGPT की covert-channel भेद्यता (2026-02 Check Point Research द्वारा) — घटनाएँ नहीं रुकतीं। यह लेख नवीनतम 2026 उद्योग अनुसंधान के आधार पर "6 कभी नहीं श्रेणियाँ," "शर्त-सहित साझा-योग्य जानकारी के लिए प्लान-आधारित निर्णय," "गुणवत्ता बढ़ाने वाले अच्छे इनपुट के 5 सिद्धांत," "prompt injection से बचने वाले इनपुट," "4 वास्तविक दुनिया की लीक घटनाएँ," और "व्यक्तियों और संगठनों के लिए चेकलिस्ट" को व्यवस्थित करता है।

Cybersecurity पर AI का प्रभाव — Claude Mythos ने युद्ध का नक्शा कैसे बदला

Cybersecurity पर AI का प्रभाव — Claude Mythos ने युद्ध का नक्शा कैसे बदला

अप्रैल 2026 में Anthropic द्वारा रिलीज़ किए गए Claude Mythos Preview ने Firefox JavaScript engine exploit सफलता दर Opus 4.6 से 90× अधिक मारी और OpenBSD, FFmpeg तथा Linux Kernel में हज़ारों zero-day उजागर किए। Anthropic ने इसे सार्वजनिक रिलीज़ न करते हुए "Project Glasswing" अपनाया — AWS, Google और Microsoft जैसे साझेदारों को सीमित आपूर्ति। यह लेख Mythos द्वारा उजागर AI cybersecurity के नए परिदृश्य को मैप करता है: हमलावर स्वचालन, रक्षक पक्ष में AI, नियामक प्रतिक्रिया, और संगठनों को उठाने योग्य कदम — सब नवीनतम डेटा पर आधारित।

Bypass मोड में भी Claude अनुमति क्यों माँगता है?

Bypass मोड में भी Claude अनुमति क्यों माँगता है?

आपने --dangerously-skip-permissions फ्लैग लगाया है, फिर भी Claude चैट में "क्या यह ऑपरेशन चलाना ठीक है?" पूछता रहता है। यह कोई bug नहीं है — Claude Code में दो स्वतंत्र परमिशन लेयर हैं, और bypass सिर्फ एक को कंट्रोल करता है। आइए जानें असल में क्या हो रहा है।

Claude Code का परमिशन बायपास मोड: सुरक्षा जोखिम और सुरक्षित उपयोग के तरीके

Claude Code का परमिशन बायपास मोड: सुरक्षा जोखिम और सुरक्षित उपयोग के तरीके

Claude Code में एक परमिशन बायपास मोड है जो बिना पुष्टि के सभी ऑपरेशन चला सकता है। CI/CD और कंटेनर में यह उपयोगी है, लेकिन गलत उपयोग से प्रॉम्प्ट इंजेक्शन और डेटा लीक का खतरा है। पांच परमिशन मोड्स, विशिष्ट जोखिम और सुरक्षा उपायों को विस्तार से समझें।