AI ब्राउज़र के काम कहाँ तक automate कर सकता है? Form भरना, बुकिंग और रिसर्च की हकीकत
"मैंने एक AI से कहा और उसने ब्राउज़र खोला, चीज़ें ढूँढीं, और एक form भी भर दिया।" 2026 में यह अब कोई दिखावटी demo नहीं रहा: agentic browsers (ChatGPT Atlas, Claude for Chrome, Gemini/Chrome, Perplexity Comet) एक साथ आ गए। तो ये असल में कहाँ तक automate करते हैं? हकीकत साफ़-साफ़ तीन स्तरों में बँट जाती है। (1) रिसर्च = production-ready: WebVoyager (असली sites) पर शीर्ष agents 89-98% तक पहुँचते हैं, और चूँकि ग़लत action की क़ीमत कम है, सौंपना यहीं से शुरू करें। (2) Form भरना = हो सकता है, पर जाँचें: इनपुट खुद समर्थित है, फिर भी agents fields को ग़लत label दे सकते हैं या ग़लत submit दबा सकते हैं, इसलिए "AI draft करे, इंसान भेजे" सुरक्षित है। (3) बुकिंग/भुगतान = अभी भी खुद करें: agents CAPTCHA, जटिल JavaScript checkout, two-factor auth और session management पर लड़खड़ाते हैं, और WebArena पर सबसे बेहतरीन भी क़रीब 47-68% ही पाते हैं (~78% इंसानी baseline के मुक़ाबले); OpenAI ने स्वतंत्र Operator (2025/8/31) इसी checkout अविश्वसनीयता के कारण बंद किया। लेख पहले दो तरीके बताता है (उपभोक्ता ब्राउज़र/extension बनाम डेवलपर API/OSS), फिर 2026 के खिलाड़ी मैप करता है, बुकिंग विफल होने की चार दीवारें समझाता है, और सबसे बड़े खतरे — indirect prompt injection — में गहराई से उतरता है (Comet zero-click credential चोरी के प्रति कमज़ोर दिखा और फ़रवरी 2026 में ठीक हुआ; बचाव से पहले 23.6% सफलता बुनियादी बचाव से ~11% और सबसे मज़बूत से ~1% तक घटती है, फिर भी शून्य नहीं)। अंत में पाँच सुरक्षा सिद्धांत। एक बेहतरीन रिसर्च साथी; पैसा हिलाने वाले काम खुद करें।