إلى أي مدى يستطيع الذكاء الاصطناعي أتمتة مهام المتصفح؟ واقع ملء النماذج والحجز والبحث
"طلبتُ من الذكاء الاصطناعي ففتح المتصفح وبحث بنفسه، بل وملأ نموذجًا أيضًا." في 2026 لم يعد هذا عرضًا مُجهَّزًا: ظهرت المتصفحات الوكيلة (ChatGPT Atlas وClaude for Chrome وGemini/Chrome وPerplexity Comet) دفعةً واحدة. فإلى أي مدى تؤتمت فعلاً؟ ينقسم الواقع بوضوح إلى ثلاث طبقات. (1) البحث = جاهز للإنتاج: على WebVoyager (مواقع حقيقية) تبلغ أفضل الوكلاء 89-98%، أي تشبُّع تقريبًا، ومن هنا تبدأ التفويض لأن الخطأ يكلّف القليل. (2) ملء النماذج = ممكن لكن تحقّق: الإدخال نفسه مدعوم، لكن الوكيل قد يخطئ في الحقول أو يضغط زر الإرسال الخطأ، لذا "الذكاء الاصطناعي يصوغ والإنسان يرسل" هو الآمن، وكثير من المنتجات مثل Atlas يطلب تأكيدًا قبل الإجراءات المهمة. (3) الحجز/الدفع = تولَّه بنفسك: يتعثّر الوكلاء عند CAPTCHA وتدفقات إتمام الدفع المعقّدة بـJavaScript والمصادقة الثنائية وإدارة الجلسات، وعلى WebArena (مهام معقّدة متعددة الخطوات) يسجّل حتى الأفضل ~47-68% مقابل خط أساس بشري ~78%؛ والسبب الذي دفع OpenAI لإغلاق Operator المستقل (2025/8/31) كان عدم موثوقية الدفع. يؤطّر المقال أولاً المقاربتين (متصفح/امتداد للمستهلك مقابل API/OSS للمطوّر)، ثم يرسم لاعبي 2026 (Atlas متصفح مخصّص لا يشغّل الكود ولا يقرأ كلمات المرور بحكم التصميم؛ Claude for Chrome امتداد بلوحة جانبية؛ مشروع Project Mariner من Google انتهى 2026/5/4 وأُدمج في Gemini/Chrome؛ Operator انتقل إلى ChatGPT Agent وAgents SDK؛ OSS browser-use بأكثر من 78k نجمة). ويشرح الجدران الأربعة التي تُفشل الحجز (دفاعات الروبوتات، إتمام الدفع المعقّد، 2FA، كلفة التراجع)، ثم يتعمّق في أكبر فخّ: حقن الأوامر غير المباشر (ثبت أن Perplexity Comet عرضة لسرقة بيانات اعتماد بصفر نقرات وأصلحها في فبراير 2026؛ نجاح هجوم بنسبة 23.6% قبل الدفاعات ينخفض إلى ~11% بالأساسية و~1% بالأقوى، وما يزال غير صفر). ويختم بخمسة مبادئ أمان (ابدأ بالقراءة فقط، يوافق إنسان على الإرسال/الدفع، لا تسلّم كلمات المرور أبدًا، لا تشغّله على مواقع غير موثوقة، أقلّ صلاحيات في ملف تعريف مخصّص). شريك بحث ممتاز؛ أمّا الإجراءات التي تحرّك المال فتولَّها بنفسك. الأرقام مقتبسة من مواد عامة وإعلانات كمؤشرات اتجاه.