تخطي إلى المحتوى

أدلة ومقارنات وأحدث الأخبار عن أدوات الذكاء الاصطناعي

أدلة ومقارنات وأحدث الأخبار عن أدوات الذكاء الاصطناعي للمبتدئين

مقال مميز

ما هي Agent Evals؟ قياس النتيجة والمسار معًا
Claude تطوير AI والبرمجة للمبتدئين

ما هي Agent Evals؟ قياس النتيجة والمسار معًا

Agent evals هي عملية القياس المنهجي لما إذا كان الوكيل — الذي يستخدم الأدوات ويتخذ خطوات متعددة للوصول إلى هدف — قادرًا فعلًا على إنجاز مهامه. إنها تطور لتقييمات الـ LLM، يتوسع فيه الهدف من «مخرَج واحد» إلى «سلسلة من الأفعال». ولأن الوكيل يخطط، ويستدعي الأدوات، ويحدّث الحالة، فإن المخرَج النهائي وحده لا يكفي؛ وتشير Google إلى أن عليك فهم «لماذا» وراء أفعال الوكيل، وتقسّم التقييم إلى استجابة نهائية و trajectory. الأبعاد الخمسة هي: النتيجة (نجاح المهمة، يُحكَم عليها بالحالة النهائية — ما إذا كان الحجز موجودًا في الـ DB، لا التصريح «لقد حجزتُه»)، والمسار (خطوات معقولة، أدوات صحيحة بالترتيب الصحيح)، وصحة استخدام الأدوات (الأداة والوسائط الصحيحة، مع فحص أسماء الدوال والأنواع)، والكفاءة (الخطوات، الرموز، التكلفة، زمن الاستجابة — غالبًا إشارات قابلية مراقبة مُدخَلة في التقييم)، وجودة الاستجابة النهائية (عبر LLM-as-judge أو معيار تقييم). والمُقيّمون هم الكود (سريع/رخيص/قابل لإعادة الإنتاج لكنه هشّ)، و LLM-as-judge (مرن لكنه غير حتمي ويحتاج إلى معايرة)، والبشر (المعيار الذهبي لكنه مكلف — تجنّبه إن أمكن). توصي Anthropic بتقييم النتيجة لا المسار: فمطابقة المسار الحرفية «صارمة وهشّة» لأن الوكلاء يجدون بدائل صحيحة، بينما تقدّم Google و Microsoft مقاييس مطابقة المسار لتشخيص الإخفاقات. والمزالق الخاصة هي اللاحتمية (pass^k)، والأخطاء المتراكمة (p^t)، واختراق المكافأة (ذراع روبوت DeepMind تزيّف إمساكًا)، وتقادم مجموعات التقييم أو تلوثها. والخطة العملية، وفق Anthropic: حوّل 20-50 إخفاقًا في الإنتاج إلى حالات اختبار، وشغّل التقييم الآلي في CI، وافصل تقييمات القدرة والانحدار، واكتبها مبكرًا. ومعايير مثل SWE-bench و tau-bench و WebArena و GAIA و OSWorld و BFCL مراجع مفيدة (الدرجات تتغير حسب الإصدار، فلا تأخذها على ظاهرها). استنادًا إلى المعلومات الرسمية، مع الإشارة إلى أوجه عدم اليقين.

أحدث المقالات

145 مقالات
هل يدمر الذكاء الاصطناعي إيرادات المدونات؟ البيانات وراء تراجع AdSense واستراتيجيات البقاء

هل يدمر الذكاء الاصطناعي إيرادات المدونات؟ البيانات وراء تراجع AdSense واستراتيجيات البقاء

تقتطع AI Overviews من Google الآن معدلات النقر بنسبة 58%. خسر الناشرون الأمريكيون 38% من حركة البحث في 2025. وصلت نسبة البحث بدون نقرات إلى 65%. ومع ذلك نمت إيرادات Google الإعلانية بنسبة 13.5%. يستعرض هذا المقال البيانات الكامنة وراء الانهيار الهيكلي لإيرادات إعلانات المدونات، ويرسم خريطة استراتيجيات البقاء بعيداً عن الاعتماد على AdSense.

كيفية استخدام الذكاء الاصطناعي مجاناً — ChatGPT وClaude وGemini والمزيد [دليل شامل]

كيفية استخدام الذكاء الاصطناعي مجاناً — ChatGPT وClaude وGemini والمزيد [دليل شامل]

الذكاء الاصطناعي مجاني للاستخدام — والنماذج المتاحة اليوم قوية بشكل لافت. GPT-4o من ChatGPT، وSonnet 4.6 من Claude، و2.5 Flash من Gemini، وR1 من DeepSeek. إضافةً إلى توليد الصور المجاني ومساعدي البرمجة والذكاء المحلي بلا قيود. يُنظّم هذا الدليل أفضل أدوات الذكاء الاصطناعي المجانية حسب الغرض ويُريك كيفية الجمع بينها بفعالية.

Claude Opus مقابل Sonnet مقابل Haiku: مقارنة شاملة للأسعار والأداء

Claude Opus مقابل Sonnet مقابل Haiku: مقارنة شاملة للأسعار والأداء

يقدم Claude ثلاثة نماذج — Opus الأعلى أداءً، وSonnet المتوازن، وHaiku السريع منخفض التكلفة. تتراوح أسعار مخرجات API من 25$/مليون رمز (Opus) إلى 5$/مليون رمز (Haiku)، بفارق 5 أضعاف. لكن ما حجم فجوة الأداء فعلياً؟ يقارن هذا الدليل بين الأسعار والمعايير المرجعية وتقديرات التكلفة الفعلية لمساعدتك في اختيار النموذج المناسب.

ما هو LLMO؟ دليل عملي لتحسين المحتوى في عصر البحث بالذكاء الاصطناعي

ما هو LLMO؟ دليل عملي لتحسين المحتوى في عصر البحث بالذكاء الاصطناعي

مع تجاوز مستخدمي ChatGPT حاجز 2.8 مليار وبلوغ معدل عدم النقر في Google نسبة 83% عند ظهور ملخصات AI، لم يعد مجرد التصدّر في نتائج البحث كافيًا. LLMO (تحسين نماذج اللغة الكبيرة) هو النهج الجديد لجعل محتواك يُستشهد به في إجابات الذكاء الاصطناعي. من الفرق بينه وبين SEO إلى التقنيات العملية التي يمكنك البدء بها اليوم.

ما هو OpenClaw؟ مساعد الذكاء الاصطناعي مفتوح المصدر بأكثر من 240 ألف نجمة

ما هو OpenClaw؟ مساعد الذكاء الاصطناعي مفتوح المصدر بأكثر من 240 ألف نجمة

OpenClaw هو المشروع الأسرع نمواً على GitHub في عام 2026 — مساعد ذكاء اصطناعي مفتوح المصدر يتصل بـ WhatsApp وSlack وDiscord وأكثر من 50 منصة. ولكن ما الذي يمكنه فعله فعلاً؟ وما المخاطر؟ من البنية إلى المخاوف الأمنية، إليك كل ما تحتاج معرفته.

لماذا يطلب Claude التأكيد حتى في وضع تجاوز الأذونات؟

لماذا يطلب Claude التأكيد حتى في وضع تجاوز الأذونات؟

لقد فعّلت خيار --dangerously-skip-permissions، لكن Claude لا يزال يرسل رسائل تأكيد في المحادثة. هذه ليست مشكلة تقنية — فنظام أذونات Claude Code يتكون من طبقتين مستقلتين، والـ bypass لا يتحكم إلا في إحداهما. إليك ما يحدث فعلاً.

نصائح لتوفير التوكنات في Claude Code وماذا يحدث عند الوصول إلى الحد الأقصى

نصائح لتوفير التوكنات في Claude Code وماذا يحدث عند الوصول إلى الحد الأقصى

هل فوجئت بسرعة استنزاف التوكنات في Claude Code؟ يوضح هذا المقال أسباب الاستهلاك العالي، ويشارك 10 تقنيات عملية للتوفير، ويشرح ماذا يحدث عند الوصول إلى الحد الأقصى وكيف تعمل التكاليف الإضافية في خطط Pro وMax وAPI.

نصائح لكتابة الأوامر لتطوير التطبيقات بالذكاء الاصطناعي -- كيف تكتب أوامر تحقق نتائج أفضل

نصائح لكتابة الأوامر لتطوير التطبيقات بالذكاء الاصطناعي -- كيف تكتب أوامر تحقق نتائج أفضل

طلبت من Claude Code أو ChatGPT بناء تطبيق لكن النتيجة كانت مختلفة تماماً عما تصوّرته؟ المشكلة في طريقة كتابة أوامرك. يغطي هذا المقال 5 نصائح عملية لكتابة أوامر تحصل من خلالها على كود دقيق من الذكاء الاصطناعي، مع أمثلة توضيحية قبل وبعد.

الذكاء الاصطناعي يقول "استخدم Docker" -- ما الذي يجب أن يعرفه المبتدئون قبل البدء

الذكاء الاصطناعي يقول "استخدم Docker" -- ما الذي يجب أن يعرفه المبتدئون قبل البدء

عندما تسأل Claude Code أو ChatGPT عن إعداد بيئة تطوير، غالباً ما يقترحان Docker. لكن ما هو Docker بالضبط؟ هل تحتاجه حقاً؟ يشرح هذا المقال لماذا يوصي الذكاء الاصطناعي بـ Docker، ويقدم مخططاً لاتخاذ القرار، ويعرض المفاهيم الأساسية والبدائل حتى تبدأ البرمجة بدونه.

وضع تجاوز الصلاحيات في Claude Code: المخاطر الأمنية وطرق الاستخدام الآمن

وضع تجاوز الصلاحيات في Claude Code: المخاطر الأمنية وطرق الاستخدام الآمن

يوفّر Claude Code وضعاً لتجاوز الصلاحيات يتيح تنفيذ جميع العمليات دون تأكيد. وهو مفيد في بيئات CI/CD والحاويات، لكن الاستخدام الخاطئ قد يؤدي إلى حقن الأوامر وتسريب البيانات. نشرح أوضاع الصلاحيات الخمسة والمخاطر المحددة وإجراءات الحماية.

هل يمكن للمبتدئين إنشاء تطبيقات بالذكاء الاصطناعي التوليدي فقط؟ ما ينجح وما لا ينجح

هل يمكن للمبتدئين إنشاء تطبيقات بالذكاء الاصطناعي التوليدي فقط؟ ما ينجح وما لا ينجح

«يمكنك إنشاء تطبيقات بدون برمجة بفضل الذكاء الاصطناعي التوليدي» — لكن هل هذا صحيح فعلاً؟ في 2026، تطورت أدوات البرمجة بالذكاء الاصطناعي التوليدي بشكل كبير، لكن هل يستطيع المبتدئ حقاً إنهاء تطبيق بالذكاء الاصطناعي التوليدي وحده؟ هذا الدليل يغطي بصراحة ما يمكنك بناؤه، وما لا يمكنك، وأين يتعثر المبتدئون.

ما هو وكيل الذكاء الاصطناعي؟ الفرق مع روبوتات الدردشة والقدرات والقيود

ما هو وكيل الذكاء الاصطناعي؟ الفرق مع روبوتات الدردشة والقدرات والقيود

ما الذي يميّز "وكيل الذكاء الاصطناعي" عن روبوت الدردشة التقليدي؟ وكلاء الذكاء الاصطناعي يقسّمون الأهداف ذاتياً ويستخدمون الأدوات وينجزون المهام بأنفسهم. يشرح هذا الدليل الفرق مع روبوتات الدردشة والقدرات والقيود وأبرز الخدمات في 2026.

تصفح حسب الفئة

GitHub Copilot

عرض الكل

Stable Diffusion

عرض الكل

أدوات أخرى

عرض الكل

للمبتدئين

عرض الكل

تطوير AI والبرمجة

عرض الكل

بيئة التطوير والبنية التحتية

عرض الكل

وكلاء AI والأتمتة

عرض الكل

كفاءة العمل

عرض الكل

الكتابة

عرض الكل

التصميم

عرض الكل

تحليل البيانات

عرض الكل

التعلم والتعليم

عرض الكل

الدخل الإضافي

عرض الكل

تطوير الألعاب

عرض الكل

الأمان والحوكمة

عرض الكل

مخاطر AI والتأثير الاجتماعي

عرض الكل