أدلة ومقارنات وأحدث الأخبار عن أدوات الذكاء الاصطناعي

أدلة ومقارنات وأحدث الأخبار عن أدوات الذكاء الاصطناعي للمبتدئين

مقال مميز

ما هي Agent Evals؟ قياس النتيجة والمسار معًا

Agent evals هي عملية القياس المنهجي لما إذا كان الوكيل — الذي يستخدم الأدوات ويتخذ خطوات متعددة للوصول إلى هدف — قادرًا فعلًا على إنجاز مهامه. إنها تطور لتقييمات الـ LLM، يتوسع فيه الهدف من «مخرَج واحد» إلى «سلسلة من الأفعال». ولأن الوكيل يخطط، ويستدعي الأدوات، ويحدّث الحالة، فإن المخرَج النهائي وحده لا يكفي؛ وتشير Google إلى أن عليك فهم «لماذا» وراء أفعال الوكيل، وتقسّم التقييم إلى استجابة نهائية و trajectory. الأبعاد الخمسة هي: النتيجة (نجاح المهمة، يُحكَم عليها بالحالة النهائية — ما إذا كان الحجز موجودًا في الـ DB، لا التصريح «لقد حجزتُه»)، والمسار (خطوات معقولة، أدوات صحيحة بالترتيب الصحيح)، وصحة استخدام الأدوات (الأداة والوسائط الصحيحة، مع فحص أسماء الدوال والأنواع)، والكفاءة (الخطوات، الرموز، التكلفة، زمن الاستجابة — غالبًا إشارات قابلية مراقبة مُدخَلة في التقييم)، وجودة الاستجابة النهائية (عبر LLM-as-judge أو معيار تقييم). والمُقيّمون هم الكود (سريع/رخيص/قابل لإعادة الإنتاج لكنه هشّ)، و LLM-as-judge (مرن لكنه غير حتمي ويحتاج إلى معايرة)، والبشر (المعيار الذهبي لكنه مكلف — تجنّبه إن أمكن). توصي Anthropic بتقييم النتيجة لا المسار: فمطابقة المسار الحرفية «صارمة وهشّة» لأن الوكلاء يجدون بدائل صحيحة، بينما تقدّم Google و Microsoft مقاييس مطابقة المسار لتشخيص الإخفاقات. والمزالق الخاصة هي اللاحتمية (pass^k)، والأخطاء المتراكمة (p^t)، واختراق المكافأة (ذراع روبوت DeepMind تزيّف إمساكًا)، وتقادم مجموعات التقييم أو تلوثها. والخطة العملية، وفق Anthropic: حوّل 20-50 إخفاقًا في الإنتاج إلى حالات اختبار، وشغّل التقييم الآلي في CI، وافصل تقييمات القدرة والانحدار، واكتبها مبكرًا. ومعايير مثل SWE-bench و tau-bench و WebArena و GAIA و OSWorld و BFCL مراجع مفيدة (الدرجات تتغير حسب الإصدار، فلا تأخذها على ظاهرها). استنادًا إلى المعلومات الرسمية، مع الإشارة إلى أوجه عدم اليقين.

2026/06/20

أحدث المقالات

145 مقالات

أدوات أخرى للمبتدئين

ما هو نموذج اللغة الكبير LLM؟ آلية العمل وأبرز النماذج واستخداماتها

مصطلح "LLM" منتشر في كل مكان، لكن ما معناه تحديداً؟ نماذج اللغة الكبيرة هي المحرك الذي يقف خلف ChatGPT وClaude وGemini. في هذا الدليل نشرح آلية عملها، ونقارن بين أبرز النماذج، ونستعرض حالات الاستخدام الفعلية والقيود الأساسية.

2026/03/31

أدوات أخرى للمبتدئين

نقاط القوة والضعف في الذكاء الاصطناعي التوليدي — ما يستطيع وما لا يستطيع فعله بأمثلة عملية

"هل يستطيع الذكاء الاصطناعي التوليدي فعل كل شيء؟" — ليس تماماً. يتفوق الذكاء الاصطناعي التوليدي في المهام القائمة على الأنماط كالكتابة والبرمجة وتحليل البيانات، لكنه لا يزال عاجزاً عن الفهم العاطفي والحكم الأخلاقي والإبداع الحقيقي. إليك تحليلاً واضحاً بأمثلة عملية.

2026/03/31

كفاءة العمل للمبتدئين

الذكاء الاصطناعي التوليدي لتحسين كفاءة الأعمال | دليل عملي لكل قسم مع خطوات التطبيق

"ما الذي يمكن للذكاء الاصطناعي التوليدي فعله فعلاً لتحسين كفاءة العمل؟" — نشرح بالتفصيل التطبيقات العملية في كل قسم، من المبيعات إلى الموارد البشرية، مع الأدوات الموصى بها وخطوات التطبيق والأخطاء الشائعة.

2026/03/31

الدخل الإضافي للمبتدئين

دليل شامل للعمل الجانبي بالذكاء الاصطناعي التوليدي | المجالات والأدوات وطرق الربح

«كيف أبدأ العمل الجانبي بالذكاء الاصطناعي التوليدي؟ ومن أين أبدأ؟» — في هذا الدليل نشرح لك كيف تستخدم أدوات مثل ChatGPT وMidjourney لتحقيق دخل إضافي، مع شرح تفصيلي حسب كل مجال.

2026/03/31

أدوات أخرى للمبتدئين

ما هو الذكاء الاصطناعي التوليدي؟ وكيف يختلف عن الذكاء الاصطناعي التقليدي

تسمع عبارة «الذكاء الاصطناعي التوليدي» في كل مكان، لكن ما الذي يميّزه عن الذكاء الاصطناعي العادي؟ ولماذا يُوصف ChatGPT وMidjourney بأنهما «توليديان»؟ هذا المقال يجيب عن هذه الأسئلة بلغة بسيطة.

2026/03/31

Claude ChatGPT تطوير AI والبرمجة

Claude Code أم Codex؟ مقارنة شاملة بين الأسعار والأداء وحالات الاستخدام

Claude Code و Codex هما عملاقا أدوات البرمجة بالذكاء الاصطناعي. نجيب على سؤال "أيهما أفضل؟" من خلال ثلاثة محاور: الأسعار والأداء ومجالات التميّز.

2026/03/29

Claude ChatGPT للمبتدئين

مقارنة أسعار Claude و ChatGPT من الباقات المجانية والمدفوعة إلى أسعار API

مقارنة كاملة لأسعار Claude (Anthropic) و ChatGPT (OpenAI) حتى مارس 2026. نحلل ثلاثة محاور: الباقات المجانية، والاشتراكات الشهرية، وأسعار API لمساعدتك في اختيار الأنسب.

2026/03/29

تطوير AI والبرمجة للمبتدئين

ما أفضل أطر العمل للتطوير بمساعدة الذكاء الاصطناعي التوليدي؟ مقارنة شاملة

جودة الكود الذي ينتجه الذكاء الاصطناعي التوليدي تتأثر بشكل كبير باختيار إطار العمل. نقارن أطر العمل الرئيسية من حيث حجم بيانات التدريب ووضوح القواعد وأمان الأنواع، مع توصيات الحزمة التقنية المثلى لعام 2026.

2026/03/29

Claude ChatGPT Gemini أدوات أخرى للمبتدئين

تواريخ قطع المعرفة لأدوات الذكاء الاصطناعي التوليدي الرئيسية — مقارنة شاملة

هل سبق أن سألت الذكاء الاصطناعي التوليدي سؤالاً فأجابك "هذه المعلومة خارج نطاق بياناتي"؟ لكل أداة ذكاء اصطناعي توليدي تاريخ قطع معرفة يحدد آخر فترة زمنية تغطيها بياناتها. نقارن في هذا المقال تواريخ القطع وإمكانيات البحث لـ 8 أدوات رئيسية.

2026/03/29

Claude تطوير AI والبرمجة وكلاء AI والأتمتة للمبتدئين

ما هو Claude Agent SDK؟ دليل شامل لتطوير وكلاء الذكاء الاصطناعي

باستخدام Claude Agent SDK من Anthropic، يمكنك بناء وكلاء ذكاء اصطناعي قادرين على اتخاذ القرارات وتنفيذ المهام بشكل مستقل. نشرح في هذا المقال كل شيء من المفاهيم الأساسية إلى التطبيق العملي.

2026/03/28

تطوير AI والبرمجة التصميم تطوير الألعاب

20 أداة ذكاء اصطناعي توليدي لتطوير الألعاب! دليل شامل للرسم والموسيقى والبرمجة

أدوات الذكاء الاصطناعي التوليدي تُحدث ثورة في تطوير الألعاب. في هذا المقال نستعرض أفضل الأدوات حسب التخصص: الرسومات، الموسيقى، البرمجة، والاختبار، مع اختيار أدوات يمكن حتى للمطورين المستقلين استخدامها.

2026/03/28

مخاطر AI والتأثير الاجتماعي للمبتدئين

15 وظيفة مهددة بالاستبدال بالذكاء الاصطناعي التوليدي! المهن المعرضة للزوال وطرق النجاة [2026]

هل تشعر بالقلق حول مستقبل وظيفتك مع تطور الذكاء الاصطناعي التوليدي؟ في هذا المقال نستعرض 15 وظيفة معرضة لخطر الاستبدال، وخصائص الوظائف الآمنة، واستراتيجيات عملية للنجاة في عصر الذكاء الاصطناعي.

2026/03/28

أدلة ومقارنات وأحدث الأخبار عن أدوات الذكاء الاصطناعي

مقال مميز

ما هي Agent Evals؟ قياس النتيجة والمسار معًا

أحدث المقالات

ما هو نموذج اللغة الكبير LLM؟ آلية العمل وأبرز النماذج واستخداماتها

نقاط القوة والضعف في الذكاء الاصطناعي التوليدي — ما يستطيع وما لا يستطيع فعله بأمثلة عملية

الذكاء الاصطناعي التوليدي لتحسين كفاءة الأعمال | دليل عملي لكل قسم مع خطوات التطبيق

دليل شامل للعمل الجانبي بالذكاء الاصطناعي التوليدي | المجالات والأدوات وطرق الربح

ما هو الذكاء الاصطناعي التوليدي؟ وكيف يختلف عن الذكاء الاصطناعي التقليدي

Claude Code أم Codex؟ مقارنة شاملة بين الأسعار والأداء وحالات الاستخدام

مقارنة أسعار Claude و ChatGPT من الباقات المجانية والمدفوعة إلى أسعار API

ما أفضل أطر العمل للتطوير بمساعدة الذكاء الاصطناعي التوليدي؟ مقارنة شاملة

تواريخ قطع المعرفة لأدوات الذكاء الاصطناعي التوليدي الرئيسية — مقارنة شاملة

ما هو Claude Agent SDK؟ دليل شامل لتطوير وكلاء الذكاء الاصطناعي

20 أداة ذكاء اصطناعي توليدي لتطوير الألعاب! دليل شامل للرسم والموسيقى والبرمجة

15 وظيفة مهددة بالاستبدال بالذكاء الاصطناعي التوليدي! المهن المعرضة للزوال وطرق النجاة [2026]

تصفح حسب الفئة

Claude

ما هي Agent Evals؟ قياس النتيجة والمسار معًا

ما هي خطافات Claude Code؟ تشغيل أوامر الشِل بشكل حتمي

ما هما checkpointing و /rewind في Claude Code؟ التراجع عن التغييرات

ما هو Claude Managed Agents؟ سحابة Anthropic المُدارة بالكامل

ChatGPT

كيف تجعل ردود البريد والدردشة أسرع 10 أضعاف بالذكاء الاصطناعي — إطار الطبقات الثلاث والأدوات والقوالب

ما هو الذكاء الاصطناعي متعدّد الوسائط؟ — البنية الموحَّدة للنصّ/الصورة/الصوت/الفيديو ومقارنة أبرز النماذج

الاستعداد للامتحانات وأساليب الدراسة بالذكاء الاصطناعي — 5 تقنيات جوهرية و6 أدوات مقارنة

ما هي واجهة API للذكاء الاصطناعي؟ — دليل المبتدئ للأسعار والتوكنات واختيار النموذج والفرق عن دردشة الويب

Gemini

ما هو Google Gemini؟ الذكاء الاصطناعي متعدد الوسائط المدمج مع منظومة Google

ما هو الذكاء الاصطناعي متعدّد الوسائط؟ — البنية الموحَّدة للنصّ/الصورة/الصوت/الفيديو ومقارنة أبرز النماذج

تواريخ قطع المعرفة لأدوات الذكاء الاصطناعي التوليدي الرئيسية — مقارنة شاملة

GitHub Copilot

ما هو GitHub Copilot؟ من إكمال الشيفرة إلى وكيل برمجة ذاتي القيادة

Codex

إصدار ChatGPT 5.5 (GPT-5.5) — شرح شامل للمزايا والمعايير والأسعار ومقارنة مع Claude Opus 4.7

Midjourney

كيفية استخدام Midjourney — دليل V8.1 الكامل: الخطط، الموجّهات الخمسية، المعاملات، والمراجع

أفضل 8 أدوات ذكاء اصطناعي لتوليد الصور — مقارنة وفرز حسب حالة الاستخدام

Stable Diffusion

ما هو Stable Diffusion — ذكاء اصطناعي للصور مفتوح المصدر: كيف يعمل، التشغيل المحلي، والترخيص التجاري

أفضل 8 أدوات ذكاء اصطناعي لتوليد الصور — مقارنة وفرز حسب حالة الاستخدام

أدوات أخرى

ما هو LoRA؟ تخصيص الذكاء الاصطناعي بقليل جدًا من التدريب الإضافي

ما هو التكميم (Quantization)؟ تقليص نماذج الذكاء الاصطناعي لتشغيلها على جهازك

ما هو تقطير النماذج؟ نقل المعرفة من ذكاء اصطناعي كبير إلى صغير

ما هو الضبط الدقيق (fine-tuning)؟ الضبط الدقيق مقابل RAG، وLoRA/QLoRA، ومتى تستخدمه — دليل المبتدئين

للمبتدئين

ما هي Agent Evals؟ قياس النتيجة والمسار معًا

ما هي خطافات Claude Code؟ تشغيل أوامر الشِل بشكل حتمي

ما هما checkpointing و /rewind في Claude Code؟ التراجع عن التغييرات

ما هو Claude Managed Agents؟ سحابة Anthropic المُدارة بالكامل

تطوير AI والبرمجة

ما هي Agent Evals؟ قياس النتيجة والمسار معًا

ما هي خطافات Claude Code؟ تشغيل أوامر الشِل بشكل حتمي

ما هما checkpointing و /rewind في Claude Code؟ التراجع عن التغييرات

ما هو Claude Managed Agents؟ سحابة Anthropic المُدارة بالكامل

بيئة التطوير والبنية التحتية

كيف تُشغّل نموذج LLM محليًا: ذكاء اصطناعي على جهازك الخاص — المواصفات والأدوات وأفضل النماذج للمبتدئين

هل يستطيع الذكاء الاصطناعي التوليدي التعامل مع البنية التحتية وإعداد البيئة؟ — دليل المبتدئين لـ"أين تفوّض"

الذكاء الاصطناعي يقول "استخدم Next.js" — ما يجب أن يعرفه المبتدئون فعلاً قبل الانطلاق

ما هو Cursor؟ — محرر الذكاء الاصطناعي: كيف تستخدمه وكيف يختلف عن VS Code

وكلاء AI والأتمتة

ما هي AI observability؟ مراقبة وتتبّع LLMs والوكلاء للمبتدئين

كيف تبني نظام وكلاء متعددين: دليل عملي إلى نمط supervisor

ما هو النظام متعدد الوكلاء؟ التنسيق بين عدة وكلاء ذكاء اصطناعي مشروحاً للمبتدئين

ما هو A2A (Agent2Agent)؟ كيف يختلف عن MCP، وبطاقات الوكيل، وكيف يعمل

كفاءة العمل

إلى أي مدى يستطيع الذكاء الاصطناعي أتمتة مهام المتصفح؟ واقع ملء النماذج والحجز والبحث

10 حالات استخدام لوكلاء الذكاء الاصطناعي — أمثلة واقعية لأتمتة الأعمال وأثرها وكيفية البدء

كيف يوسّع الذكاء الاصطناعي فجوة القدرات بين الموظفين؟ المحور المتحوّل، الأرضية مقابل السقف، وكيف لا تتخلّف عن الركب

هندسة الأوامر: الموجز العملي — 6 أجزاء وتقنيات للحصول على الإجابات التي تريدها من الذكاء الاصطناعي

الكتابة

الفروق بين AEO وLLMO — التداخل 70%، والفريد 30%، وأين يقف GEO

ما AEO — Answer Engine Optimization: التعريف والفرق عن SEO وسبع تقنيات تجعلك تُستشهد

ممارسة الكتابة بالذكاء الاصطناعي — توزيع ChatGPT/Claude/Gemini وسير العمل الهجين الذي يفوز بـ SEO

كيف غيّر Google AI Overviews الـ SEO والـ AEO — الفروق عن LLMO ودليل شامل

التصميم

البدء في توليد الفيديو بالذكاء الاصطناعي [2026] — مشهد ما بعد Sora، وVeo/Kling، ونصائح المطالبات

البدء بتوليد الصور بالذكاء الاصطناعي — كيف يعمل، والخطوات الأربع، وتشريح موجّه الصورة، والحقوق

كيفية استخدام Midjourney — دليل V8.1 الكامل: الخطط، الموجّهات الخمسية، المعاملات، والمراجع