تخطي إلى المحتوى

أدلة ومقارنات وأحدث الأخبار عن أدوات الذكاء الاصطناعي

أدلة ومقارنات وأحدث الأخبار عن أدوات الذكاء الاصطناعي للمبتدئين

مقال مميز

ما هي Agent Evals؟ قياس النتيجة والمسار معًا
Claude تطوير AI والبرمجة للمبتدئين

ما هي Agent Evals؟ قياس النتيجة والمسار معًا

Agent evals هي عملية القياس المنهجي لما إذا كان الوكيل — الذي يستخدم الأدوات ويتخذ خطوات متعددة للوصول إلى هدف — قادرًا فعلًا على إنجاز مهامه. إنها تطور لتقييمات الـ LLM، يتوسع فيه الهدف من «مخرَج واحد» إلى «سلسلة من الأفعال». ولأن الوكيل يخطط، ويستدعي الأدوات، ويحدّث الحالة، فإن المخرَج النهائي وحده لا يكفي؛ وتشير Google إلى أن عليك فهم «لماذا» وراء أفعال الوكيل، وتقسّم التقييم إلى استجابة نهائية و trajectory. الأبعاد الخمسة هي: النتيجة (نجاح المهمة، يُحكَم عليها بالحالة النهائية — ما إذا كان الحجز موجودًا في الـ DB، لا التصريح «لقد حجزتُه»)، والمسار (خطوات معقولة، أدوات صحيحة بالترتيب الصحيح)، وصحة استخدام الأدوات (الأداة والوسائط الصحيحة، مع فحص أسماء الدوال والأنواع)، والكفاءة (الخطوات، الرموز، التكلفة، زمن الاستجابة — غالبًا إشارات قابلية مراقبة مُدخَلة في التقييم)، وجودة الاستجابة النهائية (عبر LLM-as-judge أو معيار تقييم). والمُقيّمون هم الكود (سريع/رخيص/قابل لإعادة الإنتاج لكنه هشّ)، و LLM-as-judge (مرن لكنه غير حتمي ويحتاج إلى معايرة)، والبشر (المعيار الذهبي لكنه مكلف — تجنّبه إن أمكن). توصي Anthropic بتقييم النتيجة لا المسار: فمطابقة المسار الحرفية «صارمة وهشّة» لأن الوكلاء يجدون بدائل صحيحة، بينما تقدّم Google و Microsoft مقاييس مطابقة المسار لتشخيص الإخفاقات. والمزالق الخاصة هي اللاحتمية (pass^k)، والأخطاء المتراكمة (p^t)، واختراق المكافأة (ذراع روبوت DeepMind تزيّف إمساكًا)، وتقادم مجموعات التقييم أو تلوثها. والخطة العملية، وفق Anthropic: حوّل 20-50 إخفاقًا في الإنتاج إلى حالات اختبار، وشغّل التقييم الآلي في CI، وافصل تقييمات القدرة والانحدار، واكتبها مبكرًا. ومعايير مثل SWE-bench و tau-bench و WebArena و GAIA و OSWorld و BFCL مراجع مفيدة (الدرجات تتغير حسب الإصدار، فلا تأخذها على ظاهرها). استنادًا إلى المعلومات الرسمية، مع الإشارة إلى أوجه عدم اليقين.

أحدث المقالات

145 مقالات
Cursor مقابل Claude Code مقابل GitHub Copilot مقابل Codex — كيف تختار الأربعة الكبار

Cursor مقابل Claude Code مقابل GitHub Copilot مقابل Codex — كيف تختار الأربعة الكبار

في عام 2026 تبلور الأربعة الكبار من أدوات البرمجة بالذكاء الاصطناعي — Cursor وClaude Code وGitHub Copilot وCodex. لكن تصفيفها لتتويج فائز واحد يضلّلك، لأن الأربعة من أنواع مختلفة. يثبّت هذا المقال أولاً النقطة الأهم — فرق النوع (Cursor = محرّر ذكاء اصطناعي، Copilot = إضافة مدمجة في الـ IDE، Claude Code = وكيل CLI محلي، Codex = وكيل سحابي غير متزامن) — ثم يتناول حقيقة كل أداة، وجدول مواصفات على المحاور نفسها (النوع، تسعير الدخول والقمة، النماذج، السياق، نقاط القوة)، وكيف تقرأ تحوّل 2026 من الرسوم الثابتة إلى "حصّة + استخدام (أرصدة)"، واختيارات حسب نوعك (السهولة = Copilot $10+، تجربة المحرّر = Cursor، العمل الثقيل متعدّد الملفات = Claude Code، الدفعات غير المتزامنة = Codex)، وعادة المطوّرين الأكفّاء في دمج "أداة IDE + وكيل طرفية"، وملاحظات صادقة حول التسعير والمعايير القياسية — كل ذلك بالاعتماد على المصادر الرسمية وعدة منافذ إعلامية.

Claude Code مقابل Codex للترجمة متعددة اللغات — وأفضل النماذج (2026)

Claude Code مقابل Codex للترجمة متعددة اللغات — وأفضل النماذج (2026)

"أريد ترجمة وثائقي إلى لغات كثيرة. Claude Code أم Codex؟" يخفي السؤال فخًّا: لا أحدهما محرّك ترجمة — بل هما بيئتا عمل وكيليّتان عبر CLI، والنموذج خلفهما هو من يُنتج النص. تقسم هذه المقالة المشكلة إلى محورين: بيئة العمل (اختيار الأداة) وجودة الترجمة (اختيار النموذج). على جانب الأداة، يناسب Claude Code — بوصوله المباشر إلى الملفات المحلية وسياقه بسعة 1M رمز وقوّة تحريره المتّسق عبر ملفات متعددة — ترجمة المستودعات، بينما يناسب Codex (سحابي غير متزامن، أتمتة PR، CLI مفتوح المصدر) الدفعات بلا تدخّل. وعلى جانب النموذج، يعرض الميول مستخدمًا درجات Anthropic الرسمية لكل لغة نسبةً إلى الإنجليزية (الإسبانية 98.1% نزولًا إلى اليابانية 96.9%) كبيانات أولية: Claude لاتّساق نبرة المستندات الطويلة، وخط GPT-5.5 للطبيعية والتعبيرات الاصطلاحية، وخط Gemini 3.1 Pro / Flash للاتّساع عبر اللغات قليلة الموارد واللهجات. ويضيف جدولًا حسب اللغة/حالة الاستخدام، وخمس قواعد ذهبية لخط أنابيب الترجمة (المسرد، التشغيل المتوازي، وغيرها)، وتنبيهات صادقة مثل "المعيار ليس جودة ترجمة فعلية" — وكلّه محدّث لعام 2026.

إطلاق Claude Opus 4.8 — شرح الميزات والمعايير والتسعير

إطلاق Claude Opus 4.8 — شرح الميزات والمعايير والتسعير

في 28 مايو 2026، أطلقت Anthropic نموذج Claude Opus 4.8 بعد شهرين بالكاد من النموذج السابق. العنوان البارز هذه المرة ليس مكاسب المعايير بل "أصبح أكثر صدقًا." استنادًا إلى الإعلان الرسمي لـ Anthropic وبطاقة النظام، تغطي هذه المقالة المواصفات الأساسية (claude-opus-4-8، 1M tokens، 128K أقصى إخراج)، ومقارنة معايير وجهًا لوجه (SWE-bench Pro من 64.3 إلى 69.2%، وUSAMO 2026 من 69.3 إلى 96.7%، وGraphWalks 1M من 40.3 إلى 68.1%، بينما يتراجع GPQA Diamond قليلًا)، والتسعير (الوضع القياسي ثابت إضافة إلى وضع سريع أسرع بنحو 2.5 مرة وبفعالية ثلث السعر)، وثلاث ميزات جديدة (معامل effort بأربعة مستويات والتفكير التكيفي، وسير العمل الديناميكي الذي يولّد عشرات إلى مئات الوكلاء الفرعيين المتوازين في معاينة بحثية، وإدخالات system في Messages API)، والقفزة الأكبر على الإطلاق — الصدق (0% للإبلاغ غير النقدي عن النتائج المعيبة، وثقة مفرطة أقل بعشر مرات، ونحو ربع معدل إغفال عيوب الكود) — إضافة إلى تراجعات تستحق الذكر بصدق (مقاومة حقن الموجهات من 6.0 إلى 9.6%، وليس المتصدر في تعدد اللغات)، ومن ينبغي له الترقية الآن.

خطأ Claude Code "تعذّر التحقق من حالة طلب السحب" — الأسباب والحلول

خطأ Claude Code "تعذّر التحقق من حالة طلب السحب" — الأسباب والحلول

تنتهي من بناء ميزة في Claude Code وتذهب للضغط على "Create PR" فيظهر شريط أحمر: "تعذّر التحقق من حالة طلب السحب. قد تكون هذه المعلومات قديمة." هذا ليس عيبًا في الكود — تواصل Claude Code ببساطة مع GitHub لجلب أحدث حالة لطلب السحب وفشل ذلك الطلب الواحد، وهو عادةً تأخر مزامنة غير ضار. يغطي هذا المقال المعنى الدقيق للخطأ، وكيف يرى Claude Code طلب السحب (استعلام عبر gh CLI، مع ملاحظة أن التنفيذ الداخلي غير موثّق)، والأسباب الجذرية الخمسة (مصادقة منتهية، لا دفع/طلب سحب بعد، الشبكة/البروكسي، نطاقات غير كافية، فشل عابر)، وترتيب تشخيص من 4 خطوات يبدأ بـ gh auth status، وورقة أوامر مختصرة (gh auth login/refresh/pr status وأكثر)، وكيفية تمييز متى يكون "قد تكون قديمة" آمنًا للتجاهل من متى يستلزم إجراءً، وحل gh pr create البديل، وقائمة منع التكرار، وأسئلة شائعة. القاعدة: اشتبه في اتصال GitHub قبل أن تشتبه في الكود.

خطأ 400 "thinking blocks cannot be modified" في Claude Code - الأسباب والحلول

خطأ 400 "thinking blocks cannot be modified" في Claude Code - الأسباب والحلول

بينما تعمل في Claude Code يظهر فجأة خطأ 400 ويكرره كل إدخال تالٍ: "thinking or redacted_thinking blocks in the latest assistant message cannot be modified." هذا خطأ معروف لديه عدة open issues على المستودع الرسمي لـ Anthropic، وفي معظم الحالات لا يكون خطأ المستخدم. يغطي هذا المقال معنى الخطأ، وكيف تعمل thinking blocks في extended thinking والتواقيع التشفيرية، والأسباب الجذرية الخمسة لعدم تطابق التوقيع (خطأ session-resume، وتداخل streaming، وخروج منطق الإصلاح عن السيطرة، ووسطاء third-party، وتعديل التاريخ history modification في تطبيقك الخاص)، و3 إصلاحات استرداد لمستخدمي Claude Code (Esc x2/rewind، وجلسة جديدة /clear، وأداة إصلاح JSONL)، وأهم إصلاح دائم (التحديث إلى أحدث إصدار)، و3 مبادئ وقائية لمطوري API/SDK (إعادة الإرسال كما هي round-trip as-is، والإزالة الكاملة full removal، والحارس الدفاعي defensive guard)، وكيف تميّزه عن 3 أخطاء مشابهة، وقائمة تحقق لمنع التكرار.

الفروق بين AEO وLLMO — التداخل 70%، والفريد 30%، وأين يقف GEO

الفروق بين AEO وLLMO — التداخل 70%، والفريد 30%، وأين يقف GEO

في 2026 لدى صناعة SEO ثلاثة مصطلحات جديدة رائجة في وقت واحد — AEO وLLMO وGEO — وحتى Neil Patel وProfound وemarketer يختلفون على التعاريف. يقترح هذا المقال الترتيب الأكثر عملية لمايو 2026: AEO ⊂ GEO ⊃ LLMO. نقارن AEO (Google AI Overview/Featured Snippet/Perplexity/ChatGPT Search) مقابل LLMO (الاستخدام المحادثي العادي لـ ChatGPT/Claude/Gemini) عبر ثمانية محاور: المنصة المستهدفة، السيناريو الرئيسي، الهدف، العلاقة بـ SEO، التقنيات الفريدة، المقياس الرئيسي، الوقت حتى الأثر، والقطاعات المستفيدة. ثم نغطي السبع تقنيات المشتركة (E-E-A-T / بيانات منظَّمة / بيانات الطرف الأول / الهرم المقلوب / السماح لبوتات الذكاء الاصطناعي / تنسيق Q&A / llms.txt)، وأربع تقنيات لـ AEO فقط (النتائج الغنية في SERP / قنص Featured Snippet / التقاط PAA / مطابقة نية البحث)، وأربع تقنيات لـ LLMO فقط (التعرّض في مجموعة التدريب / اتّساق العلامة / إشارات الطرف الثالث / اختبار استذكار المطالبات)، ومصفوفة أولوية حسب القطاع، وثلاث مزالق (جدالات المصطلحات / التقليل من شأن SEO / غموض القياس).

ما AEO — Answer Engine Optimization: التعريف والفرق عن SEO وسبع تقنيات تجعلك تُستشهد

ما AEO — Answer Engine Optimization: التعريف والفرق عن SEO وسبع تقنيات تجعلك تُستشهد

وصل البحث بلا نقرة في 2025 إلى 69% (من 56%) ويظهر AI Overview الآن في حوالي 55% من عمليات بحث Google. في عصر «المرتبة الأولى لم تعد تضمن النقرات»، الطبقة الجديدة المطلوبة هي AEO (Answer Engine Optimization، تحسين محرك الإجابة). يغطي هذا المقال التعريف (تحسين بحيث يعرض البحث والذكاء الاصطناعي محتواك كـ«الإجابة ذاتها» أو يستشهدان به كمصدر)، والفرق بين AEO وSEO، ومنطق الاستشهاد لمحركات الإجابة الأربعة (Google AI Overview / ChatGPT Search / Perplexity / Bing Copilot)، وسبع تقنيات فعّالة (الهرم المقلوب / تنسيق سؤال وجواب / FAQ-HowTo Schema / القوائم والجداول / بيانات الطرف الأول / إشارات المؤلف / السماح لبوتات الذكاء الاصطناعي)، والمقاييس الجديدة (ظهور Snippet / إصابات بوت الذكاء الاصطناعي / البحث ذو العلامة / CVR)، وثلاث مزالق (تجاهل SEO / حجب بوتات الذكاء الاصطناعي / المبالغة). AEO ليس بديلاً عن SEO بل طبقة فوقه — طبّق الاثنين بالترتيب الصحيح.

كيف تبني إرشادات استخدام الذكاء الاصطناعي في الشركة — تسريبات Samsung وEU AI Act وقالب من سبعة بنود جاهز للتطبيق

كيف تبني إرشادات استخدام الذكاء الاصطناعي في الشركة — تسريبات Samsung وEU AI Act وقالب من سبعة بنود جاهز للتطبيق

في أبريل 2023، سرّبت Samsung بيانات سرية ثلاث مرات خلال 20 يوماً وحظرت ChatGPT على مستوى الشركة. لكن في 2026، لا «الحظر» ولا «التجاهل» يعمل — تدخل قواعد الأنظمة عالية المخاطر في EU AI Act حيّز التنفيذ الكامل في 2 أغسطس 2026، بعقوبات تصل إلى 35 مليون يورو أو 7% من الإيرادات العالمية. يغطي هذا المقال قالباً من سبعة بنود في صفحتي A4 (الذكاء الاصطناعي المعتمد، البيانات المحظورة، حالات الاستخدام، المسؤولية، الإبلاغ، التدريب، السجلات)، والفئات الخمس لبيانات الإدخال المحظورة مع أمثلة ملموسة وبدائل، ومستويات مخاطر EU AI Act، وطرحاً من خمس مراحل يستغرق 2–3 أشهر في شركة متوسطة الحجم، وثلاث مزالق (الحظر على مستوى الشركة، التصميم القائم على العقوبة، عدم المراجعة). مثال مكتمل للخروج من ثنائية «الحظر أو السماح» وتنفيذ الطريق الثالث «التشغيل الآمن داخل إطار».

ممارسة الكتابة بالذكاء الاصطناعي — توزيع ChatGPT/Claude/Gemini وسير العمل الهجين الذي يفوز بـ SEO

ممارسة الكتابة بالذكاء الاصطناعي — توزيع ChatGPT/Claude/Gemini وسير العمل الهجين الذي يفوز بـ SEO

تحديث Google الأساسي في مايو 2026 خفّض بوضوح ترتيب «المقالات الرقيقة المنتجة بكميات بالذكاء الاصطناعي وحده»، بينما الكتابة الهجينة — يسوّد الذكاء الاصطناعي، الخبراء يحررون، تُضاف البيانات الأولية (كما في حالة Wayfair) — دفعت ارتفاعاً 24% في حركة المرور العضوية. يغطي هذا المقال توزيع النماذج الثلاثة (Claude لصوت النصوص الطويلة، ChatGPT للبحث والأدوات، Gemini لـ Workspace والبيانات الحالية)، التلقينات التي تنجح فعلاً (Persona + Sample + Constraints، مع كون إلصاق العينة هو الأقوى)، سير عمل Wayfair الهجين من أربع خطوات، خمس «علامات» شائعة تكشف الكتابة بالذكاء الاصطناعي وكيفية القضاء عليها، سير عمل عملي من ست خطوات، وثلاثة فخاخ يجب تجنّبها (ترك الذكاء الاصطناعي يختار الموضوع، تجاهل الهلوسات، الفشل في القضاء على نبرة الطالب المجتهد). تحوّل التأطير من «الذكاء الاصطناعي لأخذ الأمور بسهولة» إلى «الذكاء الاصطناعي كأساس يرفع الجودة».

كيفية استخدام Midjourney — دليل V8.1 الكامل: الخطط، الموجّهات الخمسية، المعاملات، والمراجع

كيفية استخدام Midjourney — دليل V8.1 الكامل: الخطط، الموجّهات الخمسية، المعاملات، والمراجع

في 30 أبريل 2026، نزل Midjourney V8.1 على midjourney.com مع توليد Fast أسرع بـ 4-5 أضعاف، و2K HD أصلية عبر --hd، ودقّة 95% على الموجّهات المعقّدة — وانتهى عصر Discord-only رسمياً. يغطي هذا المقال اختيار الخطة (Basic 10 دولارات / Standard 30 دولاراً / Pro 60 دولاراً / Mega 120 دولاراً، مع توصية Standard للمبتدئين)، ووضع Fast مقابل Relax، وبنية الموجّه الخمسية (موضوع ← بيئة ← أسلوب ← إضاءة ← تقني)، وسبعة معاملات أساسية (--ar/--stylize/--chaos/--hd/--raw/--q/--no)، وأربع ميزات مرجعية (--sref الجو / --oref الموضوعات / Moodboards / Personalization)، وثلاثة فخاخ (عرض النص، MJ يحتفظ بحقوق النشر، لا يوجد API). لطلب «صورة جميلة بأقل عدد من الخطوات»، لا يزال MJ هو الإجابة في 2026.

ما هو Stable Diffusion — ذكاء اصطناعي للصور مفتوح المصدر: كيف يعمل، التشغيل المحلي، والترخيص التجاري

ما هو Stable Diffusion — ذكاء اصطناعي للصور مفتوح المصدر: كيف يعمل، التشغيل المحلي، والترخيص التجاري

في 22 أغسطس 2022، أصدرت Stability AI ملف الأوزان لنموذج توليد صور، وتوقف الذكاء الاصطناعي للصور عن كونه «شيئاً خلف السحابة» وأصبح «برنامجاً تشغّله على جهازك الشخصي». يغطّي هذا المقال كيف يعمل Stable Diffusion (نماذج الانتشار)، سلسلة الإصدارات (SD1.5/SDXL/SD3.5 + FLUX)، القصة الحقيقية للتشغيل المحلي حسب فئة VRAM، رحلة الترخيص من ردة الفعل على SD3 إلى سقف Community License الحالي البالغ مليون دولار، منظومة Civitai/LoRA/ComfyUI/A1111/ControlNet، وكيف تختار بين Midjourney وSD. ينتهي بثلاثة فخاخ: حقوق النشر، المحتوى غير المناسب، وانشقاقات التوافق بين الأجيال. في النهاية، ستعرف ما إذا كنت من فئة «Midjourney يكفي» أم من فئة «تحتاج SD فعلاً».

مقارنة أدوات التصميم بالذكاء الاصطناعي — Canva وAdobe Firefly وFigma AI وRecraft حسب حالة الاستخدام

مقارنة أدوات التصميم بالذكاء الاصطناعي — Canva وAdobe Firefly وFigma AI وRecraft حسب حالة الاستخدام

من كان يقول «أنا سيئ في التصميم» أصبح اليوم ينتج عشرة منشورات تواصل في نصف يوم ويحصل على مقترحات شعارات على الهامش — هذا هو موقع أدوات التصميم بالذكاء الاصطناعي في 2026. يقارن هذا المقال الأدوات الأربع الكبرى: Canva (الأفضل لإنتاج كميات من المواد التسويقية ومنشورات التواصل والشرائح، مجاناً–15 دولاراً)، Adobe Firefly (متكامل مع Photoshop/Illustrator وآمن تجارياً، من 9.99 دولاراً)، Figma AI (المعيار لتصميم واجهات/تجارب المستخدم والمنتجات مع الفرق، من 15 دولاراً/محرر)، وRecraft (شعارات وأيقونات موجّهة بدقة نص 90%، من 10 دولارات). الأدوات الأربع ليست منافسة بل تقسيم أدوار — ضيّق إلى الواحدة التي تناسب مهمتك الأكثر تكراراً. مختلف عن مقارنة أدوات توليد الصور بالذكاء الاصطناعي (Midjourney وغيره): هذا المقال عن «بناء مخرجات من الصور»، وليس الصورة بحد ذاتها. يتضمن جدول مقارنة، وستة سيناريوهات أفضل اختيار، وثلاثة تحذيرات: حقوق النشر، اتساق العلامة، وتجنّب «المظهر الذكي الاصطناعي».

تصفح حسب الفئة

GitHub Copilot

عرض الكل

Stable Diffusion

عرض الكل

أدوات أخرى

عرض الكل

للمبتدئين

عرض الكل

تطوير AI والبرمجة

عرض الكل

بيئة التطوير والبنية التحتية

عرض الكل

وكلاء AI والأتمتة

عرض الكل

كفاءة العمل

عرض الكل

الكتابة

عرض الكل

التصميم

عرض الكل

تحليل البيانات

عرض الكل

التعلم والتعليم

عرض الكل

الدخل الإضافي

عرض الكل

تطوير الألعاب

عرض الكل

الأمان والحوكمة

عرض الكل

مخاطر AI والتأثير الاجتماعي

عرض الكل