في 21 أبريل 2026، أعلنت OpenAI عن GPT Image 2. وفي 12 مايو، تقاعدت رسميًا الأيقونة الأصلية DALL·E 2 / DALL·E 3. وقبل شهر واحد، في 17 مارس، أطلقت Midjourney V8 ليصبح التوليد أسرع بخمس مرات وبدقة 2K HD افتراضيًا. ووصل Imagen 4 Ultra من Google إلى المستوى الذي يجعل المخرجات «لا يمكن تمييزها عن الصور الفوتوغرافية الحقيقية». ويردّ FLUX 1.1 Pro Ultra من Black Forest Labs على نموذج Midjourney الشهري بسعر 0.04–0.06 دولار لكل صورة بنظام الدفع حسب الاستخدام.

الخلاصة: بحلول مايو 2026، لم يعد أي ذكاء اصطناعي للصور يهيمن منفردًا. هذا ليس عام 2024 حين كانت Midjourney وحدها في القمة. ولا عام 2023 حين كان SDXL يحكم المستوى المجاني. الآن تختار حسب ما تصنع.

دعوني أضع رأيي في المقدمة: إذا كان بإمكانك الاشتراك في أداة واحدة فقط، فاختر Midjourney V8 (10 دولار/شهر). لا يزال يتصدّر في الجمع بين الجودة الفنية وجودة المرئيات للعلامات التجارية. للأعمال التجارية التي تحتاج نصًا داخل الصورة، اذهب إلى Ideogram V3 أو GPT Image 2. للصور الفوتوغرافية، Imagen 4 Ultra أو FLUX 1.1 Pro Ultra. إذا كانت السلامة التجارية أولوية قصوى، فـ Adobe Firefly. يستعرض هذا المقال الأدوات الثماني الكبرى حتى مايو 2026، مرتبة حسب نقاط القوة والتسعير وملاءمة حالة الاستخدام، مع أرقام حقيقية.

الذكاء الاصطناعي للصور · مايو 2026

8 أدوات، 5 محاور قوة — لم يعد هناك «أفضل» واحد

— صورة فوتوغرافية / نص / فن / آمن تجاريًا / تصميم — لكل منها ملكها الخاص

صورة فوتوغرافية
Imagen 4 Ultra
FLUX 1.1 Pro
نص
Ideogram V3
GPT Image 2
فن
Midjourney V8
Stable Diffusion
آمن
Adobe Firefly
بيانات معلنة
تصميم
Recraft V3
إخراج متجهي

2024: Midjourney وحدها في القمة ← 2026: انقسمت إلى 5 معسكرات حسب الاستخدام.
الخطوة الصحيحة الآن هي الجمع بين 2–3 أدوات حسب الغرض، وليس اختيار واحدة فقط.

1. أبريل 2026: تقاعد DALL·E بهدوء — تحوّل جيلي في الذكاء الاصطناعي للصور

في 21 أبريل 2026، أطلقت OpenAI GPT Image 2 (داخليًا، ChatGPT Images 2.0). وقد تقاعدت رسميًا علامة «DALL·E» في 12 مايو؛ وأصبح توليد الصور داخل ChatGPT يعمل الآن على GPT Image 2. وبعد نحو أربع سنوات من DALL·E 2 في 2022، سلّمت الأداة ذاتها التي أدخلت مصطلح «الذكاء الاصطناعي لتوليد الصور» إلى المعجم السائد المشعل إلى خليفتها.

في الشهر ذاته من أبريل، أتاحت Google Imagen 4 Ultra للعموم على Vertex AI. وصنّفه المقيّمون المستقلون بأن «نسيج البشرة، ونسج القماش، وانعكاسات الماء، والأجواء، كلها تُعرض بدرجة يصعب باستمرار تمييزها عن الصور الفوتوغرافية الحقيقية»، مما منحه المركز الأول في لوحة Artificial Analysis للواقعية الفوتوغرافية. وأطلقت Midjourney V8 قبل شهر في 17 مارس ليصبح التوليد أسرع بخمس مرات وبدقة 2K HD افتراضيًا.

هذه الفترة باتت تُسمّى الآن «شهر تحديثات الموردين الثلاثة». وما يتجاوز ذلك: FLUX 1.1 Pro Ultra من Black Forest Labs يصل إلى الـ API بسعر 0.04–0.06 دولار لكل صورة، وحلّ Recraft V3 في المرتبة الأولى في ساحة Artificial Analysis للنص-إلى-صورة في أعمال التصميم التجاري، ورسّخ Ideogram V3 موقعه في أعمال الشعارات والملصقات بـ دقة نص 90–95%، ويأخذ Adobe Firefly Image 5 مساره الخاص بالسلامة التجارية والتكامل مع Photoshop/Illustrator.

لذا فإن ثلاثي 2024 المكوّن من «Midjourney وDALL·E وStable Diffusion» لم يعد ملائمًا. لقد انقسم 2026 إلى 5 معسكرات حسب الاستخدام.

2. الأدوات الثماني الكبرى في لمحة

أولًا، نظرة شاملة من أعلى. ثماني أدوات كبرى حتى مايو 2026، مع الإصدارات الحالية والتسعير والقوة الجوهرية.

الأداةأحدث إصدارالتسعير (الأدنى)القوة الجوهرية
MidjourneyV8 (مارس 2026)10 دولار/شهر (200 توليد)الفن، الأسلوبية
GPT Image 2أبريل 2026 (خليفة DALL·E)مرفق مع ChatGPT Plus 20 دولار/شهردقة نص 99%، نموذج استدلالي
FLUX 1.1 Pro Ultra2026 (يُحدَّث باستمرار)0.04–0.06 دولار/صورة (API)كفاءة تكلفة الواقعية الفوتوغرافية، السرعة
Google Imagen 44 Ultra (أبريل 2026)0.02–0.06 دولار/صورة (Vertex AI)جودة صور فوتوغرافية من الطراز الأول
Recraft V3V3 (مستمر منذ 2024)0.04 دولار/صورة (نقطية)إخراج متجهي، أنظمة تصميم
IdeogramV3 (2026)من 7 دولار/شهرعرض النص داخل الصورة
Adobe FireflyImage 5 (2026)9.99 دولار/شهر (Standard)السلامة التجارية، تكامل Adobe
Stable Diffusion3.5 / Cascadeمجاني (وحدة GPU خاصة بك)أوزان مفتوحة، قابل للتخصيص

الجدول وحده لن يقرر عنك. عليك أولًا أن تصوغ هدفك بكلمات؛ وإلا فلن يبدو أي صف في هذا الجدول «صحيحًا». القسم التالي يرتّب الأدوات الثماني حسب محور القوة.

3. مرتّبة حسب نقاط القوة — أين توجّه جهدك

الأدوات الثماني نفسها، لكن هذه المرة أُعيد تجميعها في 5 معسكرات حسب ما يبرعون فيه. هذه هي الخريطة العملية لميدان معركة 2026.

5 معسكرات × 8 أدوات

مصفوفة الاختيار حسب القوة

① الواقعية الفوتوغرافية
Imagen 4 Ultra / FLUX 1.1 Pro Ultra
صور المنتجات والأشخاص والمناظر الطبيعية والطعام. لا يمكن تمييزها عن اللقطات الحقيقية. يعمل Imagen خلال 3–6 ثوانٍ — الأسرع في الفئة المتميزة.
② الكتابة داخل الصورة
Ideogram V3 / GPT Image 2
الشعارات، الملصقات، الصور المصغرة الاجتماعية، الإنفوجرافيك. دقة Ideogram 90–95%؛ وGPT Image 2 99% (مع دعم متعدد اللغات).
③ الأسلوبية الفنية
Midjourney V8 / Stable Diffusion
الرسوم التوضيحية، الفن المفاهيمي، الأعمال المدفوعة بالمزاج. يغطي Midjourney المدى والاتساق؛ ويتفوق SD في حرية الضبط الدقيق.
④ آمن تجاريًا
Adobe Firefly Image 5
مدرَّب فقط على صور Adobe Stock المرخّصة. الخيار الواقعي الوحيد لأعمال الإعلانات والنشر والشركات حيث تهم مخاطر الملكية الفكرية.
⑤ المتجهات / أنظمة التصميم
Recraft V3
إخراج SVG، اتساق أسلوب العلامة، إنتاج الأيقونات على نطاق واسع. احتلّ المرتبة الأولى في لوحة ELO للنص-إلى-صورة لدى Artificial Analysis.

لا تحاول فعل كل شيء بأداة واحدة. اشترك في 2–3 حسب حالة الاستخدام — هذه هي إجابة 2026.
التكلفة الإجمالية تقع حول 20–40 دولار/شهر، يمكن استردادها بسهولة من مشروع واحد.

نظرة أقرب: ملوك الواقعية الفوتوغرافية — Imagen 4 وFLUX

Google Imagen 4 Ultra، الصادر في أبريل 2026، يحتل المركز الأول في معيار Artificial Analysis للواقعية الفوتوغرافية. التوليد في 3–6 ثوانٍ هو الأسرع في الفئة المتميزة، وبسعر 0.06 دولار/صورة عبر Vertex AI. ينتج إخراجًا من الدرجة الأولى لاستبدالات المنتجات والصور الشخصية وتصوير الطعام.

من ناحية أخرى، FLUX 1.1 Pro Ultra (Black Forest Labs) بسعر 0.04–0.06 دولار/صورة مع واقعية فوتوغرافية مماثلة. لا يتطلب اشتراكًا شهريًا — دفع خالص حسب الاستخدام عبر API، لذا في حالات «أقل من 100 صورة شهريًا»، يكون FLUX أرخص بشكل دراماتيكي. متاح عبر Replicate وfal.ai وTogether وFreepik وغيرها من مراكز الـ API الرئيسية.

عرض النص: ثنائية Ideogram + GPT Image 2

طوال 2024، كان «وضع النص داخل الصور» أكبر نقطة ضعف للذكاء الاصطناعي للصور. حقق Midjourney V7 في أحسن الأحوال دقة نص 30–40% — غير قابل للاستخدام للشعارات أو الملصقات.

غيّر Ideogram V3 ذلك، محققًا دقة نص 90–95% ودعم النصوص غير الإنجليزية بشكل معقول. ثم في أبريل 2026 دفع GPT Image 2 ذلك إلى 99%، مع عرض أصلي عبر اليابانية والكورية والصينية والهندية والبنغالية والعربية وغيرها. الصور المصغرة للشبكات الاجتماعية، ولافتات الإعلانات، والإنفوجرافيك — هذان الاثنان يمتلكان هذا المجال الآن.

4. نماذج التسعير — اشتراك مقابل الدفع لكل صورة

بعد القوة، تأتي بنية التسعير كقرار كبير تالٍ. تنقسم الأدوات بحدّة بين الاشتراك الشهري الثابت والفوترة لكل صورة. وحسب الحجم، يمكن أن تتأرجح التكلفة الشهرية 10 أضعاف.

نوع الفوترةأدوات نموذجيةالأنسب لـ
شهري ثابت (غير محدود)Midjourney Standard 30 دولار، Adobe Firefly Pro 19.99 دولارالمستخدمون اليوميون؛ من يريدون التكرار دون عدّ
شهري ثابت (قائم على الرصيد)Midjourney Basic 10 دولار (200 صورة)، Ideogram 7 دولارالمستخدمون الخفيفون في نطاق 100–200 صورة/شهر
دفع لكل صورة (API)FLUX من 0.04 دولار، Imagen 4 0.02–0.06 دولار، Recraft 0.04 دولار، GPT Image 2 قائم على الرموزتكامل التطبيقات؛ دفعات غير منتظمة لكن بحجم كبير
مجاني (وحدة GPU خاصة)Stable Diffusion 3.5 / Cascadeمهارة النشر المحلي؛ بيانات لا يمكن أن تغادر شبكتك

حساب ملموس. فرد يولّد 100 صورة/شهر:

  • Midjourney Basic: 10 دولار/شهر (حصة 200 صورة، هامش مريح)
  • FLUX 1.1 Pro Ultra: 0.05 دولار × 100 = 5 دولار/شهر
  • Imagen 4 Standard: 0.04 دولار × 100 = 4 دولار/شهر
  • Adobe Firefly Standard: 9.99 دولار/شهر (حصة 2,000 رصيد)

عند 100/شهر، يفوز الدفع حسب الاستخدام عبر API. وفوق 500/شهر، تسحق خطة Midjourney الثابتة كل شيء. حساب «فوق أي حجم شهري تصبح الخطة غير المحدودة مجدية» هو ثقافة التسعير لعام 2026 التي تحتاجها.

ملاحظة: GPT Image 2 مرفق مع ChatGPT Plus (20 دولار/شهر). إذا كنت تدفع بالفعل مقابل ChatGPT، فستحصل عليه بتكلفة إضافية صفرية. وهذا على الأرجح خيار القيمة الأفضل المخفي في 2026.

5. حسب حالة الاستخدام — دليل قرار «اختر هذه»

لديك نقاط القوة والتسعير. فأيها يناسب عملك؟ ستة أنماط شائعة، بإجابات مباشرة.

حالة الاستخدام × الموصى به × 6

دليل قرار «اختر هذه»

① رسوم المدونات / الشبكات الاجتماعية
← Midjourney V8 Basic (10 دولار/شهر)
حصة 200 صورة شهريًا كافية. من السهل الحفاظ على الاتساق الفني والعلامة التجارية. للصور المصغرة المثقلة بالنص، اقرنها بـ GPT Image 2.
② الشعارات / الملصقات / اللافتات
← Ideogram V3 (7 دولار/شهر) أو GPT Image 2
دقة النص هي الفيصل. Ideogram 90–95%، GPT Image 2 99%. للنصوص غير اللاتينية (اليابانية، العربية، إلخ)، GPT Image 2 فقط.
③ صور منتجات التجارة الإلكترونية
← Imagen 4 Ultra أو FLUX 1.1 Pro Ultra
تركيز على الواقعية الفوتوغرافية. أنسجة المواد سليمة. FLUX بالدفع حسب الاستخدام لمئات/شهر؛ Imagen عبر فئة الحجم في Vertex AI عند تجاوز 1,000+/شهر.
④ الإعلانات / النشر / الشركات
← Adobe Firefly Image 5 (من 9.99 دولار/شهر)
مدرَّب فقط على صور Adobe Stock المرخّصة بشكل سليم. مخاطر التقاضي بشأن حقوق النشر صفر فعليًا. التكامل مع Photoshop / Illustrator ميزة كبرى أيضًا.
⑤ الأيقونات / SVG / تصميم بالجملة
← Recraft V3 (0.04–0.08 دولار/صورة)
من بين النماذج القليلة من الذكاء الاصطناعي التي تُخرج متجهات. لا غنى عنه لمجموعات أيقونات التطبيقات وإنتاج الأصول المتوافقة مع دليل العلامة.
⑥ بيانات سرية / داخلية
← Stable Diffusion 3.5 (وحدة GPU خاصة)
الإجابة الوحيدة عندما لا يمكن للصور أن تغادر شبكتك. عتاد من فئة RTX 4090 يعمل بسرعة قابلة للاستخدام. LoRA يتيح الضبط الدقيق لأسلوب العلامة.

أفضل ممارسة شخصية لي: Midjourney Basic + GPT Image 2 (مرفق مع ChatGPT Plus)، بإجمالي 30 دولار/شهر.
هذا يغطي نحو 80% من الاحتياجات اليومية. الـ APIs فقط للأعمال التجارية لمرة واحدة التي تحتاج نصًا أو صورًا.

6. مزالق شائعة — الاستخدام التجاري وحقوق النشر وعرض النص

اخترت حسب القوة والتسعير. ثلاثة فخاخ لا تظهر إلا بعد أن تبدأ في استخدام الأداة:

المزلق ①: شروط الاستخدام التجاري تختلف لكل أداة

«صورة الذكاء الاصطناعي = مجانية للاستخدام التجاري» خطأ. تختلف الشروط حسب الخطة. Midjourney يتطلب الخطة Pro فما فوق لوضع التخفي (حتى لا تكون توليداتك علنية). Adobe Firefly يسوّق نفسه على السلامة التجارية، لكن Stable Diffusion يعتمد على النموذج — النماذج الأساسية مسموح بها تجاريًا بينما قد تكون LoRAs محددة محظورة. اقرأ بند الاستخدام التجاري قبل التسجيل — هذه هي القاعدة الحديدية.

المزلق ②: مخاطر حقوق النشر تتفاوت في الشدة

Midjourney وOpenAI مدّعى عليهما في دعاوى حقوق نشر مرفوعة في 2024–2025. النزاع يدور حول ما إذا كانت الأعمال المحمية بحقوق النشر قد انتهت في مجموعات تدريبهما. الأحكام لم تصدر بعد، لكن للأعمال المؤسسية، يجب أن تعلم أن Adobe Firefly هو الوحيد الكبير الذي يفصح عن بيانات تدريبه. لذلك بالضبط تتجه وكالات الإعلان والناشرون افتراضيًا إلى Firefly.

المزلق ③: «النص في الصور» مختلف ليلًا ونهارًا للإنجليزية مقابل اليابانية

«دقة 90–95%» الموصوفة لـ Ideogram V3 هي في الغالب للأحرف الإنجليزية/الرقمية. أما لليابانية والصينية والعربية وغيرها من النصوص المعقدة، فتنخفض الدقة بحدّة. للحصول على نص ياباني موثوق داخل الصورة، GPT Image 2 هو الخيار الوحيد الآن. أعمال الشعارات والملصقات متعددة اللغات تضيّق الاختيار بسرعة.

الخلاصة

تلخيص:

  • أبريل 2026: تقاعد DALL·E؛ GPT Image 2 يتولّى المهمة. ومع تحديث Midjourney V8 وImagen 4 Ultra وFLUX 1.1 Pro Ultra جميعًا، أصبحت هذه الفترة «شهر تحديثات الموردين الثلاثة».
  • تنقسم الأدوات الثماني الكبرى إلى 5 معسكرات قوة — صور فوتوغرافية / نص / فن / آمن تجاريًا / نظام تصميم.
  • ينقسم التسعير بين الشهري الثابت والدفع لكل صورة؛ ونقطة التعادل تقع حول 100 صورة/شهر للأفراد.
  • للأفراد، إقران Midjourney Basic + GPT Image 2 (مرفق مع ChatGPT Plus)، بإجمالي 30 دولار/شهر، يغطي نحو 80% من الاحتياجات اليومية.
  • للأعمال التجارية، يبقى Adobe Firefly قويًا بشكل فريد بموقعه المعتمد على بيانات التدريب المعلنة.

سؤال الذكاء الاصطناعي للصور في 2026 لم يعد «ما الأفضل؟» بل «أيها يناسب حالة الاستخدام لديّ؟» لا تطارد حلًا واحدًا يناسب الجميع. اجمع 2–3 أدوات حسب الغرض — هذه هي الإجابة الصحيحة لسوق انقسم إلى 5 معسكرات.

الأسئلة الشائعة

س1. من أين أبدأ؟

إذا كنت تدفع بالفعل مقابل ChatGPT Plus، فـ GPT Image 2 مجاني للاستخدام. إن لم يكن، فـ Midjourney Basic (10 دولار/شهر). أيهما يمنحك الإحساس الجوهري بالذكاء الاصطناعي للصور في شهرك الأول.

س2. هل توجد خيارات مجانية تمامًا؟

Stable Diffusion 3.5 إذا كان بإمكانك تشغيله محليًا — مجاني. يتطلب RTX 3060 أو أفضل وبيئة Python. للخيارات المجانية المستضافة على السحابة، راجع دليل أدوات الذكاء الاصطناعي المجانية.

س3. أيها أأمن للاستخدام التجاري؟

Adobe Firefly هو حاليًا الأأمن. تقتصر بيانات التدريب على صور Adobe Stock المرخّصة. لأعمال الذكاء الاصطناعي للصور في الإعلان / النشر / الشركات، ابدأ بتقييم Firefly. Midjourney وOpenAI مسموح بهما تجاريًا لكن مع دعاوى حقوق نشر جارية — الفرق المؤسسية ستزن تلك المخاطر بشكل فردي.

س4. ماذا عن نصائح المطالبات (prompts)؟

تختلف الأعراف حسب الأداة. Midjourney يفضّل «الموضوع، الأسلوب، المزاج، التركيب» مفصولة بفواصل. GPT Image 2 / Imagen 4 يعملان أفضل مع أوصاف لغة طبيعية طويلة ومحددة. Stable Diffusion يستفيد جيدًا من المطالبات السلبية (ما يجب استبعاده). راجع أيضًا نصائح المطالبات العامة.

س5. كيف يختلف الذكاء الاصطناعي لتوليد الفيديو؟

يغطي هذا المقال أدوات الصور الثابتة فقط. توليد الفيديو يسير على مسار منفصل — Sora 2 / Runway Gen-4 / Pika 2 / Kling 2 / Adobe Firefly Video هي الأسماء الرئيسية. Adobe Firefly استثنائي في كونه يفعل الاثنين. يتطور الفيديو حتى أسرع من الذكاء الاصطناعي للصور الثابتة؛ توقّع تحوّل المشهد على دورة من ستة أشهر.