في 22 أغسطس 2022، أصدرت الشركة الناشئة Stability AI في لندن ملف الأوزان لنموذج توليد صور يُسمى Stable Diffusion v1.4. ملف `.ckpt` واحد بحجم 4 جيجابايت. لحظة وصوله إلى GitHub وHugging Face، تحوّل «الذكاء الاصطناعي لتوليد الصور» من شيء خلف السحابة إلى برنامج يمكنك تنزيله إلى حاسوبك الشخصي. لم يكن Midjourney ولا DALL·E 2 ليفعل ذلك في حينه.

بعد قرابة أربع سنوات، وصل Stable Diffusion إلى SD 3.5 Large (8.1 مليار معامل)، ويستضيف Civitai أكثر من 100,000 نموذج مخصص وLoRA. في الوقت نفسه، تسببت موجة ردود الفعل حول ترخيص SD3 في خروج جماعي للمطوّرين، ما أفرز FLUX — الذي بنته شركة فريق SD الأصلي الجديدة، Black Forest Labs — وتفوّق FLUX على الأم في الجودة. لم تعد الصورة بسيطة.

موقفي مقدماً. إذا كان «Midjourney يكفي» يعمل لك، فلا تُجبر نفسك على Stable Diffusion. لكن إن انطبق عليك أي من التالي — «أريد إبقاء الشخصية نفسها متسقة عبر 100 صورة»، «أريد دمج بياناتي السرية محلياً»، «أريد أن تكون تكلفتي الشهرية 0 دولار»، «أحتاج نموذجاً مفتوحاً يمكنني الإفصاح عنه للعمل التجاري» — عندها SD لا مفر منه. يغطّي هذا المقال كيف يعمل SD، وتاريخ إصداراته، ومتطلبات العتاد، والترخيص، والمنظومة، وكيفية الاختيار، كل ذلك حتى مايو 2026.

Stable Diffusion · ذكاء اصطناعي للصور مفتوح المصدر

أربعة أشياء تجعله مختلفاً

— ما لن يمنحك إياه Midjourney أو DALL·E أو Firefly أبداً

1. أوزان مفتوحة
ملفات الأوزان مُوزَّعة
نزّل .safetensors مباشرة من Hugging Face. Midjourney لا يكشف حتى عن واجهة برمجة تطبيقات
2. محلي أولاً
يعمل على GPU الخاص بك
عملي بدءاً من RTX 3060 (12 جيجابايت). البيانات المولّدة تبقى على جهازك
3. ضبط دقيق
عدّله بحرية عبر LoRA
أكثر من 100,000 LoRA ونموذج مخصص على Civitai — أنمي، واقعي فوتوغرافي، شخصيات بعينها، أي شيء
4. تكلفة صفرية
مجاني بعد الكهرباء
بعد استثمار GPU الأولي، كل صورة تكلف 0 دولار. الاستخدام التجاري مسموح أيضاً بشروط

بعبارة أخرى، هذا هو الذكاء الاصطناعي للصور لمن يريدون التحرر من الاعتماد على السحابة، والصناديق السوداء، والاشتراكات الشهرية.
الثمن الذي تدفعه في المقابل: بطاقة GPU، ووقت إعداد، وتجارب وأخطاء في الموجّهات.

1. 22 أغسطس 2022 — اليوم الذي أصبح فيه الذكاء الاصطناعي للصور شيئاً يمكنك تنزيله

في حينه، كان مشهد الذكاء الاصطناعي لتوليد الصور سباقاً بين فريسين: DALL·E 2 من OpenAI (إصدار تجريبي بدعوة فقط) وMidjourney V3 (على Discord فقط). كلاهما سحابيٌ فقط، وكلاهما أبقى أوزانه مخفية تماماً. ما تعلّمه الذكاء الاصطناعي، وكيفية تشغيله، وما يمكنه وما لا يمكنه توليده — كل ذلك كان متروكاً لتقدير المزوّد.

ثم اتخذت Stability AI خياراً لم يتوقعه أحد: إصدار ملف الأوزان نفسه. نموذج انتشار مُدرَّب على LAION-5B (5.8 مليار زوج صورة-نص)، كود الاستدلال تحت MIT، الأوزان تحت CreativeML Open RAIL-M (الاستخدام التجاري مسموح، مجاني تقريباً بالكامل). في غضون أسبوع، شغّله مهندسون حول العالم في Google Colab، وُلدت واجهة WebUI محلية (لاحقاً AUTOMATIC1111)، وأُطلق Civitai — وانطلق تخصيص الفن الاصطناعي.

الشيء اللافت لم يكن القفزة التقنية بقدر ما كان السابقة التي أرستها: «الذكاء الاصطناعي لتوليد الصور شيء يمكن للأفراد امتلاكه وتعديله». إذا أردت تشبيهاً من عالم نماذج اللغة الكبيرة، فالصدمة كانت قريبة من نزول Llama 2 وLlama 3 مع «الاستخدام التجاري مسموح». منذ ذلك الحين، تجري صناعة الذكاء الاصطناعي للصور على مسارين متوازيين: «مغلق وعالي الجودة» (MJ/DALL·E) و«مفتوح وقابل للتخصيص بحرية» (عائلة SD).

2. ما هو Stable Diffusion — في ثلاثة أسطر

Stable Diffusion هو ذكاء اصطناعي لتوليد الصور مفتوح الأوزان قائم على نموذج الانتشار، أصدرته Stability AI. تفصيل في ثلاثة أسطر:

1. كيف يعمل
يبدأ من صورة ضوضاء عشوائية، ثم يزيل الضوضاء تدريجياً ليطابق موجّهك النصي. يستغرق 20–50 خطوة
2. البنية
حِزمة ثلاثية: مُرمِّز نصي (CLIP/T5) يفسّر الموجّه، وU-Net/DiT الذي يقوم بإزالة الضوضاء، وVAE الذي يضغط/يفكّ ضغط الصورة
3. التوزيع
ملفات الأوزان (.safetensors، من 2 إلى 16 جيجابايت) قابلة للتنزيل بحرية من Hugging Face. شغّلها على GPU محلي أو عبر خدمات استدلال سحابية

الشيء الذي أعتقد أنه يهم فعلاً هو ما يعنيه «نموذج الانتشار» بكلمات بسيطة. في عصر GAN (StyleGAN ورفاقه)، كان مولّد ومُميِّز يتقاتلان لإنتاج الصور. اتخذت نماذج الانتشار طريقاً مختلفاً: «ابدأ من صورة مليئة بالضوضاء واطرح الضوضاء تدريجياً». فكرة أبسط — لكن تبيّن أنها تنتج مخرجات أكثر استقراراً وأعلى دقة بكثير من GAN. هذه الرؤية هي جوهر نجاح SD، وتقريباً كل ذكاء اصطناعي للصور منذ ذلك الحين (Imagen، DALL·E 3، FLUX) هو أيضاً نموذج انتشار.

3. سلسلة الإصدارات — SD1.5 / SDXL / SD3.5 وانشقاق FLUX

أكثر شيء يربك في تاريخ SD هو «أي إصدار ينبغي أن أستخدم فعلاً؟» يختلف كل جيل في الأداء، والترخيص، وGPU الموصى به، ومنظومة LoRA. لنوضّح ذلك.

الإصدار تاريخ الإصدار المعاملات VRAM الموصى به الخصائص
SD 1.5 أكتوبر 2022 0.9 مليار 4–8 جيجابايت الأخف، أكثر LoRAs، الأقوى في الأنمي. لا يزال السائد على Civitai
SD 2.x نوفمبر 2022 0.9 مليار 6–8 جيجابايت يمكن تخطّيه عملياً. قلّت بيانات التدريب، استقبال ضعيف، لم ينتشر أبداً
SDXL 1.0 يوليو 2023 3.5 مليار 8–12 جيجابايت 1024×1024 معيار. الخيار الافتراضي للواقعي الفوتوغرافي والتصميم التجاري. ثاني أكبر تجمع لـLoRA
SD 3 Medium يونيو 2024 2 مليار 8–12 جيجابايت تسببت ردة الفعل على الترخيص بخروج جماعي للمطوّرين. يُنظر إليه على نطاق واسع كفشل
SD 3.5 Medium أكتوبر 2024 2.5 مليار 9.9 جيجابايت رد اعتبار لـSD3. بنية MMDiT-X، مصمَّم لأجهزة المستهلكين
SD 3.5 Large أكتوبر 2024 8.1 مليار 18 جيجابايت (11 جيجابايت في FP8) جودة الإصدار الرائد. موجَّه لفئة RTX 4090
FLUX.1 dev أغسطس 2024 12 مليار 12–24 جيجابايت من Black Forest Labs، التي أسسها مطوّرو SD السابقون. يُقيَّم على نطاق واسع فوق SD نفسه

الخلاصة: إن كنت تبدأ اليوم، فالاختيار ثنائي بين SDXL وFLUX.1 dev. SD 1.5 خفيف ولديه أكثر LoRAs، لكنه متأخر بجيل في الجودة. SD 3.5 Large ثقيل ومع ذلك يتقدّمه FLUX. التصنيف العملي: SDXL للتصميم التجاري، FLUX لأعلى جودة، SD 3.5 Medium لأخف إعداد محلي قابل للتطبيق.

وصول FLUX له قصة خلفية ساخرة. بعد كارثة ترخيص SD3 (مزيد أدناه)، غادر كثير من فريق SD الأصلي Stability AI، وأسّسوا Black Forest Labs في ألمانيا، وأطلقوا FLUX.1. «خليفة SD أعلى جودة» — قادم من الأشخاص الذين بنوا SD في المقام الأول. من منظور المجتمع، يرى كثيرون الآن FLUX الوريث الشرعي بدلاً من الأم.

4. واقع التشغيل المحلي — حسب فئة VRAM

«يعمل محلياً» شيء؛ وما يمكن لجهازك المحدد فعله شيء آخر. هذا ما رأيته في الممارسة.

4–6 جيجابايت (GTX 1660 / RTX 3050)
فئة بالكاد تعمل
SD 1.5 فقط. 20–60 ثانية لكل صورة. SDXL وما فوق صعب
8 جيجابايت (RTX 3060 Ti / 4060)
الحد الأدنى العملي
SDXL يعمل مع تحسين الذاكرة. 15–30 ثانية لكل صورة 1024 بكسل
12 جيجابايت (RTX 3060 12GB / 4070)
فئة مريحة
SDXL/SD 3.5 Medium بهامش. كدّس LoRAs بحرية. 5–15 ثانية لكل صورة
16–24 جيجابايت (RTX 4080 / 4090)
إعداد إنتاج جاد
FLUX/SD 3.5 Large بهامش. يمكنك تدريب LoRAs خاصة بك. 2–8 ثوانٍ لكل صورة

ملاحظة: مطلوب أيضاً 16 جيجابايت أو أكثر من ذاكرة النظام و100 جيجابايت أو أكثر من مساحة SSD الحرة. Mac يعمل عبر MPS الخاص بـApple Silicon لكنه أبطأ بـ3–5 مرات من NVIDIA

دون تجميل: إن أردت التعامل بجدية مع SD اليوم، نقاط الدخول الواقعية هي RTX 3060 12GB (حوالي 200 دولار مستعمل) أو RTX 4070 (حوالي 600 دولار جديد). بطاقات GPU بسعة 8 جيجابايت تعمل، لكنك تدخل مستنقعاً من علامات التحسين والكَمّنة — ليس ما أنصح به مبتدئاً. إن لم ترغب بشراء GPU، فالخطوة الصحيحة هي خدمات الاستدلال السحابية (Runpod / Replicate / استضافة Civitai الخاصة) بتكلفة تقريبية 0.001–0.01 دولار لكل صورة.

5. فخ الترخيص — دروس من ردة الفعل على SD3

«مفتوح المصدر، لذا الاستخدام التجاري مسموح» ليس البيان البسيط الذي يريده الناس مع SD. الترخيص يعتمد على الإصدار.

SD 1.5 / SDXL
CreativeML Open RAIL-M
لا سقف للإيرادات. الاستخدام التجاري مجاني تقريباً بالكامل. القيود تتعلق فقط بالاستخدام غير القانوني أو الضار
SD 3 / SD 3.5 / FLUX.1 dev
Community License (بسقف إيرادات 1 مليون دولار)
يمكن للأفراد والمنظمات تحت مليون دولار من الإيرادات السنوية استخدامه تجارياً. فوق ذلك، يلزم عقد مؤسسي

المدوّنون الأفراد، والمستقلون، والشركات الناشئة في مراحلها المبكرة كلهم بمأمن. الاتفاق التجاري ضروري فقط حين تدمجه مؤسسة كبيرة في منتج. بيع الصور المولّدة بحد ذاتها غير محدود — مهما ولّدت أو بعت، لا تدين بشيء لـStability AI

حين نزل SD 3 في يونيو 2024، كان ترخيصه قاسياً جداً — رسوم مبنية على الاستخدام لكل صورة مولّدة، وحظر توزيع المشتقات على Civitai — لدرجة أن Civitai رفض علناً استضافة مشتقات SD3. أعلن المجتمع «SD مات»، وانتقل كثير من المطوّرين إلى Black Forest Labs وأطلقوا FLUX. خفّفت Stability AI الشروط بشكل كبير حين أُطلق SD 3.5 في أكتوبر (الإصدار الحالي بسقف مليون دولار)، لكن حتى مايو 2026، لم تتعافَ ثقة المجتمع بالكامل.

نصيحة عملية: «فقط استخدم SDXL» هو الإصدار الأقل عضّاً. CreativeML Open RAIL-M يعني لا سقف للإيرادات، تجمّع LoRA ضخم، والمنظومة ناضجة. انتقل إلى SD 3.5 أو FLUX فقط حين يتوقّف SDXL عن أن يكون كافياً.

6. Civitai / LoRA / ComfyUI — منظومة أكبر من النموذج نفسه

الحديث عن Stable Diffusion كـ«مجرد نموذج» يُفوّت الفكرة. قوة SD في المنظومة المحيطة به.

Civitai
منصة توزيع النماذج
أكثر من 100,000 نقطة تفتيش وLoRA وembeddings. أنمي، واقعي فوتوغرافي، شخصيات بعينها، أوضاع بعينها — أي شيء
LoRA
ملف تدريب إضافي
ملفات صغيرة بحجم 50–300 ميجابايت تضيف أسلوباً أو شخصية إلى نموذج أساس. كدّسها لدمج التأثيرات
ComfyUI
واجهة مستخدم قائمة على العُقد
خيار المحترفين. ابنِ سير عمل معقّداً بصرياً (سلاسل ControlNet ← تكبير ← Inpaint وغيرها)
A1111
WebUI سهلة للمبتدئين
مشروع AUTOMATIC1111. قائم على النماذج وبديهي. كيف دخل معظم مستخدمي SD أولاً
ControlNet
التحكم بالتكوين
حدّد التكوين بصورة وضعية، أو رسم خطوط، أو خريطة عمق. Midjourney لا يملك ما يعادل ذلك بهذه الدقة
IP-Adapter
مرجع صور
انسخ أسلوب صورة مرجعية، أو وجهاً، أو ملابس إلى صورة جديدة. أساسي لاتساق الشخصية

تحذير واحد. LoRAs الخاصة بـSD 1.5 لا تُحمَّل على SDXL؛ LoRAs الخاصة بـSDXL لا تُحمَّل على FLUX. كل نموذج أساس منظومة بحد ذاته. إن كانت LoRAs التي تحبها على Civitai كلها لـSD 1.5، فالتحوّل إلى SDXL يعني التخلي عنها. عند البحث على Civitai، تحقق دائماً من فلتر «Base Model».

7. Midjourney مقابل Stable Diffusion — أيهما تختار

كثيراً ما يُسأل «أيهما أفضل، SD أم Midjourney/DALL·E؟» — لكن هذا هو المحور الخاطئ. اختر Midjourney للجودة، اختر SD للحرية والملكية. دوران مختلفان تماماً.

الجانب Midjourney V8 Stable Diffusion (SDXL/FLUX)
سهولة الاستخدام ممتاز اكتب الموجّه فحسب متوسط يتطلب إعداداً
الجودة الافتراضية ممتاز أفضل مظهر فني في الصناعة جيد يعتمد على النموذج (FLUX على قدم المساواة)
التحكم بالتكوين متوسط الموجّه فقط ممتاز تحكم كامل عبر ControlNet
اتساق الشخصية جيد Character Reference ممتاز درّب LoRA، استنسخ بإتقان
التكلفة الشهرية 10–120 دولاراً 0 دولار (محلي) أو دفع حسب الاستخدام
الاستخدام التجاري مسموح على الخطط المدفوعة SDXL غير محدود؛ SD3.5/FLUX بسقف مليون دولار
خصوصية البيانات سيئ مرتبط بالسحابة ممتاز يمكن أن يبقى محلياً من البداية للنهاية
منحنى التعلّم ساعات أيام إلى أسابيع

القراءة النظيفة: لـ«صنع صورة جميلة واحدة»، Midjourney. 10 دولارات شهرياً ولا جحيم إعداد. لـ«أريد 100 صورة لنفس الشخصية»، أو «أريد دمج بيانات مملوكة»، أو «أريد سعراً ثابتاً تجارياً بأي حجم»، أو «أريد إعادة إنتاج أسلوب أنمي معيّن»، Stable Diffusion. ولا أيٌّ منهما «أفضل». كثير من المحترفين يستخدمون كليهما (مصمم رسوم أعرفه يضع التكوين الأولي في MJ ويُنهي في SD).

8. ثلاثة فخاخ — حقوق النشر، المحتوى غير المناسب، التوافق

ثلاثة أشياء ستصطدم بها عند استخدام SD يستحق معرفتها مقدماً.

الفخ 1: مخاطر حقوق نشر بيانات التدريب

تُدرَّب نماذج SD الأساسية على LAION-5B (5.8 مليار صورة مُستخرَجة من الإنترنت). حتماً، الأعمال محمية الحقوق موجودة بأعداد كبيرة. Getty Images تقاضي حالياً Stability AI (رُفعت 2023، جارية في كل من الولايات المتحدة والمملكة المتحدة)، وLoRAs «أسلوب فنان بعينه» على Civitai أصبحت أكثر رمادية بشكل واضح منذ 2025. للعمل التجاري، الحد الأدنى من النظافة: لا تستخدم أسماء فنانين بعينهم في الموجّهات، وحتى على LoRAs الخاصة بـCivitai، تجنّب الشخصيات العامة أو الأعمال المبنية على أصحاب حقوق يمكن التعرف عليهم. إن كان «الأمان التجاري» غير قابل للتفاوض، Adobe Firefly هو البديل.

الفخ 2: توليد المحتوى غير المناسب سهل للغاية

لأن SD مفتوح الأوزان، فتعطيل SafetyChecker يعني أن الصور الجنسية أو العنيفة سهلة التوليد. Civitai يستضيف علناً كثيراً من النماذج غير المناسبة. التقنية بحد ذاتها محايدة، لكن إنشاء أو توزيع محتوى مولّد يشمل قاصرين غير قانوني في كثير من الدول (اليابان حالياً تناقش تشريعاً). لا تفعل هذا أبداً على جهاز العمل خلال ساعات العمل — السجلات وحركة الشبكة تجعل اكتشاف ذلك تافهاً. حتى على جهاز منزلي، فئات معيّنة غير قانونية للإنشاء أو حتى التخزين. الوعي الذاتي إلزامي.

الفخ 3: انشقاقات التوافق بين الأجيال

كما غُطّي أعلاه، SD1.5 / SDXL / SD3.5 / FLUX كل منها منظومة بحد ذاتها. LoRAs والembeddings ونماذج ControlNet لا تُحمَّل بشكل متبادل. «دعني أرقّي إلى SDXL» قد يعني اكتشاف 50 LoRA لـSD1.5 لم تعد تستطيع استخدامها. إن كنت تبدأ، اختر واحدة (SDXL أو FLUX) وابقَ ضمن تلك المنظومة — هذا في الواقع أكثر كفاءة على المدى البعيد.

الخلاصة

الجوهر
الثورة التي حوّلت الذكاء الاصطناعي للصور إلى «برنامج يمكن للأفراد امتلاكه وتعديله». يوفّر حريات لا يوفّرها MJ/DALL·E
نقطة الدخول
RTX 3060 12GB + SDXL + A1111 هي البداية الواقعية. لا GPU؟ استخدم Runpod من 0.001 دولار/صورة
أيهما تستخدم
معظم الناس: Midjourney. اختر SD فقط إن احتجت «100 من نفس الشخصية»، أو «بيانات خاصة»، أو «تكاليف الكهرباء فقط»
تنبيه
حقوق النشر، والمحتوى غير المناسب، وانشقاقات التوافق هي الثلاثة التي يجب معرفتها مبكراً. ابدأ العمل التجاري على SDXL (لا سقف للإيرادات)

Stable Diffusion غيّر العالم في 2022. لكن في 2026، «فقط استخدم SD» لم يعد الجواب الافتراضي — Midjourney V8 يفوز في الجودة الخام، وAdobe Firefly يفوز في الأمان التجاري. السبب في أن SD لم يمت — وفي الواقع اكتسب زخماً مع FLUX — هو أنه يبقى الخيار الوحيد لـ«استخدام الذكاء الاصطناعي للصور على جهازك الشخصي، ببياناتك الخاصة، بالطريقة التي تريدها بالضبط، دون الاعتماد على أي شركة سحابية». Midjourney قد يحجبك عن Discord؛ OpenAI قد تغيّر شروط خدمتها؛ ملف أوزان SD على قرص SSD لديك ملكك. لمن يشعرون بأمان أكثر بهذه الطريقة، سيبقى SD أداة خاصة.

الأسئلة الشائعة

هل Stable Diffusion مجاني؟

النموذج نفسه (ملفات الأوزان) مجاني للتنزيل والاستخدام. تحتاج فعلاً إلى GPU لتشغيله — كحد أدنى RTX 3060 12GB (حوالي 200 دولار) — أو خدمة استدلال سحابية (Runpod يكلف حوالي 0.4 دولار/الساعة). لا تدين بأي رسوم شهرية لـStability AI.

هل أستطيع استخدامه تجارياً؟

يعتمد على الإصدار. SD 1.5 وSDXL مفتوحان تماماً (CreativeML Open RAIL-M، لا سقف للإيرادات). SD 3 وSD 3.5 وFLUX.1 dev مجانية للاستخدام التجاري تحت مليون دولار من الإيرادات السنوية؛ فوق ذلك تحتاج عقداً مع Stability AI أو Black Forest Labs. بيع الصور المولّدة بحد ذاتها غير محدود على جميع الإصدارات.

أيهما أفضل، Midjourney أم SD؟

يعتمد على الاستخدام. إن أردت صورة جميلة واحدة من موجّه، Midjourney أبسط بكثير والجودة ممتازة. إن احتجت إنتاج نفس الشخصية بكميات، أو دمج بيانات مملوكة، أو خفض التكلفة إلى الكهرباء، أو إعادة إنتاج أسلوب أنمي بعينه، فقط Stable Diffusion ينجح. كثير من المحترفين يستخدمون كليهما.

بأي إصدار أبدأ؟

SDXL 1.0 هو أأمن بداية اليوم. يعمل في 8–12 جيجابايت VRAM، لديه مكتبة LoRA ضخمة على Civitai، لا سقف إيرادات تجاري، والمنظومة ناضجة. لأعلى جودة انتقل إلى FLUX.1 dev (موصى به 16 جيجابايت VRAM أو أكثر). SD 1.5 خفيف لكنه متأخر بجيل في الجودة — يُرجَّح أن يترك المستخدمين الجدد يريدون أكثر.

هل FLUX شيء مختلف عن Stable Diffusion؟

مرتبط تقنياً لكن من شركة مختلفة. FLUX من Black Forest Labs، التي أسسها مهندسون سابقون في Stability AI بَنوا SD. مكانه أقل كخليفة وأكثر كـ«ذكاء اصطناعي مفتوح للصور أعلى جودة». المنظومتان منفصلتان (LoRAs الخاصة بـFLUX لا تعمل في SD). لكن في فئة «ذكاء اصطناعي مفتوح الأوزان قابل للتشغيل محلياً» هما من نفس المعسكر، وكلاهما مواطن من الدرجة الأولى على Civitai وComfyUI.

هل أشتري GPU أم أستأجر السحابة؟

السحابة (Runpod / Replicate / استضافة Civitai عند الطلب) أرخص إن ولّدت أقل من 50 صورة شهرياً. حوالي 0.001–0.01 دولار لكل صورة. إن ولّدت مئات شهرياً، أو درّبت LoRAs خاصة بك، أو رفضت إرسال البيانات خارج جهازك، فشراء GPU يُسدّد ثمنه. النقطة الذهبية من حيث التكلفة الفعّالة للمستخدمين الجادين هي RTX 3090 مستعمل (24 جيجابايت، حوالي 500 دولار).