المحتويات
- 1. ما هو توليد الصور بالذكاء الاصطناعي؟ وما الذي يمكنه فعله؟
- 2. كيف يعمل، بشكل مبسّط (نماذج الانتشار)
- 3. البداية — الخطوات الأربع المشتركة
- 4. [الأساس] تشريح موجّه الصورة
- 5. سبع نصائح لإتقانه
- 6. ما الذي يصعب على الذكاء الاصطناعي، وكيف تعالجه
- 7. الحقوق والاستخدام التجاري والأخلاقيات (مهم)
- 8. الخطوات التالية، حسب الأداة
- الخلاصة
- الأسئلة الشائعة
"أنا لا أجيد الرسم، إذن هذا الأمر ليس لي" — هل تحمل هذا التصوّر المسبق عن توليد الصور بالذكاء الاصطناعي؟ الحقيقة عكس ذلك تمامًا. اكتفِ بإعطاء التعليمات بالكلمات، وبعد ثوانٍ تحصل على مرئيات بجودة احترافية. ملصقات، نماذج أولية للمنتجات، صور مصغّرة لوسائل التواصل، رسوم توضيحية للمدونات — ما كنت تضطر يومًا إلى تكليف مصمّم به، يمكنك الآن إنشاؤه من كلماتك أنت.
هذا دليل عابر للأدوات حول "الصورة الكبرى للبدء بتوليد الصور بالذكاء الاصطناعي وإتقانه"، دون الاعتماد على أداة واحدة بعينها. باختصار، مفاتيح التحسّن هي (1) معرفة سير العمل المشترك المكوّن من أربع خطوات، و(2) استيعاب "تشريح" موجّه الصورة (الموضوع، المشهد، الأسلوب، الإضاءة، التكوين، التقني). وكلاهما يصلح في أي أداة. وبخصوص "أي أداة تختار،" راجع مقارنة أفضل أدوات توليد الصور بالذكاء الاصطناعي؛ وللطرق العملية المحددة، راجع كيفية استخدام Midjourney وما هو Stable Diffusion. يركّز هذا المقال على الأساسيات التي تنطبق أيًّا كانت الأداة.
"نحت" صورة من التشويش (الضوضاء)
— كلماتك تصبح المخطّط الذي يوجّه كيفية النحت
ضوضاء خالصة
قيد التوليد
يبدأ الشكل بالظهور
اكتمل
يقوم الذكاء الاصطناعي بـترتيب التشويش العشوائي تدريجيًّا ليتحوّل إلى صورة. وما يوجّه هذا "الترتيب" هو الموجّه (التعليمات) الذي تكتبه أنت.
*يلخّص هذا المقال أساليب عامة عابرة للأدوات. إن مواصفات كل أداة وأسعارها وشروطها التجارية وطريقة تعاملها مع حقوق النشر تتغيّر بسرعة وتختلف من بلد إلى آخر. تحقّق دائمًا من أحدث الشروط الرسمية ومن قوانين بلدك قبل الاستخدام.
1. ما هو توليد الصور بالذكاء الاصطناعي؟ وما الذي يمكنه فعله؟
توليد الصور بالذكاء الاصطناعي تقنية تجعل الذكاء الاصطناعي، حين تعطيه التعليمات نصًّا (موجّهًا)، يرسم صورة جديدة تمامًا تطابق طلبك. من المناظر الطبيعية الواقعية إلى الرسوم التوضيحية وأفكار الشعارات والنماذج الأولية للمنتجات — يمكنه صنع أي نوع تقريبًا.
توليد الصور بالذكاء الاصطناعي = "تقنية تجعل الكلمات الذكاء الاصطناعي يرسم صورة جديدة تمامًا من الصفر." إنها ليست مهارة الرسم بل مهارة الإيصال — النسخة المرئية من هندسة الموجّهات.
المجال واسع: صور مصغّرة لوسائل التواصل والمدونات، لافتات إعلانية، صور للمنتجات والديكور الداخلي، مسوّدات أولى للأيقونات والشعارات، اسكتشات لكتب الصور والقصص المصوّرة، رسوم توضيحية لشرائح العروض التقديمية — وهو يغطّي معظم لحظات "أحتاج صورة سريعة فحسب." وكما أتاح الذكاء الاصطناعي النصّي "الكتابة" للجميع، فإن الذكاء الاصطناعي المولّد للصور وضع "الرسم" في متناول الجميع. لننظر في كيفية عمله وطريقة استخدامه، خطوة بخطوة.
2. كيف يعمل، بشكل مبسّط (نماذج الانتشار)
تعمل معظم أدوات توليد الصور بالذكاء الاصطناعي بأسلوب يُسمّى "نموذج الانتشار." الاسم مخيف، لكن الفكرة بسيطة كبساطة المخطّط الافتتاحي.
بصيغة مبسّطة —
- يُدرَّب الذكاء الاصطناعي على أعداد ضخمة من أزواج "الصورة + التعليق التوضيحي"، فيتعلّم كيف تتطابق الكلمات مع المظاهر.
- عند التوليد، يبدأ من ضوضاء عشوائية (تشويش).
- مستخدمًا موجّهك دليلًا، يزيل الضوضاء تدريجيًّا ليدع الصورة تظهر.
- عبر خطوات كثيرة، "ينحت" النتيجة، مقتربًا من هدفك.
النقطة الأساسية: الذكاء الاصطناعي لا ينسخ ويلصق صورًا موجودة؛ بل يرسم من الصفر في كل مرة، استنادًا إلى الأنماط التي تعلّمها. ولذلك يعطي الموجّه نفسه صورة مختلفة قليلًا في كل تشغيل (يمكن تثبيت هذا "التذبذب" عبر "البذرة" (seed)، كما سيُشرح لاحقًا). لست بحاجة إلى فهم الآلية فهمًا كاملًا، لكن معرفة أنه "يبني صورة من الضوضاء مستخدمًا الكلمات كدليل" تجعلك تدرك لماذا يشكّل الموجّه النتيجة بهذه القوة. ولمزيد من التعمّق، يستكشف ما هو Stable Diffusion هذه الآلية.
3. البداية — الخطوات الأربع المشتركة
أيًّا كانت الأداة التي تستخدمها، فإن سير العمل الأساسي واحد. استوعب هذه الخطوات الأربع، وستنتقل المهارة معك حتى لو تغيّرت الأداة.
اختر أداة
اختر حسب الاستخدام والميزانية والشروط التجارية. إن لم تكن متأكدًا، راجع المقارنة.
اكتب موجّهًا
حدّد الموضوع والأسلوب والتكوين بالكلمات (القسم 4).
ولّد واختر
أنتج عدّة صور، واختر الأفضل. جرّب بحرّية.
حسّن وأنهِ
عدّل، وأعد رسم أجزاء، وارفع الدقّة حتى الاكتمال.
تملك معظم الأدوات باقات مجانية أو تجارب مجانية، لذا فإن أفضل خطوة ببساطة هي تجربة إحداها. ويتيح المزيد والمزيد منها — ChatGPT (مع GPT Image المدمج)، وGemini، وغيرها — صنع الصور داخل أداة محادثة ذكاء اصطناعي تستخدمها أصلًا، فتغدو الخطوة الأولى أيسر عامًا بعد عام. لا تستهدف الكمال من البداية؛ بل تنقّل ذهابًا وإيابًا بين الخطوتين 3 و4 لتنمية النتيجة. هذه بالضبط عقلية "التكرار" من المقال السابق، الدليل العملي لهندسة الموجّهات.
4. [الأساس] تشريح موجّه الصورة
هنا يظهر الفارق الأكبر. يُبنى موجّه الصورة الجيّد من ستة أجزاء. لست بحاجة إليها جميعًا؛ أضف ما تتطلّبه الصورة التي تريدها.
| الجزء | الوظيفة | مثال على الصياغة |
|---|---|---|
| ① الموضوع | ما الذي تريد رسمه (البطل) | "قطة بيضاء"، "امرأة تحمل قهوة" |
| ② المشهد / الإطار | أين وفي أي موقف | "بجانب نافذة"، "شارع بعد المطر" |
| ③ الأسلوب | مظهر العمل الفني | "ألوان مائية"، "تصوير فوتوغرافي"، "أسلوب أنمي" |
| ④ الإضاءة / اللون | الإضاءة ولوحة الألوان | "شمس صباح ناعمة"، "ألوان دافئة" |
| ⑤ التكوين / الزاوية | موضع الكاميرا والمسافة | "من الأعلى"، "لقطة قريبة" |
| ⑥ التقني | النسبة، الجودة، إلخ. | "16:9"، "تفاصيل عالية" |
اجمعها فتحصل، على سبيل المثال، على هذا. وكلّما زوّدت أجزاءً أكثر، اقتربت من اللقطة التي قصدتها.
[الأسلوب] تصوير فوتوغرافي، بسيط، [الإضاءة] ضوء طبيعي ناعم،
[التكوين] منظر من الأعلى، [التقني] 1:1، تفاصيل عالية
عنصران إضافيان من المفيد معرفتهما: الموجّهات السلبية ونسبة العرض إلى الارتفاع.
🚫 الموجّه السلبي
حقل لـ"ما لا تريده." مثال: "جودة منخفضة، ضبابية، أصابع زائدة." متاح في بعض الأدوات مثل Stable Diffusion؛ ويقلّل من حالات الفشل.
📐 نسبة العرض إلى الارتفاع
مواصفة العرض إلى الارتفاع. 1:1 للمنشورات المربّعة على وسائل التواصل، و16:9 للصور المصغّرة على YouTube والصور العريضة، و9:16 للوضع الرأسي على الهاتف. حدّدها مسبقًا حسب الاستخدام.
تحديث مهم واحد: النماذج الأحدث مثل GPT Image وGoogle Imagen تفهم الجمل الطبيعية جيّدًا، لذا فإن "جملة قصيرة محدّدة بسيطة" غالبًا ما تتفوّق على حشو الكلمات كأنها تعويذة سحرية. أمّا أدوات عائلة Stable Diffusion، فتستجيب جيّدًا لقوائم الكلمات والموجّهات السلبية. تذكّر أن "الصياغة التي تنجح" تختلف باختلاف الأداة.
5. سبع نصائح لإتقانه
بعد أن أتقنت التشريح، إليك تقنيات عملية ترفع النتيجة درجةً. كلّها قابلة للاستخدام اليوم.
① لا تكتفِ بواحدة
ولّد عدّة صور دفعة واحدة واختر الأفضل. اضبط العدد على افتراض أنك ستظفر بنتيجة رابحة.
② أضف شيئًا فشيئًا
لا تكدّس كل شيء دفعة واحدة؛ أضف عنصرًا في كل مرّة. فترى أي كلمة نجحت، ويسهل الضبط.
③ استخدم صورة مرجعية
عبر إدخال الصور، يمكنك تقديم صورة نموذجية لتوجيه التكوين والأجواء.
④ أعد رسم جزء واحد فقط
عبر التعبئة الداخلية (inpainting)، أصلح فقط الموضع الذي يزعجك مع الحفاظ على البقية.
⑤ ثبّت البذرة (seed)
استخدام "البذرة العشوائية" نفسها يعيد إنتاج صورة شبه متطابقة، فيُبقي التعديلات الدقيقة مستقرّة.
⑥ ارفع الدقّة في النهاية
ارفع دقّة الصورة التي أعجبتك إلى جودة تناسب الطباعة والنشر.
⑦ احفظ الموجّهات الجيّدة
دوّن الموجّهات التي نجحت. فـ"أنماطك" الخاصة تصبح رصيدًا لك.
الأكثر فاعلية هما ① اضبط العدد و② أضف شيئًا فشيئًا. توليد الصور بالذكاء الاصطناعي ليس "مقامرة بضربة واحدة" بقدر ما هو أقرب إلى "السحب من غاتشا مع تضييق الاتجاه." تعامل مع الإخفاقات على أنها "أدلّة للمحاولة التالية"، فتتحسّن أسرع بكثير.
6. ما الذي يصعب على الذكاء الاصطناعي، وكيف تعالجه
يبدو كلّي القدرة، لكن لتوليد الصور بالذكاء الاصطناعي نقاط ضعف. ومعرفتها مسبقًا تجنّبك الذعر (وكلّها مجالات تواصل أحدث النماذج تحسينها).
- اليدان والأصابع: يميل العدد أو الشكل إلى الاختلال. لا تصوّرها في لقطات قريبة، وزِد عدد عمليات التوليد، وأصلح بالتعبئة الداخلية.
- النص: قد تخرج الحروف على اللافتات أو الشعارات مشوّهة. اختر أداة قوية في النص، أو أضف النص لاحقًا في برنامج تحرير.
- الاتساق: قد يصعب إظهار الشخصية نفسها في وضعية مختلفة. استخدم صورًا مرجعية أو ميزات تثبيت الشخصية.
- الدقّة الدقيقة: المخطّطات والخرائط والنسب الدقيقة ليست من نقاط قوّته. اجعل إنسانًا يراجع الاستخدامات التي تتطلّب دقّة.
- التعليمات المُهملة: مع كثرة العناصر، يُتجاهَل بعضها. ضع المواصفات الأساسية أولًا، أو قسّمها.
وبقلب المعادلة، فإن استخدامه بطرق تتجنّب نقاط ضعفه يقلّص حالات الفشل بشدّة. "لا تصوّر اليدين عن قرب"، "أضف النص لاحقًا" — معرفة هذه الحيل الصغيرة هي ما يفصل بين نتيجة مستقرّة وأخرى متذبذبة.
7. الحقوق والاستخدام التجاري والأخلاقيات (مهم)
يسهل تجاهل هذا الجزء، لكن إن استخدمت الذكاء الاصطناعي في العمل، فهو ضروري. إليك النقاط الأساسية لتجنّب المشكلات.
⚖️ حقوق النشر اليوم
يرى مكتب حقوق النشر الأمريكي وحكم Thaler (2025) أن العمل المولّد بالكامل بالذكاء الاصطناعي يصعب حمايته بحقوق النشر (يلزم إسهام إبداعي بشري). وتختلف المعالجة من بلد إلى آخر.
💼 الاستخدام التجاري
يعتمد ما إذا كان مسموحًا على شروط كل أداة. وقد تختلف الشروط بين الباقات المجانية والمدفوعة. للعمل التجاري، تُعدّ الأدوات المسوّقة بأنها "آمنة تجاريًّا" (مراعيةً لبيانات التدريب) خيارًا.
🛡️ الأخلاقيات والسلامة
الصور المزيّفة لأشخاص حقيقيين (التزييف العميق) وتقليد أساليب الآخرين دون إذن ممنوعان منعًا باتًّا. وتنتشر بيانات المصدر (C2PA) التي توسم التوليد بالذكاء الاصطناعي.
الخلاصات بسيطة. (1) "الصورة المصنوعة بالذكاء الاصطناعي" ليست تلقائيًّا عملًا محميًّا بحقوقك (المخرَج المولّد بالكامل بالذكاء الاصطناعي ضعيف الحماية بوجه خاص؛ وكلّما أضفت تحريرًا واختيارًا وترتيبًا بشريًّا، زادت الحقوق المعترَف بها). (2) تحقّق دائمًا من الاستخدام التجاري في ضوء شروط الأداة التي تستخدمها. (3) لا تقلّد أشخاصًا حقيقيين أو علامات تجارية أو أساليب فنانين آخرين دون إذن. ومؤخرًا، مع حمل جميع صور DALL-E بيانات مصدر C2PA وما شابه ذلك من خطوات، يتقدّم التوجّه نحو "الإفصاح عن أن شيئًا ما مصنوع بالذكاء الاصطناعي." وعند الشك، فإن عادة التوقّف لتسأل "هل من المقبول نشر هذا أو بيعه؟" هي خير دفاع لك.
8. الخطوات التالية، حسب الأداة
بعد إتقان الأساسيات، جرّب صنع شيء بأداة تناسب هدفك. فالتشريح الوارد في هذا المقال يصلح كما هو، أيًّا اخترت.
🔰 غير متأكد أيها تختار
لمقارنة حسب الاستخدام، راجع مقارنة أفضل أدوات توليد الصور بالذكاء الاصطناعي، المنظّمة حسب الفئة: واقعية، فنية، آمنة تجاريًّا.
🎨 جودة عالية، ميل فني
للصور عالية الصقل، اطّلع على الخطوات العملية في كيفية استخدام Midjourney.
🛠️ التحكّم والتشغيل المحلي
للتحكّم في التفاصيل، افهم الآلية والإعداد في ما هو Stable Diffusion.
🖌️ مدمج في عمل التصميم
لإنتاج العروض واللافتات بكميات كبيرة، تفيدك مقارنة أدوات التصميم بالذكاء الاصطناعي (Canva وFirefly وغيرهما).
الخلاصة
إليك نقاط البدء بتوليد الصور بالذكاء الاصطناعي وإتقانه، مكثّفةً.
- الجوهر: تقنية تصنع الصور من الصفر عبر الكلمات. تطلب "مهارة الإيصال"، لا "مهارة الرسم."
- الآلية: نماذج الانتشار. من ضوضاء عشوائية، ومستخدمةً الموجّه دليلًا، تنحت صورة.
- الخطوات الأربع: اختر أداة ← موجّه ← ولّد واختر ← حسّن وأنهِ. والتكرار هو المنطلق.
- تشريح موجّه الصورة: الموضوع، المشهد، الأسلوب، الإضاءة، التكوين، التقني، إضافةً إلى الموجّه السلبي / النسبة.
- الإتقان: اضبط العدد، أضف شيئًا فشيئًا، صور مرجعية، تعبئة داخلية، بذرة، رفع الدقّة.
- الحقوق: المخرَج المولّد بالكامل بالذكاء الاصطناعي ضعيف الحماية / الاستخدام التجاري يعتمد على الشروط / التزييف العميق وما شابهه ممنوع.
في النهاية، توليد الصور بالذكاء الاصطناعي ليس "امتيازًا للموهوبين." بثلاثة أمور فحسب — اعرف التشريح، واضبط العدد، وأضف الكلمات شيئًا فشيئًا — يستطيع أي شخص الاقتراب من اللقطة التي يريدها. ابدأ في ChatGPT الذي أمامك أو في أداة تجريبية، بثلاثة أجزاء فقط: "① الموضوع + ③ الأسلوب + ⑥ النسبة." وللخطوة التالية، يُعدّ الاختيار من مقارنة الأدوات حسب الاستخدام خطوة موفّقة.
الأسئلة الشائعة
س. ما هو توليد الصور بالذكاء الاصطناعي؟ اشرح للمبتدئين من فضلك.
ج. إنها تقنية يرسم فيها الذكاء الاصطناعي، حين تعطيه التعليمات نصًّا (موجّهًا)، صورة جديدة تمامًا تطابق طلبك. يمكنك صنع نطاق واسع — مناظر طبيعية فوتوغرافية، رسوم توضيحية، أفكار شعارات، صور للمنتجات. لا حاجة إلى مهارة في الرسم؛ فما يطلبه هو "القدرة على أن تنقل، بالكلمات، أي صورة تريدها." تملك أدوات كثيرة باقات مجانية أو تجارب مجانية، فيمكنك البدء بلا تكلّف من ذكاء اصطناعي تستخدمه أصلًا، مثل ChatGPT.
س. كيف ينبغي أن أكتب موجّه الصورة؟
ج. النهج الأساسي هو أن تختار، من ستة أجزاء — الموضوع، المشهد/الإطار، الأسلوب، الإضاءة/اللون، التكوين/الزاوية، والتقني (النسبة، إلخ) — ما تحتاجه الصورة التي تريدها. مثال: "قطة بيضاء، بجانب نافذة، ألوان مائية، شمس صباح ناعمة، لقطة قريبة، 1:1." وبدلًا من حشو كل شيء دفعة واحدة، أضف عنصرًا في كل مرّة؛ فيكون أوضح أي كلمة نجحت، وتتحسّن أسرع.
س. ما هو الموجّه السلبي؟
ج. إنه آلية لتحديد "العناصر التي لا تريدها في الصورة." فمثلًا، تحديد "جودة منخفضة، ضبابية، أصابع زائدة" يدفع النتيجة لتجنّبها، مقلّلًا حالات الفشل. وهو متاح في بعض الأدوات مثل Stable Diffusion، لكن مع النماذج الجيّدة في فهم الجمل الطبيعية — GPT Image من ChatGPT، وGoogle Imagen — قد يكون أكثر فاعليةً أن تقول ببساطة "اجعلها كذا" بلغة عادية بدلًا من الاعتماد بشدّة على الموجّهات السلبية.
س. هل يمكنني استخدام الصور المصنوعة بالذكاء الاصطناعي تجاريًّا؟ وهل حقوق النشر لي؟
ج. يعتمد ما إذا كان الاستخدام التجاري مسموحًا على شروط الأداة التي تستخدمها (وقد تختلف الشروط بين المجاني والمدفوع). أمّا بخصوص حقوق النشر، فكما يشير مكتب حقوق النشر الأمريكي وحكم Thaler (2025)، فإن العمل المولّد بالكامل بالذكاء الاصطناعي دون إسهام إبداعي بشري يصعب حاليًّا حمايته بحقوق النشر. لكن كلّما أضفت إبداعًا بشريًّا — توجيه التكوين، الاختيار، التحرير — زاد احتمال الاعتراف بالحماية. وتختلف المعالجة كذلك من بلد إلى آخر، لذا تحقّق دائمًا من أحدث الشروط ومن قوانين بلدك قبل الاستخدام.
س. لماذا تُرسَم اليدان والنص بشكل سيّئ؟ وهل من حلول؟
ج. عدد الأصابع، والنص على اللافتات أو الشعارات، من الأمور الكلاسيكية التي يميل توليد الصور بالذكاء الاصطناعي إلى إفسادها. الحلول: لا تصوّر اليدين عن قرب، وزِد عدد عمليات التوليد واختر الأفضل، وأصلح بالتعبئة الداخلية (إعادة رسم جزئية)، وللنص، اختر أداة قوية في النص أو أضفه لاحقًا في برنامج تحرير. وتتحسّن أحدث النماذج باستمرار، لكن للاستخدامات المهمّة، يُنصح بمراجعة بشرية نهائية.
س. بأي أداة ينبغي أن أبدأ؟
ج. الأسهل هو تجربة ذكاء اصطناعي محادثة تستخدمه أصلًا (مثل ChatGPT، مع GPT Image المدمج). وللاختيار بجدّية، استخدم مقال المقارنة حسب الاستخدام "مقارنة أفضل أدوات توليد الصور بالذكاء الاصطناعي" واختر ما يناسب هدفك — مركّز على الواقعية، أو على الفن، أو آمن تجاريًّا، أو مدمج في التصميم. ولدينا كذلك مقالات مخصّصة: Midjourney للصقل، وStable Diffusion للتحكّم والتشغيل المحلي. وتشريح الموجّه الوارد في هذا المقال يصلح كما هو في أي أداة.