«الذكاء الاصطناعي الضخم وعالي الأداء ذكي — لكنه ثقيل ومكلف.» التقنية التي تحل هذه المشكلة هي تقطير النماذج (تقطير المعرفة). فمن خلال نقل معرفة النموذج «المعلّم» الكبير إلى نموذج «الطالب» الصغير، يمكنك الحفاظ على أكثر من 95% من أداء المعلّم بعُشر الحجم وبسرعة أكبر — أفضل ما في العالمين.

يشرح هذا المقال كيفية عمل التقطير عبر تشبيه المعلّم والطالب للمبتدئين، ويغطي الفوائد والمنهجين، وكيف يختلف عن fine-tuning و quantization. ثم يتعمّق — دون مبالغة — في «القضايا القانونية وشروط الخدمة» المحيطة بالتقطير التي جذبت اهتماماً كبيراً في 2026 (نزاع OpenAI ضد DeepSeek وبنود منع التقطير).

تقطير النماذج · من المعلّم إلى الطالب

انقل معرفة المعلّم الكبير إلى طالب صغير

— حافظ على أكثر من 95% من الأداء بعُشر الحجم

🧑‍🏫
المعلّم
كبير · عالي الأداء · مكلف
نقل المعرفة
🎓
الطالب
صغير · سريع · رخيص
أصغر وأسرع بنحو 10x يحافظ على أكثر من 95% من الأداء انتبه لشروط الخدمة

* الأرقام والأمثلة في هذا المقال مقتبسة من مواد عامة وتقارير إخبارية (حتى يونيو 2026). النقاط القانونية هي توجيه عام؛ راجع الخبراء والمصادر الرسمية لأي حالة محددة.

1. ما هو تقطير النماذج؟ تشبيه المعلّم والطالب

تقطير النماذج هو تقنية يُدرَّب فيها نموذج «طالب» صغير على إعادة إنتاج سلوك نموذج «معلّم» كبير وعالي الأداء. وبمحاكاة مخرجات المعلّم، يكتسب الطالب قدرة قريبة من قدرة المعلّم بحجم أصغر بكثير. وكمثال واقعي، يُوصف GPT-4o mini بأنه مُقطَّر من GPT-4o.

المفتاح هو الـ soft labels: التدريب العادي يُعلّم فقط «الجواب هو قطة» (hard label)، لكن التقطير يمرّر توزيع الاحتمالات الكامل للمعلّم مثل «90% قطة، 8% كلب، 2% ثعلب» إلى الطالب. تلك «درجة التردد» تحمل معلومات غنية لا يمكن أن ينقلها الجواب وحده. ثم يقوم معامل يُسمى temperature بـ«تليين» الاحتمالات حتى تصبح العلاقات الدقيقة بين الفئات المتشابهة مرئية.

وبالتشبيه البشري، يُعلّم المخضرم (المعلّم) المبتدئ (الطالب) ليس فقط «هذه قطة» بل دقّة الحكم — «قطة، رغم أنها حالة حدّية قريبة من الكلب». وهكذا يتعلّم الطالب بعمق وكفاءة أكبر من الحفظ. وإذا كنت تعرف كيف تعمل نماذج LLM، يتضح لماذا يكون توزيع الاحتمالات غنياً بالمعلومات إلى هذا الحد.

2. لماذا التقطير؟ الفوائد

هدف التقطير بسيط — «الحفاظ على أكبر قدر ممكن من الذكاء مع جعله أخف وأسرع وأرخص.» الفوائد الملموسة:

⚡ سريع ورخيص

حوسبة أقل تعني زمن استجابة أقل وتكلفة أقل. وهذا يؤتي ثماره في الإنتاج عالي الحجم.

📦 أصغر بنحو 10x

تُظهر التقارير عُشر الحجم مع الحفاظ على أكثر من 95% من الأداء.

📱 يعمل على الـ edge

سهل التشغيل حتى في البيئات محدودة الموارد مثل الهواتف والأجهزة.

🎯 قوي في التخصص

سهل بناء نماذج صغيرة لكن دقيقة خاصة بمهام محددة.

باختصار، التقطير جسر ينقل «ذكاء المستوى الرائد» إلى «تكلفة يمكنك تشغيلها في الإنتاج». وللاستخدامات عالية حجم الاستدعاءات مثل الوكلاء، يتراكم فرق التكلفة، لذا تكون القيمة كبيرة بشكل خاص.

3. منهجان: white-box / black-box

ينقسم التقطير إلى نوعين، بحسب مدى وصولك إلى «دواخل» المعلّم. وهذا مرتبط ارتباطاً مباشراً بالنقطة القانونية لاحقاً.

🔓

التقطير من نوع white-box

عندما يكون لديك وصول كامل إلى أوزان المعلّم وتمثيلاته الداخلية. يتعلّم الطالب ليس فقط المخرجات بل عملية اتخاذ القرار الداخلية، فيصبح النقل أعمق. قابل للاستخدام عندما يكون المعلّم نموذجك الخاص أو نموذج OSS.

📦

التقطير من نوع black-box

عندما ترى فقط مخرجات المعلّم (استجابات API). تجمع أزواج المدخلات والمخرجات وتُدرّب الطالب عليها. استخدام API شركة أخرى كمعلّم قد يخالف شروطها (انظر أدناه).

4. مقابل quantization و fine-tuning

يسهل الخلط بين التقطير وتقنيات مشابهة لـ«جعل النموذج أخف/مختلفاً» — quantization و fine-tuning. وبما أن أهدافها تختلف، فلنرتّبها.

التقنية ماذا تفعل الهدف
Distillation تدريب نموذج صغير منفصل على معرفة نموذج كبير صغير وسريع، مع الحفاظ على الأداء
Quantization ضغط النموذج نفسه بخفض دقة الأوزان توفير الذاكرة/السرعة (النموذج نفسه بالداخل)
Fine-tuning مواصلة تدريب نموذج موجود لمهمة محددة التكيف مع حالة استخدام/مجال (الحجم دون تغيير تقريباً)

تقريباً: التقطير = «نقل الحكمة إلى وعاء آخر أصغر»، و quantization = «جعل الوعاء نفسه أخف»، و fine-tuning = «إضافة معرفة المجال إلى الوعاء نفسه». الثلاثة ليست متنافية — بل غالباً ما تُدمج معاً (مثلاً، تطبيق quantization على نموذج صغير مُقطَّر لزيادة خفّته).

هذا هو الجزء الذي أصبح قضية كبيرة في 2026. تقنية التقطير مشروعة تماماً. ما يصبح مشكلة هو «مخرجات مَن تستخدم، ولأي غرض.»

جوهر المسألة: تتضمن شروط الاستخدام لدى OpenAI و Anthropic و Mistral و xAI وغيرها بند «التقطير المنافس» الذي يحظر استخدام مخرجات خدمتها لتطوير نموذج منافس. لذا فإن تقطير نموذج منافس باستخدام مخرجات API مقيّد قد يخالف الشروط — رغم أنه ممكن تقنياً.

تصاعد هذا إلى نزاع حقيقي في قضية OpenAI ضد DeepSeek. ووفقاً للتقارير، زعمت OpenAI أن «حسابات يُعتقد أنها مرتبطة بـ DeepSeek تجاوزت قيود الوصول للحصول على مخرجات النماذج واستخدمتها في التقطير» (مطلع 2026). وفي المقابل، تفيد التقارير بأن شروط استخدام DeepSeek نفسها تسمح باستخدام مخرجات خدمتها لتدريب نماذج أخرى (بما في ذلك التقطير). والنقطة هي أن التقييم يتغير بحسب «شروط API مَن تنطبق.»

تُلقي هذه القضية بظلالها على أحدث النماذج أيضاً. فمع Claude Fable 5 / Mythos 5، أُفيد بتصميم تُقيّد فيه مُصنّفات السلامة الردود على الأعمال المُصنّفة كـ«تقطير نماذج». يستمر التوتر حول التقطير على الجبهتين التنظيمية وسياسات المورّدين. ومن الناحية العملية، القاعدة هي التحقق دائماً من شروط استخدام النموذج المعلّم الذي تستخدمه.

نصائح للتقطير بأمان

  • استخدم نموذجك الخاص أو نموذج OSS مرخّص كمعلّم (الكثير منها يسمح بالتقطير)
  • قبل استخدام API تجاري لشركة أخرى كمعلّم، تحقق من بند منع التقطير لديها
  • احكم بعناية على ما إذا كان الاستخدام يرقى إلى «تطوير نموذج منافس»

الخلاصة

تقطير النماذج تقنية قوية تنقل ذكاء ذكاء اصطناعي كبير إلى ذكاء اصطناعي صغير وتُنزله إلى تكلفة يمكنك تشغيلها في الإنتاج. لنلخّص.

النقاط الأساسية

  • 🧑‍🏫 المعلّم → الطالب: نقل معرفة نموذج كبير إلى نموذج صغير. الـ soft labels و temperature هما المفتاح.
  • ⚡ أصغر وأسرع بنحو 10x، مع الحفاظ على أكثر من 95% من الأداء. رائع للـ edge والتشغيل منخفض التكلفة.
  • 🔓 منهجان: white-box (يرى الدواخل) / black-box (المخرجات فقط).
  • 🔀 يختلف عن quantization و fine-tuning: نقل الأوعية / التخفيف / إضافة معرفة المجال.
  • ⚖️ انتبه للشروط: التقنية مشروعة، لكن استخدام مخرجات API مقيّد لبناء منافس قد يخالف الـ ToS.

«الذكاء من النموذج الكبير، والتشغيل من النموذج الصغير.» التقطير يجعل هذا المزيج ممكناً. لكن مَن تختاره معلّماً يغيّر النتيجة تقنياً وقانونياً. للأساسيات، انظر ما هو LLM؛ ولتقنية ذات صلة، fine-tuning.

الأسئلة الشائعة

س. كم من الأداء يُفقد بالتقطير؟

ج. يعتمد على حالة الاستخدام، لكن التقارير تقول إن تقطيراً مُصمَّماً جيداً يمكن أن «يحافظ على أكثر من 95% من الأداء بعُشر الحجم». فهو ليس مطابقاً، لذا تأكد دائماً من أنه ضمن حدود التسامح عبر التقييم.

س. متى أستخدم التقطير مقابل quantization؟

ج. التقطير «ينقل المعرفة إلى نموذج صغير منفصل»؛ و quantization «يضغط أوزان النموذج نفسه». أهدافهما تختلف، لذا فهما ليسا متنافيين — ودمجهما (مثلاً، تطبيق quantization على نموذج صغير مُقطَّر) أمر شائع.

س. هل يمكنني استخدام مخرجات ذكاء اصطناعي آخر لبناء نموذجي الخاص؟

ج. يعتمد على شروط ذلك المزوّد. لدى OpenAI و Anthropic وغيرهما بنود منع تقطير تحظر استخدام المخرجات لتطوير نماذج منافسة. وقد يخالف الشروط حتى لو كان ممكناً تقنياً، لذا تحقق دائماً من شروط الخدمة التي تستخدمها كمعلّم.

س. هل يستطيع المبتدئ القيام بالتقطير؟

ج. المفهوم بسيط، لكن التنفيذ يحتاج إلى معرفة بتعلّم الآلة. ابدأ بفهم الآلية. كما يقدّم مزوّدو السحابة (مثل Azure) خدمات تساعد في التقطير، فهناك خيارات أسهل من البناء من الصفر.