جدول المحتويات
«ماتت هندسة المُوجِّهات» — لازمة بدأت تنتشر منذ عام 2025. وما برز ليأخذ مكانها هو مفهوم «هندسة الطوق» (Harness Engineering). ابتكر هذا المصطلح باحثو Anthropic والمهندسون الذين يبنون وكلاء مثل Claude Code وCursor، وسرعان ما أصبح أحد أهم تخصّصات الهندسة في عصر وكلاء الذكاء الاصطناعي.
يستعرض هذا المقال ما تعنيه هندسة الطوق فعلاً، وكيف تختلف عن هندسة المُوجِّهات، والمكوّنات الستة التي يتألّف منها الطوق، وقائمة تحقق عملية للتصميم، وأمثلة ملموسة من أبرز الأدوات اليوم — وهو الأساس الذي تحتاجه إن كنت جادًّا في استخدام وكلاء الذكاء الاصطناعي أو بنائهم.
الطوق = الطبقات الأربع المُحيطة بنموذج اللغة
— تمامًا كطوق الحصان، إنّه العُدّة التي توجِّه حيوانًا قويًّا نحو هدفك
بنفس النموذج، يستطيع تصميم الطوق وحده أن يُغيِّر الجودة والأمان تغييرًا كبيرًا.
هذه هي ساحة «هندسة الطوق» — تخصّص تصميم جديد تمامًا.
1. ما هي هندسة الطوق (Harness Engineering)؟
كلمة «Harness» (الطوق) تعني في الأصل العُدّة والأحزمة التي تُلبَس للحصان — أي العتاد الذي يُوجِّه قوّة الحيوان نحو الاتجاه الذي تريده. والمصطلح في الذكاء الاصطناعي يعمل بنفس المجاز تمامًا: المجموعة الكاملة من المعدّات التي تُسخِّر نموذجًا لغويًّا قويًّا لكنّه جامح في عمل مُنتج.
وعلى وجه التحديد، يشمل ذلك:
- الأدوات: عمليات الملفات، البحث على الويب، تنفيذ الشيفرة — أي الوسائل التي يستطيع بها النموذج أن يتّخذ إجراءً.
- إدارة السياق: استراتيجية ما يُدخَل إلى المُوجِّه وما يُضغَط أو يُستبعَد.
- أنظمة الذاكرة: المعرفة الدائمة وتفضيلات المستخدم التي تبقى عبر الجلسات.
- حلقة الوكيل: دورة الإدراك ← الاستدلال ← الفعل ← الملاحظة.
- الحواجز الواقية (Guardrails): الصلاحيات، الصندوق الرمليّ، Hooks، تدفّقات الاعتماد.
- تنسيق المُخرجات: Markdown، JSON، الاستشهادات، البثّ المباشر.
تصميم كلّ ذلك معًا هو ما نُسمّيه هندسة الطوق. فبدلاً من تدريب نموذج اللغة أو تحسينه، فإنّها حِرفة رفع المنفعة الواقعيّة عبر هندسة كلّ ما يُحيط بالنموذج. إنّ Claude Code وCursor وDevin وCodex CLI تعمل جميعها تقريبًا على نفس النماذج، ومع ذلك يتباعد سلوكها وأداؤها تباعدًا حادًّا بسبب الفرق في أطواقها.
2. هندسة الطوق مقابل هندسة المُوجِّهات (Prompt Engineering)
لم تختفِ هندسة المُوجِّهات — لكنّ النطاق مختلف اختلافًا جوهريًّا.
| البُعد | هندسة المُوجِّهات | هندسة الطوق |
|---|---|---|
| الهدف | نصّ إدخال لدور واحد | المنظومة بأكملها (الأدوات، الذاكرة، الحلقة) |
| العمل الرئيسيّ | تحسين صياغة المُوجِّه، اختيار أمثلة few-shot | تصميم الأدوات، استراتيجية السياق، تصميم الحلقة |
| المُسلَّم النهائي | قوالب نصّيّة | شيفرة، إعدادات، معماريّة منظومة |
| المهارات المطلوبة | حسّ لغويّ، حدس بسلوك النموذج | هندسة برمجيات عامّة |
| نطاق التأثير | جودة استجابة واحدة | معدّل إنجاز المهام الطويلة وتكلفتها وأمانها |
| مثال | «فكِّر خطوة بخطوة» | تعريف أداة آلة حاسبة وترك النموذج يستدعيها |
إن كانت هندسة المُوجِّهات هي حِرفة «ماذا تقول للنموذج»، فإنّ هندسة الطوق هي حِرفة «ماذا تُعطي للنموذج وكيف تُشغِّله». الاثنتان ليستا متنافستين — بل متطبِّقتان. المُوجِّه ليس سوى مكوِّن واحد ضمن الطوق.
3. المكوّنات الستة للطوق
1. استخدام الأدوات (Tool Use)
وسائل النموذج للتأثير في العالم: قراءة الملفات وكتابتها، تنفيذ الشيفرة، البحث على الويب، استدعاء واجهات API. إذا أخطأت في تصميم واجهة الأداة — الأسماء، الوسائط، القيم المُعادة — فلن يستطيع النموذج استخدامها بشكل صحيح. وعلى وجه التحديد:
- أسماء فعلية لا لبس فيها (مثل
read_file). - تمييز واضح بين الوسائط المطلوبة والاختياريّة، مع قيم افتراضيّة.
- رسائل خطأ مُهيكَلة عند الفشل (أخبر النموذج بما عليه فعله تاليًا).
- تحذيرات صريحة على العمليّات ذات الآثار الجانبيّة (المُدمِّرة).
2. إدارة السياق
انتباه النموذج محدود — ما تُريه إيّاه يُحدِّد ما يقوله. وعلى وجه التحديد:
- تصفية الصلة: استخرج فقط الأجزاء ذات الصلة بالمهمّة، لا الملفات بكاملها.
- الضغط (Compaction): لخِّص المحادثات الطويلة للاحتفاظ بها.
- تكامل RAG: اجلب ما يلزم عبر البحث المتّجه.
- التخزين المؤقّت (Caching): قلِّل التكلفة على المُوجِّهات النظاميّة المتكرّرة باستخدام أدوات مثل ذاكرة المُوجِّهات لدى Anthropic.
ذو صلة: ما هو RAG؟
3. نظام الذاكرة
الاحتفاظ بالمعرفة عبر الجلسات. ملفّ CLAUDE.md الخاصّ بـ Claude Code، و.cursor/rules الخاصّ بـ Cursor، وAGENTS.md الخاصّ بـ Codex، كلّها أمثلة على ذاكرة المشروع. وفيما عدا ذلك:
- الذاكرة قصيرة المدى: تاريخ المحادثة الأخير.
- الذاكرة طويلة المدى: ملفّ المستخدم، القرارات السابقة.
- المعرفة الواقعيّة: قواعد معرفة خاصّة بمجال محدّد.
4. حلقة الوكيل (Agent Loop)
الجوهر الذي يجعل «وكيل الذكاء الاصطناعي» يعمل فعلاً. الصورة الأساسيّة هي دورة الإدراك ← الاستدلال ← الفعل ← الملاحظة:
- استقبال هدف المستخدم.
- تحليل الحالة الراهنة (جمع المعلومات بالأدوات إن لزم الأمر).
- تخطيط الإجراء التالي.
- التصرّف عبر أداة.
- ملاحظة النتيجة؛ التحقّق من تحقّق الهدف.
- التكرار إن لم يتحقّق، والإنهاء إن تحقّق.
مدى ذكاء وكيلك يعتمد على ما إذا كنتَ قد أدمجت إعادة التخطيط، والنقد الذاتيّ، وتفكيك الأهداف الفرعيّة.
5. الحواجز الواقية (Guardrails)
الآليّات التي تمنع السلوك المنفلت. وكما يُبيِّن مقال لماذا يتجاهل الذكاء الاصطناعي قواعد .md، فإنّ فرض السلوك عبر البيئة أكثر موثوقيّة بكثير من الطلب اللطيف بالنثر:
- وضع الاعتماد: العمليّات الخطرة تحتاج تأكيدًا بشريًّا (مثل وضع Plan في Claude Code).
- الصندوق الرمليّ (Sandbox): تقييد الوصول إلى نظام الملفات والشبكة.
- Hooks: فحوص اعتباطيّة قبل استدعاءات الأدوات وبعدها.
- تحديد المعدّل: تقليل الضرر إذا انفلت شيء عن المسار.
6. تجربة مستخدم المُخرجات
تقديم النتائج بصورة يستطيع المستخدم فهمها والتحقّق منها. عرض Markdown، الاستشهادات بالمصادر، كتل شيفرة بإبراز التركيب، البثّ المباشر، إظهار الاستدلال (التفكير)، المُخرجات المُهيكَلة (JSON)، وما إلى ذلك. إنتاج «الإجابة الصحيحة» وحده لا يكفي — مهمّة الطوق هي تقديمها بصورة يثق بها المستخدم ويستطيع التحقّق منها.
4. لماذا هندسة الطوق، ولماذا الآن؟
ثلاث قوى تدفع موجة الاهتمام بأعمال الطوق.
1. ظهر سقف القدرات الخام لنماذج اللغة. فمع توفّر نماذج من فئة GPT-5، وClaude Opus 4.7، وGemini 3.1 Pro، بدأت مكاسب المعايير القياسيّة تتسطّح. ويمكن أن يتأرجح الأداء الواقعيّ لنموذج ثابت بمقدار مرّتين أو أكثر بحسب الطوق، وهذا يعني أنّنا دخلنا عصرًا تعود فيه تغييرات الطوق بمكاسب أكبر من تغيير النموذج.
2. تتراكم المشاكل التي لا تستطيع المُوجِّهات وحدها حلّها. «أدوات أكثر من اللازم، والنموذج يختار الخطأ.» «السياق مكتظّ لدرجة أنّ الإشارة المهمّة مدفونة فيه.» «في المهام الطويلة، يفقد الوكيل الخيط في منتصف الطريق.» هذه ليست مشاكل تحلّها بصياغة أذكى في دور واحد — إنّها مشاكل تصميم.
3. انتقل عنق الزجاجة لوكلاء الذكاء الاصطناعي الإنتاجيّين إلى الطوق. كان عام 2024 سباقًا لجعل النماذج أذكى. ومن 2025 إلى 2026 هو سباق لجعل الأطواق أذكى. وكلّ منتج رئيسيّ — Claude Code من Anthropic، وCodex من OpenAI، وCursor، وDevin — يتنافس على هندسة الطوق.
5. قائمة تحقق عملية لتصميم طوق جيّد
7 نقاط تحقّق لطوق جيّد
6. مقارنة بين أبرز الأطواق
توجّهات تصميم أبرز أطواق وكلاء الذكاء الاصطناعي
كلّ من هذه الأطواق يعمل على نماذج لغويّة متشابهة إلى حدّ بعيد (Claude / GPT / Gemini)، ومع ذلك تتباعد نقاط قوّتها تباعدًا حادًّا بسبب اختلاف فلسفات تصميم الطوق. «أيّ طوق؟» يهمّ أكثر من «أيّ نموذج لغويّ؟» — تلك هي ساحة المعركة الحقيقيّة في عصر الوكلاء.
7. الأنماط المضادّة (Anti-Patterns)
1. إضافة أدوات كثيرة جدًّا
متى تجاوزت ما يقارب 20 أداة، يقفز احتمال أن يختار النموذج الأداة الخطأ قفزة كبيرة. كن صارمًا في الإبقاء على الأدوات التي تحتاجها فعلاً، وادمج المتشابه منها.
2. حشو كلّ شيء في السياق
«أرِه كلّ شيء فقط، حرصًا على السلامة» نهج عكسيّ المفعول. مرِّر الأشياء عبر مرشّح صلة وأدرج فقط ما يلزم. السياق أداة لإبراز الإشارة المهمّة — لا خِزانة للتخزين.
3. تطبيق الأمان عبر المُوجِّهات وحدها
«من فضلك لا تُؤدِّ عمليّات خطرة» سيُتَجاهل آجلاً أم عاجلاً، بحسب الموقف. الإجابة الصحيحة هي جعل ذلك مستحيلاً ماديًّا على مستوى البيئة — صندوق رمليّ، Hooks، حدود صلاحيات.
الخلاصة
هندسة الطوق هي حِرفة تصميم الطبقة «الخارجة» عن نموذج اللغة. وهندسة المُوجِّهات ليست إلّا مكوّنًا واحدًا ضمن الطوق. ومعالجة العناصر الستة بقصد — تعريف الأدوات، وإدارة السياق، والذاكرة، والحلقة، والحواجز الواقية، وتجربة مستخدم المُخرجات — قادرة على تحويل الأداء الواقعيّ من نفس النموذج اللغويّ الكامن.
وحتّى عام 2026، انتقلت ساحة المعركة الرئيسيّة لوكلاء الذكاء الاصطناعي الإنتاجيّين بوضوح إلى الطوق. فبناء «أطواق ذكيّة» — لا مجرّد كتابة «مُوجِّهات ذكيّة» — سيكون عامل التميّز للجيل القادم من المهندسين.
الأسئلة الشائعة
س1. إذًا لم نعد بحاجة إلى هندسة المُوجِّهات؟
خطأ. ما زالت ضروريّة — كمكوّن واحد ضمن الطوق. فأوصاف الأدوات، والمُوجِّهات النظاميّة، ورسائل الأخطاء — كلّها أسطح لتصميم المُوجِّهات. ما تجاوزه الزمن هو عقليّة «سأُصلح هذا بمُوجِّه أفضل».
س2. ما الخطوة الأولى لتعلّم هندسة الطوق؟
خذ Claude Code أو Cursor ولا تكتفِ باستخدامه — غيِّر سلوكه بتعديل إعداداته. اكتب CLAUDE.md / .cursor/rules. جرِّب Hooks. ابنِ أمر سلاش. تلك هي تجربة عمليّة لما هو الطوق فعلاً.
س3. هل الأطواق نفسها أُطر مثل LangChain؟
قريبة، لكن ليست متطابقة. فـالإطار هو عُدّة تنفيذ؛ بينما الطوق تخصّص تصميم وعقليّة. وLangChain، وLlamaIndex، وClaude Agent SDK، وما شابه، أدوات لبناء الأطواق.
س4. أبني طوقي الخاصّ أم أستخدم طوقًا موجودًا؟
في معظم الحالات، طوق موجود (Claude Code، Cursor، إلخ) مع التخصيص كافٍ. وبناء واحد من الصفر لا يكون منطقيًّا إلّا لمتطلّبات المؤسّسات، أو المجالات النوعيّة، أو التحسين الجذريّ للتكلفة.
س5. هل سيُصبح «مهندس الطوق» مُسمّى وظيفيًّا فعليًّا؟
المؤشّرات موجودة بالفعل. فقد بدأت Anthropic، وOpenAI، وCursor، وغيرها من شركات بناء الوكلاء، تُوظِّف لأدوار مثل «مهندس الوكلاء»، و«مُصمِّم الأدوات»، و«مهندس السياق». وبحلول 2027 أو 2028، يُرجَّح أن يستقرّ بوصفه فئة وظيفيّة مستقلّة.