جدول المحتويات
إن RAG والبحث الدلالي والتوصيات — البطل الخفي وراءها جميعًا هو embedding (التضمين / المتجه). باختصار، إنه «تقنية لتحويل معنى الكلمات إلى سلسلة من الأرقام». قد يبدو متواضعًا، لكنه أساس البحث واستخدام المعرفة في عصر الذكاء الاصطناعي.
يشرح هذا المقال للمبتدئين ما هو embedding، ولماذا يمكنه قياس المعنى، وفيمَ يُستخدم، وكيف تختار نموذجًا، وقواعد بيانات المتجهات وكيفية البدء.
كلما اقترب المعنى، اقترب المتجه
— أساس البحث وRAG والتصنيف والتوصيات
حوّل المعنى إلى أرقام
تحويل النص إلى «سلسلة من الأرقام» يمكن للآلة التعامل معها.
القريب = المتشابه
الكلمات المتقاربة في المعنى تقع في مواضع متقاربة داخل الفضاء.
البحث بالمعنى
العثور على الأشياء بـ«قرب المعنى» لا بالمطابقة الحرفية للكلمات.
1. ما هو embedding (التضمين / المتجه)؟
embedding هو «معنى» النص (أو الصورة وغيرها) مُحوَّلًا إلى سلسلة من الأرقام — أي متجه. على سبيل المثال، تُستبدل كلمة «كلب» بقائمة من مئات إلى آلاف الأرقام مثل [0.21, -0.78, 0.34, ...]. تبدو للإنسان أرقامًا بلا معنى، لكن هذه السلسلة هي مجموعة من «إحداثيات المعنى».
تخيّل «خريطة للمعنى». فكما أن المدن المتقاربة على الخريطة قريبة جغرافيًا، ففي فضاء embedding تُوضَع الكلمات المتقاربة في المعنى قرب بعضها. «كلب» و«جرو» متقاربان؛ بينما «كلب» و«سيارة» متباعدان. والقدرة على حساب هذه «المسافة» هي بيت القصيد بأكمله.
💡 في سطر واحد: embedding = «تقنية تحوّل معنى الكلمات إلى إحداثيات رقمية». لا يستطيع الحاسوب فهم معنى النص مباشرة، لكن متى صار أرقامًا أمكنه حساب «قرب المعنى».
2. لماذا يمكن لـ«القرب» أن يقيس المعنى
تُبنى تقنية embedding عبر التعلّم، من كميات هائلة من النصوص، لـ«أيّ الكلمات تميل إلى استخدامها معًا». ونتيجة لذلك، تحصل الكلمات المستخدمة في سياقات متشابهة على أرقام متشابهة. ويمكن قياس قرب متجهين بمقاييس مثل cosine similarity (التشابه الجيبي)، حيث يعني الاقتراب من 1 «تشابهًا أكبر في المعنى».
قرب المعنى من «كلب» (توضيحي)
※ توضيح مفاهيمي. في مثال شهير، تظهر العلاقات الدلالية على هيئة عمليات حسابية على المتجهات — «ملك − رجل + امرأة ≈ ملكة».
يتكوّن المتجه الحقيقي من مئات إلى آلاف الأرقام (الأبعاد)، وهذا العدد الضخم يعبّر عن أوجه لا حصر لها من المعنى — «هل هو حيوان؟»، «هل هو مركبة؟»، «كبير أم صغير؟» — شيئًا فشيئًا. كلما زادت الأبعاد التُقطت فروق أدق، لكن تكاليف التخزين والحوسبة ترتفع تبعًا لذلك.
لذا حتى عندما لا تتطابق الحروف، يمكن للآلة أن تحكم على «ما إذا كان المعنى قريبًا». هذه هي الآلية الحقيقية وراء معاملة «AI» و«الذكاء الاصطناعي» على أنهما الشيء نفسه، أو العثور على وثيقة مصاغة كـ«خطوات الإلغاء واسترداد المبلغ» انطلاقًا من سؤال مثل «أريد استرداد نقودي».
3. فيمَ يُستخدم؟ (RAG والبحث الدلالي)
نادرًا ما يُستخدم embedding بمفرده — فهو يدعم ميزات متنوعة مبنية على «قرب المعنى». وإليك أبرز الاستخدامات.
RAG (التوليد المعزّز بالاسترجاع)
العثور على وثائق قريبة في المعنى من السؤال وتسليمها إلى الذكاء الاصطناعي كمرجع. هو جوهر RAG.
البحث الدلالي
البحث بالمعنى لا بمطابقة الكلمات المفتاحية. يُعثَر عليه حتى مع اختلاف الصياغة.
التصنيف وإزالة التكرار
فرز الاستفسارات تلقائيًا، والعثور على الوثائق المتشابهة أو المكررة.
التوصيات
إظهار «منتجات أو مقالات مشابهة لهذا» بحسب قرب المعنى.
على وجه الخصوص، لا يمكن لـ RAG أن يوجد بلا embedding. فالنظام الذي يبحث في الوثائق الداخلية ويجعل الذكاء الاصطناعي يجيب يعمل عبر تحويل الوثائق إلى متجهات مسبقًا. وإلى جانب النص، تنتشر أيضًا تضمينات متعددة الوسائط تضع الصور والصوت في الفضاء نفسه.
4. كيف تختار نموذج embedding
تُنتَج التضمينات عبر «نموذج embedding» مخصّص. وهناك خياران رئيسيان عمومًا.
نوع API (سهل، بلا GPU)
OpenAI (text-embedding-3) وCohere وGoogle Gemini وVoyage وغيرها. يكفي استدعاء API — دون حاجة إلى بنية تحتية. الطريقة السهلة للبدء.
نوع مفتوح المصدر (مجاني، ذاتي الاستضافة)
BGE-M3 وNomic Embed وQwen3 وغيرها. مجانية الاستخدام، لكنك تحتاج إلى بيئة لتشغيلها. مناسبة للخصوصية والتكلفة.
💡 Matryoshka: تتيح بعض النماذج الأحدث تقليص عدد الأبعاد لاحقًا. فمثلًا، يُقال إن تقليل 3,072 بُعدًا إلى 1,024 يحافظ على نحو 95% من الجودة مع خفض تكلفة التخزين والبحث إلى الثلث تقريبًا. مفيدة لموازنة التكلفة والدقة.
※ أسماء النماذج والأرقام مقتبسة من أدلة وإفصاحات متنوعة (حتى يونيو 2026). يختلف أفضل نموذج باختلاف اللغة وحالة الاستخدام والميزانية، لذا فإن الطريقة المضمونة هي التجربة ثم الاختيار.
5. قواعد بيانات المتجهات وكيفية البدء
تُخزَّن التضمينات التي تنشئها في قاعدة بيانات متجهات (vector DB). وهي قاعدة بيانات متخصصة في العثور بسرعة على «الأقرب إلى السؤال» بين أعداد هائلة من المتجهات — ومن أمثلتها Pinecone وWeaviate وQdrant وChroma وpgvector. وتصبح هذه «محرك البحث» للبحث الدلالي وRAG.
البدء بسيط.
- ① اختر نموذج embedding واحدًا: نوع API (مثل text-embedding-3-small من OpenAI) سهل للبدء.
- ② حوّل الوثائق إلى متجهات وخزّنها: حوّل وثائقك إلى متجهات باستخدام النموذج وضعها في قاعدة بيانات المتجهات.
- ③ حوّل السؤال إلى متجه وابحث: حوّل السؤال إلى متجه بالنموذج نفسه واسحب أقرب الوثائق.
هذه الخطوات الثلاث هي بالضبط أساس تنفيذ RAG. قِس وحسّن دقة البحث الذي تبنيه باستخدام تقييمات الذكاء الاصطناعي.
الخلاصة
ثلاث نقاط جوهرية حول embedding.
- ما هو: تقنية تحوّل «معنى» الكلمات إلى سلسلة من الأرقام (متجه). كلما اقترب المعنى، اقترب المتجه.
- دوره: أساس RAG والبحث الدلالي والتصنيف وإزالة التكرار والتوصيات. يتيح لك العمل بـ«المعنى» لا بالمطابقة الحرفية للكلمات.
- كيف تبدأ: ابدأ بسهولة بنموذج من نوع API. خزّن في قاعدة بيانات متجهات وابحث. اضبط التكلفة عبر Matryoshka.
embedding هو الخطوة الأولى في بناء البحث واستخدام المعرفة بالذكاء الاصطناعي. ابدأ بتحويل جملتين إلى متجهات بنموذج embedding وحساب قربهما. اقرأ RAG وكيف تعمل نماذج LLM جنبًا إلى جنب مع هذا المقال للحصول على الصورة الكاملة.
لرفع دقة البحث بالتضمين أكثر، تأتي الخطوة التالية: «إعادة الترتيب». اقرأ ما هي إعادة الترتيب لإعادة ترتيب المرشحات حسب الصلة ورفع دقة RAG.
الأسئلة الشائعة
س. ما الفرق بين embedding ونموذج LLM؟
ج. الأدوار مختلفة. نموذج LLM هو نموذج يولّد النص؛ أما نموذج embedding فهو نموذج يحوّل المعنى إلى أرقام. في RAG يتعاونان: يجد embedding الوثائق ذات الصلة، ويحوّل LLM النتيجة إلى نص متصل.
س. هل الأبعاد الأكثر أفضل دائمًا؟
ج. ليس بالضرورة. تزيد الأبعاد الأكثر القدرة التعبيرية، لكنها ترفع أيضًا تكلفة التخزين والبحث. ومع نموذج يدعم Matryoshka يمكنك تقليص الأبعاد مع الحفاظ على الجودة بلا مساس يُذكر، مما يسهّل موازنة التكلفة والدقة.
س. هل استخدامه مجاني؟
ج. نماذج embedding مفتوحة المصدر (مثل BGE-M3) مجانية. وأنواع API تفرض عادةً رسومًا بسيطة، لكن التضمينات أرخص بكثير من التوليد. يُنصح بالبدء بالطبقة المجانية أو بمجموعة بيانات صغيرة.
س. هل أحتاج إلى قاعدة بيانات متجهات؟
ج. للكميات الصغيرة يمكنك البحث بحساب بسيط، لكن مع نمو الوثائق تصبح قاعدة بيانات متجهات مخصصة عملية. وتتراوح الخيارات بين سهلة مثل Chroma وإضافات مثل pgvector لقاعدة بيانات قائمة، فيمكنك الاختيار حسب الحجم.