جدول المحتويات
- 1. ما هو Ollama؟ بيئة التشغيل المفضّلة للنماذج المحلية
- 2. التثبيت (Win / Mac / Linux)
- 3. الأوامر الأساسية في لمحة
- 4. الحصول على النماذج واختيارها
- 5. استخدام واجهة رسومية (Open WebUI وغيرها)
- 6. استخدام الـ API (دمجه في التطبيقات)
- 7. التخصيص (Modelfile ومتغيرات البيئة)
- 8. حل المشكلات
- الخلاصة
- الأسئلة الشائعة
عند البدء مع نموذج لغوي محلي (LLM)، فإن الأداة المفضّلة التي يُنصح بتثبيتها أولاً هي Ollama. فهي تتولّى عنك معظم متاعب الإعداد المعقّدة، حتى تتمكن من تنزيل نموذج وبدء المحادثة بأمر واحد. يأخذك هذا المقال خطوة بخطوة عبر التثبيت والأوامر الأساسية واختيار النماذج والواجهات الرسومية واستخدام الـ API والتخصيص وحل المشكلات—من البداية إلى النهاية، وموجّه للمبتدئين.
الخلاصة أولاً: Ollama أشبه بـ«Docker للنماذج اللغوية». ما عليك إلا كتابة ollama run فيقوم بجلب نموذج مُكمَّم وتشغيله ويتيح لك محادثته. شغّله أولاً، ثم—بعد أن تألفه—ادمجه في تطبيقاتك الخاصة عبر الـ API. سنشرح كل ذلك بهذا الترتيب.
أمر واحد، ونموذج لغوي محلي
— يتولّى عنك معظم متاعب الإعداد
✅ مجاني / مفتوح المصدر
🖥️ Win/Mac/Linux
🔌 API محلي
⏱️ إعداد في دقائق
1. ما هو Ollama؟ بيئة التشغيل المفضّلة للنماذج المحلية
Ollama هو أداة مجانية ومفتوحة المصدر لتشغيل النماذج اللغوية المحلية بسهولة على حاسوبك الشخصي. فهو يتولّى المتاعب—تنزيل النماذج، والتعامل مع صيغ التكميم، وضبط استخدام كرت الرسوميات—خلف الكواليس، فلا يبقى عليك سوى «تسمية النموذج وتشغيله».
💡 باختصار: Ollama هو «Docker للنماذج اللغوية». اجلب نموذجًا بـ ollama pull، وحادثه بـ ollama run. كما يقوم بتشغيل خادم API محلي، حتى تتمكن تطبيقاتك وواجهات المحادثة الخاصة بك من استدعائه أيضًا.
هناك أداة مشابهة اسمها LM Studio. وبشكل تقريبي: Ollama = موجّه لسطر الأوامر أولاً، للمطوّرين وواجهات الـ API والأتمتة؛ LM Studio = موجّه للواجهة الرسومية أولاً، لغير المهندسين الراغبين في البدء. كلاهما مجاني ويُثبَّت في دقائق. يتمحور هذا المقال حول Ollama (الذي يغطي أيضًا الـ API والدمج)؛ وإن كنت تريد واجهة رسومية، فانتقل إلى القسم 5.
2. التثبيت (Win / Mac / Linux)
كل ما عليك هو الحصول على أداة التثبيت من الموقع الرسمي ollama.com. وإليك خطوات كل نظام تشغيل.
🪟 Windows / 🍎 Mac
ما عليك إلا تنزيل التطبيق من الموقع الرسمي وتشغيله. تشغيل التطبيق يبدأ أيضًا خادم الـ API في الخلفية. بعدها يصبح أمر ollama متاحًا في طرفيتك (PowerShell / Terminal).
🐧 Linux
ثبّته بسكربت السطر الواحد الرسمي. كما أنه مناسب جدًا للاستخدام على الخوادم ولنشره عبر Docker (تتوفر صورة Docker رسمية).
🔌 تحقّق من عمله: بعد التثبيت، يفترض أن يطبع الأمر ollama --version رقم الإصدار. ونموذجك الأول لا يتطلب سوى سطر واحد: ollama run qwen3 (التشغيل الأول يبدأ التنزيل).
3. الأوامر الأساسية في لمحة
الأوامر التي عليك تعلّمها قليلة جدًا. وإليك أكثرها استخدامًا أولاً.
ollama run <model>
يشغّل نموذجًا ويبدأ المحادثة. ويُنزّله أولاً إن لم يكن موجودًا. للخروج استخدم /bye.
ollama pull <model>
يُنزّل نموذجًا فقط (دون محادثة). مفيد للجلب مسبقًا.
ollama list
يعرض النماذج المُنزَّلة وأحجامها (يعمل ollama ls أيضًا).
ollama ps
يعرض النماذج العاملة حاليًا (المحمّلة في الذاكرة).
ollama rm <model>
يحذف نموذجًا لتحرير مساحة على القرص.
ollama serve
يبدأ خادم الـ API (الافتراضي localhost:11434). يعمل تلقائيًا على Win/Mac عند تشغيل التطبيق.
4. الحصول على النماذج واختيارها
حدّد النموذج بـ الاسم + وسم الحجم. على سبيل المثال، llama3.2 هو الحجم القياسي، وllama3.2:3b هو إصدار 3B. والقاعدة العملية: اختر حجمًا يتّسع له VRAM لديك.
💡 أيّ نموذج أختار؟ القرار يكون حسب حالة الاستخدام (عام / برمجة / لغتك) والحجم. للاختيار حسب السلالة وحالة الاستخدام، راجع مقارنتنا لأفضل النماذج اللغوية المحلية؛ ولمعرفة VRAM الذي يحتاجه كل حجم، راجع مقال متطلبات العتاد. وعند التردد، ابدأ بحجم صغير (فئة 7B).
5. استخدام واجهة رسومية (Open WebUI وغيرها)
ألست من محبّي الطرفية؟ لا مشكلة—يمكنك وضع شاشة محادثة (واجهة رسومية) فوق Ollama.
شاشة شائعة بأسلوب ChatGPT تصلها بنسخة Ollama المحلية لديك. تدعم سجل المحادثات وتبديل النماذج وتعدد المستخدمين.
تريد واجهة رسومية من البداية؟ LM Studio
تطبيق واحد يتولّى البحث عن النماذج وتنزيلها والمحادثة. مثالي لغير المهندسين عند البدء. وعلى معالجات Apple Silicon قد يكون سريعًا عبر صيغة MLX.
6. استخدام الـ API (دمجه في التطبيقات)
القوة الحقيقية لـ Ollama في الـ API المحلي. يعمل الخادم على localhost:11434، وبإرسال الطلبات إليه تستطيع تطبيقاتك وسكربتاتك وأدواتك الخاصة استخدام نموذج لغوي محلي.
الـ API الأصلي
POST localhost:11434
/api/chat
/api/generate
صيغة Ollama الخاصة البسيطة.
API متوافق مع OpenAI
POST localhost:11434
/v1/chat/completions
أعِد استخدام شيفرة OpenAI الموجودة بـتغيير نقطة النهاية فقط.
🔌 التوافق مع OpenAI فعّال: كثير من المكتبات والأدوات تدعم API الخاص بـ OpenAI. وجّهها إلى نقطة النهاية /v1 في Ollama وستتمكن من استخدام المحلي بدل السحابة—وهو حلّ احتياطي مفيد عند تعطّل السحابة.
7. التخصيص (Modelfile ومتغيرات البيئة)
هو مفيد جدًا كما هو افتراضيًا، لكن يجدر بك معرفة أمرين إذا أردت التعمّق أكثر.
📝 Modelfile
ملف إعداد يشبه Dockerfile. أضِف موجّهًا نظاميًا ومعاملات إلى نموذج أساس لتصنع «نموذجك الخاص» (مثلًا نموذجًا يجيب دائمًا بعربية مهذّبة).
⚙️ متغيرات البيئة
اضبط التشغيل عبر OLLAMA_HOST (تغيير عنوان الربط لاستخدامه من أجهزة أخرى على شبكتك المحلية)، وOLLAMA_MODELS (مسار تخزين النماذج، مثلًا نقله إلى قرص آخر)، وغيرها.
8. حل المشكلات
إليك أبرز العقبات الشائعة وحلولها سلفًا.
بطيء أو متوقف
على الأرجح أن النموذج لا يتّسع له VRAM بالكامل. انزل حجمًا واحدًا، أو استخدم إصدارًا مُكمَّمًا بشكل أكبر.
يتعطّل بسبب نقص الذاكرة
خصّص 8 جيجابايت RAM على الأقل لفئة 7B، و16 جيجابايت لفئة 13B فأعلى. والمدخلات الطويلة تستهلك أكثر بكثير، فاختصر طول السياق.
الـ API لا يتصل
تحقّق من أن ollama serve يعمل وأن المنفذ 11434 متاح. وإذا لم يكن التطبيق يعمل، فإن الـ API يكون متوقفًا أيضًا.
النموذج غير موجود
عادةً ما يكون السبب خطأً إملائيًا في الاسم أو وسم الحجم. تحقّق من الاسم الصحيح في قائمة النماذج الرسمية.
الخلاصة
Ollama هو أسرع طريق للدخول إلى عالم النماذج اللغوية المحلية. إليك ثلاث نقاط للتذكّر:
- الإعداد في دقائق: ثبّته من الموقع الرسمي، ثم فقط
ollama run <model>. الأوامر التي عليك تعلّمها قليلة جدًا. - اختر النماذج حسب الحجم: ابقَ ضمن سعة VRAM لديك. وعند التردد، ابدأ بفئة 7B واختر السلالة حسب حالة الاستخدام.
- الـ API هو القيمة الحقيقية: يتيح لك الـ API المتوافق مع OpenAI على
localhost:11434دمجه في تطبيقاتك وواجهات المحادثة الخاصة بك—وأن يكون حلًّا احتياطيًا للسحابة.
ابدأ بكتابة ollama run qwen3. وأفضل طريقة للتعلّم هي تشغيله مع الاطلاع على الفروقات عن السحابة وكيفية اختيار نموذج.
الأسئلة الشائعة
س. هل Ollama مجاني؟ وهل يمكنني استخدامه تجاريًا؟
ج. Ollama نفسه مجاني ومفتوح المصدر. لكن لكل نموذج تشغّله رخصته الخاصة، والاستخدام التجاري يعتمد على النموذج. تحقّق من شروط كل نموذج قبل استخدامه في منتج (راجع قسم الترخيص في مقارنة النماذج).
س. Ollama أم LM Studio—أيهما أفضل؟
ج. للأوامر والـ API والأتمتة والدمج في تطبيقاتك الخاصة، اختر Ollama؛ وإن أردت البدء بسهولة بواجهة رسومية، فاختر LM Studio. كلاهما مجاني، فعند التردد ثبّت كليهما وقارن.
س. هل تُرسَل بياناتي إلى الخارج؟
ج. الاستدلال في Ollama يبقى بالكامل على حاسوبك؛ ولا يُرسَل مُدخَلك إلى الخارج (باستثناء التنزيل الأولي للنموذج). وهذه ميزة كبيرة للنماذج اللغوية المحلية.
س. هل يمكنني استخدامه مع شيفرة OpenAI الموجودة؟
ج. نعم. يوفّر Ollama API متوافقًا مع OpenAI على localhost:11434/v1، لذا تكتفي في معظم الحالات بتغيير رابط نقطة النهاية واسم النموذج. وهو مفيد للانتقال من السحابة إلى المحلي، أو كحلّ احتياطي.
س. ما نوع الحاسوب الذي أحتاجه؟
ج. كدليل عام، 8 جيجابايت RAM على الأقل لنماذج 7B، و16 جيجابايت فأكثر لفئة 13B فما فوق. وللراحة، يساعد وجود كرت رسوميات مدعوم (VRAM بسعة 8 جيجابايت أو أكثر) أو جهاز Mac بذاكرة موحّدة وفيرة. راجع مقال متطلبات العتاد للتفاصيل.