كيف تُشغّل نموذج LLM محليًا: ذكاء اصطناعي على جهازك الخاص — المواصفات والأدوات وأفضل النماذج للمبتدئين
ربما تفترض أن نموذج LLM لا بد أن يعمل في السحابة، لكن في عام 2026 صار تشغيل الذكاء الاصطناعي بالكامل داخل جهازك الخاص — أي "نموذج LLM المحلي" — خيارًا واقعيًا. ويعني ذلك تشغيل نموذج مثل ChatGPT أو Claude مباشرةً على جهازك بدلًا من السحابة. مزاياه الثلاث الكبرى هي: الخصوصية (المدخلات لا تغادر جهازك)، وانعدام التكلفة (بلا رسوم API)، والعمل دون اتصال (يعمل بلا إنترنت). أما عيوبه: فهو ليس بذكاء الذكاء الاصطناعي السحابي من الطراز الأول، ويحتاج إلى جهاز بقدرات معقولة، ويتطلب بعض الإعداد، ولا يملك معرفة محدّثة. يغطي هذا الدليل للمبتدئين ما هو نموذج LLM المحلي (بتشبيه البث مقابل التنزيل)، والمزايا والعيوب، والمواصفات المطلوبة والكمّنة (صيغة GGUF، مع Q4_K_M المفضّل الذي يحافظ على الجودة بينما يقلّص الذاكرة إلى نحو الربع؛ ونحو 0.5 GB من الذاكرة لكل 1B معامل عند 4 بِت)، وكيف تبدأ (واجهة LM Studio الرسومية للمبتدئين، وسطر أوامر Ollama للمطوّرين — 52 مليون تنزيل شهريًا في الربع الأول من 2026)، والنماذج المُوصى بها لعام 2026 (Llama 3.2 7B، وGoogle Gemma 4، وAlibaba Qwen3.5، إضافةً إلى DeepSeek وMistral — وكلها مفتوحة)، ومتى تستخدم المحلي مقابل السحابة (المحلي للأعمال السرية وكثيفة الحجم والتي تجري دون اتصال؛ والسحابة للمسائل الصعبة). وأسرع خطوة أولى: شغّل نموذجًا صغيرًا واحدًا من فئة 3B–7B في LM Studio.