Cómo ejecutar un LLM local: IA en tu propio PC — specs, herramientas y los mejores modelos para principiantes
Probablemente das por hecho que un LLM tiene que ejecutarse en la nube, pero en 2026 ejecutar la IA por completo dentro de tu propio PC —un "LLM local"— es una opción realista. Un LLM local significa ejecutar un modelo como ChatGPT o Claude directamente en tu máquina en lugar de en la nube. Los tres grandes atractivos son la privacidad (la entrada nunca sale de tu dispositivo), el coste cero (sin tarifas de API) y el uso sin conexión (funciona sin internet). Las desventajas: no es tan inteligente como la IA en la nube de primer nivel, necesita un PC razonablemente capaz, requiere algo de configuración y no tiene conocimiento actualizado. Esta guía para principiantes cubre qué es un LLM local (con una analogía de streaming vs. descarga), las ventajas y desventajas, las specs que necesitas y la cuantización (el formato GGUF, con Q4_K_M como referencia que mantiene la calidad reduciendo la memoria a una cuarta parte; unos 0,5 GB de memoria por cada 1B de parámetros a 4 bits), cómo empezar (la interfaz gráfica de LM Studio para principiantes, la línea de comandos de Ollama para desarrolladores: 52 millones de descargas mensuales en el Q1 de 2026), modelos recomendados de 2026 (Llama 3.2 7B, Google Gemma 4, Alibaba Qwen3.5, además de DeepSeek y Mistral, todos abiertos) y cuándo usar local frente a nube (local para trabajo confidencial, de alto volumen y sin conexión; la nube para problemas difíciles). El primer paso más rápido: ejecutar un modelo pequeño de 3B–7B en LM Studio.