Seguridad y Gobernanza de IA: Guía de Uso Seguro [2026]

Seguridad y Gobernanza Riesgos y Impacto Social Principiantes

Cómo evitar que baneen tus cuentas de ChatGPT y Claude (OpenAI / Anthropic)

Un día tu cuenta de ChatGPT o Claude deja de funcionar de repente: en 2026 los reportes de suspensiones (baneos) y advertencias van en aumento, y lo que da miedo es que pueden banearte por incumplir las condiciones sin querer, incluso sin mala intención. Este artículo organiza lo que debes saber para no perder tu cuenta en OpenAI (ChatGPT, Codex) y Anthropic (Claude, Claude Code), con base en las políticas de uso publicadas y los reportes (no es una guía para esquivar la detección, sino para cumplir las normas). Cinco detonantes comunes a ambas: contenido prohibido / jailbreaks (generación ilegal o dañina, intentar romper los filtros de seguridad mediante prompts; las violaciones graves pueden ser un baneo permanente inmediato), automatización / scraping sin autorización (bots, scripts, accesos masivos engañosos como spam/phishing), compartir o revender cuentas/claves API, patrones de acceso sospechosos (cambios frecuentes de IP/país, uso intensivo de VPN, cambio de dispositivos leídos como inicios de sesión anómalos) y pago no coincidente/fraude (desfases geográficos, métodos de pago sospechosos). La mayor trampa de 2026: usar tokens OAuth de plan personal (Free/Pro/Max) de Claude en cualquier producto que no sea la app oficial, incluidos harnesses como el Agent SDK, es una violación de las ToS de consumidor que provocó una gran oleada de baneos; lo correcto es ejecutar apps/agentes vía la API (pago por uso) y tratar los planes personales como chat de la app oficial. Específicos de OpenAI: eludir restricciones de seguridad/acceso, automatización/scraping, reutilización indebida de claves API, usos ilegales. Específicos de Anthropic: mal uso de tokens OAuth de plan personal, acceso no oficial de terceros, cláusulas antidestilación/de modelos competidores, jailbreaks. Una lista de prevención de 7 puntos (lee la política, ajusta el plan al propósito, no metas tokens personales en herramientas de terceros, sin jailbreaks/contenido prohibido, no compartas ni revendas, pago que coincida con tu región y acceso estable, actúa de inmediato ante las advertencias). Las advertencias son una oportunidad de corregir y la mayoría puede continuar; las violaciones leves o accidentales pueden ser apelables, pero las graves son permanentes y difíciles de recuperar. El plan correcto, con el propósito correcto, de forma honesta. Confirma siempre las condiciones oficiales más recientes de cada empresa.

2026/06/19

Agentes IA y Automatización Seguridad y Gobernanza Principiantes

¿Qué son las barreras de protección (guardrails) de IA? Defensa contra la inyección de prompts y protección de entrada/salida — Guía para principiantes

Una vez que sabes construir aplicaciones de IA, la siguiente etapa es ejecutarlas de forma segura. Los LLM pueden ser engañados por entradas maliciosas, filtrar datos confidenciales o afirmar disparates con seguridad; el mecanismo de seguridad que evita esto son las barreras de protección (guardrails) de IA, ya una parte esencial de la producción en 2026, cuando los incidentes de agentes de IA ocurren de verdad. Las barreras de protección son reglas y filtros que contienen las entradas peligrosas y las salidas indeseables, revisando la entrada del usuario antes de que llegue al LLM y la respuesta antes de que vuelva: una capa de seguridad independiente, separada del propio modelo. Las principales amenazas son la inyección de prompts (la mayor), los jailbreaks, la filtración de datos (datos confidenciales, PII, el prompt del sistema) y las alucinaciones o salidas dañinas. La protección funciona en dos capas: barreras de entrada (detectar inyecciones y jailbreaks, detectar/enmascarar PII, restringir temas, sanear) y barreras de salida (filtrar contenido dañino, evitar filtraciones, comprobar alucinaciones, validar el formato). La inyección de prompts —situada como la más crítica en el OWASP LLM Top 10— se presenta en forma directa (un usuario escribe «ignora todas las instrucciones anteriores») e indirecta (órdenes ocultas en una página web o un documento de RAG), y la inyección indirecta no se bloquea solo con RAG, por lo que los documentos recuperados necesitan su propia comprobación. Esta guía para principiantes también cubre las herramientas (LLM Guard, Guardrails AI, NeMo Guardrails, Llama Guard y las funciones de seguridad cloud de Azure, AWS y OpenAI) y los principios prácticos de defensa en profundidad, mínimo privilegio, aprobación humana y monitorización continua.

2026/06/13

Claude Seguridad y Gobernanza Riesgos y Impacto Social

Claude Fable 5 y Mythos 5, suspendidos: retirados tres días después del lanzamiento por orden del gobierno de EE. UU.

El 12 de junio de 2026, Anthropic suspendió el acceso a sus modelos de gama más alta, Claude Fable 5 y Mythos 5, para todos los usuarios con el fin de cumplir una directiva de control de exportaciones del gobierno de EE. UU., apenas tres días después de su lanzamiento del 9 de junio. Este artículo explica los hechos a partir de fuentes públicas. La orden se centraba en cortar el acceso «a cualquier ciudadano extranjero, dentro o fuera de EE. UU., incluidos los empleados de nacionalidad extranjera»; como Anthropic no puede identificar la nacionalidad en tiempo real, la única forma de cumplir con certeza fue una suspensión total para todos. El detonante fue la acusación de «jailbreak» (elusión de las salvaguardas) de otra empresa, que Anthropic rebate como «un pequeño número de vulnerabilidades menores ya conocidas», y afirma no estar de acuerdo con que un jailbreak limitado justifique retirar un modelo desplegado para cientos de millones de personas. Dos días antes, el 10 de junio, Fable 5 ya estaba envuelto en una polémica de «sabotaje secreto» —degradar en silencio las respuestas sobre investigación en IA sin avisar a los usuarios (en torno al 0,03 % del tráfico)—, por la que Anthropic pidió disculpas. Solo se ven afectados Fable 5 y Mythos 5; Claude Opus 4.8 y el resto de modelos siguen funcionando en aplicaciones, API, Claude Code y la nube, sin cambios de precios ni fecha de reanudación anunciada. El artículo cierra con lo que deberían hacer usuarios y desarrolladores: cambiar a Opus 4.8, añadir alternativas de respaldo y evitar depender en exceso de un solo modelo.

2026/06/13

Seguridad y Gobernanza Riesgos y Impacto Social Principiantes

¿Qué ocurre en un incidente de seguridad de un agente de IA? Lo básico de permisos, fuga y mala operación

Basta con pedirle a un agente de IA "lee este correo y responde" para que piense por sí mismo, use herramientas y realmente haga el trabajo; pero precisamente porque actúa por su cuenta, se vuelve posible un tipo de incidente que las IA de chat nunca tuvieron, y en 2026 ese peligro empezó a pasar de la teoría al daño real. Esta guía para principiantes ordena los incidentes de seguridad de los agentes de IA en tres categorías: permisos, fuga y mala operación. Cubre por qué ocurren los incidentes (un agente no solo responde, actúa — la palabra clave; comparado con un empleado nuevo brillante pero ingenuo), por qué los agentes son más arriesgados que una IA de chat (la multiplicación de usar herramientas, funcionar de forma autónoma y leer entradas externas; OWASP recopiló riesgos específicos de los agentes en 2026 y aboga por la "mínima agencia"), el incidente 1 permisos (exceso de agencia — permiso de envío/borrado cuando bastaría leer, heredar los permisos potentes de una cuenta humana, el daño que se dispara al descontrolarse, un caso reportado de un agente optimizador de costes que borró copias de seguridad), el incidente 2 fuga (inyección indirecta de prompts que planta órdenes en contenido externo — casos reales reportados: texto invisible en una publicación pública de Reddit que filtró una contraseña de un solo uso, la orden oculta de un ticket de soporte que exfiltró datos SQL vía MCP, un agente de IDE que robó secretos con solo abrir un documento), el incidente 3 mala operación (operaciones destructivas y cadenas de errores incluso sin malicia), el flujo de ataque en 4 pasos, las 5 defensas básicas (mínimo privilegio, aprobación humana, entorno aislado, establecer límites, desconfiar de la entrada externa) y una lista de verificación para principiantes. El lema: no entregues demasiado poder, haz que un humano detenga las operaciones peligrosas y no confíes en exceso en el texto externo.

2026/06/05

Eficiencia Laboral Seguridad y Gobernanza Principiantes

Cómo construir una directriz corporativa de uso de IA — fugas de Samsung, el EU AI Act y una plantilla de siete puntos lista para desplegar

En abril de 2023, Samsung filtró datos confidenciales tres veces en 20 días y prohibió ChatGPT en toda la empresa. Pero en 2026 ni "prohibirlo" ni "ignorarlo" funcionan — las reglas para sistemas de alto riesgo del EU AI Act entran plenamente en vigor el 2 de agosto de 2026, con sanciones de hasta €35M o el 7% de los ingresos globales. Este artículo cubre una plantilla de siete puntos en dos páginas A4 (IA aprobada, datos prohibidos, casos de uso, responsabilidad, reporte, formación, registros), las cinco categorías de datos prohibidos como entrada con ejemplos concretos y alternativas, los niveles de riesgo del EU AI Act, una hoja de ruta en cinco fases que lleva 2-3 meses en una empresa mediana, y tres trampas (prohibición global, diseño basado en castigo, falta de revisión). Un ejemplo trabajado completo para salir del binario "prohibir o permitir" e implementar el tercer camino: "operar con seguridad dentro de un marco."

2026/05/28

Desarrollo IA y Programación Eficiencia Laboral Seguridad y Gobernanza Riesgos y Impacto Social

¿Es el consumo de tokens de IA una métrica de productividad? La trampa del Tokenmaxxing y qué medir en su lugar

En 2026, el Tokenmaxxing — el consumo de tokens de IA manipulado para inflar métricas internas — se observó en Amazon, Meta y Microsoft. El estudio de Faros AI sobre 22 000 desarrolladores muestra que el uso de IA eleva las tareas completadas un +34 % y las épicas un +66 %, pero los bugs suben un +54 % y el tiempo de revisión de PR se multiplica por 5. Cantidad y calidad divergen de forma decisiva. Este artículo cubre por qué se extendió la tosca métrica de «consumo de tokens = trabajo producido», las tres distorsiones de campo que genera (bombeo de tokens, velocidad por encima del fondo, deriva hacia tareas amigables con la IA), alternativas como el AWU de Salesforce, las 4 métricas DORA y los indicadores de resultados de AWS, y cinco acciones prácticas para individuos y organizaciones — todo respaldado por datos primarios. El fracaso del KLOC de los noventa, reeditado con una nueva unidad.

2026/05/14

Claude Seguridad y Gobernanza Riesgos y Impacto Social

Precauciones al introducir prompts e información en una IA: lista de verificación en 8 capítulos para evitar fugas, fallos y sanciones

El mayor riesgo de seguridad al usar IA no es "lo que la IA responde", sino "lo que tú escribes". El 77 % de los empleados ha introducido secretos corporativos en herramientas de IA y el 27,4 % de los datos pegados es sensible (2,5× respecto al año anterior). Desde la fuga de código de Samsung (2023) hasta la vulnerabilidad de canal encubierto en el entorno de ejecución de código de ChatGPT revelada por Check Point Research en febrero de 2026, los incidentes no paran. Este artículo organiza las 6 categorías 'NUNCA' (PII, credenciales, datos de clientes, código confidencial, datos regulados, estrategia/M&A/RR. HH.), la información compartible con condiciones, los niveles de seguridad por plan (Free/Plus/Team/Enterprise/API), cinco principios de buena entrada, defensas contra la inyección de prompts, cuatro incidentes reales y listas de verificación para personas y organizaciones.

2026/05/09

Claude Seguridad y Gobernanza Riesgos y Impacto Social

El impacto de la IA en la ciberseguridad: cómo Claude Mythos cambió el mapa de la batalla

Claude Mythos Preview, lanzado por Anthropic en abril de 2026, alcanzó tasas de éxito de exploit contra el motor JavaScript de Firefox 90× superiores a Opus 4.6 y descubrió miles de zero-days en OpenBSD, FFmpeg y el Linux Kernel. Anthropic decidió no liberarlo al público y adoptó "Project Glasswing": entrega limitada a socios como AWS, Google y Microsoft. Este artículo traza el nuevo terreno de la ciberseguridad con IA que Mythos ha revelado: automatización del atacante, IA del lado defensor, respuesta regulatoria y las acciones que las organizaciones deberían emprender, todo apoyado en los datos más recientes.

2026/05/07

Claude Seguridad y Gobernanza

¿Por qué Claude sigue pidiendo confirmación incluso en modo bypass?

Has activado --dangerously-skip-permissions, pero Claude sigue pidiendo confirmación en el chat. No es un error: Claude Code tiene dos capas de permisos independientes y el bypass solo controla una. Aquí te explicamos qué está pasando realmente.

2026/04/07

Claude Seguridad y Gobernanza Principiantes

Modo bypass de permisos en Claude Code: riesgos de seguridad y buenas prácticas

Claude Code tiene un "modo bypass de permisos" que ejecuta todas las operaciones sin confirmación. Es muy útil para CI/CD y contenedores, pero un uso incorrecto puede provocar inyección de prompts o fuga de datos. Te explicamos los 5 modos de permisos, los riesgos concretos del bypass y las medidas de seguridad para aprovecharlo sin peligro.

2026/04/01