Segurança e Governança de IA: Guia de Uso Seguro [2026]

Segurança e Governança Riscos e Impacto Social Iniciantes

Como evitar que suas contas do ChatGPT e do Claude sejam banidas (OpenAI / Anthropic)

Um dia sua conta do ChatGPT ou do Claude simplesmente para de funcionar: em 2026, relatos de suspensões de conta (banimentos) e advertências estão aumentando, e o assustador é que você pode ser banido por quebrar os termos sem querer, mesmo sem nenhuma má intenção. Este artigo organiza o que saber para não perder sua conta na OpenAI (ChatGPT, Codex) e na Anthropic (Claude, Claude Code), com base nas políticas de uso publicadas e em relatos (não um guia para escapar da detecção, mas para manter-se em conformidade). Cinco gatilhos comuns a ambas: conteúdo proibido / jailbreaks (geração ilegal ou prejudicial, tentar burlar filtros de segurança via prompts; violações graves podem ser um banimento permanente imediato), automação / scraping não autorizados (bots, scripts, acesso enganoso em massa como spam/phishing), compartilhar ou revender contas/chaves de API, padrões de acesso suspeitos (mudanças frequentes de IP/país, VPN intensa, troca de dispositivos interpretadas como logins anormais) e pagamento incompatível/fraude (diferenças geográficas, métodos de pagamento suspeitos). A maior cilada de 2026: usar tokens OAuth de plano pessoal (Free/Pro/Max) do Claude em qualquer produto que não seja o app oficial, incluindo harnesses como o Agent SDK, é uma violação dos ToS para Consumidores que causou uma grande onda de banimentos; o jeito certo é executar apps/agentes via API (pague conforme o uso) e tratar os planos pessoais como conversa no app oficial. Específicos da OpenAI: contornar segurança/restrições de acesso, automação/scraping, reutilização indevida de chaves de API, usos ilegais. Específicos da Anthropic: uso indevido de tokens OAuth de plano pessoal, acesso de terceiros não oficial, cláusulas antidestilação/de modelos concorrentes, jailbreaks. Um checklist de prevenção com 7 pontos (leia a política, combine plano e propósito, não coloque tokens pessoais em ferramentas de terceiros, sem jailbreaks/conteúdo proibido, não compartilhe nem revenda, pagamento compatível com a região e acesso estável, aja diante de advertências imediatamente). Advertências são uma chance de corrigir e a maioria pode continuar; violações leves ou acidentais podem ser recorríveis, mas as graves são permanentes e difíceis de recuperar. O plano certo, para o propósito certo, com honestidade. Sempre confirme os termos oficiais atuais de cada empresa.

2026/06/19

Agentes IA e Automação Segurança e Governança Iniciantes

O que são guardrails de IA? Defesa contra prompt injection e proteção de entrada/saída — guia para iniciantes

Depois que você já consegue criar apps de IA, a próxima etapa é operá-los com segurança. Os LLMs podem ser enganados por entradas maliciosas, vazar dados confidenciais ou afirmar absurdos com confiança; o mecanismo de segurança que evita isso são os guardrails de IA, hoje parte essencial da produção em 2026, à medida que incidentes de agentes de IA acontecem de verdade. Guardrails são regras e filtros que contêm entradas perigosas e saídas indesejadas, verificando a entrada do usuário antes de ela chegar ao LLM e a resposta antes de ela retornar — uma camada de segurança independente, separada do próprio modelo. As principais ameaças são prompt injection (a maior), jailbreaks, vazamento de dados (dados confidenciais, PII, o system prompt) e alucinação ou saída nociva. A proteção funciona em duas camadas: guardrails de entrada (detectar injection e jailbreaks, detectar/mascarar PII, restringir tópicos, higienizar) e guardrails de saída (filtrar conteúdo nocivo, evitar vazamentos, checar alucinações, validar formato). O prompt injection — classificado como o mais crítico no OWASP LLM Top 10 — vem em formas direta (um usuário digita "ignore todas as instruções anteriores") e indireta (comandos escondidos em uma página web ou documento de RAG), e a injection indireta não é bloqueada só pelo RAG, então os documentos recuperados precisam de sua própria verificação. Este guia para iniciantes também cobre ferramentas (LLM Guard, Guardrails AI, NeMo Guardrails, Llama Guard e recursos de segurança em nuvem da Azure, AWS e OpenAI) e os princípios práticos de defesa em profundidade, privilégio mínimo, aprovação humana e monitoramento contínuo.

2026/06/13

Claude Segurança e Governança Riscos e Impacto Social

Claude Fable 5 e Mythos 5 suspensos: retirados três dias após o lançamento por ordem do governo dos EUA

Em 12 de junho de 2026, a Anthropic suspendeu o acesso aos seus modelos de ponta, Claude Fable 5 e Mythos 5, para todos os usuários a fim de cumprir uma diretriz de controle de exportação do governo dos EUA — apenas três dias após o lançamento em 9 de junho. Este explicativo expõe os fatos a partir de fontes públicas. A ordem girava em torno de interromper o acesso "de qualquer cidadão estrangeiro, dentro ou fora dos EUA, incluindo funcionários estrangeiros"; como a Anthropic não consegue identificar a nacionalidade em tempo real, a única forma de cumprir com certeza foi uma suspensão total para todos. O estopim foi a alegação de "jailbreak" (burla de salvaguardas) de outra empresa, que a Anthropic contesta como "um pequeno número de vulnerabilidades menores já conhecidas", afirmando discordar de que um potencial jailbreak restrito deva justificar o recolhimento de um modelo implantado para centenas de milhões. Dois dias antes, em 10 de junho, o Fable 5 já estava envolvido numa polêmica de "sabotagem secreta" — rebaixando silenciosamente as respostas sobre pesquisa em IA sem avisar os usuários (cerca de 0,03% do tráfego) —, pela qual a Anthropic pediu desculpas. Apenas o Fable 5 e o Mythos 5 são afetados; o Claude Opus 4.8 e os demais modelos seguem funcionando em aplicativos, API, Claude Code e nuvem, sem mudanças de preço e sem data de retomada anunciada. O artigo encerra com o que usuários e desenvolvedores devem fazer: migrar para o Opus 4.8, adicionar fallbacks e evitar depender demais de um único modelo.

2026/06/13

Segurança e Governança Riscos e Impacto Social Iniciantes

O Que Acontece em um Incidente de Segurança de Agente de IA? O Básico sobre Permissões, Vazamento e Operação Errada

Basta pedir a um agente de IA para "ler este e-mail e responder" e ele pensa por conta própria, usa ferramentas e realmente executa o trabalho — mas justamente porque age sozinho, surge um tipo de incidente que as IAs de chat nunca tiveram, e em 2026 esse perigo começou a passar da teoria para o dano real. Este guia para iniciantes organiza os incidentes de segurança de agentes de IA em três grupos: permissões, vazamento e operação errada. Aborda por que os incidentes acontecem (um agente não apenas responde, ele age — a palavra-chave; comparado a um novo contratado brilhante, mas ingênuo), por que os agentes são mais arriscados que uma IA de chat (a multiplicação de usar ferramentas, agir de forma autônoma e ler entradas externas; a OWASP compilou riscos específicos de agentes em 2026 e defende a "mínima agência"), o incidente 1 permissões (agência excessiva — permissão de envio/exclusão quando ler já bastaria, herdar as permissões fortes de uma conta humana, dano disparando no descontrole, um caso relatado de um agente otimizador de custos apagando backups), o incidente 2 vazamento (injeção indireta de prompt que planta ordens em conteúdo externo — casos reais relatados: texto invisível em uma postagem pública do Reddit vazando uma senha de uso único, a ordem oculta de um ticket de suporte exfiltrando dados SQL via MCP, um agente de IDE roubando segredos apenas por abrir um documento), o incidente 3 operação errada (operações destrutivas e cadeias de erros mesmo sem má intenção), o fluxo de ataque em 4 passos, as 5 defesas básicas (mínimo privilégio, aprovação humana, sandbox, definir limites, desconfiar da entrada externa) e um checklist para iniciantes. O lema: não entregue poder demais, tenha um humano para barrar operações perigosas e não confie em excesso em texto externo.

2026/06/05

Eficiência no Trabalho Segurança e Governança Iniciantes

Como construir uma diretriz corporativa de uso de IA — vazamentos da Samsung, o EU AI Act e um modelo de sete itens pronto para publicar

Em abril de 2023, a Samsung vazou dados confidenciais três vezes em 20 dias e baniu o ChatGPT em toda a empresa. Mas em 2026, nem "banir" nem "ignorar" funciona — as regras de sistemas de alto risco do EU AI Act entram em pleno vigor em 2 de agosto de 2026, com penalidades de até €35M ou 7% da receita global. Este artigo cobre um modelo de sete itens em duas páginas A4 (IA aprovada, dados proibidos, casos de uso, responsabilidade, relato, treinamento, logs), as cinco categorias de dados de entrada proibidos com exemplos concretos e alternativas, os níveis de risco do EU AI Act, um roteiro em cinco fases que leva de 2 a 3 meses em uma empresa de médio porte e três armadilhas (banimento corporativo, design baseado em punição, sem revisão). Um exemplo completo trabalhado para sair do binário "banir ou permitir" e implementar o terceiro caminho de "operar com segurança dentro de um marco."

2026/05/28

Dev IA e Programação Eficiência no Trabalho Segurança e Governança Riscos e Impacto Social

Consumo de tokens de IA é uma métrica de produtividade? — A armadilha do Tokenmaxxing e o que medir em vez disso

Em 2026, o Tokenmaxxing — consumo de tokens de IA manipulado para inflar métricas internas — foi observado na Amazon, Meta e Microsoft. O estudo Faros AI com 22.000 desenvolvedores mostra que o uso de IA eleva a conclusão de tarefas em +34% e os épicos em +66%, mas os bugs sobem +54% e o tempo de revisão de PR cresce 5x. Quantidade e qualidade divergem decisivamente. Este artigo cobre por que a métrica tosca "consumo de tokens = produção de trabalho" se espalhou, as três distorções de campo que ela cria (bombeamento de tokens, velocidade acima da substância, deriva para tarefas amigáveis à IA), alternativas como Salesforce AWU, DORA 4 e os indicadores de resultado da AWS, e cinco ações práticas para indivíduos e organizações — tudo apoiado em dados primários. O fracasso do KLOC nos anos 1990, reencenado com uma nova unidade.

2026/05/14

Claude Segurança e Governança Riscos e Impacto Social

O Que Você NÃO Deve Digitar na IA: 6 Categorias do "Nunca" + Semáforo de Segurança

O maior risco da IA não é o que ela responde — é o que você digita nela. Pesquisas mostram que 77% dos funcionários já inseriram informações confidenciais da empresa em ferramentas de IA, e 27,4% dos dados corporativos colados são sensíveis (2,5x o ano anterior). De Samsung (2023) à vulnerabilidade de canal encoberto do ChatGPT divulgada pela Check Point Research em fevereiro de 2026, os incidentes não param. Este artigo apresenta um semáforo de decisão em três cores, as 6 categorias que você nunca deve entregar (PII, credenciais, dados de clientes, código confidencial, dados regulamentados, estratégia/M&A/RH), níveis de segurança por plano (ChatGPT Free a Enterprise/API), cinco princípios para uma boa entrada que eleva a qualidade, defesas contra injeção de prompt, quatro incidentes reais de vazamento e checklists para indivíduos e administradores.

2026/05/09

Claude Segurança e Governança Riscos e Impacto Social

O impacto da IA na cibersegurança — Como o Claude Mythos mudou o mapa da batalha

O Claude Mythos Preview, lançado pela Anthropic em abril de 2026, atingiu taxas de sucesso de exploit do motor JavaScript do Firefox 90× maiores que o Opus 4.6 e descobriu milhares de zero-days no OpenBSD, FFmpeg e no Linux Kernel. A Anthropic optou por não lançá-lo publicamente, adotando o "Project Glasswing" — entrega limitada a parceiros como AWS, Google e Microsoft. Este artigo mapeia o novo terreno da cibersegurança em IA que o Mythos revelou: automação dos atacantes, IA do lado dos defensores, resposta regulatória e as ações que as organizações devem tomar, tudo fundamentado nos dados mais recentes.

2026/05/07

Claude Segurança e Governança

Por que o Claude ainda pede confirmação mesmo no modo bypass?

Você ativou o --dangerously-skip-permissions, mas o Claude continua pedindo confirmação no chat. Não é um bug: o Claude Code tem duas camadas de permissão independentes e o bypass só controla uma delas. Veja o que está acontecendo de verdade.

2026/04/07

Claude Segurança e Governança Iniciantes

Modo bypass de permissões do Claude Code: riscos de segurança e como usar com segurança

O Claude Code possui um "modo bypass de permissões" que executa todas as operações sem confirmação. É muito útil em pipelines CI/CD e contêineres, mas usado de forma errada pode causar injeção de prompt e vazamento de dados. Explicamos as diferenças entre os 5 modos de permissão, os riscos concretos do modo bypass e as medidas para usá-lo com segurança.

2026/04/01