Pular para o conteúdo
Ferramentas de IA

Outros IA

Descubra e compare ferramentas IA emergentes. Análises, recursos e guias práticos.

40 artigos

Ordene os artigos para encontrar o que precisa

O que é LoRA? Personalizando a IA com um pouquinho de treino extra

O que é LoRA? Personalizando a IA com um pouquinho de treino extra

Retreinar uma IA gigante do zero é caro demais, mas você quer ajustá-la só para você; o LoRA (Low-Rank Adaptation) realiza esse desejo congelando o modelo original e treinando apenas uma pequena peça adicional (um adaptador), cortando os parâmetros treináveis em cerca de 90%. O LoRA torna o fine-tuning drasticamente mais barato e rápido, e é enormemente popular na geração de imagens, como no Stable Diffusion, como um pequeno arquivo que adiciona um personagem ou estilo. Este artigo explica com uma analogia de remendo. O LoRA é o carro-chefe do fine-tuning eficiente em parâmetros (PEFT): deixar os enormes pesos originais congelados, inserir uma pequena matriz adicional em cada camada e treinar apenas isso (W = W0 + BA, onde W0 fica congelado e BA é a pequena parte adicionada). Ele se baseia na descoberta de que adaptar uma IA não exige grandes mudanças (um rank baixo basta). Benefícios: cerca de 90% menos parâmetros treináveis (segundo relatos, 10.000x menos na escala do GPT-3), menos memória de GPU (cerca de 3x menos), treinamento mais rápido e barato, sem latência de inferência depois que o adaptador é mesclado, e menor risco de overfitting. Sua maior força são os adaptadores intercambiáveis: mantenha uma base comum e troque pequenos arquivos LoRA (de poucos MB) por caso de uso (suporte, tom da empresa, um personagem específico) instantaneamente. Muita gente encontra o LoRA pela primeira vez na geração de imagens, onde LoRAs do Stable Diffusion que aprenderam um personagem, estilo ou tema são amplamente compartilhados. O QLoRA combina a quantização, treinando o LoRA sobre uma base 4-bit para ~4x menos memória que o LoRA padrão, permitindo o fine-tuning de modelos enormes em uma GPU de consumo (às vezes CPU) com perda mínima de precisão. Diferentemente do fine-tuning completo (treinar todos os pesos), o LoRA difere nos pesos treinados, no custo, no resultado e no melhor uso; para a maior parte do trabalho, o LoRA basta. Mantenha a base, tempere pouco. Os números são citados de materiais públicos, como orientação.

O que é quantização? Encolher modelos de IA para rodá-los na sua própria máquina

O que é quantização? Encolher modelos de IA para rodá-los na sua própria máquina

Um enorme modelo de 70B rodando em um único PC gamer caseiro, em vez de um rack de GPUs de data center, é possível graças à quantização, que reduz a precisão numérica dos pesos do modelo para encolher drasticamente tamanho e memória. Enquanto a destilação transfere conhecimento para um modelo separado e menor, a quantização deixa o mesmo modelo mais leve. Este artigo explica isso com uma analogia de compressão de fotos. A quantização substitui pesos armazenados como decimais FP16/FP32 por inteiros INT8 (8 bits) ou INT4 (4 bits), cortando bytes por peso (FP32=4, INT8=1, INT4=0,5); como comprimir uma foto RAW para JPEG, você sacrifica um pouco de precisão por uma grande redução, e a surpresa é o quão pouco abre mão. Em memória, 4-bit usa cerca de um quarto do FP16: um modelo de 70B cai de ~140GB para ~35GB, e um de 8B em 4-bit fica em ~4.5-5GB, cabendo em uma GPU intermediária de 8GB de VRAM para uso local (a democratização dos LLMs). Em precisão, INT8 é praticamente sem perdas e INT4 degrada abaixo de 4% em perguntas e respostas gerais e senso comum, mas a perda é mais perceptível em matemática, geração de código e raciocínio difícil (aparece como um pequeno aumento na perplexidade), então escolha a precisão em bits pela tarefa. Principais métodos: GPTQ (pioneiro do 4-bit preciso), AWQ (protege os ~1% pesos mais importantes, frequentemente 1-2% mais preciso e rápido), GGUF (formato llama.cpp/Ollama, Q2_K-Q8_0, híbrido CPU+GPU, para uso local) e QLoRA (base de 4-bit mais LoRA para fine-tuning em GPU de consumidor). Difere da destilação (mudar para um modelo separado menor) e do fine-tuning (adicionar conhecimento de tarefa), e as três costumam ser combinadas (quantizar um modelo destilado; fazer fine-tuning sobre uma base quantizada). Para começar, rode um modelo GGUF com o Ollama em um comando, escolha Q4/Q8 pela VRAM e evite INT4 para código ou matemática exata. A maioria dos grandes modelos já vem quantizada, então basta baixar e usar. Mantenha a inteligência, tire apenas o peso. Os números são citados de materiais públicos, indicativos.

O que é destilação de modelos? Levando o conhecimento de uma IA grande para uma pequena

O que é destilação de modelos? Levando o conhecimento de uma IA grande para uma pequena

Uma IA enorme e de alto desempenho é inteligente, mas pesada e cara; a destilação de modelos (destilação de conhecimento) resolve isso transferindo o conhecimento de um grande modelo professor para um pequeno modelo aluno, mantendo mais de 95% do desempenho do professor com um décimo do tamanho e da velocidade. Este artigo explica o tema com uma analogia professor-aluno. A chave são os soft labels: o treinamento comum só ensina "a resposta é gato" (hard label), enquanto a destilação passa toda a distribuição de probabilidade do professor, como "90% gato, 8% cachorro, 2% raposa", cujo grau de hesitação carrega informações ricas; um parâmetro temperature suaviza as probabilidades para revelar relações sutis (exemplo real: GPT-4o mini destilado a partir do GPT-4o). Benefícios: rápido e barato, ~10x mais compacto mantendo mais de 95% do desempenho, roda na edge e é forte para especialização. Duas abordagens: white-box (acesso total a pesos e representações internas, transferência mais profunda; para seus modelos ou modelos OSS) e black-box (só as saídas/respostas da API visíveis; usar a API de outra empresa como professor pode violar os termos). Difere da quantização (comprimir a precisão dos pesos do mesmo modelo) e do fine-tuning (continuar treinando um modelo existente para uma tarefa) — a destilação move o conhecimento para um modelo pequeno separado, e as três são combináveis. A realidade jurídica/ToS foi um grande tema em 2026: a técnica é legítima, mas OpenAI, Anthropic, Mistral e xAI incluem cláusulas de destilação anticompetitiva que proíbem usar saídas para criar modelos concorrentes, então destilar um concorrente a partir de uma API restrita pode violar os termos. A disputa OpenAI v. DeepSeek (a OpenAI alegou que contas ligadas à DeepSeek burlaram restrições para obter saídas para destilação, enquanto os termos da DeepSeek supostamente permitem destilar suas saídas) mostra que a avaliação depende de quais termos de API se aplicam, e o Claude Fable 5/Mythos 5 supostamente restringe respostas sobre trabalho sinalizado como destilação. Dicas: use seus modelos ou modelos OSS licenciados como professor, verifique as cláusulas antidestilação antes de usar uma API comercial e avalie se o uso configura desenvolvimento de um modelo concorrente. Inteligência do modelo grande, operação do pequeno — mas quem você escolhe como professor muda o resultado técnica e juridicamente. Os números são citados de materiais públicos, em caráter orientativo.

O que é fine-tuning? Fine-tuning vs RAG, LoRA/QLoRA e quando usar — Guia para iniciantes

O que é fine-tuning? Fine-tuning vs RAG, LoRA/QLoRA e quando usar — Guia para iniciantes

Quando você quer personalizar a IA para a sua própria empresa, o fine-tuning é uma das opções — mas mergulhar nisso sem cuidado sai caro e é fácil errar. Este guia para iniciantes explica o fine-tuning: pegar um modelo base já treinado, treiná-lo ainda mais com dados adaptados ao seu uso e remodelá-lo em um modelo especializado que incorpora "comportamento" (estilo da casa, formato de saída, vocabulário da área) no próprio modelo ao reescrever os seus pesos. O fine-tuning é bom em mudar comportamento, mas ruim em memorizar conhecimento atualizado, então a regra é "fatos e conhecimento → RAG, personalidade e molde → fine-tuning, prompts primeiro". Como notam os especialistas, cerca de 80% dos casos de "precisamos de fine-tuning" são resolvidos com melhor recuperação (RAG) ou prompting, então a ordem importa. O artigo cobre o que é fine-tuning (uma analogia com o treinamento de um novo funcionário), no que ele é bom e ruim, uma tabela comparativa de fine-tuning vs RAG vs prompting, os principais métodos (full fine-tuning, LoRA e QLoRA — quantização de 4-bit leve o suficiente para iniciantes), o que você precisa (mais de 500 exemplos de alta qualidade como referência, com a construção dos dados sendo o trabalho de verdade; custos de $5,000 a mais de $50,000, fine-tuning da OpenAI a cerca de $25–$100 por milhão de tokens de treinamento; ferramentas como OpenAI, Unsloth, Axolotl e Hugging Face) e em que ordem começar. O fine-tuning é o último recurso.

Como rodar um LLM local: IA no seu próprio PC — configurações, ferramentas e os melhores modelos para iniciantes

Como rodar um LLM local: IA no seu próprio PC — configurações, ferramentas e os melhores modelos para iniciantes

Você provavelmente imagina que um LLM precisa rodar na nuvem, mas em 2026 rodar a IA inteiramente dentro do seu próprio PC — um "LLM local" — é uma opção realista. Um LLM local significa rodar um modelo como o ChatGPT ou o Claude diretamente na sua máquina em vez da nuvem. Os três grandes atrativos são privacidade (o input nunca sai do seu dispositivo), custo zero (sem taxas de API) e uso offline (funciona sem internet). As desvantagens: não é tão inteligente quanto a IA na nuvem de ponta, precisa de um PC razoavelmente capaz, exige alguma configuração e não tem conhecimento atualizado. Este guia para iniciantes cobre o que é um LLM local (uma analogia de streaming x download), as vantagens e desvantagens, as configurações que você precisa e a quantização (o formato GGUF, com o Q4_K_M de referência que mantém a qualidade enquanto corta a memória para cerca de um quarto; cerca de 0,5 GB de memória por 1B de parâmetros a 4 bits), como começar (a interface gráfica do LM Studio para iniciantes, a linha de comando do Ollama para desenvolvedores — 52 milhões de downloads mensais no 1º trimestre de 2026), modelos recomendados para 2026 (Llama 3.2 7B, Google Gemma 4, Alibaba Qwen3.5, além de DeepSeek e Mistral — todos abertos) e quando usar local x nuvem (local para trabalho confidencial, de alto volume e offline; nuvem para problemas difíceis). O primeiro passo mais rápido: rodar um modelo pequeno 3B–7B no LM Studio.

Análise do Lançamento do Claude Fable 5 — Recursos, Benchmarks, Preço, a Diferença do Mythos e um Novo Design de Segurança

Análise do Lançamento do Claude Fable 5 — Recursos, Benchmarks, Preço, a Diferença do Mythos e um Novo Design de Segurança

Em 9 de junho de 2026, a Anthropic lançou o Claude Fable 5 — liberando, pela primeira vez em uma forma que usuários e desenvolvedores comuns podem usar, capacidade no nível do "Mythos", o modelo de fronteira há muito considerado o mais poderoso internamente. A Anthropic o posiciona como o modelo mais poderoso que oferece de forma geral, com o slogan "feito para trabalho complexo e de longa duração". Esta análise, escrita para que iniciantes possam acompanhar, cobre o que é o Fable 5 (uma forma pública e segura da capacidade de classe Mythos, otimizada para terminar uma maratona em vez de uma única pergunta e resposta; ID do modelo claude-fable-5), como ele difere de seu gêmeo Mythos 5 (idênticos por dentro, apenas as salvaguardas diferem; o público usa o Fable), os benchmarks (SWE-Bench Pro 80.3% vs Opus 4.8 69.2 e GPT-5.5 58.6, os primeiros 90%+ de sempre na análise de longa duração da Hex, topo no Cognition FrontierCode e no financeiro da Hebbia, novo SOTA em visão jogando Pokémon sem ajuda), sua verdadeira força em autonomia de longa duração (foco ao longo de milhões de tokens, execuções de 12 horas, a Stripe concluindo uma migração Ruby de 50 milhões de linhas em um dia contra mais de dois meses manualmente, memória em arquivo impulsionando uma tarefa de jogo 3x mais que o Opus 4.8, o GitHub relatando programação de longo horizonte de alta autonomia), preço e disponibilidade ($10 entrada / $50 saída por 1M tokens, contexto de 1M e saída de 128K, gratuito dentro de cada plano de 9 a 22 de junho e depois créditos, API claude-fable-5 e GitHub Copilot), uma comparação direta com o Opus 4.8 (padrão $5/$25 vs $10/$50, +11.1 pontos no SWE-Bench Pro, mesmo contexto de 1M, Opus 4.8 Fast Mode a $10/$50; divida trabalho pesado para o Fable 5 e o dia a dia para o Opus 4.8 padrão), o destaque do novo design de segurança (classificadores de cibernética, bioquímica e destilação que recuam para o Opus 4.8 apenas quando perigoso, acionados em menos de 5% das sessões para que 95%+ rodem com desempenho total, com retenção de 30 dias do tráfego de classe Mythos), o contexto de lançar dias após alertar que a IA é perigosa demais (um terceiro caminho que fecha apenas as áreas perigosas) e quando usá-lo. Os números são citados do anúncio da Anthropic e de relatos e podem mudar.

Como Começar com a Geração de Vídeo com IA [2026] — O cenário pós-Sora, Veo/Kling e dicas de prompt

Como Começar com a Geração de Vídeo com IA [2026] — O cenário pós-Sora, Veo/Kling e dicas de prompt

Digite um texto e, em segundos, nasce um vídeo com som — o que não muito tempo atrás seria ficção científica virou realidade em 2026, e a situação está mudando em um ritmo assustador. O Sora da OpenAI, que dominava a conversa, encerrou seu app e a versão web em abril de 2026 (com a API a seguir em setembro); em seu lugar, Google Veo, Kling e Runway assumiram a liderança. Este guia atualizado (junho de 2026), independente de ferramenta, cobre o que é a geração de vídeo com IA (criar imagens em movimento a partir de palavras ou de uma imagem, com sincronização de áudio, 1080p–4K e imagem para vídeo agora padrão), o cenário de 2026 (o encerramento do Sora — pano de fundo relatado de pressão sobre computação e custos e queda de usuários — e os líderes atuais Google Veo 3.1, Kling 3.0 e Runway Gen-4.5, com a cobrança por segundo como norma), como funciona (modelos de difusão estendidos para a dimensão do tempo; texto para vídeo e imagem para vídeo), o fluxo dos 5 passos em comum (escolher uma ferramenta, prompt/imagem, definir duração/proporção/áudio, gerar e escolher, juntar na edição), as dicas essenciais de prompt de vídeo (sujeito + movimento + câmera + estilo + duração + áudio, com verbos e câmera como chaves, um corte uma ação, usar imagem para vídeo, gerar em quantidade), o que ela já faz e o que ainda não faz (peças longas de uma só vez e consistência total continuam difíceis, e o custo por segundo soma) e os pontos essenciais de direitos, marcas-d'água e ética (SynthID e C2PA tornam a procedência de IA padrão e não removível, a saída puramente de IA é fracamente protegida com diferenças entre países, o uso comercial depende dos termos e deepfakes de pessoas reais são proibidos). Faça cortes e junte-os na edição em vez de mirar uma peça longa de uma só vez. Como o campo se move rápido, sempre confirme o mais recente oficialmente.

Primeiros passos com a geração de imagens com IA — Como funciona, os 4 passos, a anatomia do prompt e os direitos

Primeiros passos com a geração de imagens com IA — Como funciona, os 4 passos, a anatomia do prompt e os direitos

"Eu não sei desenhar, então isso não é para mim" — esse preconceito sobre a geração de imagens com IA está invertido. Basta instruí-la com palavras e, segundos depois, você tem visuais de nível profissional. Este guia, que atravessa as ferramentas, cobre o que é a geração de imagens com IA (criar imagens do zero por meio de palavras — a habilidade de comunicar, não de desenhar; a versão em imagem da engenharia de prompts), como funciona (modelos de difusão esculpem uma figura a partir do ruído aleatório usando o seu prompt como pista, desenhando do zero a cada vez, por isso os resultados oscilam), o fluxo de trabalho comum de 4 passos que funciona em qualquer ferramenta (escolher uma ferramenta, escrever um prompt, gerar e escolher, refinar e finalizar — a iteração é o pressuposto), a anatomia essencial do prompt de imagem em 6 partes (sujeito, cena/cenário, estilo, luz/cor, composição/enquadramento, técnico) mais prompts negativos e proporção de aspecto — embora o GPT Image e o Imagen prefiram frases simples, enquanto ferramentas da família Stable Diffusion gostam de listas de palavras e de prompts negativos, 7 dicas para dominar (fazer as contas, acrescentar aos poucos, imagens de referência, inpainting, fixar a seed, upscale, salvar bons prompts), onde a IA tem dificuldade (mãos, texto, consistência, precisão fina) e as soluções, e o essencial sobre direitos, uso comercial e ética para o trabalho (a saída puramente de IA é fracamente protegida segundo o Copyright Office dos EUA e a decisão Thaler de 2025, com diferenças entre países; o uso comercial depende dos termos de cada ferramenta; deepfakes e a imitação não autorizada de estilo são proibidos; a proveniência, como os metadados C2PA do DALL-E, está se difundindo). Qual ferramenta escolher e os tutoriais específicos remetem aos artigos de comparação, do Midjourney e do Stable Diffusion. Conheça a anatomia, faça as contas, acrescente palavras aos poucos — qualquer pessoa pode se aproximar da imagem que quer.

Engenharia de prompts: o compêndio prático — 6 partes e técnicas para obter da IA as respostas que você quer

Engenharia de prompts: o compêndio prático — 6 partes e técnicas para obter da IA as respostas que você quer

Você pergunta a mesma coisa para a mesma IA e, ainda assim, uma pessoa a chama de inútil enquanto outra se impressiona com o quanto ela é capaz — e a verdadeira causa dessa diferença muitas vezes não é o poder da IA, mas a forma como o prompt é escrito. Este é um compêndio prático dessa habilidade, a engenharia de prompts, organizado para que um iniciante possa usá-la de imediato. Ele cobre o que é engenharia de prompts (a habilidade de projetar e melhorar sua instrução para a IA — não código, e sim a arte de como dizer as coisas), os três princípios que mudam seus resultados (seja específico, dê contexto, especifique a saída, além de "faça X" em vez de "não faça Y"), as 6 partes essenciais de um bom prompt (papel, contexto, instrução, exemplos, formato, restrições — os elementos que frameworks como COSTAR e RCOF listam em comum; você não precisa das seis toda vez), 7 técnicas práticas (dar um papel, mostrar um modelo/few-shot, raciocinar passo a passo, fixar o formato da saída, estruturar com delimitadores, não pedir demais de uma vez e iterar — a mais forte sendo a iteração), um exemplo antes/depois, técnicas de nível avançado (cadeia de raciocínio, autoconsistência, encadeamento de prompts, ReAct — embora modelos de raciocínio como a série o e o pensamento estendido do Claude façam CoT internamente, de modo que enunciar o objetivo funciona melhor), 7 erros comuns, além de dicas por modelo e segurança na entrada. Com links internos para dicas de prompt de desenvolvimento de aplicativos e cuidados com a entrada. Transforme o vago em específico, o despejo em diálogo — qualquer um pode melhorar a partir de hoje.

O Que É a Singularidade Tecnológica? Um Guia para Iniciantes — Mecanismo, Previsões e Como Difere da AGI

O Que É a Singularidade Tecnológica? Um Guia para Iniciantes — Mecanismo, Previsões e Como Difere da AGI

Em junho de 2025, Sam Altman, da OpenAI, escreveu em seu blog: "Já passamos do horizonte de eventos; a decolagem começou" ("The Gentle Singularity"). No entanto, outros pesquisadores descartam categoricamente a ideia como algo que nunca vai chegar. Este guia para iniciantes explica que a singularidade (singularidade tecnológica) é "o ponto de virada no qual a IA supera a inteligência humana e começa a se aprimorar sozinha, de modo que o progresso se torna explosivamente rápido e já não pode ser previsto nem controlado" (uma hipótese, não realizada em 2026). Aborda o coração da questão — a explosão de inteligência = autoaprimoramento recursivo, em que uma IA inteligente constrói uma IA ainda mais inteligente e quem aprimora muda de humano para IA; como ela difere da AGI e da ASI (AGI/ASI são "estados" de inteligência, a singularidade é o "evento" de se tornar imprevisível; AGI → autoaprimoramento → o salto repentino para a ASI = a singularidade); a história do termo (a "explosão de inteligência" de I. J. Good em 1965 → Vinge popularizando o nome em 1993 → Kurzweil tornando-a mainstream com "2045"); a ampla dispersão das previsões (Kurzweil 2045, Altman "já começou", Vinge e céticos como Gary Marcus e o "freio da complexidade" do falecido Paul Allen); decolagem dura repentina vs. decolagem suave gradual; as esperanças (avanços em doenças e na ciência) e os riscos (perda de controle, o problema do alinhamento); o profundo ceticismo (freio da complexidade, limites físicos, uma coisa totalmente diferente); e mitos comuns como "robôs dominando", "imediata quando a AGI chegar" e "fixada para 2045". Sem temê-la em excesso nem sonhar demais — aproveite ao máximo a IA de hoje enquanto observa com calma o que pode vir a seguir.

O impacto da IA sobre advogados, contadores e consultores tributários: o que muda e o que permanece

O impacto da IA sobre advogados, contadores e consultores tributários: o que muda e o que permanece

Em 2023, um advogado foi sancionado depois que uma petição redigida com o ChatGPT citou casos que eram todos fabricações da IA — e esse episódio espalhou pelo mundo a desconfiança em torno de direito e IA. Ainda assim, em poucos anos a adoção explodiu, com mais de 90% dos advogados supostamente usando alguma IA no dia a dia. Como a próxima entrada da nossa série de impacto da IA por setor, depois da #068 (trading), da #094 (marketing) e da #097 (consultoria), este artigo examina as profissões liberais. O cenário atual em números (62% dos advogados relatam economia semanal de 6 a 20%; Harvey e o CoCounsel da Thomson Reuters processaram mais de 10 milhões de documentos jurídicos no 1º trimestre de 2026; o uso de IA generativa em firmas de tributação/contabilidade/auditoria saltou de 8% em 2024 para 21% em 2025; um estudo de Stanford mostra empregos de início de carreira em áreas como a contabilidade em queda de 13% vs 2022, contadores +5% e escriturários -5%), o trabalho que a IA transforma por profissão (advogados = pesquisa de casos, revisão de contratos, extração de obrigações; contadores = escrituração, conferência de comprovantes, amostragem, identificação de riscos; consultores tributários = entrada de dados, rascunho de declarações, busca de legislação — a IA faz o trabalho de base, os humanos dão a palavra final), a maior armadilha da alucinação (inventar casos/leis inexistentes — levando a sanções e perda de confiança; a Harvey alega 99,7% de precisão em citações verificadas e sinaliza o resto, o CoCounsel ancora citações em uma base de jurisprudência para só citar casos reais), o valor essencial imutável (julgamento final, ceticismo profissional, ética, julgamentos tributários em zona cinzenta e — decisivamente — a assinatura e a responsabilidade legal que não podem ser delegadas à IA), a crise dos juniores (automatização da rotina de aprendizado) e os novos papéis (diretores de compliance de IA, engenheiros de prompt tributário), e conselhos por perfil para profissionais, aspirantes e clientes (verificar citações e números contra as fontes primárias; confirmar o tratamento da confidencialidade). A regulação e a responsabilidade diferem de país para país; no Japão, os recursos de IA em softwares de contabilidade também são amplamente difundidos. A pergunta que a IA coloca: o que você vende é o trabalho, ou o julgamento e a responsabilidade?

Como Criar Legendas e Transcrições de Vídeo/Áudio com IA

Como Criar Legendas e Transcrições de Vídeo/Áudio com IA

Legendar um vídeo de uma hora à mão consumia um dia inteiro — ouvir, pausar, digitar, alinhar o timecode. Em 2026 esse inferno termina ao "jogar o vídeo dentro e esperar alguns minutos." Focado em legendar/transcrever conteúdo de vídeo e áudio (atas de reunião vão para #086, OCR de imagens para #091), este guia cobre as quatro etapas que a IA automatiza (extração de áudio → transcrição com diarização → timecodes em SRT/VTT → tradução e estilização), a diferença entre legendas (SRT/VTT) e transcrições e quando usar cada uma, uma comparação de ferramentas (Whisper gratuito e privado, Descript que edita tudo, Sonix e Happy Scribe de alta precisão e multilíngues, Notta amigável para indivíduos, CapCut no celular, legendas automáticas do YouTube como o mais fácil — muitas usando reconhecimento da família Whisper por baixo dos panos), o fluxo de 4 passos mais repetível (preparar → transcrever → revisar → exportar/anexar SRT/VTT), recomendações por caso de uso (YouTube, podcasts, palestras, entrevistas, confidencial, multilíngue), seis dicas de precisão com a qualidade do áudio como 80% do resultado (qualidade, definição de idioma, lista de nomes próprios, localizar e substituir, diarização, comprimento da linha), o fluxo multilíngue do caminho real (aperfeiçoar o idioma de origem → traduzir com IA → revisão por nativo) e as armadilhas — confiar demais na precisão, fraqueza com ruído e jargão, direitos autorais, uploads confidenciais e desvio de timecode. Em áudio limpo a precisão é de 90–96% (publicado, dependente das condições) e o trabalho cai 80–90%. O trabalho para a IA; o acabamento — conferir nomes próprios e assistir do começo ao fim — para você.