O que é um embedding (vetor)? Como o significado vira números, usos e como escolher um modelo
O RAG, a busca semântica e as recomendações dependem todos de um trabalhador invisível: o embedding (vetor). Um embedding é o significado de um texto (ou de uma imagem) convertido em uma sequência de números — um vetor. A palavra "cachorro" vira uma lista de centenas a milhares de números que funcionam como "coordenadas de significado", de modo que palavras próximas em significado ficam perto umas das outras ("cachorro" e "filhote" estão próximos; "cachorro" e "carro" estão distantes), e a proximidade é quantificada com medidas como a cosine similarity. Exemplo famoso: "rei − homem + mulher ≈ rainha". Por causa disso, a máquina consegue julgar se o significado é próximo mesmo quando os caracteres não coincidem. Este guia para iniciantes cobre o que é um embedding (um "mapa de significados"), por que a proximidade mede significado (dimensões e cosine similarity), para que serve (RAG, busca semântica, classificação e remoção de duplicatas, recomendações e multimodal), como escolher um modelo de embedding (tipo API como OpenAI text-embedding-3, Cohere, Gemini, Voyage; open-source como BGE-M3, Nomic, Qwen3; além da Matryoshka, que pode reduzir 3.072 dimensões para 1.024 mantendo cerca de 95% da qualidade por aproximadamente um terço do custo), e os bancos de dados vetoriais (Pinecone, Weaviate, Qdrant, Chroma, pgvector) com um começo em três passos (escolher um modelo, vetorizar e armazenar documentos, vetorizar a pergunta e buscar). Os embeddings são a base da implementação de RAG.