Was ist ein Embedding (Vektor)? Wie Bedeutung zu Zahlen wird, Anwendungen und Modellauswahl
RAG, semantische Suche und Empfehlungen beruhen alle auf einem unbesungenen Arbeitspferd: dem Embedding (Vektor). Ein Embedding ist die in eine Zahlenfolge — einen Vektor — umgewandelte Bedeutung von Text (oder eines Bildes). Das Wort „Hund" wird zu einer Liste aus Hunderten bis Tausenden von Zahlen, die als „Koordinaten der Bedeutung" wirken, sodass Wörter mit naher Bedeutung nah beieinander liegen („Hund" und „Welpe" sind nah; „Hund" und „Auto" sind fern), und die Nähe wird mit Maßen wie der Kosinus-Ähnlichkeit quantifiziert. Berühmtes Beispiel: „König − Mann + Frau ≈ Königin." Dadurch kann eine Maschine beurteilen, ob die Bedeutung nah ist, selbst wenn die Zeichen nicht übereinstimmen. Dieser Einsteiger-Leitfaden behandelt, was ein Embedding ist (eine „Landkarte der Bedeutung"), warum Nähe Bedeutung misst (Dimensionen und Kosinus-Ähnlichkeit), wofür es verwendet wird (RAG, semantische Suche, Klassifikation und Deduplizierung, Empfehlungen sowie multimodal), wie man ein Embedding-Modell auswählt (API-Typ wie OpenAI text-embedding-3, Cohere, Gemini, Voyage; Open-Source wie BGE-M3, Nomic, Qwen3; plus Matryoshka, das 3.072 Dimensionen auf 1.024 senken kann und dabei etwa 95 % der Qualität bei rund einem Drittel der Kosten erhält) sowie Vektordatenbanken (Pinecone, Weaviate, Qdrant, Chroma, pgvector) mit einem Drei-Schritte-Start (ein Modell wählen, Dokumente vektorisieren und speichern, die Frage vektorisieren und suchen). Embeddings sind das Fundament der RAG-Implementierung.