什么是嵌入(向量)?意义如何变成数字、有何用途、如何选择模型
RAG、语义搜索和推荐系统,背后都靠一个无名功臣:嵌入(向量)。嵌入就是把文本(或图像)的意义转换成一串数字,即向量。"狗"这个词会变成数百到数千个数字组成的列表,充当"意义的坐标",于是意义接近的词语彼此靠近("狗"和"小狗"很近,"狗"和"汽车"很远),其接近度可用余弦相似度等指标量化。著名的例子是"国王 − 男人 + 女人 ≈ 女王"。正因如此,即使字面不一致,机器也能判断意义是否接近。本入门指南讲解什么是嵌入(一张"意义的地图")、为什么接近度能衡量意义(维度与余弦相似度)、能用来做什么(RAG、语义搜索、分类与去重、推荐及多模态)、如何选择嵌入模型(API 型如 OpenAI text-embedding-3、Cohere、Gemini、Voyage;开源型如 BGE-M3、Nomic、Qwen3;以及 Matryoshka,可把 3,072 维降到 1,024 维,仍保留约 95% 质量而成本约为三分之一),以及向量数据库(Pinecone、Weaviate、Qdrant、Chroma、pgvector)和三步上手法(选模型、把文档向量化并存储、把问题向量化并检索)。嵌入是实现 RAG 的根基。