リランキング(reranking)とは?RAGの精度を上げる2段階検索を初心者向けに解説
RAGを作ったのに検索の精度がいまいち——そんなときに効くのがリランキング(reranking/再ランク付け)。埋め込み(ベクトル)検索でざっくり集めた候補を、もう一段、関連度で並べ替えて上位だけ残す処理で、RAGの回答品質を大きく左右する検索精度の最後のひと押し。本記事は、リランキングの正体(一次選考と最終面接のたとえ)、なぜ必要か(埋め込み検索はクエリと文書を別々にベクトル化するため関連度の見極めが粗い)、2段階検索の仕組み(速い埋め込み検索で広く取得=再現率→リランカーで上位に絞る=精度→LLMに渡す。研究で精度が大きく改善し一例で約40%向上と報告)、なぜリランカーが正確か(bi-encoder=別々に見て速いが近似、cross-encoder=クエリと文書を一緒に入れて関連度スコア0〜1を直接出すため正確だが重い)、モデルと実装(API型=Cohere Rerank/Voyage/Jina、OSS型=BGE reranker/mixedbread/FlashRank、LLMで採点するRankLLM等。既存のベクトル検索の取得件数を50〜100に増やしリランカーで上位5件に絞る1工程を足すだけ)までを初心者向けに解説。「広く取得して賢く絞る」が原則で、件数はAI評価で測りながら調整する。