RAGの仕組み– category –
RAG(Retrieval-Augmented Generation)は、生成AI(特にLLM)がより正確で根拠のある回答を作るための仕組みで、外部の知識データを検索(Retrieval)してから生成(Generation)に活用する手法です。従来のLLMは学習データに依存するため、最新情報に弱かったり誤情報(ハルシネーション)を生みやすいという課題がありました。RAGはこの弱点を補います。
仕組みは大きく3段階です。
1. クエリ生成
ユーザーの質問をLLMが埋め込みベクトルに変換し、「何を調べるべきか」を明確にします。
2. 外部検索(Retrieval)
質問に関連する文書を検索します。検索先は企業のデータベース、PDF、Web情報、FAQなどさまざまです。ベクトルデータベースを使うことで、単語一致ではなく意味的に近い内容を高速に取り出せます。
3. **生成(Generation)**
検索して得られた文書をLLMが読み込み、「事実に基づいた回答」を生成します。このときLLMは、検索結果を根拠として文章を組み立てるため、精度が大幅に向上します。
RAGの強みは、(1)最新情報に対応できる、(2)専門的・正確な回答を作れる、(3)学習し直さなくても知識を更新できる点です。
総じて、RAGは
「検索で得た外部知識をLLMに注入し、正確で信頼性の高い回答を生む技術」
であり、企業システムや業務支援AIで広く利用されています。
記事が見つかりませんでした。
