RAGの仕組み– category –

RAG（Retrieval-Augmented Generation）は、生成AI（特にLLM）がより正確で根拠のある回答を作るための仕組みで、外部の知識データを検索（Retrieval）してから生成（Generation）に活用する手法です。従来のLLMは学習データに依存するため、最新情報に弱かったり誤情報（ハルシネーション）を生みやすいという課題がありました。RAGはこの弱点を補います。

仕組みは大きく3段階です。

1. クエリ生成
　ユーザーの質問をLLMが埋め込みベクトルに変換し、「何を調べるべきか」を明確にします。

2. 外部検索（Retrieval）
　質問に関連する文書を検索します。検索先は企業のデータベース、PDF、Web情報、FAQなどさまざまです。ベクトルデータベースを使うことで、単語一致ではなく意味的に近い内容を高速に取り出せます。

3. **生成（Generation）**
　検索して得られた文書をLLMが読み込み、「事実に基づいた回答」を生成します。このときLLMは、検索結果を根拠として文章を組み立てるため、精度が大幅に向上します。

RAGの強みは、（1）最新情報に対応できる、（2）専門的・正確な回答を作れる、（3）学習し直さなくても知識を更新できる点です。

総じて、RAGは
「検索で得た外部知識をLLMに注入し、正確で信頼性の高い回答を生む技術」
であり、企業システムや業務支援AIで広く利用されています。

記事が見つかりませんでした。