ひとことで言うと
RAG(Retrieval-Augmented Generation、検索拡張生成) とは、LLM が回答を生成する時、外部のドキュメントやデータベースを検索して、その結果を取り込んで回答する 仕組みです。
具体的にどんな場面?
例えば、ChatGPT に「最新の AI 市場動向は?」と質問された時:
[従来の LLM]:
学習データの cutoff(例:1 年前)までしか知らないので、
古い情報か「わかりません」と答える
[RAG を使った AI 検索]:
1. リアルタイムで Web を検索(retrieval)
2. 関連情報を取得
3. それを元に回答を生成(generation)
→ 最新情報を踏まえた回答が返る
これが Perplexity、SearchGPT、Gemini AI Overview の中核技術です。
なぜ GEO 文脈で重要か
- AI 検索エンジンはすべて RAG ベース
- 「検索フェーズで自社が引用される」ことが GEO の本質
- 学習データに含まれていなくても、Web で見つかれば引用される(新しい記事も即引用候補)
RAG の流れ(GEO 対策視点)
ユーザー質問
↓
LLM が「これは Web 検索が必要な質問」と判断
↓
クローラー(検索インデックス)から候補を取得 ← ★ GEO 対策の主戦場 ★
↓
取得した情報を元に回答を生成
↓
ユーザーへ回答(引用源を明示)
ステップ 3 の「候補取得」で自社が選ばれるかどうかが GEO 対策の成否を決めます。
自社で RAG システムを使う場合
GEO とは別文脈で、企業が自社データで RAG システムを作るケースも増えています(社内 ChatGPT、顧客サポート AI 等)。技術的には同じですが、GEO の対象は 「外部の AI 検索で引用される」 ことです。