LLM(生成AI)の台頭による情報検索の変化
検索スタイルの変化
検索と言えば、これまではGoogle検索に見られるように、指定されたキーワードで蓄積されたデータ内を検索し、スコアの高い順に検索結果を表示し、その中から利用者が選択する方式が主流でした。
しかし最近では、ChatGPTなどのように、LLM(ここでは生成AIを指します。以下では単にLLMと言います)により生成されたズバリの回答を1つだけ提示する形式が普及しています。さらに、回答に対してさらに細かい質問や指示をLLMに送信することで、利用者が求める回答へ調整してゆき、最終的な回答を得る方式、つまりAIアシスタント型が利用者に受け入れられるようになってきました。
LLMに潜む課題
LLMは、多くの可能性を秘めた革新的な技術ですが、その正確性や信頼性、最新情報の反映には課題が残ります。
代表的なものとしては「ハルシネーション(幻覚)」と呼ばれる、事実と異なる情報を生成してしまうリスクが懸念されています。また、企業内に閉じた情報はLLMの学習ソースに含まれないため、こうした情報を活用するのが難しいという課題もあります。
RAGについて
こうした課題を解決する技術として、RAG(Retrieval-Augmented Generation) があります。
RAGは、LLMに外部データを取り込み、回答の正確性・信頼性を向上させる手法です。従来のLLMは学習データに基づきますが、RAGはKandaSearchのような検索エンジンなどから検索結果を取得しLLMへ送信、生成用モデルと組み合わせて回答を生成します。これにより、ハルシネーションのリスクを低減し、企業独自の知識を活用できます。

RAGの有無によるLLMの比較
RAGありのLLMとなしのLLMの特徴を比較してみます。
機能 |
RAGありのLLM |
RAGなしのLLM |
情報ソース |
独自のデータベース、知識ベース |
事前学習済みのデータ |
情報の正確性 |
高い |
ハルシネーションのリスクあり |
最新情報対応 |
可能 |
限定的 |
回答の信頼性 |
高く、根拠が明確 |
公開データに依存し、ばらつきがある |
応答速度 |
データベースの規模に依存するが、高速 |
高速 |
RAGの強み
RAGの主な強みは以下の通りです。
- リアルタイム情報の活用(最新データを検索し回答)
- 専門知識の強化(企業独自のデータや専門文献を組み込み可能)
- 検索結果の要約・整理(検索したデータを理解しやすく整理)
これにより、より精度の高い情報提供が可能となり、実用的なAIアシスタントアプリの開発が実現します。
RAGにより、従来のLLM単体では難しかった高精度な情報提供やリアルタイム対応が可能になり、より実用的なAIアシスタントアプリの開発が可能となります。
KandaSearchのRAG開発支援
KandaSearchは、RAGの開発を支援するプラットフォームとしての役目を果たします。
「RAG」機能の概要
「RAG」は、インスタンスの作成やコレクションの追加などと並ぶ、KandaSearchに追加されたコアの機能です。 次の特徴を備えています。
- KandaSearchのインスタンスとコレクションを情報ソースとして活用
- セマンティック検索を利用し、適切な検索結果をLLMへ提供
- ドキュメント・クエリのベクトル変換エンドポイントを提供
- AIエージェントのU/Iとして「AIチャット」を提供
- RAGに適したLLMを標準提供し、独自LLMの指定も可能
- パラメータ変更によるRAGのチューニングが可能
「RAG」機能の利用目的
通常、RAGの構築には複雑な仕組みとリソースが必要ですが、KandaSearchの「RAG」機能を使うことで、PoC(サービスや製品に用いられるアイデアや技術が実現可能か確認するための検証作業)をスムーズに進められます。
RAGを使ったアプリケーション例
RAGを活用すると、LLM単体では困難だった高度なアプリケーションが実現できます。
1. AIチャットによるカスタマーサポート
アプリケーション例
- 企業のFAQチャット(社内ナレッジベースを活用)
- ECサイトのカスタマーサポート(商品情報や在庫データをリアルタイムで取得)
- 医療相談(最新の論文や医学データを基に回答)
- 金融アドバイザー(市場情報を検索し、投資アドバイスを生成)
メリット
- 最新のデータを取得し、正確な回答が可能
- 企業独自の情報や専門知識を活用可能
2. 高度な検索エンジン & ナレッジマネジメント
アプリケーション例
- 企業内ドキュメント検索(社内報告書やマニュアルを検索し要約)
- 研究論文の要約・検索(学術論文を検索し要約)
- 法律・契約書の検索と解釈(法令や契約書の内容を検索して解説)
メリット
- 単なるキーワード検索ではなく、質問意図に合った情報で回答を生成
- ユーザーにとって理解しやすい形で提供
3. リアルタイム情報を活用するアプリケーション
対応可能なアプリケーション例
- ニュース要約AI(最新ニュースを取得し、簡潔にまとめる)
- 市場・競合分析ツール(最新の市場データを検索し、レポートを生成)
- SNSトレンド解析(XやRedditなどのデータをリアルタイム分析)
メリット
- RAGのないLLMでは対応できない最新情報を提示可能
- 情報ソースをからのセマンティック検索結果をLLMが解釈・要約することで、理解しやすい回答を生成
4. クリエイティブコンテンツの生成支援
アプリケーション例
- 記事・ブログの自動生成(最新のデータを組み込みながら文章作成)
- 映画やゲームのストーリーアイデア生成(関連する過去作品のプロットを参考に新たなアイデアを提案)
- プログラムコード生成とエラーデバッグ(検索した技術ドキュメントをもとに適切なコードを提案)
メリット
- 既存のデータに基づいた高品質なコンテンツ生成
- 単なる文章生成だけでなく、関連情報を補強して説得力を向上
5. 教育・学習支援AI
アプリケーション例
- インタラクティブな学習アシスタント(教科書や参考書から適切な情報を取得し解説)
- 専門資格の学習支援(法律・医療・IT資格試験の教材を検索し要点をまとめる)
- プログラミング学習AI(最新のライブラリやフレームワークを検索し、最適な学習内容を提案)
メリット
- 過去の学習コンテンツではなく、最新の情報を反映した学習が可能
- ユーザーの質問に対し適切な情報を情報ソースから取得して、パーソナライズされた回答を生成
6. 法務・コンプライアンス対応AIシステム
アプリケーション例
- 契約書のチェックAI(契約書の条文を検索し、リスクを解析)
- コンプライアンスチェック(業界の最新ガイドラインを検索し、適合性を評価)
- 特許調査AI(関連する特許情報を検索し、内容を比較)
メリット
- 法律や規制の最新情報を取り入れた適切なアドバイスが可能
- 文書の意味を理解し検索結果を要約することで迅速な意思決定を支援
関連情報
- AIチャットデモ
- AIチャット画面の右下の吹き出しアイコンよりご確認いただけます。
- セマンティック検索
お問い合わせ
本件に関するご質問・ご相談等は、下記よりお気軽にお問い合わせください。
お問い合わせフォーム