全文検索は、データベースやドキュメントコレクション内の全ての文書を対象として、特定の単語やフレーズを含む文書を検索する技術です。検索エンジンが提供する検索機能について、「全ての文書を対象にして検索する」点を強調するとき、 全文検索 と言います。
一般に、KandaSearchをはじめとする検索エンジンが提供する全文検索の特徴は以下の通りです。
- テキストの全体を対象とする: 全文検索では、ドキュメントやデータベース内の全てのテキストが検索対象です。つまり、どの部分にキーワードが含まれていても、その文書が検索結果に含まれます。
- 高度な検索機能: 全文検索エンジンは、単なる単語のマッチングだけでなく、複雑なクエリ、同義語の処理、文脈に基づく検索などをサポートすることが多いです。
- インデクシング: 効率的な検索のために、全文検索システムは通常、テキストデータのインデックスを作成します。このインデックスにより、検索クエリに迅速に応答することが可能になります。
通常の検索(例えばデータベースの単純な検索)との違いは、検索の範囲と機能の複雑さにあります。通常の検索では、特定のフィールドや単純な条件に基づいて検索が行われることが多いですが、全文検索では文書全体を対象にしてより高度な検索が可能です。また、全文検索は大量のテキストデータに対しても高速に動作するよう最適化されていることが一般的です。
なお、KandaSearchでは、人間が理解するように、検索エンジンが文章や画像の意味や意図を理解して行うAIを活用した先進的なセマンティック検索を提供しています。