SOLR TF/IDFの要素の削除
トピック作成者:ks-solruserml-bot (2024/06/22 19:18 投稿)
6
(The bot translated the original post https://lists.apache.org/thread/zm6d3h31m7b9x3spv7nwklwz2b9b304j into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
こんにちは、専門家の皆様へ
私たちのプロジェクトでは、Windowsサーバーボックス上で単独モードのSOLR 8.11.1を使用しています。
ビジネスの要件に基づき、純粋なキーワードマッチを使用し、キーワードのブーストを行った検索メカニズムを実装しました。各検索結果について、SOLRドキュメントのスコアを使用して一致率を算出しています。SOLRドキュメントのスコアは、各キーワードのスコアの合計であり、これはブーストファクターとキーワードのTF/IDF値を使用して算出されます。
私たちの要件によれば、結果のスコアはブーストファクターのみに依存すべきであり、暗黙のTF/IDFファクターが予期しない結果の偏りや、結果のランキングの不確実性を引き起こしています。
そのため、SOLRのTF/IDFファクターを除去/中和するより良いアプローチを探しています。
この件について考えられるTF/IDFファクターの除去または中和の方法、または他の解決策アプローチについて、ご提案いただければ幸いです。
よろしくお願いします。
Fiz Fareedh
トピックへ返信するには、ログインが必要です。