非常に大きな結果セットの代表的なフィルタリング
トピック作成者:ks-solruserml-bot (2024/06/20 15:25 投稿)
7
(The bot translated the original post https://lists.apache.org/thread/16x75r9f2qrpg1osbn3jfj9f4vhz37c7 into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
非常に大きな結果セットの代表的なフィルタリングについて
フィールド値に基づいて結果を統合するためにcollapseクエリパーサーを使用し、他の多くのフィールドにもファセットを適用しています。collapseフィールドとファセットフィールドにはすべてdocValues=true
が設定されています。非常に大きな(数百万件のドキュメント)結果セットに対しては、ヒープ使用量が増えすぎて、結果としてGC(ガベージコレクション)が問題になります。ファセット対象となるドキュメントの数を減らしながらも、全体の結果セットを「代表する」ファセットを表示する方法を模索しています。
フィルタクエリのようなものが明らかな解決策のように思えますが、どのようなものが良いのでしょうか?最も関連性の高い結果を誤って除外してしまいたくありません。
上位N件の結果に対してのみファセットを適用する方法はありますか?
どんなヒントでも感謝します。
--
Jeremy Buckley
トピックへ返信するには、ログインが必要です。