`facet.limit`がファセットカウント値に与える影響

トピック作成者:ks-solruserml-bot (2024/08/24 22:11 投稿)
4
OpenOpen

(The bot translated the original post https://lists.apache.org/thread/f8s1ygt1gxxrb861cjf682d1kfgobr1w into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは、

facet.limitの値を増減させると、ファセットカウントが変わることに気づきました。これはグループ化されたファセットで発生しています。

facet.limitを-1またはより高い数値に設定すると、グループ化されたファセットカウントが正確になります。

この問題について理解し、正しいグループ化ファセットカウントを得るための解決方法を教えていただけないでしょうか。

ありがとうございます。
Modassar

返信投稿者:ks-solruserml-bot (2024/08/24 22:11 投稿)

SolrCloudを使用していて、問題のコレクションが複数のシャードを持っている場合は、overrequestoverrefineパラメーターを確認することをお勧めします。

返信投稿者:ks-solruserml-bot (2024/08/24 22:11 投稿)

ご返信ありがとうございます。

Solrクラスタは48のシャードにデプロイされており、グループ内のすべてのドキュメントは1つのシャードにのみ存在しています。

このファセットの動作の理由について理解するのにご協力いただけますか?

よろしくお願いします。
Modassar

返信投稿者:ks-solruserml-bot (2024/08/24 22:12 投稿)

正確なメカニズムは覚えていませんが、概ね次のような理由です。例えば、上位10件の結果が欲しいとします。デフォルトでは、Solrは各シャードやレプリカからおよそ15件のトップドキュメントを上位10件の候補として考慮します。もし、いくつかのシャードで16位の結果が多くのドキュメントを持っていて、それが考慮されれば15位の結果を超えたとしたらどうなるでしょうか?この結果、正確なトップ10リストになりません。そして、もしそのトップ10リストの中に、あるレプリカで16位にあったものが含まれていたら、そのドキュメントは最終的なカウントに含まれず、不正確なカウントになる可能性があります。

overrequestoverrefineのパラメータについて調べると、私よりもはるかにわかりやすく説明しているリソースがいくつかあります 😃 これらのパラメータは、この問題を軽減するためのものです。例えば、以下のリンクを参照してください:

https://medium.com/@sarkaramrit2/overrequest-and-refine-json-facet-bucket-counts-in-solr-1acfa77cd90c

ufuk yilmaz

返信投稿者:ks-solruserml-bot (2024/08/24 22:12 投稿)

Ufukさん、ご返信ありがとうございます。

よろしくお願いします、
Modassar

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?