ピボットファセット vs JSONファセット

トピック作成者:ks-solruserml-bot (2024/09/11 21:24 投稿)
1
OpenOpen

(The bot translated the original post https://lists.apache.org/thread/db5hgc3c78qzjkjlvptvq0dmrytdg6tf into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

皆さんこんにちは、

ピボットファセットとJSONのサブファセットを比較しています。
Yonikの投稿を読みましたが、とても興味深い内容で、サブファセットが柔軟性の面で優れているとありました。

https://yonik.com/solr-subfacets/

皆さんの意見や、経験上、パフォーマンスに違いがあるかどうかについて、教えていただけると幸いです。

よろしくお願いします。
Vincenzo

返信投稿者:ks-solruserml-bot (2024/09/11 21:24 投稿)

JSONファセットは元々、何らかのリファインメント(細分化処理)をサポートしていませんでした。そのため、ファセットバケットの大まかな情報を得るには役立ちましたが、階層的なファセットや統計を必要とし、その精度に確信を持ちたい場合には、ピボットファセットを使用すべきだと(個人的には)思っていました。

JSONファセットに(オプションの)リファインメントが追加されたことで状況は改善しましたが、それでも「二段階」のリファインメントに過ぎず、リファインメントの積極性を調整するためのオプションがほとんどありませんでした。その時点でも、トップバケットの精度に確信を持ちたいユースケースでは、ピボットファセットをお勧めしていました。

「overrequest」および「overrefine」のパラメータが追加されると、リファインメントの量やトップバケットの精度を大幅に制御することが可能になりました。また、その過程でJSONファセットは多くの追加機能、最適化、およびバグ修正を得ました。

現在では、私が見た「現実的な」ユースケースにおいて、ピボットファセットを推奨することはほとんどありません。ピボットファセットが有利になると考えられる唯一の仮想的なユースケースは、非常に多くの用語を持つフィールドで、非常に深くネストされたファセットを実行し、用語/バケットの分布が非常に不均衡なコレクションで、各レベルのネストされたバケットで可能な限り最良のトップバケットを得ることに完全な自信を持ちたい場合です。なぜなら、ピボットファセットは各レベルのネストされたファセットに対して再帰的なリファインメント呼び出しを行い、各バケットの統計およびサブファセットがすべてのシャードで確実に集計されるからです。

しかし、ほとんどのユースケースでは、JSONファセットの「二段階」アプローチは非常に高速で、デフォルトで問題なく機能し、「overrequest」および「overrefine」の調整によってさらに改善できます。

-Hoss
http://www.lucidworks.com/

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?