Solr 7.5.0 と docValues に関するパフォーマンス問題
(The bot translated the original post https://lists.apache.org/thread/h6ko2tsgwfjohw237xvj20r2httc244v into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
こんにちは、
私たちは Solr を検索システムに使用しており、複数のマシン上でドキュメントがコアにインデックスされています。時間の経過とともに、あるマシンのインデックスが 30GB から 60GB、そして現在は 133GB という非常に大きなサイズに成長しています。他のマシンは 80GB 程度で推移しており、さらに他のマシンではまだ 30GB 未満です。ドキュメントの配置は手動で管理しており、SolrCloud は使用していません。
インデックスには DocValues フィールドがあり、このフィールドに対するファセットクエリが、約 130GB のインデックスを持つ大きなサーバーマシンでは、ほぼ毎回、最初のクエリが 10 秒ほどかかります。サーバーは 1 分ごとにコミットしており、RAM に十分な容量を確保しています。130GB のインデックスを持つマシンには 256GB の RAM があり、セグメントは常にメモリ内に存在しています。
それにもかかわらず、1 分後に行われる各クエリでは、インデックスサイズが約 130GB の大きなシャードで 10 秒、80GB のシャードで 6 秒、30GB 未満のシャードでは 4 秒以下の時間がかかります。
このレイテンシをどのように最適化し、改善することができるでしょうか? DocValuesFormat=Direct
の使用、facet.threads
の数の増加、ヒープサイズの増加などを試しましたが、大きなシャードでのファセットクエリのパフォーマンスを 2 秒未満にするための他の方法があれば教えてください。
よろしくお願いします。
Arun
トピックへ返信するには、ログインが必要です。