Solr 9.1 のパフォーマンス
(The bot translated the original post https://lists.apache.org/thread/ysdcrvsbxggkb32nfq701h3cjg1xg0m2 into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
こんにちは、
現在、Windows上で動作しているSolr 5.4.1のクラウド設定を使用しています。
このクラウドには4,500万件のレコードが含まれており、12個のシャードに分割され、レプリケーションファクターは2です。12個のシャードは、4つのノードを実行する6つのサーバーにホストされています。3つのサーバーは1つのデータセンターに、もう3つのサーバーは別のデータセンターに配置されているため、高可用性とサイト冗長性を実現しています。
この設定は非常にうまく機能しており、毎分数百件のクエリに対応し、1日に2万件の新しいドキュメントのフィードと更新を簡単に処理できますが、古い機器で動作しています。
新しいサーバーと同じトポロジーと設定を使用して、Solr 9.1(Eclipse Adoptium OpenJDK 17.0.4)を使用して新しいクラウドを構築しましたが、ノードでの最初のいくつかのクエリが非常に悪いことがわかりました。全体的なP95時間は6〜8Kミリ秒です。最初の数クエリが新しいインデクサーをスピンアップするような感じで、メモリに定着すると(またはスピンアップすると)、クエリは<10msで返されますが、90秒間アイドル状態にすると再び遅いクエリが発生します。場合によっては、管理UIパネルもアイドル状態でクエリが遅くなることがあります。ブラウザの開発ツールを使用すると、最初のクエリのページ時間が、すでに高いクエリ/経過時間よりも長いことがわかります。
クエリの性質上、キャッシュの自動ウォーミングは行っていません。ガベージコレクションは1200MBの割り当てで問題なく動作しています。クイックかつ頻繁ではなく、通常1200MBの割り当ての70%に達する前にクリーンアップされます。
インデックス作成がアクティブでない場合でも同じ動作が見られるため、それを除外できます。以前、同じ問題が発生していたバージョン9でクラウドを構築しました。
クラウドにリクエストを常にスパムすることでクエリを高速に保つことはできますが、5.4 Solrクラウドでは常にアクティビティがあるため、アイドル期間を比較することはできません。
おそらく、これが本番環境で使用されるとアクティビティがクラウドを常にアクティブに保つでしょうが、クラウドを常にアクティブに保つために他に見るべきものはありますか?
よろしくお願いします。
トピックへ返信するには、ログインが必要です。