こんにちは Shawn,
説明とアドバイスをありがとうございます。
シャードとレプリカに関して使用した誤った用語に同意します。
ヒープメモリ使用量とスレッド数の一時的なスパイクを理解して修正しようとしています。
問題が発生すると、ヒープダンプにはフィルターキャッシュを構築する多くのスレッドが表示されます。各スレッドが多くのヒープメモリを消費しています。
その結果、ヒープが完全には満杯でなくても、連続したフルGCが発生します。
SolrのログファイルにはCdcr関連のメッセージも見られ、同じレプリカで数秒間隔で同時に検索者が開かれているのが分かります。
これらの検索者が、autosoftcommit maxtimeが60000で、autocommit maxtimeが300000で、opensearcherがfalseに設定されている同じ秒に開かれている理由が分かりません。
solr.log.18:394492:2022-11-23 14:45:37.134 INFO (zkCallback-5-thread-128)
[ ] o.a.s.h.CdcrLeaderStateManager Received new leader state @ SSSS:shard1
solr.log.18:418525:2022-11-23 14:45:48.533 INFO (Thread-2218) [c:SSSS s:shard1 r:core_node90 x:SSSS_shard1_replica_t89] o.a.s.s.SolrIndexSearcher
Opening [Searcher@39764e3a[SSSS_shard1_replica_t89] main]
solr.log.18:418626:2022-11-23 14:45:49.535 INFO (Thread-2218) [c:SSSS s:shard1 r:core_node90 x:SSSS_shard1_replica_t89] o.a.s.s.SolrIndexSearcher
Opening [Searcher@3dd70403[SSSS_shard1_replica_t89] main]
solr.log.18:418667:2022-11-23 14:45:50.090 INFO
(recoveryExecutor-4-thread-13-processing-n:no2fyy27.noe.edf.fr:8984_solr
x:SSSS_shard1_replica_t89 c:SSSS s:shard1 r:core_node90) [c:SSSS s:shard1 r:core_node90 x:SSSS_shard1_replica_t89] o.a.s.s.SolrIndexSearcher Opening
[Searcher@4a51a759[SSSS_shard1_replica_t89] main]
solr.log.18:418682:2022-11-23 14:45:50.153 INFO
(recoveryExecutor-4-thread-13-processing-n:no2fyy27.noe.edf.fr:8984_solr
x:SSSS_shard1_replica_t89 c:SSSS s:shard1 r:core_node90) [c:SSSS s:shard1 r:core_node90 x:SSSS_shard1_replica_t89] o.a.s.h.CdcrRequestHandler Solr
core is being closed - shutting down CDCR handler @ SSSS:shard1
または
solr.log.18:454048:2022-11-23 14:59:21.351 INFO (Thread-2668) [c:SSSS s:shard1 r:core_node90 x:SSSS_shard1_replica_t89] o.a.s.s.SolrIndexSearcher
Opening [Searcher@273ebecf[SSSS_shard1_replica_t89] main]
solr.log.18:454403:2022-11-23 14:59:21.993 INFO (Thread-2668) [c:SSSS s:shard1 r:core_node90 x:SSSS_shard1_replica_t89] o.a.s.s.SolrIndexSearcher
Opening [Searcher@711992c5[SSSS_shard1_replica_t89] main]
solr.log.18:454484:2022-11-23 14:59:22.588 INFO
(recoveryExecutor-4-thread-17-processing-n:no2fyy27.noe.edf.fr:8984_solr
x:SSSS_shard1_replica_t89 c:SSSS s:shard1 r:core_node90) [c:SSSS s:shard1 r:core_node90 x:SSSS_shard1_replica_t89] o.a.s.s.SolrIndexSearcher Opening
[Searcher@5258502d[SSSS_shard1_replica_t89] main]
solr.log.18:454502:2022-11-23 14:59:22.609 INFO
(recoveryExecutor-4-thread-17-processing-n:no2fyy27.noe.edf.fr:8984_solr
x:SSSS_shard1_replica_t89 c:SSSS s:shard1 r:core_node90) [c:SSSS s:shard1 r:core_node90 x:SSSS_shard1_replica_t89] o.a.s.h.CdcrRequestHandler Solr
core is being closed - shutting down CDCR handler @ SSSS:shard1
最後に、1サーバーあたり2つのSolrインスタンスがあります。
アーキテクチャは以下の通りです:
- 7台のサーバー(96GB RAM / 12 CPU)
- 14個のSolrインスタンス(24GB Heap)
巨大なコレクションがシャーディングされており、14シャード×2レプリカ全てTLOGです。
ドキュメントの総数:15億(1シャードあたり1億ドキュメント)
よろしくお願いします。
Dominique