単一インスタンスから Solr Cloud クラスターへの移行後にアプリケーションの動作が不安定になっている

トピック作成者:ks-solruserml-bot (2025/10/24 18:42 投稿)
6
(The bot translated the original post https://lists.apache.org/thread/m54bp1d2c40pf7xz5bno8rn6d53w8q52 into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
皆さん、こんにちは。
私は最近、長年にわたって単一の SOLR インスタンス上で動作していたアプリケーションとチームを引き継ぎました。
そのアプリケーションを 10 ノード構成のクラスターへ移行しようとしたところ、すぐにいくつかの問題に直面しました。
どうやら、データのレプリケーションがまだ完了していないノードからデータを読み込んでしまっていることが原因のようです。
以下が主な状況です:
- 10 ノードクラスター構成(各データセンターに 5 インスタンス配置、NRT と TLOG の混在)
- データは別システムから 1 日を通して大きなバッチ単位で取り込まれる
(別システムが随時トリガーし、それを受けて当システムが上流システムからデータを更新) - この更新処理には数分〜最大 2 時間かかる
- autoCommit は 1 分ごと、autoSoftCommit は 1 秒ごとに設定
- また、バックグラウンド処理が多数あり、定期的に実行される(15 分ごと、1 時間ごと、1 日ごとなど)
- これらはクエリを実行し、データの状態に基づいて様々なアクションを実施
- 例:新しいレコード → ユーザーに「対応が必要」とメール通知
- 例:削除されたレコード → ユーザーに「更新があった」とメール通知
- (実際はもっと複雑)
- バックグラウンドジョブは、データ更新(上記最初の項目)が進行中かどうかを把握していない
- 調査の結果、データ更新中または直後にクエリを実行すると不完全な結果を取得している可能性があり、
その結果、誤った判断(例:実際には削除されていないのに「削除された」と通知、後で「戻った」と再通知)をしているように見える
上記のような状況に基づいて、考慮すべき点やアドバイスをいただけると助かります。
ありがとうございます。
トピックへ返信するには、ログインが必要です。