SOLR のオートリカバリ

トピック作成者:ks-solruserml-bot (2024/07/02 11:58 投稿)
5
CloseClose

(The bot translated the original post https://lists.apache.org/thread/gflmgm5z75rj5nf5t2vl5tlmy15fjfps into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは、皆さん。

ソーラーノードがダウンした場合に通知するアラートメカニズムがある場合、そのアラートに対して何らかのアクションを設定し、自動的にそのソーラーノードを再起動し、回復させることは可能でしょうか?
アドバイスをお願いします。

ありがとうございます。
Poorna

返信投稿者:ks-solruserml-bot (2024/07/02 11:58 投稿)

私の経験では、Solrがダウンする原因はディスクスペース不足であることが多いので、自動的に再起動してもすぐにまたダウンしてしまいます。スタンドアロンのSolrであれば、必要な処理を行う簡単なBashスクリプトを作成することができます。ただし、再起動前に残っているSolrの子プロセスを確実に終了させる必要があります。

返信投稿者:ks-solruserml-bot (2024/07/02 11:58 投稿)

Dave に同意します。

環境が正常である場合(OSとJavaが正しく動作し、十分なディスクスペース、メモリ、他のリソース(ファイルハンドルなど)が利用可能である場合)、Solrはクラッシュしません。クラッシュした場合、それは何かが間違っていることを意味し、それを修正する必要があります。単にSolrを再起動するだけでは、再びクラッシュする可能性が非常に高いです。このため、Solrには自動的に再起動する機能がありません。もしそれが必要なら、監視システムの一部としてそれを実装する必要がありますが、これは推奨されません。

ありがとうございます。
Shawn

返信投稿者:ks-solruserml-bot (2024/07/02 11:58 投稿)

私たちのSolrインスタンスがディスクスペース不足でダウンしたことは一度もありません。代わりに、活動が突然極端に増加したときにOutOfMemoryのためにダウンすることがあります。その場合、Solrは停止します。

私たちのデーモンはすべてsystemdで制御されており、自動的に再起動され、通常は問題なくクラスターに再参加します。OutOfMemoryエラーの場合には、自動再起動のおかげで作業が少なくて済みます。しかし、ディスクスペースの問題にはこの方法は機能しません。

返信投稿者:ks-solruserml-bot (2024/07/02 11:59 投稿)

OOMエラーは確かに厄介ですね。私たちはLinux上で実装されたメモリキャッシュ、バッファ、スワップスペースをクリアする手順を、再起動シェルスクリプトに追加しました。しかし、Shawnの言ったように、展開されたSolrはこれまでにダウンしたことがありません。それぞれのサーバーには200GB以上のRAMがあり、31GBのヒープスペースが割り当てられています。時には、問題に対処するためにお金やハードウェアを投入するのが最善の方法かもしれませんね。

返信投稿者:ks-solruserml-bot (2024/07/02 11:59 投稿)

わかりました。Solrが時々クラッシュする原因を突き止めるまで、私たちはMonitを使ってプロセスを監視し、プロセスが消えた場合に再起動するようにしています。私たちはすでに他の用途でMonitを使用していたので、Solrの設定を追加するのは簡単でした。

https://mmonit.com/monit/

あなたの警告メカニズムが同様のことを行えるかどうかは、そのメカニズム次第です。

しかし、問題を見つけて修正することが最善の解決策であることには同意します。

--
Mark H. Wood
リード・テクノロジー・アナリスト

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?