SolrCloudノードは、Kubernetes環境でZookeeperノードを再発見しようとしないのですか?
(The bot translated the original post https://lists.apache.org/thread/qb7owwx3zwgjf3q8dn1rz3kjy63y8og4 into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
こんにちは、皆さん!
Kubernetes環境でのSolrCloud + Zookeeperの動作について助けや明確な説明を求めています。
具体的には、ZKクラスタの3つのノードのうち2つがダウンしてリクエストを処理できない場合、接続しようとするSOLRノードは失敗し、Ready状態にはなりません。これは理解できます。
しかし、ZKクラスタが復旧して、つまり3つのノードすべてが再び稼働している場合でも、最初に自身を解決できなかったSOLRノードは引き続き解決しません。見たところ、これらのSOLRノードはZKに再接続しようとせず、したがってZKが再び利用可能であることを認識しないようです。
これは期待される動作でしょうか?そして、これから自動的に復旧する方法はありますか?
私たちはbitnamiのSOLR & Zookeeper helmチャートを使用しており、セットアップは以下の通りです:
- 3つのレプリカを持つZKステートフルセット
- 3つのレプリカを持つSolrCloudステートフルセット
再現方法は以下の通りです:
~~
- ZKクラスタを1つのレプリカにスケールダウンし、それがリクエストを処理できないことを確認します
- 3つのSolrCloudポッドすべてがZKが正常でないことを認識することを確認します
以下はエラーメッセージです:
2022-09-13 21:37:01.741 WARN
(main-SendThread(solr-v1-base-zookeeper-headless:2181)) [ ]
o.a.z.ClientCnxn Session 0x0 for sever solr-v1-base-zookeeper-headless/
10.64.0.69:2181, Closing socket connection. Attempting reconnect except it
is a SessionExpiredException. => EndOfStreamException: Unable to read
additional data from server sessionid 0x0, likely server has closed socket
- 2つのSolrCloudポッドを削除し、それらが再起動するのを待ちます。再起動後、それらはZKにアクセスできないと文句を言います
org.apache.solr.common.SolrException: Error occurred while loading solr.xml
from zookeeper
削除された2つのSolrCloudポッドは一貫して準備ができていない状態であり、それはコアが初期化されていないかシャットダウンしているためだと表示されます。削除されなかった単一のポッドは通常通り動作し続けます。
ZKクラスタを再び3つのレプリカにスケールアップし、それが再び正常であることを確認します
- ZKが正常でない時に起動した2つのSolrCloudポッドが引き続き準備ができていないままであり、ログに同じエラーが表示され続けることを確認します
javax.servlet.ServletException: javax.servlet.UnavailableException: Error
processing the request. CoreContainer is either not initialized or shutting
down.
o.a.s.s.SolrDispatchFilter Error processing the request. CoreContainer is
either not initialized or shutting down.
o.e.j.s.HttpChannel /solr/admin/info/system =>
javax.servlet.ServletException: javax.servlet.UnavailableException: Error
processing the request. CoreContainer is either not initialized or shutting
down.
~~
したがって、確認したいのは...
SOLRが以前に失敗した場合、ZKに再接続しようとしないようです。これは意図的な動作でしょうか?それを実行させる方法はありますか?
ありがとうございます!
トピックへ返信するには、ログインが必要です。