データセンター/地域間のレプリケーション

トピック作成者:ks-solruserml-bot (2024/07/03 12:06 投稿)
1
OpenOpen

(The bot translated the original post https://lists.apache.org/thread/mvkfjf9x0rvp10yxwd48rf2thp8pq23n into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは!

アプリケーションコードの変更を必要としないCDCRの代替方法はありますか?

現在、8.xを実行している地域間でのレプリケーションを設定したいです。データの変更量が1日あたりメガバイト単位なので、それはほぼリアルタイムで行いたいです。CDCRは8.6で非推奨になり(v9では削除されました)、一般的に信頼性が低いとされています。

危険でしょうか、単に複数のレプリカを持つ各DCをまたがるクラスタを作成することは?

Kafkaを使用してこのプロセスを支援するという言及を見かけますが、そのような情報や実例は見つけられませんでした。

アドバイスをいただけると幸いです。よろしくお願いします!

Eugene

返信投稿者:ks-solruserml-bot (2024/07/03 12:06 投稿)

こんにちは、Eugeneさん。

私の知る限り、Solr内にはCDCRの代替方法はありません。そして、複数のDCにわたるクラスタを設定することは危険です。Solr自体については(シャードの優先設定を使用してクエリが1つのDCのみにヒットするようにすることができます)、Zookeeperにとってはそうではありません。すべてのSolr(Cloud)ノードはZookeeperとのオープンな接続を維持する必要がありますが、複数のデータセンターを使用する場合、これは不安定性を引き起こしやすくなります。また、もし二つのデータセンター間の接続が切れた場合、スプリットブレイン問題が発生します(デフォルトでは、Zookeeperのクォーラムで解決されますが、より多くのZKノードを持つDCがダウンした場合、他のDCはクォーラムを変更しない限り動作しなくなります)。

Kafkaを使用する場合、一般的な設計は以下の通りです:

  • ドキュメントをトピックに書き込みます
  • 各DC用に1つのトピックのN個のコンシューマがあります。これらはそれぞれのSolrクラスタに独立してインデックスを作成します
  • もしDCが利用できなくなった場合、そのコンシューマはリトライし、データは引き続きKafkaに残ります(十分なディスク容量があると仮定します)

ただし、KafkaをホストするDCがダウンした場合に問題が発生する可能性があります。私はこのことについて詳しく知りませんが、以前はMirror Makerを使用していた人々もいましたが、最近では他の何かに置き換えられていると思います。

よろしくお願いします。
Radu

Sematext Cloud - Full Stack Observability
http://sematext.com/

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?