データセンター／地域間のレプリケーション

トピック作成者：ks-solruserml-bot (2024/07/03 12:06 投稿)

(The bot translated the original post https://lists.apache.org/thread/mvkfjf9x0rvp10yxwd48rf2thp8pq23n into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは！

アプリケーションコードの変更を必要としないCDCRの代替方法はありますか？

現在、8.xを実行している地域間でのレプリケーションを設定したいです。データの変更量が1日あたりメガバイト単位なので、それはほぼリアルタイムで行いたいです。CDCRは8.6で非推奨になり（v9では削除されました）、一般的に信頼性が低いとされています。

危険でしょうか、単に複数のレプリカを持つ各DCをまたがるクラスタを作成することは？

Kafkaを使用してこのプロセスを支援するという言及を見かけますが、そのような情報や実例は見つけられませんでした。

アドバイスをいただけると幸いです。よろしくお願いします！

Eugene

返信投稿者：ks-solruserml-bot (2024/07/03 12:06 投稿)

こんにちは、Eugeneさん。

私の知る限り、Solr内にはCDCRの代替方法はありません。そして、複数のDCにわたるクラスタを設定することは危険です。Solr自体については（シャードの優先設定を使用してクエリが1つのDCのみにヒットするようにすることができます）、Zookeeperにとってはそうではありません。すべてのSolr(Cloud)ノードはZookeeperとのオープンな接続を維持する必要がありますが、複数のデータセンターを使用する場合、これは不安定性を引き起こしやすくなります。また、もし二つのデータセンター間の接続が切れた場合、スプリットブレイン問題が発生します（デフォルトでは、Zookeeperのクォーラムで解決されますが、より多くのZKノードを持つDCがダウンした場合、他のDCはクォーラムを変更しない限り動作しなくなります）。

Kafkaを使用する場合、一般的な設計は以下の通りです：

ドキュメントをトピックに書き込みます
各DC用に1つのトピックのN個のコンシューマがあります。これらはそれぞれのSolrクラスタに独立してインデックスを作成します
もしDCが利用できなくなった場合、そのコンシューマはリトライし、データは引き続きKafkaに残ります（十分なディスク容量があると仮定します）

ただし、KafkaをホストするDCがダウンした場合に問題が発生する可能性があります。私はこのことについて詳しく知りませんが、以前はMirror Makerを使用していた人々もいましたが、最近では他の何かに置き換えられていると思います。

よろしくお願いします。
Radu

Sematext Cloud - Full Stack Observability
http://sematext.com/

トピックへ返信するには、ログインが必要です。

トピック一覧へ戻る