データインポート - 最適化 (Solr バージョン 8.11.2)

トピック作成者:ks-solruserml-bot (2024/09/22 22:15 投稿)
3
OpenOpen

(The bot translated the original post https://lists.apache.org/thread/44kl0nndg350qq3sh4vl3715xflr19o2 into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

なぜ Solr Admin UIdataimport セクションで Optimize を実行すると、レコードが重複するのでしょうか?各レコードの新しいコピーが作成されます。"id" と "version" は異なりますが、それ以外は完全に同じです。Optimize を実行するたびに、元のレコード数が再び追加されます。最初のレコード数は Num Docs: 393112 ですが、最初の最適化後には Num Docs: 786224 となり、再度最適化を実行すると Num Docs: 1179336 になってしまいます。

よろしくお願いします。

Anuj

返信投稿者:ks-solruserml-bot (2024/09/22 22:15 投稿)

最適化は、削除されたドキュメントを除いてインデックス全体を再構築するだけで、インデックス自体には何も変更を加えません。Num Docs は変わらないはずです。

しかし、データインポートを実行している際に最適化が含まれている場合、それがインデックスを変更する原因となる可能性があります。

私の言っていることが正しいか確認するためには、インポートを行っていないときに手動で最適化を実行してみてください。例えば、インデックスが XXX という名前の場合、次のコマンドで実行できます:

curl "http://hostname:port/solr/XXX/update?optimize=true"

最適化は時間がかかる操作です。

ありがとう、
Shawn

返信投稿者:ks-solruserml-bot (2024/09/22 22:15 投稿)

そのコマンドは、SolrCloud バージョン 9.5.0-SNAPSHOT では動作しません。私は 1月4日に branch_9x の未修正のチェックアウトからコンパイルしました。

これは、Solr 7.5.0 で導入された最適化機能の変更が原因だと思います。コマンドはほぼ即座に戻り、実際には何も実行されていません。

以下のコマンドは動作します:

curl "http://localhost:8983/solr/XXX/update?optimize=true&maxSegments=1"

ありがとう、
Shawn

返信投稿者:ks-solruserml-bot (2024/09/22 22:15 投稿)

ありがとう、Shawn。

このコマンドは動作しました:
http://localhost:8983/solr/XXX/update?optimize=true&maxSegments=1

よろしくお願いします。

Anuj

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?