ネストされたドキュメントをインデックスする際のパフォーマンス上の考慮事項:SolrV9.6.1

(The bot translated the original post https://lists.apache.org/thread/o5b00j6knwxq90w48sn0gvx433jrp09z into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
こんにちは、皆さん
現在、ネストされたドキュメントのインデックス化に関するPoC(概念実証)を行っており、クエリ実行時のグルーピング処理の負荷を減らすことを期待しています。
本番環境でのインデックス作成では、従来のアプローチを使用しており、どのフィールドでも変更があった場合には、ドキュメント全体を再インデックスしています(参考までに、1日に約2千万(~2cr)件のドキュメントを再インデックスしています)。
Solrのバージョン:v9.6.1
しかし、Solrのドキュメントで次のような注意点を見つけました:
DOC%20and%20supporting%20documentation%20(*)
Solrは、ネストされたドキュメントツリーに更新があった場合、内部的にそのツリー全体を再インデックスする必要がある。
つまり、ルートもしくは親ドキュメントが1000件の子ドキュメントを持っていた場合、どれか1件の子ドキュメントのフィールドが変更されただけでも、すべてのネストされた子ドキュメントが再インデックスされるということになります。これは、十分とは言えない状況です。
このことから、ネストされたドキュメントを本番環境で使用した場合に、本当にパフォーマンス向上が見込めるのか、再検討することになりました。
もしこの問題が事実であれば、本番環境でのパフォーマンス向上に役立つような、他の解決策があれば教えてください。
※補足:
外部ファイルフィールドやインプレースアップデートに関してはすでにPoCを行っており、私たちのプロジェクトでは効果がないと判断しています。
よろしくお願いいたします。
Uday Kumar
トピックへ返信するには、ログインが必要です。