ネストされたドキュメントは、時間とともに増加していくドキュメントの集合に適していますか?

(The bot translated the original post https://lists.apache.org/thread/7gjsc7wjqzv5g5ko6s8zcpoy9f3vjkm2 into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
こんにちは、
別のドキュメント管理システムからダウンロードしたドキュメントをインデックス化するためのスキーマを考えようとしています。
元のソースでは、ドキュメントは「コレクション」内に保存されています。コレクションはフォルダーのようなもので、追加のメタデータを持っています(ただし、ネストはできません)。
すべてのドキュメントは必ず何らかのコレクションに属しており、宙に浮いた(どのコレクションにも属さない)ドキュメントは存在しません。ドキュメントが複数のコレクションに属することはまれですが、単純化のために、属している各コレクションごとにインデックス化しようと考えています。
主に懸念している点は以下の2つです:
- コレクションのメタデータを後から変更できること
- コレクション内のすべてのドキュメントを再インデックスせずに、新しいドキュメントを追加できること
検索の対象は、主に個々のドキュメントのテキストとメタデータ(作成日時、作成者名など)ですが、検索結果にはコレクションのメタデータも含めて返したいと考えています。
2つ目の案としては、ドキュメントとコレクションを別々にインデックス化して、クエリ時に結合することも検討しています(Solrのドキュメントによると、クエリ時のJOINが可能とのことです)。
Solrはまだ初心者なので、後悔するようなスキーマでスタートしたくありません。どんなアドバイスでも歓迎します。
よろしくお願いいたします。
Yaşar
トピックへ返信するには、ログインが必要です。