DocValuesの使用法

トピック作成者:ks-solruserml-bot (2024/06/26 20:32 投稿)
1
CloseClose

(The bot translated the original post https://lists.apache.org/thread/1p4r5oyn2gqsglsk2yx6fwzjnvy8brw8 into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは、

私たちはアプリケーションでdocValuesを導入し、フィールドキャッシュの使用を減らす計画を立てています。

これに関していくつか疑問があります。ご協力いただければ幸いです。

1) docValuesを使用する場合、特にインデックス生成時にI/O読み取りが発生するため、パフォーマンスへの影響はありますか?

2) docValuesに適したフィールドやフィールドのカテゴリの推奨リストはありますか?

3) Solrでユニークキーとして使用されている"id"フィールドがあります。ファセットやソートには使用されていませんが、それでもフィールドキャッシュに表示され、多くのメモリを占有しています。この"id"フィールドがフィールドキャッシュに入る理由を理解するのにご協力ください。

4) Solr管理ページのフィールドキャッシュを見ると現在のエントリが表示されますが、フィールドキャッシュに入る可能性のあるすべての属性のリストを取得することは可能でしょうか?

お手数ですが、よろしくお願いします。
Poorna

返信投稿者:ks-solruserml-bot (2024/06/26 20:32 投稿)

こんにちは、Poornaさん。

以下に回答を記載します。

  1. はい、インデックス生成中にはより多くのファイル書き込みが必要です。そのため、クエリのパフォーマンスは特定のI/Oに依存します。JVMヒープを制限し、メモリマッピングされたインデックスファイルに十分なRAMを空けることが重要です。

  2. 短い列挙型や数値フィールドに適しています。テキスト(分析の観点から)はサポートされていません。

  3. いくつかの内部ルーチンがフィールドキャッシュの読み込みをトリガーすることがあります。具体的な理由はデバッガーでしか確認できません。"uninvertible=false"と宣言することで、コードパスを見つけることができるかもしれませんが、確実ではありません。

  4. フィールドキャッシュは遅延読み込み/実行時になるため、可能性のあるすべての属性のリストを取得することはできないと思います。たとえば、ファセットリクエストを送信することで新しいフィールドキャッシュのトリガーを起こすことができます。

よろしくお願いします。

--
よろしくお願いします。
Mikhail Khludnev

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?