未使用のインデックスと docValues プロパティのメモリコスト

トピック作成者:ks-solruserml-bot (2024/07/31 21:22 投稿)
3
CloseClose

(The bot translated the original post https://lists.apache.org/thread/o6830y3bztycmcstlfh6ro5jp6boq5jx into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは、

現在、複雑なSolrスキーマの最適化とクリーンアップを行っており、indexed="true"およびdocValues="true"のフィールドについて、これらの機能が使用されない場合でも、対応するデータ構造(反転インデックス、カラム指向マッピング)がディスクからメモリにロードされるかどうかを知りたいと考えています。言い換えれば、これらの機能がランタイムで使用されなくても、indexeddocValuesfalseに設定することでメモリ使用量を減らすことができるのでしょうか?

よろしくお願いします。
Heinz

返信投稿者:ks-solruserml-bot (2024/07/31 21:22 投稿)

こんにちは、Heinz。

これらのデータ構造はディスク上にあり、ヒープにはごく小さな断片、つまりヘッド部分のみが保持されています。したがって、これらを削除することでヒープにいくらかの空きができるはずですが、大きな効果はないと思います。インデックスのフットプリントも減少するはずです。

ヒープサイズに関しては、フィールドサイズを推定するためのrawSize=trueという便利なパラメータを見つけましたが、これはディスクサイズを示すもので、ヒープ使用量ではありません。ヒープサイズの推定は放棄されているようです。

よろしくお願いします。
Mikhail Khludnev

返信投稿者:ks-solruserml-bot (2024/07/31 21:22 投稿)

こんにちは、Mikhail、

ご回答ありがとうございます。これにより、docValuesindexedの両方に対して、わずかなヒープのコストしかかからないということですね?rawSize=trueの情報もありがとうございます。これにより、ディスク使用量を確認するのに役立つでしょう。

よろしくお願いします。
Heinz

返信投稿者:ks-solruserml-bot (2024/07/31 21:22 投稿)

以下の内容を確認してください。

その通りです。おそらくこのアイデアが表現されています:
https://www.youtube.com/watch?v=T5RmMNDR5XI
以前、Luceneには内部コンポーネントによって使用されるヒープを報告するAPIがありましたが、https://issues.apache.org/jira/browse/LUCENE-9387までのことです。

よろしくお願いします。
Mikhail Khludnev

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?