特定の保存フィールドを非圧縮に保つ
(The bot translated the original post https://lists.apache.org/thread/lykh804fbx4y2306zymv79obyr9n79hr into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
こんにちは、
私は現在、Apache Solr 9.xで大きなパフォーマンスの問題に直面しており、皆さんからの洞察や提案を非常に期待しています。
コンテキスト:
私のSolr環境では、検索プロセスにおいてカスタムのポストフィルタが重要です。このフィルタは、検索中に各ドキュメントから特定の保存フィールドを読み取る必要があります。このフィールドには、フィルタのロジックに不可欠なアクセス制御情報が含まれています。
問題:
Solr 9.xにアップグレードしてから、パフォーマンスが劇的に低下しました。以前の約10倍から20倍ほど遅くなっており、これはSolr 9.xでは保存フィールドが圧縮されていることに起因しています。検索クエリ中にこれらのフィールドをデコードする際に大幅なオーバーヘッドが発生しています。
一つの解決策としては、文字列の代わりにバイナリフィールドを使用することです。なぜなら、Luceneではバイナリデータは圧縮されないためです。しかし、この方法の問題点は、バイナリフィールドを読み取るためにはドキュメント全体をロードしなければならないことです。保存フィールドが多いため、この方法では検索パフォーマンスが大幅に悪化する可能性があります。
質問:
このような問題に遭遇した方や、このシナリオを処理するための提案があれば教えていただけませんか?Luceneに対してフィールドを圧縮せずに保持するよう強制する方法はありますか?
よろしくお願いします。
Seez
トピックへ返信するには、ログインが必要です。