ハイライトパフォーマンス

トピック作成者:ks-solruserml-bot (2024/09/22 22:46 投稿)
3
OpenOpen

(The bot translated the original post https://lists.apache.org/thread/lmxvy688qmpy882szs0sk0g0pqf158b3 into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは、

私はハイライト処理が非常に遅い問題に直面しています。インターネット上で見つけたすべての提案を試しましたが、依然として希望するほど速くなりません。

この問題は、時々~200文字の値が~2〜3M個あるマルチバリューフィールドで発生しています。

私はSOLR 8.11.3で hl.method=unified を使用していますが、ハイライト処理には10〜20秒かかることがあります。

以下の設定を試しましたが、hl.method.unifiedhl.method=fastVector では効果が見られませんでした:

  • termVectors="true"
  • termPositions="true"
  • termOffsets="true"

また、hl.fragAlignRation=0.0hl.snippets=1 も試しました。

他に試すべきことがあれば教えていただけると助かります。

どうぞよろしくお願いします。

Maria

返信投稿者:ks-solruserml-bot (2024/09/22 22:47 投稿)

こんにちはMaria

リファレンスガイドをお読みになりましたか?
こちらです

特に、hl.method=unifiedstoreOffsetsWithPositions=true の組み合わせが最高のパフォーマンスを発揮します。termPositionstermOffsets オプションにはこだわらなくてもよいですが、ワイルドカードを使用したクエリがある場合、termVectors は役立ちます。それ以外では、このオプションも削除しても問題ないでしょう。無駄なデータ増加を防げます。

hl.fragsize=0 を設定してみてください。これにより、高コストな文の断片化処理をショートカットできるかもしれません。特に、値が200文字しかない場合は役立つ可能性があります。

2-3Mの値とは驚きです。Solrは一致するドキュメントごとにすべてのデータを引き出す必要があります。

よろしくお願いします。
〜 David Smiley

返信投稿者:ks-solruserml-bot (2024/09/22 22:47 投稿)

ご提案ありがとうございます。リファレンスガイドは読み、役立ちそうなことはすべて試しました。
現在、hl.method=unified を使用しており、クエリにはワイルドカードはありませんが、storeOffsetsWithPositions=true は試していませんでした。

これを試してみて、どうなるか確認してみます。

再度ありがとうございます。
Maria

返信投稿者:ks-solruserml-bot (2024/09/22 22:47 投稿)

この件についての進捗をお知らせしたいと思います。
ハイライト対象のフィールドに対して storeOffsetsWithPositions=true を使用してインデックスを再構築しました。インデックスのサイズは増加しましたが、クエリの応答時間に大きな改善は見られませんでした。

ありがとうございます。
Maria

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?