Solr検索結果を時間/日/週/月/年のビュー数でソートする方法

トピック作成者:ks-solruserml-bot (2024/06/20 15:36 投稿)
6
CloseClose

(The bot translated the original post https://lists.apache.org/thread/phl331v8pqp73dhd5ntgqlmvxmtk92wz into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

ビデオを検索するインターフェースがあります。そこには、過去1時間、過去1日、過去1週間、過去1ヶ月、過去1年のビュー数に基づいて結果をソートするフィルターがあります。このソートを実現するために常にインデックスを更新せずに済む方法はありますか?たとえば、特定の期間が経過するたびに、すべてのドキュメントを再インデックスする必要がありますが、これはインデックスの過負荷を引き起こします。(ちなみに、これらのフィールドについては既にアトミックインデックスを行っています)

返信投稿者:ks-solruserml-bot (2024/06/20 15:36 投稿)

ビュー数を外部ファイルフィールドに格納する方法があります。それが設計された目的です。

Solr Cloudクラスターで動作させるのは少し面倒です。各ノードでファイルを更新する必要がありますが、それでも動作するはずです。しばらく使っていませんが、この方法は機能すると思います。

詳しくは以下のリンクを参照してください:
https://solr.apache.org/guide/8_11/working-with-external-files-and-processes.html

wunder
Walter Underwood
wunder@wunderwood.org
http://observer.wunderwood.org/ (私のブログ)

返信投稿者:ks-solruserml-bot (2024/06/20 15:36 投稿)

こんにちは、

ビューを時間/日/週などで実現するために再インデックスする必要はありません。

日付数学を使用してフィルタクエリを使ってみてはいかがでしょうか?

https://solr.apache.org/guide/8_11/working-with-dates.html

よろしくお願いします。
Adreas Moll

返信投稿者:ks-solruserml-bot (2024/06/20 15:36 投稿)

この外部ファイルがインデックスとどのように統合されるかご存知ですか?

私のインデックスには約2500万件のドキュメントが含まれており、別ファイルからのディスクルックアップがSolrクエリにおいて遅延を引き起こすかどうかが心配です(特にブースト関数クエリ内で毎日更新されるいくつかのフィールドを使用しています)。

返信投稿者:ks-solruserml-bot (2024/06/20 15:37 投稿)

こんにちは、ご質問を読み間違えていました。申し訳ありません。

Walter Underwoodが書いているように、外部フィールドはこのような要件に対して良い解決策です。

views_hour、views_dailyなど、異なる外部フィールドを作成できます。

パフォーマンスは、ドキュメントIDが正しくソートされている場合(ドキュメントで説明されているように)非常に良好です。

https://solr.apache.org/guide/8_11/working-with-external-files-and-processes.html

データを更新するには、外部フィールドファイルを更新してコアリロードを実行するだけです。データを再インデックスする必要はありません。

よろしくお願いします。
Adreas Moll

返信投稿者:ks-solruserml-bot (2024/06/20 15:37 投稿)

こちらに記載されているExternalFileFieldReloaderを設定することをお勧めします:
https://solr.apache.org/guide/6_6/working-with-external-files-and-processes.html#WorkingwithExternalFilesandProcesses-ReloadinganExternalFile

これにより、Solrでファイルの値がキャッシュされ、毎回読み取りを行わなくても済みます。また、ファイルの内容がIDでソートされていることを確認してください。そうでないと、ルックアップが非常に遅くなる可能性があります。

返信投稿者:ks-solruserml-bot (2024/06/20 15:37 投稿)

役立つ情報をありがとうございます!

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?