Solr: 式の頻度を取得する方法

トピック作成者:ks-solruserml-bot (2024/07/09 21:55 投稿)
2
OpenOpen

(The bot translated the original post https://lists.apache.org/thread/wo7dm5m9qt0hcl2tn7c49830rs8dll3j into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは、

Solrクエリの問題で完全に行き詰まっており、解決方法が全くわかりません。

複数の単語を順番に並べた表現の頻度(単語一つではなく)を取得する方法を探しています。

例えば、「from parents」という表現のインデックス全体における出現回数を知りたいです。

各単語ごとの頻度を取得する方法はわかりますが、次のようにterms.flを使用します:

http://localhost:8983/solr/core_test/select?q=content:(%22from+parents%22)&terms=true&terms.ttf=true&terms.list=from%2Cparents&terms.fl=content

これで「from」と「parents」の出現回数は取得できますが、表現としてではなく、別々の単語としてです。

次のようにterms.regexを使っても試しました:

http://localhost:8983/solr/core_test/select?q=content:(%22from+parents%22)&terms=true&terms.ttf=true&terms.fl=content&terms.regex=*from%20parents*

しかし、うまくいきません :( 何かアイデアがあれば教えてください。

ご助力ありがとうございます。
よろしくお願いします、
Audrey

返信投稿者:ks-solruserml-bot (2024/07/09 21:55 投稿)

インデックスの再構築はどれくらい早くできますか?もし簡単にできるのであれば、そのフィールドに新しいフィールドを作成し、2つの単語を組み合わせたシングルを使用すると、希望する結果を得られるはずです。今はテストできませんが、理論上はうまくいくと思います。

返信投稿者:ks-solruserml-bot (2024/07/09 21:56 投稿)

これは、単一のホップ(~1)を使用した近接検索に適したユースケースのようですね。

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?