アスタリスクを使用したフルテキスト検索時の予期しない結果

トピック作成者:ks-solruserml-bot (2024/06/09 20:29 投稿)
5
CloseClose

(The bot translated the original post https://lists.apache.org/thread/3pbn5srsm5qyzpwgvvly4sy5fz7nd0ky into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは、

Solr 7.5でフルテキスト検索を実行する際に予期しない結果が得られます:
アスタリスクを使用せずにフルテキスト検索を実行すると、アスタリスクを使用した場合よりも多くの結果が得られます。
クエリが「RESTAURANTE」の場合、61件の結果が得られます

クエリが「RESTAURANTE*」の場合、わずか9件の結果しか得られません

検索の唯一の違いは、追加されたアスタリスクです。

これが起こる理由についてのアイデアをお持ちの方はいますか?なぜアスタリスクを使用した検索が、アスタリスクを使用しない検索よりも少ない結果を返すのでしょうか?

ありがとうございます。
Netta Steinberg

返信投稿者:ks-solruserml-bot (2024/06/09 20:29 投稿)

こんにちは、

調査するためのいくつかのアイデアがあります:

  • Solr管理パネルを使用して、クエリ解析チェーンが両方のクエリをどのように処理し、RESTAURANTEがインデックス前にどのように解析されるかを確認します。おそらくアスタリスクがいくつかの解析を妨げているため、クエリが少ない結果に一致している可能性がありますか?
  • www.Splainer.io を使用して、一致が発生する場所とその理由を確認します

よろしくお願いします

Charlie

返信投稿者:ks-solruserml-bot (2024/06/09 20:29 投稿)

もしこれが言語解析を行っているフィールドであるなら、アスタリスクを含む検索は言語解析部分をスキップし、文字列をトークンと一致させようとします。したがって、一部のフィールドで「restaurante」のトークン化されたステミングされたバージョンに「e」が末尾にない場合、これらの結果が欠落することが予想されます。おそらく、ステミングを行わない部分一致検索(ワイルドカードを含む検索)用の別のフィールドが必要です。

返信投稿者:ks-solruserml-bot (2024/06/09 20:29 投稿)

Stephenの指摘は正しいです。

Charlie: Solrの解析画面は見やすいですが、クエリ構文を解釈しないため、マルチターム解析チェーンの結果は表示されません。UIはこれを明確にするべきです。

〜 David Smiley
Apache Lucene/Solr検索開発者
http://www.linkedin.com/in/davidwsmiley

返信投稿者:ks-solruserml-bot (2024/06/09 20:30 投稿)

スティーブン、ありがとうございます。アスタリスクを使用すると、言語解析が行われないことを知りませんでした。関連する2つの問題があります:

  1. 私が知っている限り、Solrに送信するクエリパラメータには、特定の検索対象フィールドが含まれていないようです。そのため、クエリの解析中にどのフィールドが使用されるか(アスタリスクの有無に関係なく)はわかりません。
  2. ステミングを行わない別のフィールドを使用する方法がわかりません。クエリ文字列がどのように処理されるかを知らないため、クエリパラメータに特定のフィールドを送信していません。

現時点では、検索に使用する正確なURLを持っていません。URLを入手したら、より詳細を把握し、このスレッドを更新します(解決策を含めて、願わくば)。

再度ありがとうございます。

返信投稿者:ks-solruserml-bot (2024/06/09 20:30 投稿)

リクエストハンドラ -> デフォルト -> デフォルトフィールド

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?