精度に影響を与えずにフィールドでドキュメントをブーストする
(The bot translated the original post https://lists.apache.org/thread/xdjprzrp3b492jr3hcys71053djf5nwt into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
こんにちは、皆さん、
私たちはSolr 7.3.1を本番環境で使用しており、他の種類のドキュメントと共に数千のブログをSolrにインデックス化しています。現在、「著者名 + トピック」で検索する場合にauthorフィールドにもっと重みを付ける必要があるという要件に取り組んでいます。
例えば、author、title、textという3つのフィールドがあるとします。「Brian marketing」と検索すると、Brianが著者である「marketing」に関するブログは、Brianがtitleやtextフィールドに言及されている他のブログよりも高くランク付けされるべきです。
これを達成するために、authorフィールドにもっと重みを付けることを考えました。これは問題なさそうですが、フレーズクエリの場合にauthorフィールドが一致しないように、solrconfig.xmlファイルのmm(最小一致)パラメータを100%から1に更新する必要がありました。このmmの変更の副作用として、総ヒット数が劇的に増加し、精度に影響を及ぼしています。
以下のようにsolrconfig.xmlで条件付きmmを使用して、この変更の他のフィールドへの影響を最小限に抑えようとしました、特に大きなフレーズクエリの場合です:
<str name="defType">edismax</str>
<str name="qf">title^2 author^3 text</str>
<str name="mm">1<50% 4<-1</str>
<str name="tie">0.1</str>
ここで、私の質問は次のとおりです:
1) authorフィールドに対してだけmm(=1)を上書きし、他のすべてのフィールドに対してmm = 100%を維持する方法はありますか?
2) 私のアプローチは正しいでしょうか?望む結果を達成するためのより良い方法はありますか?
事前にありがとうございます。
Vinay
トピックへ返信するには、ログインが必要です。