ICUFoldingFilter には、preserveOriginal オプションがありますか?
トピック作成者:ks-solruserml-bot (2024/06/09 20:39 投稿)
8
(The bot translated the original post https://lists.apache.org/thread/ogbzzj8h516bhmcm98qh5hzyb8289gwy into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
こんにちは、
ICUFoldingFilterを顧客に利用することを検討しています。これにより、例えば"Genéve"を"Geneve"に変換し、より良い再現率を得ることができます。しかし、一部の一般的なノルウェー語の単語に対しては、変換が行われることで非常に一般的な単語と衝突し、必要なものを正確に見つけることが不可能になります。
ICUFoldingFilterにpreserverOriginal=trueオプションがあれば、元の単語をインデックス内の同じ位置に残し、"Genéve"の完全一致が正規化された単語よりも高いスコアを得ることができると考えましたが、このフィルタはこれをサポートしていません。
異なるフィールドに異なる解析を行い、異なる重みでそれらを検索すること以外に、これに対する回避策を見つけた方はいますか?
Jan
トピックへ返信するには、ログインが必要です。