密ベクトル検索の距離計算

トピック作成者:ks-solruserml-bot (2024/09/22 22:03 投稿)
3
OpenOpen

(The bot translated the original post https://lists.apache.org/thread/yy11sn8zjh8l3l21ds9k747n14sfo43l into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは皆さん、

私はSolrベースのアプリに密ベクトル検索を追加することに成功しましたが、他の類似検索ソリューションと結果を比較したいと考えています。そのため、Solrが計算する実際の距離値にアクセスできると便利です。しかし、これが可能であるとは思えず、私は結果として得られる「スコア」にしかアクセスできません。このスコアはもちろん距離メトリックに関連していますが、この関係がどのように機能するのかに関する情報を見つけることができませんでした。実際、コサイン距離は距離メトリックです(大きな値=非類似のアイテム)が、返されるスコアは「類似性」メトリックです(大きな値=類似のアイテム)。では、Solrはどのように距離メトリックを類似性メトリックに変換しているのでしょうか?これはどこかに文書化されていますか?

よろしくお願いします!

fredric

返信投稿者:ks-solruserml-bot (2024/09/22 22:03 投稿)

気にしないでください、Solrはコサイン距離ではなくコサイン類似度を計算しており、返されるスコアはおそらくコサイン類似度の値だと思います。

よろしくお願いします。

fredric

返信投稿者:ks-solruserml-bot (2024/09/22 22:03 投稿)

このクラスがおそらく最適でしょう:
org.apache.lucene.index.VectorSimilarityFunction
ここから、Apache Solrでベクトル類似度を計算するために使用されるJavaコードを調べることができます。

よろしくお願いします。

Alessandro Benedetti
ディレクター @ Sease Ltd.
Apache Lucene/Solr コミッター
Apache Solr PMC メンバー

返信投稿者:ks-solruserml-bot (2024/09/22 22:03 投稿)

ありがとう!

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?