MultipleAdditiveTreeModel

トピック作成者:ks-solruserml-bot (2024/06/04 22:39 投稿)
11
CloseClose

(The bot translated the original post https://lists.apache.org/thread/1rozg7205fh6c3cktqdwbvq2knz7vsfm into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

みなさん、

MultipleAdditiveTreeModelのLTRにおいて、NODE_SPLIT_SLACKをしきい値に追加する目的は何ですか?

参照:org.apache.solr.ltr.model.MultipleAdditiveTreesModel

private static final float NODE_SPLIT_SLACK = 1E-6f;

public void setThreshold(float threshold) { this.threshold = threshold + NODE_SPLIT_SLACK; }

私たちの特徴量は0.0または1.0を返す可能性があります。

そして、このモデルが次のツリーを持つ場合:

is_xyz_feature,threshold=0.99999994,left=0.0010180053,right=-0.0057609854

しかし、Solrが実際にスコアを計算すると、次のようになります:

is_xyz_feature:1.0<= 1.000001, 左に進む

その結果、常に左に進んでしまい、これは正しくありません。

ありがとう、
Roopa

返信投稿者:ks-solruserml-bot (2024/06/04 22:39 投稿)

皆さん、こんにちは

返信投稿者:ks-solruserml-bot (2024/06/04 22:39 投稿)

Roopaさん、

その余裕が追加された理由がわかりませんでした。
なぜしきい値を変更したいのかよくわかりません。
Jiraの問題を作成し、少なくとも私、Christine Poerschke、Diego Ceccarelliにタグ付けすることをお勧めします。そうすれば、私たちが議論し、必要に応じてプルリクエストを開くことができます。

よろしくお願いします。

Alessandro Benedetti
Apache Lucene/Solr コミッター
ディレクター, R&D ソフトウェアエンジニア, 検索コンサルタント

www.sease.io

返信投稿者:ks-solruserml-bot (2024/06/04 22:39 投稿)

了解しました、ご意見ありがとうございます。
Roopa

返信投稿者:ks-solruserml-bot (2024/06/04 22:39 投稿)

こんにちは、

これを確認するために、XGBoostモデルをMultipleAdditiveTreesに変換する際にまったく同じ問題に遭遇しました。これは、整数値を取るカテゴリカル特徴に特に関連する問題でした。変換されたモデルの任意の分割点で、閾値値から0.5を引くことにしました。これにより、変換されたモデルが入力モデルと同じスコアを出力するようになりました。

返信投稿者:ks-solruserml-bot (2024/06/04 22:40 投稿)

Spyros、確認してくれてありがとう。私たちは同様のことをする予定です。

ありがとう、
Roopa

返信投稿者:ks-solruserml-bot (2024/06/04 22:40 投稿)

追加の通知は受け取っていませんでした(あるいは見落としたかもしれません)。
Jiraはすでに作成されましたか?
ブール特徴は、ランキング学習の使用例ではかなり一般的です。
この貢献は有用であると考えています。
Jiraを作成する時間がない場合や、プルリクエストを貢献する時間がない場合は心配いりません。ご連絡いただければ、私たち(コミッター)がそれを行うように組織します。
あなたの助けに感謝します。Apache Solrは、ユーザーの努力なしでは同じではありません。

よろしくお願いします。

Alessandro Benedetti
Apache Lucene/Solr コミッター
ディレクター, R&D ソフトウェアエンジニア, 検索コンサルタント

www.sease.io

返信投稿者:ks-solruserml-bot (2024/06/04 22:40 投稿)

こんにちは、Alessandroさん、

このためにJIRAを作成していません。私たちは、Spyrosが説明した方法と同様に、モデル内の閾値を変更することでこれを解決しました。
うん、なぜそのSLACKが追加されているのかを理解するのは良いことです。

ありがとう、
Roopa

返信投稿者:ks-solruserml-bot (2024/06/04 22:40 投稿)

こんにちは、Alessandro, Roopa

私もこの問題がさらに調査され修正されるべきだと同意します。Jiraチケットを開く際に手助けが必要であれば、どのような詳細が必要か教えてください。

返信投稿者:ks-solruserml-bot (2024/06/04 22:41 投稿)

こんにちは、スパイロスさん、ルーパさん、

集めたすべての詳細を含んだJiraチケットを作成していただけると、大変ありがたいです。
私を、Christine Poerschke、Diego Ceccarelliにタグ付けしてくれれば、そこから引き継ぎます!
ありがとうございます!

Alessandro Benedetti
Apache Lucene/Solr コミッター
ディレクター, R&D ソフトウェアエンジニア, 検索コンサルタント

www.sease.io

返信投稿者:ks-solruserml-bot (2024/06/04 22:41 投稿)

こんにちは、Alessandro、Roopa、私はチケットをこちらに作成しました:
https://issues.apache.org/jira/browse/SOLR-15569 。しかし、人を追加する権限は持っていないと思いますので、必要な方をタグ付けしてください。
もし追加の情報が必要であればお知らせください、ありがとう!

返信投稿者:ks-solruserml-bot (2024/06/04 22:41 投稿)

ありがとう, Spyros.

Roopa

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?