ご利用にはKandaSearchへの
ユーザー登録(無料)が必要です
最新バージョン: 1.2.0
開発者: RONDHUIT
ダウンロード数: 16
最終更新日: 2024-11-22
Copyright: RONDHUIT Co.,LTD
最新バージョン: 1.2.0
開発者: RONDHUIT
ダウンロード数: 16
最終更新日: 2024-11-22
Copyright: RONDHUIT Co.,LTD
セマンティック検索用のベクトルデータが付与された拡張機能「livedoorニュースコーパス(embeddings)」に適したconfセットです。このファイルをインポートしてコレクションを作成し、livedoor ニュースコーパス(embeddings)データを登録できます。ユニークキーフィールドは id です。このconfは別途RONDHUIT Solr プラグイン(RCSS)を利用することが可能です(初期状態でRCSS参照部分はコメントアウトされています)。コメントアウト部分を有効化したら、RCSSをdata/libなどにダウンロードし、Solrを再起動してから本configをインポートしてご利用ください。
セマンティック検索用のベクトルデータが付与された拡張機能「Livedoorニュースコーパス(embeddings)」に対応したスキーマを含むSolrコンフィグファイルセットです。
このコンフィグファイルセットを使って、KandaSearchの検索エンジンインスタンスにコレクションを追加することで、Apache Solrの検索エンジンを簡単に構築できます。
そして、拡張機能ライフラリー内にある本コンフィグに対応したデータを使ってインデクシングを行うことで、KandaSearchの検索UIやApache Solr APIを使って様々な検索を試すことができます。
<uniqueKey>id</uniqueKey>
<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
<field name="keyphrase" type="string" multiValued="true" indexed="true" stored="true"/>
<field name="category" type="string" indexed="true" stored="true" docValues="true"/>
<field name="date" type="date" indexed="true" stored="false"/>
<field name="url" type="string" indexed="true" stored="true" multiValued="false"/>
<field name="body" type="text_ja" indexed="true" stored="true" multiValued="true"/>
<field name="body_exact" type="text_ja_exact" indexed="true" stored="true" multiValued="true"/>
<field name="body_reading" type="text_ja_reading" indexed="true" stored="true" multiValued="true"/>
<field name="body_2g" type="text_2g" indexed="true" stored="true" multiValued="true"/>
<field name="body_2g_exact" type="text_2g_exact" indexed="true" stored="true" multiValued="true"/>
<field name="body_hl_alternate" type="text_ja" multiValued="true" indexed="false" stored="true"/>
<field name="body_vector" type="knn_vector" indexed="true" stored="true"/>
<field name="text" type="text" multiValued="true" indexed="true" stored="false"/>
<field name="text_rev" type="text_rev" multiValued="true" indexed="true" stored="false"/>
<field name="title" type="text_ja" indexed="true" stored="true"/>
<field name="title_exact" type="text_ja_exact" indexed="true" stored="true"/>
<field name="title_2g" type="text_2g" indexed="true" stored="true"/>
<field name="title_2g_exact" type="text_2g_exact" indexed="true" stored="true"/>
<field name="title_vector" type="knn_vector" indexed="true" stored="true"/>
<field name="body_disease" type="string" indexed="true" stored="true" multiValued="true"/>
<field name="body_facility" type="string" indexed="true" stored="true" multiValued="true"/>
<analyzer />
子要素を持つフィールド型による「文字の正規化」「単語分割」「トークンのフィルタリング」「類義語展開」が設定されています。