EXTENSIONS

Livedoorニュース configuration(Solr 9)
無料

ご利用にはKandaSearchへの
ユーザー登録(無料)が必要です

Solr Collection Config
Livedoorニュース configuration(Solr 9)

最新バージョン: 2.3.0

開発者: RONDHUIT

ダウンロード数: 47

最終更新日: 2023-10-20

Copyright: RONDHUIT Co.,LTD

最新バージョン: 2.3.0

開発者: RONDHUIT

ダウンロード数: 47

最終更新日: 2023-10-20

Copyright: RONDHUIT Co.,LTD

livedoor ニュースコーパスに適したconfセットです。このファイルをインポートしてコレクションを作成し、livedoor ニュースコーパスデータを登録できます。ユニークキーフィールドは id です。このconfは別途RONDHUIT Solr プラグイン(RCSS)を利用することが可能です(初期状態でRCSS参照部分はコメントアウトされています)。コメントアウト部分を有効化したら、RCSSをdata/libなどにダウンロードし、Solrを再起動してから本configをインポートしてご利用ください。

Livedoorニュース configuration

概要

Livedoorニュースコーパスに対応したスキーマを含むSolrコンフィグファイルセットです。
このコンフィグファイルセットを使って、KandaSearchの検索エンジンインスタンスにコレクションを追加することで、Apache Solrの検索エンジンを簡単に構築できます。
そして、拡張機能ライフラリー内にある本コンフィグに対応したデータを使ってインデクシングを行うことで、KandaSearchの検索UIやApache Solr APIを使って様々な検索を試すことができます。

managed-schema

  <uniqueKey>id</uniqueKey>
  <field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" /> 
  <field name="keyphrase" type="string" multiValued="true" indexed="true" stored="true"/>
  <field name="category" type="string" indexed="true" stored="true" docValues="true"/>
  <field name="date" type="date" indexed="true" stored="false"/>
  <field name="url" type="string" indexed="true" stored="true" multiValued="false"/>
  <field name="body" type="text_ja" indexed="true" stored="true" multiValued="true"/>
  <field name="body_exact" type="text_ja_exact" indexed="true" stored="true" multiValued="true"/>
  <field name="body_reading" type="text_ja_reading" indexed="true" stored="true" multiValued="true"/>
  <field name="body_2g" type="text_2g" indexed="true" stored="true" multiValued="true"/>
  <field name="body_2g_exact" type="text_2g_exact" indexed="true" stored="true" multiValued="true"/>
  <field name="body_hl_alternate" type="text_ja" multiValued="true" indexed="false" stored="true"/>
  <field name="text" type="text" multiValued="true" indexed="true" stored="false"/>
  <field name="text_rev" type="text_rev" multiValued="true" indexed="true" stored="false"/>
  <field name="title" type="text_ja" indexed="true" stored="true"/>
  <field name="title_exact" type="text_ja_exact" indexed="true" stored="true"/>
  <field name="title_2g" type="text_2g" indexed="true" stored="true"/>
  <field name="title_2g_exact" type="text_2g_exact" indexed="true" stored="true"/>
  <field name="body_disease" type="string" indexed="true" stored="true" multiValued="true"/>
  <field name="body_facility" type="string" indexed="true" stored="true" multiValued="true"/>

特徴

  • Livedoorニュースコーパスを検索対象とするためのコンフィグです。
  • <analyzer />子要素を持つフィールド型による「文字の正規化」「単語分割」「トークンのフィルタリング」「類義語展開」が設定されています。
  • デフォルトでハイライト機能が設定されています。
  • デフォルトでファセット機能が設定されています。
  • 拡張機能ライブラリーには、本コンフィグのインデクシング用の2種類(KandaSearchのUIから登録できるminiタイプと、Apache Solr APIを使って登録するタイプの2つ)のデータが用意されています。
  • 固有表現抽出のスキーマとモデルファイルが含まれています。

使い方

  1. プロジェクトに本拡張機能を追加します。
  2. そのプロジェクトビューの左サイドメニューの「拡張機能」を選択し、本拡張機能ブロック内の「ダウンロード」リンクをクリックし、ローカルPCへファイルをダウンロードします。
  3. インスタンスビューの左サイドメニューの「コレクション」を選択し、「コレクションを追加する」をクリック後、「インポートによる作成」タブでダウンロードしたZIPファイルを指定します。
  4. 適当なコレクション名を設定し、「保存」でコレクションを作成します。

お見積もり・詳細は KandaSearch チームに
お気軽にお問い合わせください。

お問い合わせ