EXTENSIONS

ブログ記事「Apache Solr の日本語シノニム検索とハイライト 最新事情(2023年版)」のサンプルデータ
無料

ご利用にはKandaSearchへの
ユーザー登録(無料)が必要です

Data
ブログ記事「Apache Solr の日本語シノニム検索とハイライト 最新事情(2023年版)」のサンプルデータ

最新バージョン: 1.0.0

開発者: RONDHUIT

ダウンロード数: 1

最終更新日: 2023-01-02

Copyright: RONDHUIT Co.,LTD

最新バージョン: 1.0.0

開発者: RONDHUIT

ダウンロード数: 1

最終更新日: 2023-01-02

Copyright: RONDHUIT Co.,LTD

ブログ記事「Apache Solr の日本語シノニム検索とハイライト 最新事情(2023年版)」のサンプルデータです。Configurationを別途ダウンロードしてインデクシングすることで、実際にブログ記事の内容を体験でき、理解を深めることができます。

準備

  • ダウンロードしたZIPファイルを解凍します。
  • コレクションのインポート機能により、別途ダウンロードしておいたConfiguration ブログ記事「Apache Solr の日本語シノニム検索とハイライト 最新事情(2023年版)」のConfiguration のコレクションを作成します。
  • KandaSearchのSolrにアクセスできるよう、IPアドレス制限を適切に設定してください。

インデクシング

サンプルデータは以下のようになっています。

cat testdata.json
[
 {"id": "01", "title": "山田太郎が第200代内閣総理大臣になった。"},
 {"id": "02", "title": "山田太郎が第200代総理大臣になった。"},
 {"id": "03", "title": "山田太郎が第200代総理になった。"},
 {"id": "04", "title": "山田太郎が第200代首相になった。"},
 {"id": "11", "title": "山田花子大臣が内閣官房らと首相官邸にて総理と面会した。"},
 {"id": "12", "title": "山田花子大臣が総理官邸にて山田太郎首相と面会した。"},
 {"id": "13", "title": "山田花子大臣が内閣官房らと総理官邸にて山田太郎内閣総理大臣と面会した。"}
]

これを次のようにインデクシングします。なお、SolrのURLは適切に読み替えてください。

# curl を使う場合
curl 'https://blog20230104.i.kandasearch.com/solr/synonyms/update?commit=true' --data-binary @testdata.json -H 'Content-Type: text/json'

# Solr 付属のpostコマンドを使う場合
./bin/post -url https://blog20230104.i.kandasearch.com/solr/synonyms/update testdata.json

検索のテスト

ブログ記事に紹介されているシノニムやハイライトの検索を試すには、ZIPに同梱されているスクリプトを実行します。なお、スクリプトの下記部分を、KandaSearchのSolrを指すように適切に設定した上で実行してください。

SOLR_SCHEME=http        # ex) https
SOLR_HOST=localhost        # ex) blog20230104.i.kandasearch.com
SOLR_PORT=8983            # ex) 443
SOLR_COLLECTION=synonyms
SOLR_HANDLER=/select

上記を設定した上で、以下のようにスクリプトを実行します。実行結果は result- で始まる .json ファイルと .html に記録されます。

./querytest.sh

KandaSearch の検索UIを使う場合

KandaSearch の検索UIを使う場合、クエリパーサー(defType)で edismax を指定します。

お見積もり・詳細は KandaSearch チームに
お気軽にお問い合わせください。

お問い合わせ