ご利用にはKandaSearchへの
ユーザー登録(無料)が必要です
最新バージョン: 1.0.0
開発者: RONDHUIT
ダウンロード数: 1
最終更新日: 2023-01-02
Copyright: RONDHUIT Co.,LTD
最新バージョン: 1.0.0
開発者: RONDHUIT
ダウンロード数: 1
最終更新日: 2023-01-02
Copyright: RONDHUIT Co.,LTD
ブログ記事「Apache Solr の日本語シノニム検索とハイライト 最新事情(2023年版)」のサンプルデータです。Configurationを別途ダウンロードしてインデクシングすることで、実際にブログ記事の内容を体験でき、理解を深めることができます。
ブログ記事「Apache Solr の日本語シノニム検索とハイライト 最新事情(2023年版)」のConfiguration
のコレクションを作成します。サンプルデータは以下のようになっています。
cat testdata.json
[
{"id": "01", "title": "山田太郎が第200代内閣総理大臣になった。"},
{"id": "02", "title": "山田太郎が第200代総理大臣になった。"},
{"id": "03", "title": "山田太郎が第200代総理になった。"},
{"id": "04", "title": "山田太郎が第200代首相になった。"},
{"id": "11", "title": "山田花子大臣が内閣官房らと首相官邸にて総理と面会した。"},
{"id": "12", "title": "山田花子大臣が総理官邸にて山田太郎首相と面会した。"},
{"id": "13", "title": "山田花子大臣が内閣官房らと総理官邸にて山田太郎内閣総理大臣と面会した。"}
]
これを次のようにインデクシングします。なお、SolrのURLは適切に読み替えてください。
# curl を使う場合
curl 'https://blog20230104.i.kandasearch.com/solr/synonyms/update?commit=true' --data-binary @testdata.json -H 'Content-Type: text/json'
# Solr 付属のpostコマンドを使う場合
./bin/post -url https://blog20230104.i.kandasearch.com/solr/synonyms/update testdata.json
ブログ記事に紹介されているシノニムやハイライトの検索を試すには、ZIPに同梱されているスクリプトを実行します。なお、スクリプトの下記部分を、KandaSearchのSolrを指すように適切に設定した上で実行してください。
SOLR_SCHEME=http # ex) https
SOLR_HOST=localhost # ex) blog20230104.i.kandasearch.com
SOLR_PORT=8983 # ex) 443
SOLR_COLLECTION=synonyms
SOLR_HANDLER=/select
上記を設定した上で、以下のようにスクリプトを実行します。実行結果は result-
で始まる .json
ファイルと .html
に記録されます。
./querytest.sh
KandaSearch の検索UIを使う場合、クエリパーサー(defType)で edismax を指定します。