TikaサーバーDocker + Solr Docker | KandaSearch Community Support Forum

TikaサーバーDocker + Solr Docker

トピック作成者:ks-solruserml-bot (2024/12/28 18:03 投稿)
2
OpenOpen

(The bot translated the original post https://lists.apache.org/thread/0474d4gztp8sg2bhjm0rrfgn8lt8gsys into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは、

この件についての情報が見つからなかったのですが、TikaライブラリなしのSolr Dockerが、Tika Server Dockerと通信することは可能でしょうか?それについてのドキュメントはありますか?

もう1つの質問ですが、SolrやLuceneはGPU(Intel/AMD/NVIDIA)を活用することはできるのでしょうか?

よろしくお願いします。
Gaétan QUENTIN

返信投稿者:ks-solruserml-bot (2024/12/28 18:04 投稿)

こんにちは、

Tikaサーバーを使ってバイナリドキュメントを解析するようなプラグインは(現時点では)存在しません。ただし、アプリケーション側で解析を行い、その解析済みテキストをSolrに送信することをお勧めします。

Tikaはドキュメントの取得、抽出、Solrへの出力といった機能もサポートしており、いくつかの代替セットアップ方法があります。詳しくは以下の動画をご覧ください:
https://www.youtube.com/watch?v=BeYVRpWbCfQ

Jan

返信投稿者:ks-solruserml-bot (2024/12/28 18:04 投稿)

私の経験から言いますが、これは本当に実体験であり、学んだ教訓です。Tikaは別のJVMスレッドで使用し、SolrにはJSONのみを処理させるようにしてください。
Solrがクラッシュする原因の90%はTikaにあります。したがって、Tikaはサービスとして利用し、Docker経由でTikaを使用する方が良いです。
私自身、Tikaが原因でインデックスが復旧不可能になり、何度も再構築せざるを得ませんでした。早くこのことを理解すれば、それだけ快適に作業できるようになるでしょう。

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2025 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?