Data Import Handlerを使用するためのSolr構成ファイルの設定
トピック作成者:ks-solruserml-bot (2024/12/28 18:59 投稿)
1
(The bot translated the original post https://lists.apache.org/thread/r3r1nw13rwqjgqtp6jf85dbvy3h0d72j into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
こんにちは:
リストとApache Solrを使い始めたばかりです。Linux Ubuntu 22.04でバージョン9.7.0を試しています。複数のPDFファイルをインデックス化し、Tikaを使って分析したいと思っています。
Solr管理パネルから以下のパスにCOREを作成しました:
/home/myuser/APPS/solr-9.7.0/server/solr/configsets/CORE
インポートするPDFドキュメントのソースは以下のパスにあります:
/home/myuser/documentos/Doc_solr/
以下の3つのファイルを設定しました:
managed-schema.xml: PDFメタデータのフィールド定義
<field name=>
メタデータとテキスト
solrconfig.xml
<requestHandler name="/select" class="solr.SearchHandler">
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
tika-data-config.xml
<entity name="pdf" processor="TikaEntityProcessor">
<entity name="file" processor="FileListEntityProcessor">
データインポーターの設定用にdataimporter.xmlのような別のファイルを作成する必要がありますか?
その場合、何を含めるべきでしょうか?
よろしくお願いします。
トピックへ返信するには、ログインが必要です。