特定のファイルで再インデックスが失敗する

トピック作成者:ks-solruserml-bot (2024/09/22 22:43 投稿)
1
OpenOpen

(The bot translated the original post https://lists.apache.org/thread/pg9kfzljnxtdkwm4vo13j5yto8w6t7pr into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは、

約6,000個のファイルを FileDataSource を使用してインデックス作成しています。これには FileListEntityProcessor を使用してフォルダ内のファイル名を取得し、処理します。

再インデックス作業がファイル #3091 で失敗しています。バージョン 7.3 から 8.11 の間で何かが変更されたのでしょうか?

org.apache.solr.handler.dataimport.DataImportHandlerException: Exception in applying XSL Transformation Processing Document # 3091

ただし、ファイル名は表示されず、番号だけが出力されています。そこで、フォルダ内でリストを作成して "ls -all" を実行し、3091番目のファイルを見つけて削除し、再度アップデートを実行しましたが、再び3091番目のファイルで失敗しました。

その後、最初の16ファイルを削除しましたが、今度はファイル #3080 で失敗しました。

どのファイルが問題を引き起こしているのかを特定したいのですが、ログにはそれが出力されません。FileDataSource を Solr の web アプリのログ UI で ALL に設定しましたが、ログファイルの出力には変化がありませんでした。

役立つログを出力する方法について、何かアイデアはありますか?

Scott

返信投稿者:ks-solruserml-bot (2024/09/22 22:43 投稿)

こんにちは、

より広いカテゴリでログを有効にすると、手がかりが得られるかもしれません:
こちら

エラーが XPathEntityProcessor で発生している場合、onError=continue の設定があればログに出力されます:
こちら

--
よろしくお願いします、
Mikhail Khludnev

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?