日付文字列フィールドが認識されない...

トピック作成者:ks-solruserml-bot (2024/05/28 20:25 投稿)
4
CloseClose

(The bot translated the original post https://lists.apache.org/thread/0o8fd2j9b7xysz9khvm6kw67vlt2qr3p into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは、

odsドキュメントの日付形式が認識されない問題があります。

環境:

  • Ubuntu 20.04, lxdコンテナ
  • OpenJDKバージョン "14.0.2" 2020-07-14
  • Solr 8.8.2

問題:

インデクサーがLibreOfficeの.odsファイルで失敗します:

SimplePostTool: WARNING: Response: {
"responseHeader":{
"status":400,
"QTime":552},
"error":{
"metadata":[
"error-class","org.apache.solr.common.SolrException",
"root-error-class","org.apache.solr.common.SolrException"],
"msg":"ERROR: [doc=XXX.ods] Error adding field
'last_modified'='2019-01-08T00:22:05.772138594' msg=Invalid Date
String:'2019-01-08T00:22:05.772138594'",
"code":400}}

しかし、なぜなのか理解できません。日付形式は私には問題ないように見えます。

ドキュメントには、サブセカンドが長すぎる場合は切り捨てられると書かれており、UTCを示すためのZは必須ではないですよね?

質問2:無効な日付形式を有効な形式に即座に変換するようにSolrに指示するにはどうすれば良いでしょうか?または、新しい形式を認識させるにはどうすれば良いでしょうか?

よろしくお願いします、

Gaétan

返信投稿者:ks-solruserml-bot (2024/05/28 20:25 投稿)

日付が認識されない理由はよく分かりません。ただし、別の形式を解析するために、複数の形式を受け入れるカスタムUpdateRequestProcessorを作成することができます。

これは「スキーマレス」モードの動作の一部であり、solrconfig.xmlを確認することでそれを探ることができます。

よろしく、
Alex

返信投稿者:ks-solruserml-bot (2024/05/28 20:25 投稿)

ご回答ありがとうございます。

sample_techproducts_configsタイプのコアにカスタムUpdateRequestProcessorを追加するのはかなり複雑なようです。

これを手助けするツールはありますか?

Solrによって多くの日付が無効とされていますが、その理由が分かりません。大部分のドキュメントは.ods/.odt形式です。

例えば、以下のような日付が無効とされています:

msg=Invalid Date String:'2011-02-13T20:44:16'
msg=Invalid Date String:'2015-11-25T06:55:49.316556151'
msg=Invalid Date String:'2020-01-15T18:31:12.132601079'
msg=Invalid Date String:'2019-12-09T01:16:41.920883407'
msg=Invalid Date String:'2006-06-05T01:54:39'
msg=Invalid Date String:'2006-04-15T08:55:56'
msg=Invalid Date String:'2013-07-21T23:08:21'
msg=Invalid Date String:'2020-09-23T14:11:34.397265987'
msg=Invalid Date String:'2021-03-05T08:00:52.763074287'
msg=Invalid Date String:'2019-01-08T00:22:05.772138594'
msg=Invalid Date String:'2012-07-10T13:11:32'
msg=Invalid Date String:'2010-05-29T17:48:35'
msg=Invalid Date String:'2016-05-16T11:59:55.489935279'
msg=Invalid Date String:'2007-02-07T00:36:22'
msg=Invalid Date String:'2007-02-06T20:43:42'
msg=Invalid Date String:'2019-05-09T03:25:30.090833759'
msg=Invalid Date String:'2013-03-02T01:03:42'
msg=Invalid Date String:'2013-02-28T23:03:47'
msg=Invalid Date String:'2013-03-01T00:27:39'
msg=Invalid Date String:'2013-03-02T16:04:47'
msg=Invalid Date String:'2013-04-18T13:48:12'
msg=Invalid Date String:'2009-05-18T12:46:23'
msg=Invalid Date String:'2010-12-03T01:13:07'

よろしくお願いします。

Gaétan

返信投稿者:ks-solruserml-bot (2024/05/28 20:25 投稿)

'Z'がないからだと思います。'Z'はオプションだと思っていましたが、結局必須のようです。では、Solrに'Z'なしの日付を受け入れるように設定するにはどうすればいいでしょうか?

返信投稿者:ks-solruserml-bot (2024/05/28 20:26 投稿)

そのフィールドの最後に「Z」を追加するための更新リクエストプロセッサースクリプトを書くことができます。

wunder
Walter Underwood
wunder@wunderwood.org
http://observer.wunderwood.org/ (私のブログ)

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?