ExtractRequest ハンドラーを使用して、type=parent を使ってドキュメントをインデックスする方法

トピック作成者:ks-solruserml-bot (2025/08/21 11:59 投稿)
7
(The bot translated the original post https://lists.apache.org/thread/8phv1bysxk2fq4ml85l5hclj6228wdw3 into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)
こんにちは。
私は長い間、/update/extract
を使ってドキュメントをインデックスしてきました。これまではすべてうまく動作していましたが、「ネストされたドキュメントを追加する」という新しい要件が出てきました。
そのため、schema.xml
に以下を追加しました:
<field name="type_level" type="string" indexed="true" stored="true" docValues="true" />
<field name="_root_" type="string" indexed="true" stored="true" multiValued="false" required="false" />
ユニークキーの定義は以下の通りです:
<field name="DocID" type="string" indexed="true" stored="true" />
<uniqueKey>DocID</uniqueKey>
これを行った後、/update/extract
に対して再インデックスのリクエストを送ると、同じドキュメントが Solr に重複して登録されてしまいます。
以下が私のリクエスト内容です。違うのは新しいパラメータ type_level=parent
を追加したことだけです:
http://server:8983/solr/document/update/extract?
literal.id=6584239&
resource.name=&
wt=xml&
literal.DocID=6584239&
literal.CoreID=6584239&
literal.DocIsAttachToPNB=False&
literal.DocAuthorID=1455&
literal.DocIsAttachToPerson=True&
literal.DocIsAttachToAssign=False&
literal.DocIsAttachToCompany=False&
literal.DocVersionID=4504527&
literal.InsertDateSD=2011-01-03T07%3a51%3a00.0Z&
literal.DocNameS=Squires+David+RES.doc&
literal.DocCateNameS=Resume%2fCV&
literal.DocAreaCateNameS=Person+Module&
literal.type_level=parent&
stream.url=http%3a%2f%2flocalhost%3a8081%2f4%2f50%2f45%2fSquires%2520David%2520RES15EAC416-AF05-4D38-A4F9-7B489962C167.docx&
overwrite=true&
commit=true
このリクエストの後、ドキュメントが重複して表示されます。違いは type_level:parent
だけです。
どなたか、なぜこうなってしまうのか分かる方はいらっしゃいませんか?
よろしくお願いします。
Sergio Maroto
トピックへ返信するには、ログインが必要です。