Snowflake 対 Solr

トピック作成者:ks-solruserml-bot (2024/06/22 19:29 投稿)
11
CloseClose

(The bot translated the original post https://lists.apache.org/thread/5616r3dtg9zc25d1bps7npg85bhmd76z into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

こんにちは、

最近SolrからSnowflakeに移行した方はいらっしゃいますか?または、SnowflakeとSolrの比較チャートはありますか?

よろしくお願いします、
Bala

返信投稿者:ks-solruserml-bot (2024/06/22 19:29 投稿)

これらがどう比較可能なのか分かりません。Snowflakeはデータベースであり、Solrは検索エンジンです。唯一の共通点は、SolrがSnowflakeのデータをインデックス化して検索することができるという点だけです。

返信投稿者:ks-solruserml-bot (2024/06/22 19:29 投稿)

迅速な回答ありがとうございます、David。システム全体の記事から判断すると、Snowflakeは通常のデータベースシステムよりも少し高速であるようです。そのため、SnowflakeからSolrへのデータの取り込みの代わりに、Snowflakeから直接SnowSQLを介してクエリを実行することは可能でしょうか?

よろしくお願いします、
Bala

返信投稿者:ks-solruserml-bot (2024/06/22 19:29 投稿)

こんにちは、

私はこの比較が間違っていると思います。というのも、Snowflakeではデータがファクトテーブルやディメンションテーブルに整理されているのに対し、Solrは検索エンジンだからです。

Solrは全文検索に最適化されており、Snowflakeのようなデータベースは結合や分析クエリを実行するために使用されます。

ご質問にお答えしますと、Snowflakeを使用している場合、Solrは全く適切な選択肢ではありません。

返信投稿者:ks-solruserml-bot (2024/06/22 19:30 投稿)

ありがとう、アミットさん。現在、私たちはSolrを使ってアプリケーションを運用しています。データはHadoopからSolrに取り込んでいます。

今、クラウドに移行する必要があり、HadoopのデータはすべてSnowflakeに移行しています。

Solrの観点から見ると、私には以下の2つのオプションがあります。

1) SnowflakeからSolrにデータを取り込む。
2) 直接Snowflakeにクエリを実行してアプリケーションを運用する。

パフォーマンスの観点から、どちらが最適か教えていただけますか?

よろしくお願いします。
Bala

返信投稿者:ks-solruserml-bot (2024/06/22 19:30 投稿)

オプション1が最適です。オプション2は最も簡単ですが、その場合、データベース検索に限定されます。それで問題ないのであれば、Solrの機能を必要としない場合、最も手間がかからない方法です。ただし、Solrの機能に慣れている人からは不満が出る可能性があります。

返信投稿者:ks-solruserml-bot (2024/06/22 19:30 投稿)

もし既にあなたのアプリケーションがSolrと連携しているなら、そのまま続けることでアプリケーションに変更が不要になり、Solrもほとんど変更が必要ないでしょう(Solrのアップグレードや移動、改善を同時に行う場合を除きます)。HadoopからSolrへデータを移動するプロセスはSnowflakeと連携するように書き直す必要がありますが、利用するデータの種類を変更しなければ、そのプロセスは以前と同じフィールドを持つJSON構造体やSolrInputDocument(Javaの場合)を作成できるはずです。一度に複数のレベルのアーキテクチャを変更するのは通常難しいので、#1を選ぶことが非常に望ましいでしょう。

返信投稿者:ks-solruserml-bot (2024/06/22 19:30 投稿)

オプション1は、Snowflake上でクエリを実行してみることです。

オプション2は、Snowflakeのメーリングリストで質問することです。

Dima

返信投稿者:ks-solruserml-bot (2024/06/22 19:30 投稿)

こんにちは、

質問に答える前に、どのようなデータをお持ちなのか、そしてデータを取得するためにどのようなクエリを実行する予定なのかを教えていただけますか?

よろしくお願いいたします。

返信投稿者:ks-solruserml-bot (2024/06/22 19:31 投稿)

こんにちは、Amit。

ドキュメントのリストを検索し、統計、ファセット、ピボットやグルーピングのためのコラプスなどの複雑なクエリを使用しています。

よろしくお願いします。
Bala

返信投稿者:ks-solruserml-bot (2024/06/22 19:31 投稿)

それらの機能はデータベースの用途ではありません。誰もが検索エンジンからデータベースに移行することはありません。時々、データベースから検索エンジンに移行することがありますが、それはデータストアとして使用することを試みる勇気のある場合に限られます。

返信投稿者:ks-solruserml-bot (2024/06/22 19:31 投稿)

SolrアプリケーションをSnowflakeアプリケーションに移行しようとするユーザーを実際に見てきました。彼らが通常これを試みる理由は次のとおりです:

1) 彼らは、データをシステム・オブ・レコードから分析エンジンに移行したくないと考えています。
2) Snowflakeは、そのより伝統的なデータウェアハウス設計のため、より適切な分析エンジンであると感じています。

しかし、これらのユーザーは、彼らのSolrアプリケーションが行っていることをSnowflakeで行うことができないため、SolrからSnowflakeに切り替えることができませんでした。高いQPS、大規模なデータセット、多数の集計などにおいて、パフォーマンスはSolrの方が速いでしょう。

Joel Bernstein
http://joelsolr.blogspot.com/

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?