Solrに必要なメモリとハードディスクの容量はどれくらいですか?

トピック作成者:ks-solruserml-bot (2024/06/04 22:12 投稿)
2
CloseClose

(The bot translated the original post https://lists.apache.org/thread/7fc02klsp9dbs9p13s1m4sqrlc297wgt into Japanese and reposted it under Apache License 2.0. The copyright of posted content is held by the original poster.)

皆さんこんにちは、

Solrを利用したことがありません。私は生命情報解析機能を実行するために、巨大なVCFファイルを検索する正しい方法を調査しています。

Solrについて知りました。非常に興味深く、有望です。その前に、Solrを利用するためにどれくらいのメモリとハードディスク容量が必要なのかを知りたいと思います。
私のVCFファイルのサイズは、3から4テラバイトです。

この点について、ガイドをいただけますか?また、Solrを活用しようとする前に考慮すべき他のことはありますか?

よろしくお願いします、
Hasan

返信投稿者:ks-solruserml-bot (2024/06/04 22:12 投稿)

できるだけ多くのメモリと大容量のSSDを購入し、JVMのxmxおよびXmsを正確に31GBに設定し、残りの部分はLinuxサーバーが独自にキャッシュするように設定すると、とても良い結果が得られます。31GBは非常に特定の数値です。

返信投稿者:ks-solruserml-bot (2024/06/04 22:12 投稿)

このようなシナリオでは、プロトタイプを作成することをお勧めします。

  • schema.xml を微調整して、すべてのフィールドタイプを要件に応じた最小サイズのデータ型に正しくマッピングします。
  • Javaプロセスに初期メモリを割り当てます(数GBのように低く開始できます)。
  • インデックス作成プロセスを開始し、メモリ使用量を監視します(この方法でインデックス作成にどれだけのメモリが実際に必要かを把握できます)。
  • 必要なメモリ量より少し大きくメモリ割り当てを調整します。必要以上に割り当てると、厄介なガベージコレクションのシナリオに陥る可能性があります。
  • インデックスサイズを確認し、オペレーティングシステムのRAMメモリがインデックス全体をメモリに割り当てられるだけの余裕があることを確認します。
  • 必要なサイズが高価すぎる場合、そのサイズのSSDを購入するのが良いアプローチです。
  • インデックスが一時的に3倍のサイズになるためのディスクスペースを十分に確保しておきます。
  • クエリのベンチマーク(ファセット、ソート、その他の統計、再ランキングなどを含む)を実施し、割り当てたメモリが十分かどうかを確認します。
  • 繰り返し行います。

これは短いガイドラインですが、調整することがたくさんあるため、プロセスははるかに複雑になる可能性があります。このリストは出発点として役立ちます。

よろしくお願いします。

Alessandro Benedetti
Apache Lucene/Solr コミッター
ディレクター, R&D ソフトウェアエンジニア, 検索コンサルタント

www.sease.io

トピックへ返信するには、ログインが必要です。

KandaSearch

Copyright © 2006-2024 RONDHUIT Co, Ltd. All Rights Reserved.

投稿の削除

この投稿を削除します。よろしいですか?