Hammerspace Data Platformとは?

Hammerspace Data Platformは、分散された非構造化データを統合し、高速アクセスを実現するソフトウェアデファインドストレージ(SDS)です。統一されたグローバルネームスペースとデータオーケストレーションにより、オンプレミス、エッジ、クラウドにまたがるデータの一元管理と最適配置を自動化します。

こんな課題を解決

01

メタデータのサイロ化と管理の個別化

ファイルシステム管理情報(メタデータ)が各ストレージに埋め込まれ、メタデータがサイロ化しているため、データアクセスや管理が個別になりがちです。Hammerspaceはファイルシステム(メタデータ)をストレージから分離し、Anvilノードで同期的に統合管理し、複数のストレージに分散したデータが単一のファイルシステムとして透過的にアクセス可能とします。

02

ストレージ管理の複雑化とアクセスの分断

ストレージ製品中心の管理では、データアクセスにそれぞれ独自の方法(SMB、NFS、S3など)が必要となり、ストレージ管理が複雑化します。Hammerspaceは業界標準のNFS、SMB、S3プロトコルに対応し、特別なクライアントソフトは不要です。ユーザーはデータの実体を意識せず透過的にアクセスでき、管理者はストレージの場所に関係なくデータを一元管理できます。

03

非効率な「コピーによる管理」の発生

データ管理タスク(移動や保護)を実行するために、データ本体をコピーする必要があり、管理者の手間が増大します。Hammerspaceでは、「コピーによる管理」から「目的ベースのポリシー(Objectives)」による自動化へ転換し、このポリシーにより、データの階層化、保護、レプリケーションなどが自動化され、ライブデータの移動もユーザーアクセスを中断せずに実行可能です。

04

ベンダーロックインのリスク

ストレージ制御が特定のベンダーの独自仕様に依存しがちになり、ベンダーロックインのリスクが生じます。HammerspaceはpNFS v4.2をベースとした標準プロトコルでストレージ制御を実装しています。既存のNAS、ブロック、オブジェクト、クラウドなど多様なストレージを連携・活用できるため、ベンダーロックインからの解放に貢献します。

製品概要

ソフトウェアデファインドストレージ(SDS)構成

Hammerspaceは、2種類のソフトウェア製品で構成されるSDSです。

01

Anvil (メタデータノード)

  • Hammerspaceシステムのコントロールプレーンであり、メタデータを管理します。
  • ティアリングやデータ保護、レプリケーションなどのポリシー管理を実行するワークフローエンジンとしても機能します。
  • 本番環境では可用性確保のためにHA構成(推奨)で配備されます。

02

DSX (データサービスノード)

  • Hammerspaceシステムのデータプレーンであり、実データの処理実行(移動やレプリケーションなど)を担当します。
  • クラスタあたり最大60ノードまで拡張可能なスケールアウト構成に対応しています。

柔軟な導入とオープンスタンダード

  • 物理・仮想環境に配備可能であり、既存のNAS、ブロック、オブジェクトストレージ、クラウドといった多様なストレージと共存・連携が可能です。
  • 標準プロトコル(NFS, SMB, S3)を使用するため、ベンダーロックインからの解放に貢献します。
  • DSXノードを追加することで、アクセスとパフォーマンスを拡張できます。

製品の主要な特長

01

グローバルパラレルファイルシステム

  • AI/GPU/HPC向けに最適化されたパラレルファイルシステムを提供します。
  • 業界標準プロトコルであるNFS v4.2の拡張規格であるpNFS (Parallel NFS) をベースに実装されており、スケーラビリティ、パフォーマンス、可用性を向上させます。
    • Hammerspaceは、pNFS v4.2仕様に追加された「Flex Filesレイアウト」を設計・実装した最初の製品です。
  • 大規模な並列処理環境において、迅速にデータへアクセスし、高スループットを維持します。
  • GPUDirectにも対応し、GPUサーバ内蔵のローカルNVMeをTier 0として有効活用できます。

02

グローバルネームスペース

  • 全拠点のストレージをシームレスに統合し、単一のグローバルネームスペース(ファイルシステム)として利用可能です。
  • 利用者視点では、データの実体がオンプレ、リモート、クラウドのどこにあるかに関係なく、ディスクトップ上にファイル/フォルダーが透過的に表示されます。
  • 業界標準のプロトコル(SMB、NFS、S3)に対応しており、特別なクライアントソフトウェアの追加は不要です。

03

データオーケストレーション (自動データ運用)

  • 目的ベースのポリシー(Objective-based Policy)を設定することで、データの配置と保護を自動化できます。
  • 自動階層化機能(スマートティアリング)を有し、データの使用状況に応じてTier 0(超高速NVMe)からTier 2(低コストHDD/クラウドアーカイブ)間でデータを自動的に移動させます。
    • 例: 「24時間以内にアクセスされたデータはTier 0に保持」「30日間アクセスされていないファイルはTier 2に移動」などのルールを定義可能。
  • ライブデータの移動にも対応しており、アクセス中のディレクトリやファイルも、ユーザーへのインパクトなくバックグラウンドで移動・再配置されます。
  • 多様なデータサービス機能を提供します: レプリケーション、スナップショット、クローン&DR、クロスプラットフォーム階層化、暗号化、重複排除&データ圧縮など。

構成要件

Anvil (メタデータ) ノードの最小構成要件

  • CPU: Xeon E5 v3 2680以上 (36コア最小)
  • メモリ: 128GB以上
  • ネットワーク: 最小10GbE (100GbE以上が推奨)
  • Bootディスク: 512GB NVMe x2(HW RAID(RAID1)推奨)
  • メタデータ用ディスク:1024GB NVMeかSSDで構成(管理するメタデータ量に応じて拡張) (詳細はHammerspace Installation and Licensingを参照)

DSX (データ) ノードの最小構成要件

  • CPU: Xeon E5 v3 2680以上 (16コア最小)
  • メモリ: 64GB以上
  • ネットワーク: 最小10GbE(100GbE以上が推奨)
  • Bootディスク: 512GB NVMe x2(HW RAID(RAID1)推奨)
  • データ用ディスク: NVMeのみ(DSXストアに必要な容量で構成)

製品の活用例

主な利用シーン: 高性能なファイルI/Oと分散データ管理が必要な分野に最適です。 

AIトレーニングおよび推論

分散環境における大量データの高速アクセスと統合管理により、AIモデルのトレーニングや推論処理を効率化します。

高性能コンピューティング (HPC)

グローバルパラレルファイルシステムによって、HPC分野で求められる大規模並列処理と高スループットなデータアクセスを実現します。 

ライフサイエンス研究

ゲノム解析や分子シミュレーションなどライフサイエンス研究において、複数拠点のデータを一元管理し、研究データの迅速な活用を支援します。

VFXアニメーション

VFXやアニメーション制作現場で、膨大なファイルの高速転送と透過的なアクセスを可能にし、制作ワークフローの効率化に貢献します。 

製造/開発データ分析

製造・開発分野における大量データの分析や管理を自動化し、データ活用のスピードと品質向上を実現します。

製品のよくある質問

Hammerspaceの構成要素は何ですか?

Anvil(メタデータノード/コントロールプレーン)とDSX(データサービスノード/データプレーン)の2種類のソフトウェア製品で構成されるSDSです。AnvilはHA構成が推奨されています。

既存のストレージ資産は活かせますか?

はい。NAS、ブロック、オブジェクト、クラウドなど、多様なストレージを利用可能です。Hammerspaceは実データを移動させることなく、メタデータを取り込み統合管理を開始します。

どのようなプロトコルに対応していますか?

業界標準のプロトコルであるNFS、SMB、S3に対応しています。また、NFSではpNFS v4.2の仕様を実装しています。 

データオーケストレーションとは何ですか?

目的ベースのポリシー(Objectives)に基づき、データの使用状況やファイル属性などに応じた自動階層化(Tiering Migration)やレプリケーション、DRなど、多様なデータサービスを自動化する機能です。