NO IMAGE

AWS Storage Vol4 FSxファミリ完全ガイド|4エンジン選定×File Cache×EBS

NO IMAGE

FSxファミリ:4エンジン + File Cache の全体像

Storage本番運用シリーズについて
Vol1ではS3・EFS・FSx・Storage Gatewayの基礎4本柱を解説しました。Vol2ではS3ライフサイクル・Intelligent-Tiering・Object Lambda・S3 Express・CRRのS3 Advanced機能を掘り下げ、Vol3ではS3 Vectors・S3 Tables・Backup Vault Lock・Snowball Edgeの最新機能を取り上げました。
本Vol4はFSxファミリ4エンジン(Lustre/NetApp ONTAP/OpenZFS/Windows File Server)の選定・本番設計を軸に、Amazon File Cache・EBS高度運用まで一気通貫で解説します。全仕様はAWS公式ドキュメントで一次裏取り済みです。

FSxファミリは「共有ファイルシステムをAWSフルマネージドで動かす」というニーズに応える4つのエンジンと、S3/NFSデータを高速キャッシュするFile Cacheから構成されます。どのエンジンを選ぶかはプロトコル・ワークロード・スケール要件によって決まります。

エンジン主プロトコル代表ユースケーススループット規模
FSx for LustrePOSIX並列HPC/ML/ゲノム解析Persistent 2: 最大1,000 MBps/TiB×容量
FSx for NetApp ONTAPNFS/SMB/iSCSI/NVMe-oFエンタープライズ/マルチプロトコルgen2スケールアウト: 最大72 GBps
FSx for OpenZFSNFS v3/4POSIX/ZFS機能/開発・テストSingle-AZ 2: 最大10,240 MBps
FSx for Windows File ServerSMBWindows/AD環境最大12,288 MBps(6プレミアムリージョン)
Amazon File CachePOSIX(Lustreベース)S3/NFS高速キャッシュ1,000 MBps/TiB固定
fig01: FSxファミリ全体選定アーキテクチャ概観
fig01: FSxファミリ全体選定アーキテクチャ概観

FSx for Lustre:HPC/ML向け高性能並列ファイルシステム

FSx for Lustreは並列分散ファイルシステムとしてHPC・ML・ゲノム解析向けに最適化されたエンジンです。Scratchタイプは短期処理向け、Persistentタイプは耐久性が求められる本番ワークロードに使い分けます。

デプロイタイプ

タイプスループット用途・特徴
Scratch 1200 MBps/TiB(ネットワークベースライン)短期データ処理・データ増設不可・DRA非対応
Scratch 2disk 200読/100書 MBps/TiB・ネットワークburstで最大6倍(約1,300 MBps/TiB)短期・増分 2,400 GiB単位
Persistent 1 SSD50 / 100 / 200 MBps/TiB耐久性要求・増分 2,400 GiB単位
Persistent 1 HDD12 または 40 MBps/TiBコスト重視・大容量(12 MBps→6,000 GiB単位 / 40 MBps→1,800 GiB単位)
Persistent 2 SSD125 / 250 / 500 / 1,000 MBps/TiB高性能・EFA有効時に大容量増分(125→38,400 GiB単位など)
Persistent 2 Intelligent-Tiering3アクセス層(Frequent/Infrequent/Archive Instant Access)・完全エラスティックサイズ非プロビジョニング・コスト最適化

Data Repository Association(DRA)

DRAを使うと、FSx for LustreとS3バケットをリポジトリとして連携できます。1ファイルシステムあたり最大8つのDRAを設定でき、import専用・export専用・双方向の3モードを選択できます。イベント種別(new/changed/deleted)を任意に組み合わせられます。S3パス(s3://bucket/prefix/)との1対1マッピングになります。なお、Lustre 2.10またはScratch 1ではDRAは利用できません。

コンソールからの作成では自動インポートが既定でオンになりますが、CLI/APIでは既定でオフです。チームの運用フローに合わせて明示的に設定してください。

EFA/GPUDirect Storage

機械学習やゲノム解析など超大規模なIOが必要なケースでは、EFA(Elastic Fabric Adapter)とGPUDirect Storage(GDS)を活用します。

  • 通常(ENA Express使用時):クライアントあたり最大 100 Gbps
  • EFA使用時:クライアントあたり最大 700 Gbps
  • EFA + GDS使用時:クライアントあたり最大 1,200 Gbps

スループットが10 GBpsを超えるファイルシステムはEFAを推奨します。

Metadata IOPSの独立プロビジョニング(2024〜2025新機能)

Persistent 2では、ストレージ容量とは独立してメタデータIOPSをプロビジョニングできます。有効値は 1,500 / 3,000 / 6,000 / 12,000 で、以降は 12,000 の倍数で最大 192,000 IOPSまで指定できます。小ファイルが大量に発生するMLパイプラインやゲノム解析で有効です。

fig02: FSx for Lustre デプロイタイプ比較
fig02: FSx for Lustre デプロイタイプ比較

FSx for NetApp ONTAP:エンタープライズ/マルチプロトコル本番設計

FSx for NetApp ONTAPは、NFS・SMB・iSCSI・NVMe-oFと複数プロトコルを同時提供できるエンタープライズグレードのフルマネージドファイルシステムです。Oracle・SAP・エンタープライズアプリケーションの移行先として広く採用されています。

世代と最大スペック

タイプ世代最大スループット最大IOPS
Single-AZ 1 / Multi-AZ 1gen1(1 HAペア)4 GBps(4,096 MBps)160,000 SSD IOPS
Multi-AZ 2gen2(1 HAペア)6 GBps(6,144 MBps)200,000 SSD IOPS
Single-AZ 2(スケールアウト)gen2(最大12 HAペア)72 GBps(12 HAペア×6 GBps)2,400,000 SSD IOPS

スケールアウト構成(複数HAペア)はSingle-AZ 2のみ対応します。HAペアは作成後に無停止で追加できます(各HAペアは6 GBps / 200,000 IOPS)。スループット 1,536 MBps以上の設定が複数HAペア構成の前提です。

SSDストレージは最小 1,024 GiB/HAペアから利用でき、gen2のみ容量縮小(各回 9%以上)に対応します。

SVM・Volume上限

  • SVM(Storage Virtual Machine):1 HAペア・IPv4専用・スループット 2,048/4,096/6,144 MBps時で最大24。dual-stack(IPv6)または2〜12 HAペア時は最大11。
  • Volume:最大 500/HAペア・全HAペア合計で最大 1,000

SnapMirror

volume単位でのスケジュールレプリケーションで、最短5分間隔で設定できます。リージョン内/クロスリージョン、FSx間、オンプレNetApp ONTAP↔FSxの双方向に対応します。なお、SVM DR(SVMDR)と同期SnapMirror(StrictSync含む)には対応していません。

FlexClone

snapshotから即時にwritableなクローンボリュームを作成できます。初期追加容量は0で、差分ブロックのみ書き込み領域を消費します。元snapshotは使用中のcloneがある間は削除できません。

FlexGroup(gen2・2 HAペア以上)

gen2で2つ以上のHAペアを構成した場合、FlexGroupボリュームが利用できます。最大 20 PiB・constituent(分散ストライプ)あたり最大 300 TiB・最大 20億ファイル/constituentという大規模スケールに対応します。

NVMe over TCP(gen2のみ)

gen2かつHAペア 6以下の構成でNVMe over TCP(SANブロックストレージとしてnamespace単位)が利用できます。iSCSIは全FS(HAペア 6以下)で対応します。

Tiering Policy

ポリシー動作
Autoコールドデータ(ユーザーデータ + snapshot)を容量 tier へ移動。既定 cooling 31日(2〜183日設定可)
Snapshot-onlysnapshotのみ tier 移動。既定 cooling 2日
All即時コールド化
NoneSSD上に保持

SSD使用率が90%を超えるとcache promotionが停止し、98%を超えると全tiering処理が停止(read only)になります。本番設計ではSSD使用率を常時監視してください。

fig03: FSx for NetApp ONTAP gen2スケールアウト構成
fig03: FSx for NetApp ONTAP gen2スケールアウト構成

FSx for OpenZFS:POSIX完全準拠/ZFS機能/NVMe高性能

FSx for OpenZFSはPOSIXを完全準拠したNFSベースのファイルシステムです。ZFS固有のsnapshot・clone・圧縮・quota機能をフルマネージドで利用でき、開発・テスト・分析・メディアワークロードに適しています。

デプロイタイプ

タイプ最大スループット最大IOPS備考
Single-AZ 14,096 MBps160,000 SSD IOPSthroughput levels: 64〜4,096 MBps
Single-AZ 210,240 MBps400,000 SSD IOPS最大2.5 TB NVMe L2ARCキャッシュ・圧縮経由で最大21 GBps/数百万IOPS
Multi-AZ10,240 MBps400,000 IOPS(書込は7,500 MBps上限)一部リージョン(Cape Town/UAE)は160,000 IOPS上限

Single-AZ 2の2.5 TB NVMe L2ARCキャッシュは、頻繁にアクセスされるデータを超高速で読み出すためのSSD read cacheです。圧縮を有効にした状態では最大21 GBpsのスループットを引き出せます。

ストレージ範囲は最小64 GiB〜最大512 TiB(Single-AZ 2は常に512 TiB対応)。拡張のみ対応で前回変更から6時間は次の変更ができません。

ZFS機能

機能詳細
Snapshot最大700/ファイルシステム(既定・増加可能)・即時作成
Clonesnapshotから即時writable複製・初期追加容量0・元snapshot使用中は削除不可
圧縮ZSTD(高圧縮率)/ LZ4(高書込速度)
Quotauser/group それぞれ最大100/volume

volumeは最大100/ファイルシステム、クライアントコネクションは最大32,768/ファイルサーバーまで対応します。

NFS バージョン対応

v3 / v4.0 / v4.1 / v4.2 の全バージョンに対応します。nconnectオプションで最大16 TCP接続/mountを並列化できるため、単一クライアントからのスループットを最大化できます。推奨 rsize/wsize は 1,048,576 バイトです。

Intelligent-Tiering(新機能)

完全エラスティックなストレージクラスで、サイズをプロビジョニングせずに最大512 TiBまでスケールします。既定レコードサイズは1,024 KiBです。

On-demand データレプリケーション(新機能)

リージョン/アカウントをまたいだオンデマンドレプリケーションに対応します。AWS RAM経由でアカウント間共有でき、増分またはフルの選択ができます。1ファイルシステム当たり同時1タスク・アカウント/リージョン当たり最大20並列ジョブという制限があります。

fig04: FSx for OpenZFS デプロイタイプとZFS機能
fig04: FSx for OpenZFS デプロイタイプとZFS機能

FSx for Windows File Server:Windows/AD環境の本番設計

FSx for Windows File ServerはSMBネイティブのフルマネージドファイルシステムで、Windows環境・Active Directory統合・DFS Namespacesに最適化されています。

デプロイタイプ

タイプストレージ特徴
Single-AZ 1SSD専用DFS Replication対応・1サブネット/1 ENI
Single-AZ 2SSD + HDDCA(Continuously Available)shares対応
Multi-AZSSD + HDD2サブネット/2 ENI・同期レプリケーション・フェイルオーバー通常30秒未満

本番環境での高可用性を確保するにはMulti-AZを推奨します。フェイルオーバーが30秒未満で完了し、Windowsクライアントからは自動的に再接続されます。

スループット・IOPS

スループット levels は 32〜12,288 MBps まで段階設定できます。最大12,288 MBps / 400,000 IOPSは北バージニア・オレゴン・オハイオ・アイルランド・東京・シンガポールの6つのプレミアムリージョンでのみ利用できます。全リージョンでは最大2 GBps / 80,000 IOPSが上限です。

User-provisioned SSD IOPS(新機能)として96〜400,000 IOPSを手動設定できます。設定レンジは3〜50 IOPS/GiB(6プレミアムリージョンは3〜500 IOPS/GiB)です。自動モードは3 SSD IOPS/GiBで計算されます。

単一FSの最大ストレージは 64 TiB(65,536 GiB)です。

DFS Namespaces

DFS Namespacesを使うと、複数のFSx for Windows File Serverを単一の論理namespaceとして束ねられます。64 TiBの単一FS上限を超えて数百PBまでスケールアウトできます。大規模ファイル共有やコンテンツリポジトリの集約に有効です。

Shadow Copies(VSS統合)

設定
最大保持数500/ファイルシステム(可用性のため64未満を推奨・既定最大20)
既定ストレージ割当ファイルシステム容量の10%(UNBOUNDED設定も可能)
既定スケジュール月〜金 07:00 & 12:00 UTC(週10回)
I/O特性block-level・copy-on-write・書込あたり最大3 I/O

Shadow Copiesを大量に設定する場合はSSD + 高スループット tier(3倍以上)の構成を推奨します。

Active Directory 統合

AD種別対応備考
AWS Managed Microsoft AD管理グループ: AWS Delegated FSx Administrators
Self-managed Microsoft ADAzure AD DSも対応。DNS IP + サービスユーザー資格情報が必要
AD Connector非対応
Simple AD非対応

DomainName・OU・Adminグループは作成後に変更できません。ADの設計は事前に固めておくことが重要です。

fig05: FSx for Windows File Server Multi-AZ + DFS Namespaces構成
fig05: FSx for Windows File Server Multi-AZ + DFS Namespaces構成

Amazon File Cache:S3/NFSデータの高速ハイブリッドキャッシュ

Amazon File CacheはLustreベースのPOSIX準拠キャッシュサービスで、S3またはNFSv3上のデータをAWSコンピューティングから高速にアクセスするために使います。

データソース(重要)

Amazon File CacheがサポートするデータソースはS3バケットNFSファイルシステム(NFSv3)の2種類のみです。1キャッシュあたり最大8つのデータリポジトリを設定できますが、S3のみ・NFSv3のみの構成に限られます(両者の混在は不可です)。

スループット・容量

仕様
スループット1,000 MBps/TiB固定(ネットワーク: 2,600 MBps/TiB)
ストレージ最小1.2 TiB
増分単位2.4 TiB(1.2 / 2.4 / 4.8 / 7.2 / 9.6 TiB…)
メタデータ全キャッシュに +2.4 TiB 追加

スループットは容量から自動計算されます(例: 1.2 TiB → 1,200 MBps / 9.6 TiB → 9,600 MBps)。別途設定はできません。

アクセス方法

open-sourceのLustreクライアントを使ってLinux EC2インスタンスからアクセスします。EKS・ECSからも利用できます。

主なユースケース

  • M&E(メディアエンターテインメント)のVFXレンダーファーム(Thinkbox Deadline統合)
  • HPC・ML(AWS Batch経由)の大規模データ処理
  • 金融・ヘルスライフサイエンス・製造・気象予測
  • オンプレNFSサーバーのデータをAWSへキャッシュして処理するハイブリッド構成
fig06: Amazon File Cache アーキテクチャ(S3/NFSv3 → File Cache → EC2)
fig06: Amazon File Cache アーキテクチャ(S3/NFSv3 → File Cache → EC2)

EBS高度運用:ストレージ管理facetの完全活用

EBSの帯域・インスタンス接続性能はCompute本番運用 Vol2で解説済みです。本節ではストレージ管理facet——io2のスペック上限・Snapshot Archive・FSR・Multi-Attach・EBS direct API——に絞って解説します。

io2 Block Express(2025年4月30日以降全io2に適用)

仕様
最大IOPS256,000 IOPS(Nitroインスタンス使用時)
最大スループット4,000 MiB/s
最大容量64 TiB(4 GiB〜64 TiB)
IOPS:GiB比率1,000:1(256 GiB以上で最大256,000 IOPSをプロビジョニング可)
平均レイテンシ500 μs未満(16 KiB I/O)
耐久性99.999%(AFR ≤ 0.001%)

2025年4月30日以降、新規・既存の全io2ボリュームがio2 Block Expressに移行しています。

Snapshot Archive Tier

長期保管が必要なスナップショットをアーカイブ tierに移動すると、標準 tierと比べて最大75%のコスト削減が見込めます。

仕様
最小保持期間90日(早期削除・復元は残日数分の追加課金あり)
標準 tierへの復元時間最大72時間(サイズ依存)

アーカイブ時に増分 → フル snapshotへ変換されます。復元完了前はボリューム作成ができません。コンプライアンス保管・プロジェクト終了後の月次/四半期/年次スナップショットに適しています。

Fast Snapshot Restore(FSR)

ボリューム作成時のfirst-access I/Oレイテンシを排除する機能です。FSRを有効化したスナップショットから作成したボリュームは完全に初期化済みの状態で利用できます。

仕様
有効化上限最大5 snapshot/Region(共有スナップショット含む)
対象スナップショットサイズ16 TiB以下
課金snapshot × AZ × 有効時間の分単位課金(最小1時間、例: $0.75/時)

FSRは有効化している時間に対して課金されます。スナップショットを実際に使うタイミングに合わせてFSRの有効/無効を管理してください。

Multi-Attach

仕様
対応ボリュームタイプio1 / io2 のみ
最大インスタンス数16インスタンス/ボリューム(同一AZ・Nitro系のみ)
Linux/WindowsLinuxはio1/io2・Windowsはio2のみ
I/O fencingio2のみNVMe reservationをサポート(io1は非対応)

Multi-Attachを使う場合は、FS側がクラスター対応(XFS・EXT4等の通常FSは同時アクセス非対応)である必要があります。boot volumeには使えません。

EBS direct API

バックアップソフトウェアの開発や差分バックアップ処理に使えるAPIです。スナップショットの内容をボリュームをマウントせずに読み書きできます。

操作API
読取ListSnapshotBlocks / ListChangedBlocks / GetSnapshotBlock
書込StartSnapshot / PutSnapshotBlock(block毎にBase64 SHA256 checksum必須) / CompleteSnapshot

ブロックインデックスは512 KiB単位(logical offset ÷ 524,288)です。暗号化スナップショットの読み書きにはIAM/KMSの追加権限が必要な場合があります。

gp3 vs io2 Block Express 使い分け

比較項目gp3io2 Block Express
最大IOPS80,000256,000
最大スループット2,000 MiB/s4,000 MiB/s
容量範囲1 GiB〜64 TiB4 GiB〜64 TiB
Multi-Attach不可可(最大16インスタンス)
I/O fencingなしNVMe reservation対応
耐久性99.8〜99.9%99.999%
代表用途汎用SSD・Webサーバー・開発環境ミッションクリティカルDB・高IOPSブロック
fig07: EBS高度運用機能マップ
fig07: EBS高度運用機能マップ

まとめ:ユースケース別選定ガイド

FSxファミリ・File Cache・EBSをユースケース別に整理します。

ユースケース推奨サービス設計ポイント
HPC/ML大規模並列処理FSx for Lustre(Persistent 2 / Intelligent-Tiering)EFA+GDS・Metadata IOPS独立provisioning・DRA×S3
エンタープライズ/マルチプロトコル/Oracle/SAPFSx for NetApp ONTAP(gen2スケールアウト)Single-AZ 2×12 HAペア・SnapMirror・FlexClone
POSIX/ZFS/開発テスト/CI-CDFSx for OpenZFS(Single-AZ 2)ZFS snapshot/clone・NVMe L2ARC・nconnect
Windows/AD/DFS/SMBネイティブFSx for Windows File Server(Multi-AZ)DFS Namespaces・Shadow Copies・AWS Managed AD
S3/NFS上のデータをAWSでキャッシュ処理Amazon File CacheS3またはNFSv3(混在不可)・1,000 MBps/TiB
ミッションクリティカルDB/高IOPSブロックEBS io2 Block Express256K IOPS・Multi-Attach・FSR(5 snapshot/Region)

各エンジンの選定は「何プロトコルを使うか」「どの程度のスケールが必要か」「既存環境(NetApp/Windows AD)との親和性」の3軸で決まります。まずプロトコル要件を固め、次にスループット・耐久性・コストの優先度で絞り込むアプローチを推奨します。

Storage本番運用シリーズ 全4巻
Vol1: S3・EFS・FSx・Storage Gateway 基礎4本柱
Vol2: S3 Advanced(ライフサイクル/Intelligent-Tiering/Object Lambda/S3 Express/CRR)
Vol3: S3 Vectors・S3 Tables・Backup Vault Lock・Snowball Edge
Vol4(本記事): FSxファミリ4エンジン完全ガイド × File Cache × EBS高度運用