- 1 1. はじめに — D4「MLの監視・保守・セキュリティ」とは
- 2 2. SageMaker Model Monitor — 4タイプの監視
- 3 3. データドリフト・コンセプトドリフトの検出と対策
- 4 4. 再トレーニング戦略 — トリガー条件と自動化
- 5 5. MLOps保守 — Pipelines定期実行・イベント駆動
- 6 6. IAM・VPCセキュリティ — 最小権限とネットワーク分離
- 7 7. 暗号化 — KMS・S3・転送中暗号化
- 8 8. コンプライアンス・監査 — CloudTrail・Config・GuardDuty
- 9 9. 責任あるAI — 説明可能性・公平性
- 10 10. まとめ — シリーズ総括:Vol0〜Vol4でMLA-C01全4ドメイン制覇
1. はじめに — D4「MLの監視・保守・セキュリティ」とは
本記事は「AWS MLA-C01試験対策」シリーズの Vol4(最終巻) です。
これまでに Vol0 ロードマップ、Vol1 データ準備、Vol2 モデル開発、Vol3 デプロイ・推論 を解説してきました。
本記事で扱うのは試験の第4ドメイン、D4「MLソリューションの監視・保守・セキュリティ(Monitoring, Maintenance, and Security)」 です。
公式試験ガイドにおける出題比率は 24% で、65問換算なら約16問を占めます。
Vol3 で本番デプロイしたモデルは、それで終わりではありません。
時間とともに精度は劣化し、セキュリティの脅威にもさらされます。
「デプロイしたモデルを安全に、性能を保ちながら運用し続ける」 ための知識が D4 で問われます。
機械学習システムは、一度作ったら完成という従来のソフトウェアとは異なります。
コードが変わらなくても、世の中(データ)が変われば精度は静かに劣化 します。
この「気づかぬうちに劣化する」性質こそ ML 運用の難しさであり、それを検知・対処する仕組み(監視と再学習)が D4 の核心です。
加えて、ML システムは学習データやモデルという機密資産を扱うため、セキュリティと統制も欠かせません。
- D4で問われる範囲と運用フェーズの全体像(§1〜§2)
- SageMaker Model Monitor の4タイプの監視(§2)
- データドリフト・コンセプトドリフトの検出と対策(§3)
- 再トレーニング戦略とMLOps保守の自動化(§4〜§5)
- IAM/VPC・KMS暗号化によるMLセキュリティ(§6〜§7)
- コンプライアンス監査・責任あるAIの頻出論点(§8〜§9)
1-1. D4の出題範囲を一望する
D4 は出題比率24%とD1に次ぐ大きな比重を占め、運用フェーズの幅広いテーマを扱います。
内容は大きく次の6つに整理できます。
監視(ドリフト検知)と保守(再学習)が ML 固有の前半、セキュリティ・暗号化・監査・責任あるAIが基盤寄りの後半、という構成で押さえると見通しが良くなります。
| # | テーマ | 代表サービス・概念 |
|---|---|---|
| 1 | モデル監視 | SageMaker Model Monitor |
| 2 | ドリフト検出 | データドリフト / コンセプトドリフト |
| 3 | 保守・再学習 | 自動再トレーニング / Pipelines |
| 4 | セキュリティ | IAM / VPC / リソースポリシー |
| 5 | 暗号化・監査 | KMS / CloudTrail / Config |
| 6 | 責任あるAI・コスト | Clarify / Savings Plans |
- D4は ML 固有の知識(Model Monitor・ドリフト)と、AWS 共通の基盤知識(IAM・KMS・VPC)の両方が問われます。後者は ML 文脈での出題に慣れておきましょう
- 「モデルは作って終わりではない」という運用視点が核心です。劣化を検知し、対処するループを理解しましょう
- セキュリティは最小権限・暗号化・ネットワーク分離の3原則で整理すると覚えやすくなります
2. SageMaker Model Monitor — 4タイプの監視
本番モデルの健全性を継続的に監視するのが SageMaker Model Monitor です。
学習時の正常な状態を ベースライン として記録し、本番データと比較して逸脱を検知します。

監視の仕組みは次の流れです。
まず本番エンドポイントの入出力を Data Capture で S3 に保存します。
次に学習データから作成した ベースライン(正常時の統計量) と定期的に比較し、ズレを検知したら CloudWatch アラートを発報します。
Model Monitor は監視対象により4タイプに分かれます。
| 監視タイプ | 何を監視するか |
|---|---|
| データ品質(Data Quality) | 入力データの統計(欠損・型・範囲)が学習時とズレていないか |
| モデル品質(Model Quality) | 予測精度(正解ラベルと照合)が劣化していないか |
| バイアス(Bias Drift) | 予測の公平性が本番で崩れていないか(Clarify連携) |
| 特徴量重要度(Feature Attribution Drift) | 各特徴量の寄与度が変化していないか(SHAP連携) |
「入力データの異常を検知したい」ならデータ品質、「精度劣化を検知したい」ならモデル品質、という使い分けです。
2-1. ベースラインと監視スケジュール
Model Monitor を使うには、まず ベースライン を作成します。
これは学習データから計算した「正常時の統計プロファイル」で、各特徴量の平均・分散・分布や、制約(型・必須項目)が記録されます。
次に 監視スケジュール(Monitoring Schedule) を設定し、定期的(たとえば1時間ごと)に本番データとベースラインを比較する処理を自動実行します。
比較の結果、しきい値を超える逸脱があれば違反レポートを出力し、CloudWatch メトリクスとして記録します。
2-2. モデル品質監視には正解ラベルが要る
注意したいのは、モデル品質(精度)の監視には実際の正解ラベルが必要 な点です。
推論時点では正解は分からないため、後から判明する正解(グラウンドトゥルース)を S3 に取り込み、過去の予測と突き合わせて精度を算出します。
「予測してから正解が分かるまでに時間がかかる」業務(与信・需要予測など)では、この遅延を考慮した監視設計が問われます。
3. データドリフト・コンセプトドリフトの検出と対策
モデル精度が時間とともに落ちる主因が ドリフト です。
試験では2種類のドリフトの違いが頻出します。

3-1. データドリフト(Data Drift)
データドリフトとは、本番データの分布が学習時から変化する現象 です。
たとえば、学習時は20〜40代中心だった利用者が、本番では60代中心に変わった、といったケースです。
入力の傾向が変わるため、モデルが前提とする状況から外れてしまい、精度が落ちます。
検出には PSI(Population Stability Index) や KS統計量(コルモゴロフ-スミルノフ検定) といった、分布の差を測る指標が使われます。
3-2. コンセプトドリフト(Concept Drift)
コンセプトドリフトとは、入力と予測対象の「関係性」そのものが変化する現象 です。
たとえば、コロナ禍で消費者の購買行動が一変し、「過去の特徴量→購買」のルールが通用しなくなる、といったケースです。
入力分布は変わらなくても正解の意味が変わるため、モデル品質(精度)の監視で検知します。
3-3. ドリフト検出指標を理解する
データドリフトの定量化には、主に次の指標が使われます。
- PSI(Population Stability Index) — 学習時と本番のデータ分布のズレを1つの数値で表します。一般に0.1未満は安定、0.1〜0.2は注意、0.2以上は大きな変化、と判断されます。
- KS統計量 — 2つの分布の最大の差を測る検定で、連続値の分布変化に有効です。
これらは Model Monitor のデータ品質監視が内部で計算し、しきい値超過をアラートします。
重要なのは「数値を覚える」ことより、分布のズレを定量化してアラートを出す仕組みがある と理解することです。
3-4. ドリフトへの対処
ドリフトを検知したら、対処の基本は次の通りです。
第一に 再トレーニング(§4)で最新データにモデルを適合させます。
一時的な対処として、入力データの前処理を見直す、あるいは複数モデルを使い分ける、といった手段もあります。
いずれにせよ「検知して終わり」ではなく、検知 → 対処 → 再監視 のループを回すことが運用の本質です。
- データドリフト: 入力データの分布が変わる → データ品質監視・PSI/KSで検出
- コンセプトドリフト: 入力と正解の関係性が変わる → モデル品質監視・精度低下で検出
どちらも対策の基本は再トレーニングですが、「入力の分布変化」か「関係性の変化」かを見分ける問いが頻出です。
4. 再トレーニング戦略 — トリガー条件と自動化
ドリフトを検知したら、新しいデータでモデルを 再トレーニング します。
試験では「いつ・どうやって再学習を回すか」が問われます。
再トレーニングの起動方法は主に3通りです。
| 方式 | 内容 | 向いている場面 |
|---|---|---|
| スケジュール実行 | 定期的(毎週・毎月など)に再学習 | データが定常的に蓄積される |
| トリガー実行(イベント駆動) | ドリフト検知やメトリクス低下をトリガーに再学習 | 劣化に即応したい |
| 手動実行 | 人間の判断で再学習 | 重要モデルで慎重な管理が必要 |
最も洗練された運用は、Model Monitor がドリフトを検知 → CloudWatch アラーム → 自動で再トレーニングパイプラインを起動 → 評価合格なら自動デプロイ という閉ループです。
「モデル劣化に人手を介さず対応したい」というシナリオでは、この自動再学習ループが答えになります。
4-1. チャンピオン/チャレンジャー方式
再学習したモデルを安全に切り替えるには、チャンピオン/チャレンジャー の考え方が有効です。
現行の本番モデル(チャンピオン)に対し、新しく学習したモデル(チャレンジャー)を Vol3 で学んだ Shadow Testing や A/Bテスト で比較し、チャレンジャーが明確に優れていれば昇格させます。
こうすれば、再学習したモデルが必ずしも改善とは限らないリスク(再学習で逆に悪化する場合もある)を抑えられます。
再トレーニングは「回せばよい」のではなく、評価ゲートで旧モデルとの優劣を確認してから切り替える ことが重要です。
再トレーニングでは、ドリフト後の最新データを含めて学習し直すことが重要です。
古い学習データだけで再学習しても、変化した本番環境には適合しません。
また、再学習したモデルは必ず評価ゲート(Vol3の品質ゲート)を通し、旧モデルより良いことを確認してからデプロイします。
5. MLOps保守 — Pipelines定期実行・イベント駆動
再学習を支える基盤が、Vol3 で学んだ SageMaker Pipelines です。
保守フェーズでは、このパイプラインを 定期的・自動的に回す 仕組みを作ります。
- スケジュール実行 — Amazon EventBridge のスケジュールルールで、パイプラインを定期起動します。
- イベント駆動実行 — Model Monitor のアラートや、新データの S3 到着(EventBridge イベント)をトリガーにパイプラインを起動します。
これにより、「データ準備 → 学習 → 評価 → 登録 → デプロイ」という Vol1〜Vol3 で学んだ一連の流れが、人手を介さず継続的に回り続ける 運用が実現します。
これが MLOps の到達点であり、D4 が運用視点を重視する理由です。
- レベル0(手動): 学習もデプロイも手作業。再現性が低く、劣化への対応も遅れる
- レベル1(パイプライン化): SageMaker Pipelines で学習〜デプロイを自動化。再現性が確保される
- レベル2(CI/CD + 自動再学習): ドリフト検知をトリガーに再学習が自動で回る閉ループ
試験では、課題に応じて「どこまで自動化すべきか」を問われます。劣化への即応が必要ならレベル2の自動再学習が答えになります。
6. IAM・VPCセキュリティ — 最小権限とネットワーク分離
ここからは ML システムのセキュリティです。
まず ML 固有ではない AWS 共通の基盤ですが、ML 文脈での出題に慣れておく必要があります。

6-1. IAM — 最小権限の原則
IAM(Identity and Access Management)では、SageMaker の各処理に 実行ロール を割り当て、必要最小限の権限だけを付与します。
たとえば「この学習ジョブは特定の S3 バケットの読み取りだけ許可する」といった具合です。
過剰な権限は攻撃時の被害を広げるため、最小権限の原則 が常に問われます。
6-2. VPC — ネットワーク分離
SageMaker のジョブやエンドポイントを VPC(仮想プライベートネットワーク)内 に配置すると、インターネットから隔離できます。
S3 などへのアクセスも VPCエンドポイント を経由させれば、通信が AWS ネットワーク内に閉じ、データがインターネットに出ません。
「学習データを外部に流出させたくない」「閉域網で ML を動かしたい」というシナリオでは VPC 構成が答えになります。
6-3. ロールの使い分けとリソースポリシー
SageMaker のセキュリティでは、2種類の権限管理を区別します。
IAMロール(実行ロール) は「SageMaker が他サービス(S3 等)にアクセスする際の権限」を定めます。
一方 リソースベースポリシー は「誰がそのリソース(モデル・エンドポイント)にアクセスできるか」をリソース側で定めます。
両者を組み合わせ、「学習ジョブは入力バケットの読み取りと出力バケットの書き込みのみ」といった粒度で権限を絞るのが定石です。
- 最小権限: IAM で必要最小限の権限だけ付与(過剰権限は被害を拡大)
- ネットワーク分離: VPC・VPCエンドポイントで通信を閉域化
- 暗号化: KMS で保存時、TLS で転送中のデータを保護
ML 固有の話というより AWS 共通の基盤ですが、ML ワークロード(データ・モデル・エンドポイント)に適用する形で問われます。
7. 暗号化 — KMS・S3・転送中暗号化
データ保護の要が暗号化です。試験では2種類の暗号化を区別します。
| 種別 | 内容 | 手段 |
|---|---|---|
| 保存時の暗号化(At Rest) | S3・EBS・モデルアーティファクトを暗号化して保管 | AWS KMS による鍵管理 |
| 転送中の暗号化(In Transit) | 通信経路上のデータを暗号化 | TLS/HTTPS・ノード間暗号化 |
AWS KMS(Key Management Service) は暗号鍵を一元管理するサービスで、S3 や SageMaker と統合されています。
「誰がいつ鍵を使ったか」を CloudTrail で監査でき、鍵のローテーションも自動化できます。
「学習データとモデルを暗号化して保護したい」なら KMS による保存時暗号化、「通信を保護したい」なら TLS、と整理しましょう。
S3 の暗号化には、AWS が鍵を管理する SSE-S3 と、利用者が KMS で鍵を管理する SSE-KMS があります。
「鍵の使用を細かく制御・監査したい」「コンプライアンス要件で鍵管理が必要」という場合は SSE-KMS を選びます。
さらに分散学習では、インスタンス間の通信を暗号化する ノード間暗号化(inter-container traffic encryption) も設定でき、機密データを扱う学習で求められます。
SageMaker のボリュームやモデルアーティファクトは、明示的に KMS キーを指定しなければ既定の暗号化に留まります。
「規制対応で顧客管理キー(CMK)での暗号化が必須」という設問では、ジョブ作成時に KMS キーを明示的に指定する点がポイントです。
保存時・転送中の両方を押さえることが、コンプライアンス要件を満たす鍵になります。
8. コンプライアンス・監査 — CloudTrail・Config・GuardDuty
規制対応や監査では、「何が・いつ・誰によって行われたか」を記録・監視する仕組みが問われます。
| サービス | 役割 |
|---|---|
| AWS CloudTrail | API 操作の証跡を記録(誰がどのリソースを操作したか) |
| AWS Config | リソース設定の変更履歴を追跡し、コンプライアンス準拠を評価 |
| Amazon GuardDuty | 脅威検知(不審なアクセス・異常な挙動を機械学習で検出) |
| AWS Security Hub | 各種セキュリティ検出結果を集約・一元管理 |
「ML 環境への不正アクセスを検知したい」なら GuardDuty、「操作の証跡を残したい」なら CloudTrail、「設定が基準に準拠しているか確認したい」なら Config、という使い分けです。
これらは ML 専用ではありませんが、ML ワークロードの統制にそのまま適用されます。
ML 特有の観点として、データの来歴(リネージ) の追跡も重要です。
SageMaker Lineage Tracking や Model Registry のメタデータを使えば、「この本番モデルは、どのデータセットから、どの学習ジョブで生まれたか」を遡れます。
監査や障害調査の際に「問題のあるモデルがどこから来たか」を特定できることは、規制業界では必須の要件になります。
8-1. コスト最適化も保守の一部
運用フェーズではコスト管理も問われます。
学習は Managed Spot Training(Vol2)で最大90%削減、長期的な利用は Savings Plans で割引、推論は需要に応じた 右サイジング(適切なインスタンス選択) と Auto Scaling で無駄を省きます。
「ML の運用コストを下げたい」という設問は頻出で、学習・推論それぞれに適した手段を選べるようにしておきましょう。
9. 責任あるAI — 説明可能性・公平性
最後のテーマは 責任あるAI(Responsible AI) です。
ML モデルが社会に与える影響への配慮が、近年の試験で重視されています。

Vol2 で学んだ SageMaker Clarify が、ここでも中心的な役割を果たします。
- 説明可能性(Explainability) — SHAP で「なぜその予測になったか」を説明できるようにします。ブラックボックスな判断は、金融・医療などでは許されません。
- 公平性(Fairness) — 特定の属性(性別・年齢など)に不利な予測をしていないかをバイアス指標で監視します。学習前・学習後・本番運用中の各段階でチェックします。
- 継続監視 — 一度は公平だったモデルも、ドリフトで偏りを生じることがあります。Model Monitor のバイアスドリフト監視で継続的に確認します。
「モデルの判断根拠を説明する義務がある」「公平性を継続的に担保したい」という設問では、Clarify と Model Monitor の連携が答えになります。
AWS は責任あるAIの観点として、公平性・説明可能性・プライバシーとセキュリティ・堅牢性・ガバナンス・透明性といった原則を掲げています。
試験で問われるのは難しい理論ではなく、「どのサービスでその原則を実現するか」 という実装の判断です。
説明可能性なら Clarify(SHAP)、公平性なら Clarify のバイアス検出、プライバシーなら Macie や KMS、ガバナンスなら Model Registry の承認フロー、というように、これまで学んだサービスが責任あるAIの実装手段になります。
個別の知識を「責任あるAI」という上位の文脈で結びつけられると、応用問題にも対応できます。
10. まとめ — シリーズ総括:Vol0〜Vol4でMLA-C01全4ドメイン制覇
本記事では、MLA-C01 の D4「MLの監視・保守・セキュリティ」を、モデル監視からセキュリティ・責任あるAIまで体系的に整理しました。
D4 の核心は「モデルは作って終わりではなく、運用し続けるもの」という視点です。
ドリフトを検知して再学習で対処し、最小権限と暗号化で守り、監査で統制する――この一連の営みを、AWS のどのサービスで実現するかを問うのが D4 です。
個別のサービス名だけでなく、運用ライフサイクルのなかでの位置づけをセットで押さえておきましょう。
- モデル監視は Model Monitor(データ品質/モデル品質/バイアス/特徴量重要度)
- ドリフトは データドリフト(分布変化・PSI/KS)とコンセプトドリフト(関係性変化・精度低下)
- 保守は 自動再トレーニングループ(検知→再学習→評価→デプロイ)
- セキュリティは IAM最小権限・VPC分離・KMS暗号化
- 監査は CloudTrail・Config・GuardDuty・Security Hub
- 責任あるAIは Clarify(説明可能性・公平性)+ 継続監視
これにて「AWS MLA-C01試験対策」シリーズ Vol0〜Vol4 が完結 しました。
| Vol | 対象ドメイン | 内容 |
|---|---|---|
| Vol0 ロードマップ | 全体(ハブ) | 試験概要・4ドメイン俯瞰・学習法 |
| Vol1 データ準備・特徴量エンジニアリング | D1 (28%) | S3/Glue・Feature Store・前処理 |
| Vol2 モデル開発・評価・チューニング | D2 (26%) | アルゴリズム・AMT・評価指標 |
| Vol3 デプロイ・推論・オーケストレーション | D3 (22%) | 推論4オプション・MLOps |
| Vol4(本記事) 監視・保守・セキュリティ | D4 (24%) | Model Monitor・ドリフト・セキュリティ |
Vol0 から Vol4 まで読み通したあなたは、MLA-C01 の 全4ドメインを体系的に俯瞰 できたはずです。
あとは知識を本番の得点力に変えるだけです。
CertTrend LMS には MLA-C01 の出題範囲を網羅した 400問のオリジナル問題 を収録しています。
正答理由だけでなく すべての誤答がなぜ誤りか を AWS 公式ドキュメントに基づいて解説しているため、各 Vol で学んだ知識を本番形式で確実に定着させられます。
間違えた問題は該当 Vol に戻って復習する――この「読む → 解く → 戻る」の循環で、合格を確実なものにしましょう。