Amazon SageMaker のよくある質問

全般

次世代の SageMaker は、データ、分析、AI のための統合プラットフォームです。広く採用されている AWS の機械学習 (ML) と分析機能をまとめた次世代の SageMaker は、すべてのデータに対する統合アクセスとともに、分析と AI のための統合エクスペリエンスを提供します。SageMaker により、モデル開発、生成 AI、データ処理、SQL 分析のための使い慣れた AWS サービスを利用して、Unified Studio (プレビュー) からより迅速にコラボレーションや構築を行うことができます。これは、ソフトウェア開発用の最も有能な生成 AI アシスタントである Amazon Q Developer でより迅速に運用できます。さらに、企業のセキュリティニーズに対応するために組み込まれたガバナンスを使用して、保存先がデータレイク、データウェアハウス、サードパーティーまたはフェデレーテッドデータソースであるかにかかわらず、すべてのデータにアクセスすることができます。

広く採用されている Amazon SageMaker サービスを、AWS のデータ、分析、AI 機能の包括的なセットで拡張し、データ、分析、AI の統合プラットフォームを実現しました。今後、データラングリング、AI モデルの構築、トレーニング、デプロイのための SageMaker の既存の AI/ML 機能セットは、Amazon SageMaker AI と呼ばれるようになります。Amazon SageMaker AI は次世代の Amazon SageMaker に統合されており、特に大規模な AI および ML モデルの構築、トレーニング、デプロイに重点を置きたいユーザー向けのスタンドアロンサービスとしても利用できます。

次世代の Amazon SageMaker には以下が含まれます。

  • Amazon SageMaker Unified Studio (プレビュー) – Amazon EMR、AWS Glue、Amazon Athena、Amazon Redshift、Amazon Bedrock、Amazon SageMaker AI などの専用の AWS 分析サービスや AI/ML サービスの使い慣れたツールや機能にアクセスして使用するための単一の開発環境
  • Amazon SageMaker Lakehouse - Amazon S3 データレイク、Amazon Redshift、サードパーティー、フェデレーテッドデータソースにわたる統合データアクセス
  • Amazon SageMaker のデータと AI ガバナンス – データと AI を安全に検出、管理、コラボレーションできるようにします

次世代の Amazon SageMaker には次の機能が含まれています。

  • Amazon SageMaker Unified Studio (プレビュー) – 分析と AI のためのすべてのデータとツールを 1 つの環境で構築できます。
  • Amazon SageMaker Lakehouse – Amazon SageMaker Lakehouse を使用すると、Amazon Simple Storage Service (Amazon S3) データレイク、Amazon Redshift データウェアハウス、サードパーティーおよびフェデレーテッドデータソースにわたるデータを統合できます。
  • データと AI ガバナンス – Amazon DataZone 上に構築された Amazon SageMaker Catalog を使用して、データと AI を安全に検出、ガバナンス、コラボレーションできます。
  • モデル開発 – Amazon SageMaker AI (旧 Amazon SageMaker) で完全に管理されたインフラストラクチャ、ツール、ワークフローを使用して ML と FM を構築、トレーニング、デプロイします。
  • 生成 AI アプリケーション開発 – Amazon Bedrock を使用して生成 AI アプリケーションを構築し、スケールします。
  • SQL 分析 – 最もコストパフォーマンスに優れた SQL エンジンである Amazon Redshift でインサイトを得ることができます。
  • データ処理 – Amazon Athena、Amazon EMR、AWS Glue のオープンソースフレームワークを使用して、分析と AI のためのデータを分析、準備、統合します。

Amazon SageMaker は、データ、分析、AI のための統合プラットフォームです。広く採用されている AWS の機械学習と分析機能をまとめた次世代の SageMaker は、分析と AI のための統合エクスペリエンスを、すべてのデータに対する統合アクセスとともに提供します。この統一されたアプローチにより、データをより効率的に処理し、チーム間のコラボレーションを強化し、全体的な生産性を向上させることができます。

Amazon SageMaker では次のことを行えます。

  • モデル開発、生成 AI、データ処理、SQL 分析用の使い慣れた AWS サービスを使用して、データと AI の 1 つの開発環境でコラボレーションと構築を迅速に行えます。
  • 機械学習と基盤モデルのトレーニング、カスタマイズ、デプロイを行うための幅広いツールセットを使用して AI ユースケースを開発およびスケールし、ビジネスに合わせてカスタマイズされた生成 AI アプリケーションを迅速に作成できます。
  • オープンレイクハウスでデータサイロを減らし、Amazon S3 データレイク、Amazon Redshift データウェアハウス、サードパーティーデータソースやフェデレーテッドデータソースにわたるすべてのデータを統合します。
  • 組み込みのデータと AI ガバナンスで企業のセキュリティニーズを満たし、権限のあるユーザーが適切な目的のために適切なデータ、ML モデル、GenAI 開発アーティファクト、コンピューティングへアクセスできるよう制御します。

はい。Amazon SageMaker AI (旧称 Amazon SageMaker)、Amazon EMR (ビッグデータ処理用)、AWS Glue、データウェアハウジング用の Amazon Redshift などの個々の AWS サービスは、お客様固有のビジネス要件に基づいて引き続き独立して使用できます。個々のサービスを現在ご利用されている方法に影響はありません。

Amazon SageMaker には、これらのサービスへのアクセスを可能にする統一された使いやすいインターフェイスがもたらされるという利点もあります。このアプローチにより、データを活用してより効果的に革新し、チーム間のコラボレーションを強化し、全体的な生産性を向上させることができます。

Amazon SageMaker は、Amazon SageMaker Unified Studio (プレビュー)、Amazon SageMaker データおよび AI ガバナンス、および Amazon SageMaker Lakehouse にわたる包括的な AWS AI および分析サービスのセットをまとめています。

Amazon SageMaker Unified Studio から、既存の AWS サービスを使用して、データ処理、SQL 分析、機械学習、生成 AI アプリケーション開発のための機能にアクセスできます。データ処理に関しては、Amazon Athena、AWS Glue、Amazon EMR、Amazon Managed Workflows for Apache Airflow などのサービスにより、あらゆる規模の分析や AI のためにデータを簡単に分析、準備、統合、調整できます。SQL 分析の場合、Amazon Redshift は Amazon SageMaker Lakehouse とシームレスに統合され、Redshift データウェアハウスと Amazon S3 データレイクにわたる統合データに対して強力な SQL 分析機能を提供します。機械学習機能は Amazon SageMaker AI (旧 Amazon SageMaker) によって提供され、機械学習モデルと基盤モデルの構築、トレーニング、デプロイに使用されます。さらに、Amazon Bedrock IDE (プレビュー) を使用して生成 AI アプリケーションを開発できます。

Amazon SageMaker データおよび AI ガバナンスは、Amazon DataZone 上に構築された Amazon SageMaker Catalog の統合データ管理エクスペリエンスを通じて、エンドツーエンドの組み込みガバナンスを提供し、データと AI を安全に検出、管理、コラボレーションできるようにします。

Amazon SageMaker Lakehouse は、AWS Glue データカタログ、AWS Lake Formation、Amazon Redshift にまたがる複数のカタログサービスに基づいて構築されており、Amazon S3 データレイク、Amazon Redshift データウェアハウス、サードパーティーデータソースおよびフェデレーテッドデータソースにわたる統一されたデータアクセスを提供します。

さらに、これらのサービスは AWS マネジメントコンソールを通してスタンドアロン機能として引き続き利用できるため、ユースケースに応じた柔軟性がもたらされます。分析と AI のエクスペリエンスを統合するために、2025 年には Amazon SageMaker プラットフォームをさらに多くのサービスで強化する予定です。これらには、Amazon OpenSearch Service による検索分析、Amazon QuickSight によるビジネスインテリジェンス、AWS のストリーミングサービスのポートフォリオによるストリーミングが含まれます。

Amazon SageMaker は簡単に使用を開始できます。最初のステップは、Amazon SageMaker Unified Studio (プレビュー) 管理コンソールに移動して、ビジネスユニットのアセット、ユーザー、およびそれらのプロジェクトをつなぐための組織エンティティであるドメインを作成することです。管理コンソールで [ドメインを作成] を選択すると、高速セットアップと手動セットアップの 2 つのオプションが表示されます。[高速セットアップ] を選択すると、一連のデフォルト設定を使用して開始できます。デフォルト設定は後でカスタマイズできます。または、[手動セットアップ] を選択すると、ドメインの作成時に設定を完全に制御できます。ドメインを作成したら、Amazon SageMaker Unified Studio (ブラウザベースのウェブアプリケーション) に移動できます。ここで、すべてのデータと分析と AI のために設定されたツールを使用できます。開始方法の詳細については、SageMaker のドキュメントを参照してください。

Amazon EMR、AWS Glue、Amazon Athena などの AWS サービスにおける既存のデータ開発エクスペリエンスは引き続きご利用いただけます。つまり、作成した既存のコードとリソースはすべて、中断することなく引き続き使用できます。使いやすいアップグレードスクリプトと包括的なガイドラインを提供し、2025 年第 1 四半期に既存のコードベースを統一された SageMaker エクスペリエンスに取り込めるようにする予定です。

お客様が今現在ご利用中の AWS データ、分析、AI ツールの包括的なセットを統合することで、広く採用されている ML サービスである Amazon SageMaker を拡張してデータと AI のプラットフォームになるようにしています。また、新しい SageMaker プラットフォームには、SageMaker Unified Studio (プレビュー)、SageMaker Lakehouse (GA)、SageMaker Catalog (GA) などの新しい機能も追加されました。

新しい SageMaker プラットフォームには、Amazon Redshift による SQL 分析、Amazon EMR によるデータ処理、SageMaker AI による AI モデル開発、新しい Bedrock IDE (プレビュー) による生成 AI アプリケーション開発に必要なコンポーネントがほぼすべて含まれています。これらはすべて、Unified Studio (プレビュー) での統合開発エクスペリエンスを通じて提供されます。

製品体験

SageMaker のプロジェクトエンティティは、ユーザーが作業を整理し、実行中のジョブに関するビジネスコンテキストを提供するのに役立ちます。ユーザーが ML モデル、ノートブック、クエリ、ダッシュボード、生成 AI アプリケーションなどのデータやアーティファクトで共同作業できるコラボレーションワークスペースを提供します。プロジェクトは保護されており、プロジェクトに明示的に追加されたユーザーのみがプロジェクト内のデータやツールにアクセスできます。プロジェクトはプロジェクトで選択した機能 (データレイクなど) に基づいて AWS Identity and Access Management (IAM) ロールを作成し、ユーザーに業務に必要なアクセスを提供します。プロジェクトでは、同じアカウント内で作業を分離できるほか、セキュリティ境界 (セキュリティグループと IAM ロール) も設定されます。

Amazon Q Developer は SageMaker エクスペリエンスに統合された生成 AI 会話アシスタントで、開発ライフサイクルを通じて生産性を向上させます。チャットインターフェイスを通じて、自然言語を使用して SageMaker について質問したり、コードに関するヘルプを得たり、データセットなどのリソースを調べたりすることができます。Amazon Q Developer とチャットすると、現在の会話のコンテキストを使用して、SageMaker の開発エクスペリエンス全体を通じてパーソナライズされたガイダンスと自動アシスタンスを提供します。Amazon Q Developer は、コードディスカッション、インラインコード補完の遂行、SQL クエリの生成、データセットの検索と統合を支援し、特定の開発ニーズに合わせたインテリジェントなサポートを提供します。


Amazon Q Developer は、お客様の作業のニュアンスを理解することで、対象を絞ったコンテキスト認識型の支援を提供し、開発プロセスを合理化し、SageMaker 環境における全体的な生産性を向上させます。

SageMaker は、完全なデータおよび AI ワークフローを実現する強力なツールを統合したウェブベースの統合環境を提供します。組み込みの IDE により AI/ML 開発が可能になり、PySpark、AWS Glue、Amazon EMR などのフレームワークやサービスを使用して、さまざまなソースからの大量のデータを処理できます。

バージョン管理とワークフロー管理については、Git にコミットし、Amazon MWAA を使用してワークフローを定義できます。統合された SQL クエリエディタでは、データの探索、分析、視覚化が可能になり、クエリの保存と共有や新しいデータセットの作成がより簡単になります。

モデル開発は、Amazon SageMaker ノートブック、JumpStart、HyperPod、MLflow、パイプライン、モデルレジストリなど、使い慣れた SageMaker AI ツールを使って合理化できます。これらのプロセス全体を通じて、Amazon Q Developer は SageMaker ツール全体にシームレスに統合され、データの検出、準備、パイプラインの作成、モデルの構築とトレーニング、コードのデプロイをインテリジェントに支援します。

SageMaker Unified Studio (プレビュー) に統合された Bedrock IDE (プレビュー) は、生成 AI アプリケーションを開発するための包括的な環境を提供します。この直感的なインターフェイスにより、Amazon Bedrock の高性能 FM や高度なカスタマイズ機能にアクセスできるため、信頼できる安全な環境でのアプリケーション開発を加速できます。

Amazon Bedrock ナレッジベース、ガードレール、エージェント、プロンプトフローなどの強力な機能を使用できるため、チームは責任ある AI ガイドラインを遵守しながら、生成 AI アプリケーションを特定のビジネスニーズに合わせて迅速に調整できます。このプラットフォームは、アクセスコントロールによる共有と git に裏打ちされた監査機能により、管理されたアクセスをサポートし、部門間の安全なコラボレーションを可能にします。

Amazon SageMaker Lakehouse は、AWS データレイク、データウェアハウス、サードパーティーアプリケーション、および運用データベース全体のデータを統合します。ゼロ ETL 統合、フェデレーテッドクエリソース、240 以上のコネクタにより、データへの迅速かつ効率的なアクセスを 1 か所から行えるようにします。

Amazon SageMaker は、Amazon DataZone 上に構築された Amazon SageMaker Catalog の統合データ管理エクスペリエンスを通じて、エンドツーエンドの組み込みガバナンスを可能にします。このアプローチにより、組織全体の構造化データアセット、非構造化データアセット、機械学習モデル、アプリケーションのカタログ化、検出、アクセス、分析、管理が可能になります。このプラットフォームにより、適切なユーザーが適切なアセットへの適切なアクセス権を持つようにすることができ、強固なセキュリティおよびコンプライアンス基準が維持されます。

SageMaker では、さまざまな方法でデータパイプラインを作成および管理できます。SageMaker Data Processing は、Amazon EMR、Amazon Athena、AWS Glue、Amazon MWAA を組み合わせて、統一されたエクスペリエンスでデータを統合、準備、調査できるように支援します。SageMaker AI を使用して ML 固有のモデルオーケストレーション用のパイプラインを構築し、Amazon MWAA を使用してデータパイプラインとワークフローを構築できます。また、ゼロ ETL 統合を使用することもできます。これにより、複雑な抽出、変換、ロード (ETL) プロセスを排除し、サービス間で直接データをレプリケーションできるため、データの移動が簡単になります。詳細については、「ゼロ ETL とは?」をご覧ください。

料金

Amazon SageMaker を使用する場合、Amazon SageMaker 経由でアクセスできるさまざまな AWS サービスの料金モデルに従って課金されます。Amazon SageMaker 内で統合されたエクスペリエンスを提供する、データと AI の開発環境である Amazon SageMaker Unified Studio (プレビュー) の使用には、別途費用はかかりません。詳細については、Amazon SageMaker の料金ページ SageMaker の料金をご覧ください。

SageMaker 無料利用枠を利用すると、無料でデータと AI のイノベーションを迅速に開始できます。詳細については、SageMaker の料金を参照してください。

可用性

次世代の SageMaker は、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、アジアパシフィック (東京)、および欧州 (アイルランド) の各 AWS リージョンでご利用いただけます。SageMaker Unified Studio と Amazon Bedrock IDE は、これらの同じ AWS リージョンでプレビュー版としてご利用いただけます。今後のアップデートについては、AWS リージョン別のサービス表をご覧ください。

はい。SageMaker は、ミッションクリティカルな分析と AI ワークロードが必要とする一貫したパフォーマンスとアップタイムを提供するように設計されています。複数のサービスコンポーネントで構成される統合プラットフォームであるため、サービスの可用性は使用するサービスコンポーネントによって異なります。

個々のサービスのサービスレベルアグリーメント (SLA) の詳細については、それぞれの SLA ドキュメントを参照してください。SLA は、SageMaker エクスペリエンスを構成するさまざまなサービスについて、特定のアップタイムの保証と信頼性に関するコミットメントを提供します。

参照可能な SLA 文書には以下が含まれます。