Amazon SageMaker FAQ

일반

차세대 SageMaker는 데이터, 분석 및 AI를 위한 통합 플랫폼입니다. 차세대 SageMaker는 널리 도입된 AWS 기계 학습(ML) 및 분석 기능을 결합하여 모든 데이터에 대한 통합 액세스를 통해 분석 및 AI를 위한 통합 경험을 제공합니다. SageMaker를 사용하면 Unified Studio(평가판)에서 소프트웨어 개발을 위한 가장 유능한 생성형 AI 어시스턴트인 Amazon Q Developer의 지원을 받으면서 모델 개발, 생성형 AI, 데이터 처리, SQL 분석을 위한 친숙한 AWS 서비스를 사용하여 더 빠르게 협업하고 구축할 수 있습니다. 또한 데이터 저장 위치가 데이터 레이크, 데이터 웨어하우스 또는 서드 파티 또는 연합 데이터 소스 어디든 관계없이 엔터프라이즈 보안 요구 사항을 해결하도록 내장된 거버넌스를 통해 모든 데이터에 액세스할 수 있습니다.

AWS는 데이터, 분석 및 AI 통합 플랫폼을 제공하기 위해 널리 도입된 Amazon SageMaker 서비스를 포괄적인 AWS 데이터, 분석 및 AI 기능 세트로 확장했습니다. 앞으로는 SageMaker에서 AI 모델 데이터 랭글링, 구축, 훈련, 배포를 위한 기존 AI/ML 기능 세트를 Amazon SageMaker AI라고 부릅니다. Amazon SageMaker AI는 차세대 Amazon SageMaker에 통합되어 있으며, 특히 대규모 AI 및 ML 모델을 구축, 훈련, 배포하는 데 집중하려는 사용자를 위한 독립 실행형 서비스로도 제공됩니다.

차세대 Amazon SageMaker에는 다음이 포함됩니다.

  • Amazon SageMaker Unified Studio(평가판) - Amazon EMR, AWS Glue, Amazon Athena, Amazon Redshift, Amazon Bedrock, Amazon SageMaker AI와 같이 목적별 AWS 분석 및 AI/ML 서비스에서 친숙한 도구 및 기능에 액세스하고 사용할 수 있는 단일 개발 환경
  • Amazon SageMaker Lakehouse - Amazon S3 데이터 레이크, Amazon Redshift, 서드 파티 및 연합 데이터 소스 전반에 걸쳐 통합 데이터 액세스 제공
  • Amazon SageMaker 데이터 및 AI 거버넌스 - 데이터 및 AI를 안전하게 검색, 관리, 협업 가능

차세대 Amazon SageMaker에는 다음과 같은 기능이 포함되어 있습니다.

  • Amazon SageMaker Unified Studio(평가판) - 단일 환경에서 분석과 AI를 위한 모든 데이터 및 도구를 사용하여 구축할 수 있습니다.
  • Amazon SageMaker Lakehouse - Amazon SageMaker Lakehouse를 사용하여 Amazon Simple Storage Service(Amazon S3) 데이터 레이크, Amazon Redshift 데이터 웨어하우스, 서드 파티 및 연합 데이터 소스의 데이터를 통합합니다.
  • 데이터 및 AI 거버넌스 - Amazon DataZone에 구축된 Amazon SageMaker Catalog를 사용하여 데이터와 AI를 안전하게 검색 및 관리하고 협업할 수 있습니다.
  • 모델 개발 - Amazon SageMaker AI(이전의 Amazon SageMaker)를 사용하여 완전관리형 인프라, 도구, 워크플로를 사용하여 ML 및 FM을 구축, 훈련, 배포할 수 있습니다.
  • 생성형 AI 앱 개발 - Amazon Bedrock을 사용하여 생성형 AI 애플리케이션을 구축하고 확장할 수 있습니다.
  • SQL 분석 - 가격 대비 성능이 가장 뛰어난 SQL 엔진인 Amazon Redshift를 통해 인사이트를 얻을 수 있습니다.
  • 데이터 처리 - Amazon Athena, Amazon EMR 및 AWS Glue 기반의 오픈 소스 프레임워크를 사용하여 분석 및 AI용 데이터를 분석, 준비, 통합할 수 있습니다.

Amazon SageMaker는 데이터, 분석 및 AI를 위한 통합 플랫폼입니다. 차세대 SageMaker는 널리 도입된 AWS 기계 학습 및 분석 기능을 결합하여 모든 데이터에 대한 통합 액세스를 통해 분석 및 AI를 위한 통합 경험을 제공합니다. 이러한 통합 접근 방식을 통해 데이터를 더 효율적으로 사용하고, 팀 간 협업을 증진하고, 전반적인 생산성을 향상시킬 수 있습니다.

Amazon SageMaker를 사용하면

  • 모델 개발, 생성형 AI, 데이터 처리, SQL 분석을 위한 친숙한 AWS 서비스를 사용하여 단일 데이터 및 AI 개발 환경에서 더 빠르게 협업하고 구축할 수 있습니다.
  • 기계 학습 및 파운데이션 모델을 훈련, 사용자 지정, 배포하고 비즈니스에 맞춤화된 생성형 AI 애플리케이션을 빠르게 생성할 수 있는 광범위한 도구 세트를 사용하여 AI 사용 사례를 개발하고 확장할 수 있습니다.
  • Amazon S3 데이터 레이크, Amazon Redshift 데이터 웨어하우스, 서드 파티 또는 연합 데이터 소스의 모든 데이터를 통합하는 개방형 레이크하우스로 데이터 사일로를 줄일 수 있습니다.
  • 적절한 사용자가 적절한 용도로 올바른 데이터, ML 모델, 생성형 AI 개발 아티팩트 및 컴퓨팅에 대한 액세스하도록 제어하는 내장된 데이터 및 AI 거버넌스를 통해 엔터프라이즈 보안 요구 사항을 충족할 수 있습니다.

예. 특정 비즈니스 요구 사항에 따라 Amazon SageMaker AI(이전의 Amazon SageMaker), 빅 데이터 처리를 위한 Amazon EMR, AWS Glue, 데이터 웨어하우징을 위한 Amazon Redshift와 같은 개별 AWS 서비스를 계속해서 독립적으로 사용할 수 있습니다. 현재 개별 서비스를 사용하는 방식에는 영향을 미치지 않습니다.

Amazon SageMaker는 이러한 서비스에 액세스할 수 있는 사용자 친화적인 통합 인터페이스를 제공함으로써 추가적인 이점을 제공합니다. 이러한 접근 방식을 통해 데이터를 더욱 효과적으로 혁신하고, 팀 간 협업을 증진하고, 전반적인 생산성을 향상시킬 수 있습니다.

Amazon SageMaker는 Amazon SageMaker Unified Studio(평가판), Amazon SageMaker 데이터 및 AI 거버넌스, Amazon SageMaker Lakehouse 전반에서 포괄적인 AWS AI 및 분석 서비스 세트를 제공합니다.

Amazon SageMaker Unified Studio에서 기존 AWS 서비스를 사용하여 데이터 처리, SQL 분석, 기계 학습, 생성형 AI 애플리케이션 개발 기능에 액세스할 수 있습니다. 데이터 처리의 경우 Amazon Athena, AWS Glue, Amazon EMR, Amazon Managed Workflows for Apache Airflow와 같은 서비스가 모든 규모의 분석 및 AI를 위한 데이터를 쉽게 분석, 준비, 통합, 오케스트레이션합니다. SQL 분석의 경우 Amazon Redshift가 Amazon SageMaker Lakehouse와 원활하게 통합되어 Redshift 데이터 웨어하우스 및 Amazon S3 데이터 레이크 전반의 통합 데이터에 대한 강력한 SQL 분석 기능을 제공합니다. Amazon SageMaker AI(이전의 Amazon SageMaker)는 기계 학습 및 파운데이션 모델을 구축, 훈련, 배포하기 위한 기계 학습 기능을 제공합니다. 또한 Amazon Bedrock IDE(평가판)를 사용하여 생성형 AI 애플리케이션을 개발할 수 있습니다.

Amazon SageMaker 데이터 및 AI 거버넌스는 Amazon DataZone에 구축된 Amazon SageMaker Catalog의 통합 데이터 관리 경험을 통해 내장된 엔드 투 엔드 거버넌스를 제공합니다. 이를 통해 데이터와 AI를 안전하게 검색, 관리, 협업할 수 있습니다.

Amazon SageMaker Lakehouse는 AWS Glue Data Catalog, AWS Lake Formation 및 Amazon Redshift의 여러 카탈로그 서비스를 기반으로 구축되어 Amazon S3 데이터 레이크, Amazon Redshift 데이터 웨어하우스, 서드 파티 및 연합 데이터 소스 전반에 걸쳐 통합된 데이터 액세스를 제공합니다.

또한 이러한 서비스는 AWS Management Console을 통해 독립 실행형 기능으로 계속 사용할 수 있으므로 사용 사례에 따른 유연성을 제공합니다. 2025년에는 더 많은 서비스로 Amazon SageMaker 플랫폼을 개선하여 분석 및 AI 전반의 경험을 통합할 예정입니다. 여기에는 Amazon OpenSearch Service를 사용한 검색 분석, Amazon QuickSight를 사용한 비즈니스 인텔리전스, AWS 스트리밍 서비스 포트폴리오를 사용한 스트리밍이 포함됩니다.

Amazon SageMaker를 시작하기는 쉽습니다. 첫 번째 단계는 Amazon SageMaker Unified Studio(평가판) 관리 콘솔로 이동하여 사업부의 자산, 사용자 및 프로젝트를 함께 연결하기 위한 구성 엔티티인 도메인을 생성하는 것입니다. 관리 콘솔에서 도메인 생성을 선택하면 빠른 설정과 수동 설정이라는 두 가지 옵션이 표시됩니다. 빠른 설정을 선택하면 기본 구성 세트로 시작했다가 나중에 사용자 지정할 수 있습니다. 또는 도메인을 생성할 때 설정을 완전히 제어할 수 있는 수동 설정을 선택할 수도 있습니다. 도메인이 생성되면 Amazon SageMaker Unified Studio(브라우저 기반 웹 애플리케이션)로 이동하여 분석 및 AI를 위한 모든 데이터와 구성된 도구를 사용할 수 있습니다. 시작하는 방법을 자세히 알아보려면 SageMaker 설명서를 참조하세요.

Amazon EMR, AWS Glue, Amazon Athena와 같은 AWS 서비스에서의 기존 데이터 개발 경험은 그대로 사용할 수 있습니다. 즉, 기존에 생성한 모든 코드 및 리소스를 중단 없이 계속 사용할 수 있습니다. 2025년 1분기에 기존 코드베이스를 통합 SageMaker 경험으로 가져올 수 있도록 사용하기 쉬운 업그레이드 스크립트와 포괄적인 지침을 제공할 예정입니다.

현재 AWS는 고객이 이미 사용하고 있는 포괄적인 AWS 데이터, 분석 및 AI 도구 세트를 통합하여 널리 도입된 ML 서비스인 Amazon SageMaker를 데이터 및 AI 플랫폼으로 확장하고 있습니다. 또한 SageMaker Unified Studio(평가판), SageMaker Lakehouse(GA), SageMaker Catalog(GA)를 비롯한 신규 기능을 새로운 SageMaker 플랫폼에 추가했습니다.

새로운 SageMaker 플랫폼에는 Amazon Redshift를 사용한 SQL 분석, Amazon EMR을 사용한 데이터 처리, SageMaker AI를 사용한 AI 모델 개발, 새로운 BedRock IDE를 사용한 생성형 AI 앱 개발(평가판)에 필요한 거의 모든 구성 요소가 포함되어 있으며, 모두 Unified Studio(평가판)의 통합 개발 경험을 통해 제공됩니다.

제품 경험

SageMaker의 프로젝트 엔터티는 사용자가 작업을 구성하고 수행 중인 작업에 대한 비즈니스 컨텍스트를 제공하는 데 도움이 됩니다. 사용자가 데이터와 ML 모델, 노트북, 쿼리, 대시보드, 생성형 AI 애플리케이션과 같은 아티팩트에 대해 협업할 수 있는 협업 워크스페이스를 제공합니다. 프로젝트는 프로젝트에 명시적으로 추가된 사용자만 프로젝트 안의 데이터 및 도구에 액세스할 수 있도록 보안이 적용됩니다. 프로젝트에서 선택한 기능(예: 데이터 레이크)을 기반으로 사용자에게 작업 수행에 필요한 액세스 권한을 제공하는 AWS Identity and Access Management(IAM) 역할을 생성합니다. 또한 프로젝트는 보안 경계(보안 그룹 및 IAM 역할)뿐만 아니라 동일한 계정 내에서의 작업 격리도 제공합니다.

Amazon Q Developer는 SageMaker 경험에 통합된 생성형 AI 대화 어시스턴트로, 개발 수명 주기 전반에 걸쳐 생산성을 향상시킵니다. 채팅 인터페이스를 통해 자연어를 사용하여 SageMaker에 대해 질문하고, 코드에 대한 도움을 받고, 데이터세트와 같은 리소스를 탐색할 수 있습니다. Amazon Q Developer와 채팅하면 현재 대화의 컨텍스트를 사용하여 SageMaker 개발 경험 전반에 걸쳐 개인화된 지침과 자동화된 지원을 제공합니다. Amazon Q Developer는 코드 토론을 지원하고, 인라인 코드 완성을 제공하고, SQL 쿼리를 생성하고, 데이터세트를 검색 및 통합하고, 특정 개발 요구 사항에 맞게 조정된 지능형 지원을 제공할 수 있습니다.


Amazon Q Developer는 작업의 세부 사항을 이해함으로써 개발 프로세스를 간소화하고 SageMaker 환경의 전반적인 생산성을 향상시키는 컨텍스트 인식 지원을 제공합니다.

SageMaker는 전체 데이터 및 AI 워크플로를 위한 강력한 도구를 결합하는 통합 웹 기반 환경을 제공합니다. 내장 IDE는 AI/ML 개발을 지원하므로 PySpark, AWS Glue, Amazon EMR과 같은 프레임워크 및 서비스를 사용하여 다양한 소스의 대규모 데이터를 처리할 수 있습니다.

버전 제어 및 워크플로 관리의 경우 Git에 커밋하고 Amazon MWAA를 사용하여 워크플로를 정의할 수 있습니다. 통합된 SQL 쿼리 편집기를 사용하면 쿼리를 더 쉽게 저장 및 공유하고 새 데이터세트를 생성할 수 있는 기능을 통해 데이터를 탐색, 분석, 시각화할 수 있습니다.

Amazon SageMaker 노트북, JumpStart, HyperPod, MLFlow, Pipelines, Model Registry를 비롯한 친숙한 SageMaker AI 도구를 통해 모델 개발이 간소화됩니다. 이러한 프로세스 전반에서 Amazon Q Developer는 SageMaker 도구 전체에 원활하게 통합되어 데이터 검색, 준비, 파이프라인 생성, 모델 구축 및 훈련, 코드 배포에 대한 지능적인 지원을 제공합니다.

SageMaker Unified Studio(평가판)에 통합된 Bedrock IDE(평가판)는 생성형 AI 애플리케이션 개발을 위한 포괄적인 환경을 제공합니다. 이 직관적인 인터페이스는 Amazon Bedrock의 고성능 FM 및 고급 사용자 지정 기능에 대한 액세스를 제공하여 신뢰할 수 있고 안전한 환경에서 애플리케이션 개발을 가속화하는 데 도움이 됩니다.

Amazon Bedrock Knowledge Bases, Guardrails, Agents, Prompt Flows와 같은 강력한 기능을 사용하여 팀이 책임 있는 AI 지침을 준수하면서 특정 비즈니스 요구 사항에 맞게 생성형 AI 애플리케이션을 신속하게 조정할 수 있습니다. 이 플랫폼은 통제된 액세스를 지원하고 액세스가 제어된 공유 및 git 기반 감사 기능을 통해 안전한 부서 간 협업을 가능하게 합니다.

Amazon SageMaker Lakehouse는 AWS 데이터 레이크, 데이터 웨어하우스, 서드 파티 애플리케이션, 운영 데이터베이스 전반의 데이터를 통합합니다. 제로 ETL 통합, 연합 쿼리 소스, 240개 이상의 커넥터를 통해 단일 위치에서 데이터에 신속하고 효율적으로 액세스할 수 있습니다.

Amazon SageMaker는 Amazon DataZone에 구축된 Amazon SageMaker Catalog의 통합 데이터 관리 경험을 통해 내장된 엔드 투 엔드 거버넌스를 제공합니다. 이 접근 방식을 사용하면 조직 전체에서 정형 및 비정형 데이터 자산, 기계 학습 모델 및 애플리케이션을 모두 카탈로그화, 검색, 액세스, 분석, 관리할 수 있습니다. 이 플랫폼은 적절한 사람이 적절한 자산에 적절하게 액세스할 수 있도록 하여 강력한 보안 및 규정 준수 표준을 유지합니다.

SageMaker에서 다양한 방법으로 데이터 파이프라인을 생성하고 관리할 수 있습니다. SageMaker 데이터 처리는 Amazon EMR, Amazon Athena, AWS Glue, Amazon MWAA를 통합하여 통합 경험에서 데이터를 통합, 준비, 탐색할 수 있도록 지원합니다. SageMaker AI를 사용하여 ML 전용 모델 오케스트레이션을 위한 파이프라인을 구축하고 Amazon MWAA를 사용하여 데이터 파이프라인 및 워크플로를 구축할 수 있습니다. 또한 제로 ETL 통합을 사용하면 복잡한 추출, 전환, 적재(ETL) 프로세스를 제거하고 서비스 간에 직접 데이터 복제를 지원하여 데이터 이동을 간소화할 수 있습니다. 자세히 알아보려면 제로 ETL이란 무엇인가요?를 참조하세요.

요금

Amazon SageMaker를 사용하는 경우 Amazon SageMaker를 통해 액세스할 수 있는 다양한 AWS 서비스의 요금 모델에 따라 요금이 부과됩니다. Amazon SageMaker 내에서 통합 경험을 제공하는 데이터 및 AI 개발 환경인 Amazon SageMaker Unified Studio(평가판)를 사용하는 데 드는 별도의 비용은 없습니다. 자세한 내용은 Amazon SageMaker 요금 페이지 SageMaker 요금을 참조하세요.

SageMaker 프리 티어는 무료로 데이터 및 AI 혁신을 빠르게 시작할 수 있도록 도와줍니다. 자세한 내용은 SageMaker 요금을 참조하세요.

가용성

차세대 SageMaker는 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건), 아시아 태평양(도쿄) 및 유럽(아일랜드) AWS 리전에서 사용할 수 있습니다. SageMaker Unified Studio 및 Amazon Bedrock IDE는 이 동일한 AWS 리전에서 평가판으로 제공됩니다. 향후 업데이트는 AWS 리전 서비스 목록을 참조하세요.

예. SageMaker는 미션 크리티컬 분석 및 AI 워크로드에 필요한 일관된 성능과 가동 시간을 제공하도록 설계되었습니다. 여러 서비스 구성 요소로 구성된 통합 플랫폼이므로 서비스 가용성은 사용되는 서비스 구성 요소에 따라 달라집니다.

각 개별 서비스의 서비스 수준 계약(SLA)에 대한 자세한 내용은 해당 SLA 설명서를 참조하세요. SLA는 SageMaker 경험을 구성하는 다양한 서비스에 대한 구체적인 가동 시간 보장 및 신뢰성 약속을 제공합니다.

사용 가능한 SLA 문서는 다음과 같습니다.