Amazon SageMaker 노트북

데이터를 탐색하고 ML 모델을 구축하기 위한 JupyterLab의 완전관리형 노트북

Amazon SageMaker 노트북이란 무엇인가요?

Amazon SageMaker Studio에서 완전관리형 JupyterLab을 몇 초 만에 시작할 수 있습니다. 노트북, 코드 및 데이터를 지원하는 통합 개발 환경(IDE)을 사용합니다. IDE의 빠른 시작 협업 노트북을 사용하면 SageMaker에서 목적별 ML 도구 및 기타 AWS 서비스에 액세스하여, Amazon EMR에서 Spark를 사용해 페타바이트 규모의 데이터를 준비하는 것부터 모델 훈련 및 디버깅, 모델 배포 및 모니터링, 파이프라인 관리에 이르기까지, 전체 ML 개발의 모든 작업을 하나의 웹 기반 시각적 인터페이스에서 실행할 수 있습니다. 작업을 중단하지 않고 컴퓨팅 리소스를 손쉽게 스케일 업하거나 스케일 다운합니다.

SageMaker 노트북의 이점

Amazon SageMaker Studio에서 완전관리형 JupyterLab을 몇 초 만에 시작합니다. SageMaker Studio는 PyTorch, TensorFlow, Keras 등의 딥 러닝 프레임워크와 NumPy, scikit-learn, panda 등의 인기 Python 패키지를 비롯하여 널리 사용되는 ML용 패키징이 포함된 SageMaker 배포판으로 사전 구성되어 있습니다.
업계에서 가장 다양한 클라우드용 컴퓨팅 최적화 및 GPU 가속 인스턴스 옵션을 사용하여 컴퓨팅 리소스를 스케일 업 또는 스케일 다운합니다.
생성형 AI 기반 코딩 도우미 및 보안 도구를 사용하여 고품질 코드를 더 빠르게 작성합니다. Amazon CodeWhisperer를 사용하여 소스 코드를 생성, 디버깅 및 설명하고, Amazon CodeGuru를 사용하여 보안 및 코드 품질 검사를 수행합니다.
동일한 노트북에 통합 분석과 ML 워크플로를 구축합니다. 노트북에서 바로 Amazon EMR 및 AWS Glue 서버리스 인프라의 대화형 Spark 작업을 실행합니다. 인라인 Spark UI를 사용하여 작업을 더 빠르게 모니터링하고 디버깅합니다. 몇 개의 간단한 단계로 노트북을 하나의 작업으로 예약하여 데이터 준비를 쉽게 자동화합니다.

대규모 ML 구축

빠른 시작

완전관리형 JupyterLab을 Studio에서 몇 초 만에 시작할 수 있습니다. SageMaker Studio는 PyTorch, TensorFlow, Keras 등의 딥 러닝 프레임워크와 모델 구축을 시작하는 데 도움이 되는 NumPy, scikit-learn, panda 등의 인기 Python 패키지를 비롯하여 널리 사용되는 ML용 패키징이 포함된 사전 구축된 SageMaker 배포판으로 사전 구성되어 있습니다.

Elastic Compute

작업을 중단하지 않고 기본 컴퓨팅 리소스를 스케일 업하거나 스케일 다운하고, 공유 영구 스토리지를 사용하여 컴퓨팅 환경을 전환할 수 있습니다. 가장 강력한 ML용 GPU 인스턴스를 비롯하여 AWS에서 제공하는 다양한 컴퓨팅 리소스 중에서 선택할 수 있습니다.

ML 개발 생산성 향상

데이터 준비

통합 환경으로 데이터 워크플로를 간소화합니다. JupyterLab에서 바로 Amazon EMR 클러스터 및 AWS Glue 대화형 세션을 생성하고 찾아보고 연결할 수 있습니다. 내장된 데이터 준비 기능을 사용하여 데이터를 시각화하고 데이터 품질을 개선합니다.

노트북 작업

SageMaker 노트북 작업을 사용하여 필요에 따라 또는 일정에 따라 실행되는 비대화형 작업을 생성할 수 있습니다. 직관적인 사용자 인터페이스 또는 SageMaker Python SDK를 사용하여 JupyterLab에서 바로 작업을 예약할 수 있습니다. 노트북을 선택하면 SageMaker Studio 노트북이 전체 노트북의 스냅샷을 생성하고 해당하는 종속성을 컨테이너로 패키지합니다. 그런 다음 인프라를 구축하고 실무자가 설정한 일정에 따라 노트북을 자동 작업으로 실행한 후 작업이 완료되면 인프라를 프로비저닝 해제합니다. SageMaker 노트북 작업은 Amazon SageMaker Pipelines의 기본 단계로도 제공되므로, 단 몇 줄의 코드로 CI/CD 배포에 대한 종속성이 포함된 다단계 워크플로로 노트북을 자동화할 수 있습니다.

AI 기반 도구

Amazon Q Developer는 SageMaker 기능, 코드 생성 도우미, JupyterLab 환경에서의 문제 해결 지원에 대한 '사용 방법' 지침을 제공합니다. "실시간 추론을 위해 SageMaker 엔드포인트에 모델을 배포하려면 어떻게 해야 하나요?"와 같이 자연어로 질문하기만 하면 Amazon Q Developer가 시작하는 데 도움이 되는 단계별 지침과 코드를 제공합니다. 코드를 실행하는 동안 오류가 발생하면 Amazon Q Developer가 도움을 줍니다. 오류 수정을 요청하면 문제를 디버깅하고 해결하기 위한 자세한 단계가 제공됩니다.

유연성 및 사용자 지정

팀을 위해 구축

AWS IAM Identity Center(AWS Single Sign-On의 후속 서비스)를 사용하여 팀원들의 SageMaker Studio 노트북 액세스 권한을 설정합니다. SageMaker Studio의 비용과 사용량을 플랫폼 관리자와 비즈니스 리더가 모니터링할 수 있는 별도의 환경을 만듭니다. 팀원들이 실시간으로 노트북을 읽고, 편집하고, 실행할 수 있는 공유 공간을 만들어 손쉽게 협업하고 커뮤니케이션할 수 있도록 합니다. 팀원들이 정보를 서로 주고받지 않고도 결과를 함께 검토하면서 모델 성능을 즉시 파악할 수 있습니다. BitBucket 및 AWS CodeCommit과 같은 서비스를 기본적으로 지원하므로 팀원들이 다양한 노트북 버전을 손쉽게 관리하고 시간 경과에 따른 변화를 비교할 수 있습니다. 모든 리소스가 자동으로 태깅되므로 AWS Budgets 및 AWS Cost Explorer와 같은 도구를 사용하여 비용을 모니터링하고 예산 계획을 수립할 수 있습니다.

사용자 지정 가능

사용자 지정 도커 이미지를 사용하여 자신만의 노트북 개발 환경을 SageMaker Studio로 가져올 수 있습니다. 수명 주기 구성을 사용하여 팀에 맞게 노트북 환경을 자동화하고 사용자 지정할 수 있습니다.

독립 실행형 노트북 인스턴스

익숙하고 신뢰하는 독립형 Jupyter Notebook을 완전관리형 SageMaker 서비스에서 사용합니다. 컴퓨팅 리소스를 설정하고, 데이터 과학 및 ML 패키지를 업그레이드하고, 보안 패치를 적용해야 하는 번거로움에서 벗어날 수 있습니다. SageMaker 노트북 인스턴스를 사용하면 최신 오픈 소스 소프트웨어로 컴퓨팅 환경을 안전하게 보호하면서 ML에만 전적으로 집중할 수 있습니다.