Amazon SageMaker를 사용한 ML 거버넌스

액세스 제어 간소화 및 투명성 향상

ML 거버넌스가 필요한 이유

Amazon SageMaker AI는 ML을 책임감 있게 구현하는 데 유용한 목적별 거버넌스 도구를 제공합니다. 관리자는 Amazon SageMaker Role Manager를 사용하여 최소 권한을 몇 분 만에 정의할 수 있습니다. Amazon SageMaker Model Cards를 사용하면 개념 단계부터 배포 단계에 이르기까지 전체 수명주기에서 용도, 위험 등급 및 훈련 세부 정보와 같은 필수 모델 정보를 보다 손쉽게 캡처하고 검색하고 공유할 수 있습니다. Amazon SageMaker Model Dashboard는 프로덕션 환경에서 모델의 동작에 대한 정보를 한곳에서 제공합니다. Amazon SageMaker AI와 Amazon DataZone을 통합하면 ML 및 데이터 거버넌스를 더 쉽게 간소화할 수 있습니다.

SageMaker ML 거버넌스의 이점

엔터프라이즈급 보안 제어를 통해 몇 분 만에 ML 개발 환경을 프로비저닝하여 프로젝트의 ML 및 데이터 자산에 대한 액세스를 관리합니다.
기계 학습(ML) 실무자가 더 빨리 SageMaker를 사용하여 작업을 시작할 수 있도록 사용자 지정된 역할을 생성합니다.
모델 문서를 간소화하고 개념 단계부터 배포 단계까지 주요 가정, 특성 및 아티팩트에 대한 가시성을 제공합니다.
통합 보기를 통해 모든 모델, 엔드포인트 및 모델 모니터링 작업의 성능을 신속하게 감사하고 문제를 해결합니다. 자동화된 알림을 통해 예상되는 모델 동작과 누락되거나 비활성화된 모니터링 작업의 편차를 추적합니다.

Amazon DataZone 통합

제어 설정 및 프로비저닝

IT 관리자는 Amazon DataZone에서 회사와 사용 사례에 맞는 인프라 제어 및 권한을 정의할 수 있습니다. 그런 다음 몇 번의 클릭만으로 적절한 SageMaker 환경을 만들고 SageMaker Studio 내에서 개발 프로세스를 시작할 수 있습니다.

자산 검색 및 발견

SageMaker Studio에서 조직의 비즈니스 카탈로그에 있는 데이터 및 ML 자산을 효율적으로 검색하고 검색할 수 있습니다. 프로젝트에 사용해야 하는 자산을 구독하여 해당 자산에 대한 액세스를 요청할 수도 있습니다.

자산 검색 및 발견

자산 사용

구독 요청이 승인되면 JupyterLab 및 SageMaker Canvas를 사용하여 SageMaker Studio 내에서 데이터 준비, 모델 훈련, 특성 추출과 같은 ML 작업에 이러한 구독 자산을 사용할 수 있습니다.

자산 게시

ML 작업을 완료한 후에는 데이터, 모델 및 특성 그룹을 비즈니스 카탈로그에 게시하여 다른 사용자의 거버넌스 및 검색 기능을 지원할 수 있습니다.

자산 게시

권한 정의

ML 활동에 대한 권한 간소화

SageMaker Role Manager는 사전 구축된 AWS Identity and Access Management(IAM) 정책 카탈로그를 통해 ML 활동 및 페르소나에 대한 기본 권한 집합을 제공합니다. ML 활동에는 데이터 준비와 훈련이 포함될 수 있으며, 페르소나에는 ML 엔지니어와 데이터 사이언티스트가 포함될 수 있습니다. 기준 권한을 유지하거나 특정한 요구 사항에 따라 추가로 사용자 지정할 수 있습니다.

권한을 간소화하는 역할 관리자

IAM 정책 생성 자동화

몇 가지 셀프 구성 화면을 통해 네트워크 액세스 경계, 암호화 키 등 일반적인 거버넌스 구성을 빠르게 입력할 수 있습니다. 그러면 SageMaker Role Manager가 IAM 정책을 자동으로 생성합니다. AWS IAM 콘솔을 통해 생성된 역할과 관련 정책을 검색할 수 있습니다.

관리형 정책 연결

사용 사례에 대한 권한을 추가로 사용자 지정하려면, SageMaker Role Manager에서 생성하는 IAM 역할에 관리형 IAM 정책을 연결합니다. 또한 AWS 서비스 전반에서 역할을 식별하고 구성하는 데 유용한 태그를 추가할 수 있습니다.

관리형 정책 연결

문서 간소화

모델 정보 캡처

SageMaker Model Cards는 Amazon SageMaker 콘솔에서 모델 정보를 저장하는 리포지토리로, ML을 책임감 있게 구현할 수 있도록 모델 문서를 중앙 집중화하고 표준화하는 데 도움이 됩니다. 입력 데이터 세트, 훈련 환경 및 훈련 결과와 같은 훈련 세부 정보를 자동으로 채워 문서화 프로세스를 가속화할 수 있습니다. 모델 목적 및 성능 목표와 같은 세부 정보를 추가할 수도 있습니다.

sagemaker 콘솔의 모델 정보

평가 결과 시각화

편향 및 품질 지표와 같은 모델 평가 결과를 모델 카드에 첨부하고, 차트와 같은 시각화 요소를 추가하여 모델 성능에 대한 주요 인사이트를 얻을 수 있습니다.

평가 결과를 시각화하는 모델 카드

모델 카드 공유

모델 카드를 PDF 형식으로 내보내 비즈니스 관계자, 내부 팀 또는 고객과 보다 손쉽게 공유할 수 있습니다.

모델 모니터링

모델 동작 추적

SageMaker Model Dashboard는 배포된 모델과 엔드포인트에 대한 전반적인 개요 정보를 제공하므로, 한곳에서 리소스를 추적하고 동작 위반을 모델링할 수 있습니다. 데이터 품질, 모델 품질, 편향 드리프트 및 특성 귀속 드리프트의 네 가지 차원에서 모델 동작을 모니터링할 수 있습니다. SageMaker Model Dashboard는 Amazon SageMaker Model Monitor 및 Amazon SageMaker Clearify와의 통합을 통해 동작을 모니터링합니다.

모델 대시보드

알림 자동화

SageMaker Model Dashboard는 누락되고 비활성화된 모델 모니터링 작업과 모델 동작의 편차에 대한 알림을 설정하고 수신하는 통합 환경을 제공합니다.

알림 자동화

모델 편차 해결

개별 모델을 추가로 검사하고 시간 경과에 따라 모델 성능에 영향을 미치는 요인을 분석할 수 있습니다. 그런 다음 ML 실무자와 함께 시정 조치를 취할 수 있습니다.