Amazon SageMaker Lakehouse

안전한 개방형 통합 데이터 레이크하우스로 분석 및 AI를 단순화

SageMaker Lakehouse란 무엇인가요?

Amazon SageMaker Lakehouse는 Amazon Simple Storage Service(Amazon S3) 데이터 레이크와 Amazon Redshift 데이터 웨어하우스 전반의 모든 데이터를 통합합니다. 그러므로 데이터 복사본 하나로 효율적인 분석 및 AI/ML 애플리케이션을 구축할 수 있습니다. SageMaker Lakehouse는 모든 Apache Iceberg 호환 도구와 엔진을 통해 데이터를 현재 위치에서 액세스하고 쿼리할 수 있는 유연성을 제공합니다. 모든 분석 및 기계 학습(ML) 도구와 엔진에 적용되는 세분화된 권한을 정의하여 레이크하우스의 데이터를 보호할 수 있습니다. 제로 ETL 통합을 통해 운영 데이터베이스 및 애플리케이션의 데이터를 레이크하우스로 거의 실시간으로 가져올 수 있습니다. 또한 서드 파티 데이터 소스 전반에서 연합 쿼리 기능을 통해 데이터를 현재 위치에서 액세스하고 쿼리할 수 있습니다.

이점

SageMaker Lakehouse를 사용하여 Amazon S3 데이터 레이크와 Amazon Redshift 데이터 웨어하우스의 모든 데이터를 통합할 수 있습니다. 제로 ETL 통합을 통해 운영 데이터베이스 및 애플리케이션의 해당 데이터를 레이크하우스로 거의 실시간으로 가져올 수 있습니다. 수백 개의 커넥터를 사용하여 다양한 소스의 데이터를 통합할 수 있습니다. 또한 서드 파티 데이터 소스 전반에서 연합 쿼리 기능을 통해 데이터를 현재 위치에서 액세스하고 쿼리할 수 있습니다.
단일 데이터 복사본에서 모든 Apache Iceberg와 호환되는 도구를 사용하여 데이터를 현재 위치에서 액세스하고 쿼리할 수 있는 유연성을 확보할 수 있습니다. SQL, Apache Spark, 비즈니스 인텔리전스(BI), AI/ML 도구 등 원하는 분석 도구 및 엔진을 사용하고 Amazon S3 데이터 레이크 및 Amazon Redshift 데이터 웨어하우스에 저장된 단일 데이터 복사본으로 협업할 수 있습니다. SageMaker Lakehouse를 기존 데이터 아키텍처와 함께 사용하면 Apache Iceberg와 호환되는 선호하는 스토리지 형식 및 쿼리 엔진을 사용할 수 있습니다.
모든 분석 도구 및 엔진에서 모든 데이터에 적용되는 통합되고 세분화된 액세스 제어를 통해 데이터를 보호합니다. 권한을 한 번 정의하고 조직 전체에서 데이터를 자신 있게 공유합니다.

사용 사례

단일 데이터 복사본으로 분석 및 AI 이니셔티브를 위한 Amazon S3 데이터 레이크 및 Amazon Redshift 데이터 웨어하우스의 모든 데이터를 통합합니다. SageMaker Lakehouse를 사용하면 통합 액세스 제어를 통해 세분화된 권한을 정의하고 전체 조직에서 데이터의 단일 복사본을 안전하게 공유할 수 있습니다.
제로 ETL 통합을 통해 SageMaker Lakehouse의 운영 데이터베이스 및 애플리케이션 전반에서 거의 실시간으로 데이터에 액세스할 수 있습니다. Apache Iceberg를 지원하는 다양한 AWS 서비스, 오픈 소스/서드 파티 도구 및 엔진에서 데이터를 현재 위치에서 액세스하고 쿼리할 수 있습니다.
여러 Amazon Redshift 데이터 웨어하우스의 기존 데이터를 SageMaker Lakehouse로 가져와 Redshift 클러스터 및 작업 그룹에 저장된 데이터를 쿼리하고 조인할 수 있습니다. 여러 데이터 공유를 관리하지 않고도 추출, 전환, 적재(ETL) 프로세스, BI 보고, 필요 시 분석을 위한 워크로드를 확장할 수 있습니다.