Amazon SageMaker Lakehouse 기능

페이지 주제

일반

일반

Apache Iceberg와 호환되는 도구 및 엔진을 사용하여 데이터를 현재 위치에서 액세스하고 쿼리할 수 있습니다. 선호하는 Apache Iceberg와 호환되는 엔진 및 도구를 사용하여 Apache Spark 추출, 전환, 적재(ETL) 작업부터 SQL 대시보드, 기계 학습(ML) 개인화 모델, 생성형 AI 애플리케이션에 이르는 다양한 분석 및 ML 사용 사례를 실행할 수 있습니다.

기존 데이터 아키텍처를 변경하지 않고도 데이터 레이크의 유연성과 데이터 웨어하우스의 성능을 활용할 수 있습니다. 고도로 최적화된 Amazon Redshift 스토리지 및 보조 데이터 구조(예: 구체화된 뷰)에 액세스하여 데이터 레이크의 SQL 분석 속도를 높일 수 있습니다.

워크로드에 가장 적합한 형식으로 데이터를 저장하면서 단일 데이터 복사본에서 SQL, Apache Spark, 비즈니스 인텔리전스(BI), AI/ML 도구 등 원하는 분석 도구 및 엔진을 실행할 수 있습니다.

Apache Iceberg 호환성을 통해 SageMaker Lakehouse의 모든 데이터는 고성능 SQL 분석을 위해 ACID(원자성, 일관성, 격리성, 내구성)를 완벽하게 준수합니다.

여러 서드 파티 소스에 저장된 데이터에 대해 연합 쿼리를 실행하여 데이터를 현재 위치에서 액세스하고 쿼리할 수 있습니다.

거의 실시간 분석을 위해 제로 ETL 통합을 사용하여 Amazon DynamoDB, Amazon Aurora MySQL, Amazon Aurora PostgreSQL, Amazon RDS for MySQL과 같은 운영 데이터베이스와 Salesforce, ServiceNow, Zendesk를 비롯한 애플리케이션의 데이터를 SageMaker Lakehouse로 가져올 수 있습니다.

통합 액세스 제어를 사용하여 SageMaker Lakehouse의 데이터를 보호하세요. 권한을 한 번 정의하면 이러한 권한이 모든 분석 도구 및 엔진의 모든 데이터에 적용됩니다.