Amazon SageMaker Lakehouse

Đơn giản hóa quá trình phân tích và AI với hồ dữ liệu tích hợp thống nhất, mở và an toàn

Hồ dữ liệu tích hợp SageMaker là gì?

Hồ dữ liệu Amazon SageMaker thống nhất tất cả dữ liệu của bạn trên các hồ dữ liệu Amazon Simple Storage Service (Amazon S3) và kho dữ liệu Amazon Redshift, từ đó giúp bạn xây dựng các ứng dụng phân tích và AI/ML mạnh mẽ trên một bản sao dữ liệu duy nhất. Hồ dữ liệu tích hợp SageMaker cho phép bạn truy cập và truy vấn dữ liệu tại chỗ một cách linh hoạt bằng tất cả công cụ và máy phân tích tương thích với Apache Iceberg. Bảo mật dữ liệu của bạn trong hồ dữ liệu bằng cách xác định quyền chi tiết được thực thi trên tất cả các công cụ và phương tiện phân tích cũng như máy học (ML). Đưa dữ liệu từ các ứng dụng và cơ sở dữ liệu vận hành vào hồ dữ liệu của bạn gần như theo thời gian thực thông qua tích hợp không ETL. Ngoài ra, truy cập và truy vấn dữ liệu tại chỗ nhờ khả năng truy vấn liên kết trên các nguồn dữ liệu của bên thứ ba.

Lợi ích

Hợp nhất tất cả dữ liệu của bạn trên các hồ dữ liệu Amazon S3 và kho dữ liệu Amazon Redshift với SageMaker Lakehouse. Mang dữ liệu của bạn từ cơ sở dữ liệu và ứng dụng liên quan đến vận hành vào hồ dữ liệu trong thời gian gần như thời gian thực thông qua tích hợp không ETL. Bạn có thể sử dụng hàng trăm đầu nối để tích hợp dữ liệu từ nhiều nguồn khác nhau. Ngoài ra, bạn có thể truy cập và truy vấn dữ liệu tại chỗ với khả năng truy vấn liên kết trên các nguồn dữ liệu của bên thứ ba.
Mang đến khả năng linh hoạt để truy cập và truy vấn dữ liệu của bạn tại chỗ với tất cả các công cụ tương thích với Apache Iceberg trên một bản sao dữ liệu duy nhất. Bạn có thể sử dụng các công cụ phân tích và công cụ tùy chọn, chẳng hạn như SQL, Apache Spark, Business Intelligence (BI) và các công cụ AI/ML, đồng thời cộng tác với dữ liệu được lưu trữ trên các hồ dữ liệu Amazon S3 và kho dữ liệu Amazon Redshift. SageMaker Lakehouse với kiến trúc dữ liệu hiện có của bạn, cho phép bạn sử dụng các định dạng lưu trữ và công cụ truy vấn ưa thích, tương thích với Apache Iceberg.
Bảo mật dữ liệu của bạn với các biện pháp kiểm soát truy cập tích hợp, chi tiết được thực thi trên tất cả dữ liệu của bạn trong tất cả các công cụ và công cụ phân tích. Xác định quyền một lần và tự tin chia sẻ dữ liệu trên toàn tổ chức của bạn.

Trường hợp sử dụng

Hợp nhất tất cả dữ liệu của bạn trên các hồ dữ liệu Amazon S3 và kho dữ liệu Amazon Redshift cho các sáng kiến phân tích và AI của bạn với một bản sao dữ liệu duy nhất. Với các kiểm soát truy cập tích hợp, SageMaker Lakehouse cho phép bạn xác định các quyền chi tiết và chia sẻ một bản sao dữ liệu một cách an toàn trên toàn bộ tổ chức.
Truy cập dữ liệu gần thời gian thực trên cơ sở dữ liệu hoạt động và ứng dụng trong SageMaker Lakehouse thông qua tích hợp không ETL. Truy cập và truy vấn dữ liệu của bạn tại chỗ, từ một loạt các dịch vụ AWS cũng như các công cụ mã nguồn mở và các công cụ của bên thứ ba hỗ trợ Apache Iceberg.
Đưa dữ liệu hiện có từ nhiều kho dữ liệu Amazon Redshift vào SageMaker Lakehouse để truy vấn và tham gia dữ liệu được lưu trữ trong các cụm và nhóm làm việc Redshift. Mở rộng khối lượng công việc của bạn cho các quy trình trích xuất, chuyển đổi và tải (ETL), báo cáo BI và phân tích khi cần thiết mà không cần quản lý nhiều chia sẻ dữ liệu.