Quản trị dữ liệu và AI của Amazon SageMaker

Khám phá, quản lý và cộng tác về dữ liệu và AI một cách an toàn

Tổng quan

Amazon SageMaker thế hệ mới giúp đơn giản hóa quy trình khai thác, quản trị và cộng tác dữ liệu và AI trên toàn bộ hồ dữ liệu, mô hình AI và ứng dụng của bạn. Người dùng có thể khám phá và truy cập dữ liệu cũng như mô hình đã được phê duyệt một cách an toàn với Amazon SageMaker được xây dựng trên Amazon DataZone thông qua chức năng tìm kiếm theo ngữ nghĩa sử dụng siêu dữ liệu tạo bằng AI tạo sinh hoặc bạn có thể yêu cầu Nhà phát triển Amazon Q sử dụng ngôn ngữ tự nhiên để giúp bạn tìm dữ liệu. Người dùng có thể xác định và thực thi các chính sách truy cập một cách nhất quán khi sử dụng một mô hình cấp quyền duy nhất với các kiểm soát truy cập chi tiết tập trung trong Studio thống nhất Amazon SageMaker (bản xem trước). Chia sẻ và cộng tác liền mạch về dữ liệu và tài sản AI thông qua quy trình đăng ký và xuất bản đơn giản. Với SageMaker, bạn có thể duy trì an toàn và bảo vệ cho các mô hình AI của mình bằng Quy tắc bảo vệ của Amazon Bedrock và triển khai các chính sách AI có trách nhiệm. Gây dựng tín nhiệm trong toàn tổ chức bằng cách giám sát và tự động hóa chất lượng dữ liệu, phát hiện dữ liệu nhạy cảm cũng như truy xuất nguồn gốc dữ liệu và máy học (ML).

Lợi ích

Khám phá dữ liệu và tài sản AI của bạn trên quy mô lớn với Danh mục SageMaker, được xây dựng trên Amazon Datazone. Tăng cường khám phá dữ liệu với AI tạo sinh để tự động làm phong phú dữ liệu và siêu dữ liệu của bạn với bối cảnh kinh doanh, giúp tất cả người dùng tìm, hiểu và sử dụng dữ liệu dễ dàng hơn. Chia sẻ dữ liệu, mô hình AI, câu lệnh và tài sản AI tạo sinh của bạn bằng cách lọc theo tên bảng và cột hoặc thuật ngữ trong chú giải thuật ngữ kinh doanh. Tự động đề xuất các cột có giá trị và các ứng dụng phân tích có liên quan cho từng tập dữ liệu, cho phép sử dụng dữ liệu phù hợp để nhanh chóng xây dựng các mô hình phù hợp. Hỗ trợ cả mô hình quản trị tập trung và phi tập trung với dữ liệu liền mạch và chia sẻ AI thông qua việc xuất bản và đăng ký quy trình làm việc trong một trải nghiệm duy nhất thông qua Dự án.

Có được sự tin tưởng thông qua khả năng hiển thị chất lượng dữ liệu, dữ liệu và dòng dữ liệu ML theo thời gian thực trong SageMaker. Tự động hóa lập hồ sơ dữ liệu và đề xuất chất lượng dữ liệu, giám sát các quy tắc chất lượng dữ liệu và nhận cảnh báo. Giải quyết các thách thức về chất lượng dữ liệu khó tìm bằng cách sử dụng các phương pháp tiếp cận dựa trên quy tắc và ML để đối chiếu các thực thể, từ đó bạn có thể cung cấp dữ liệu chất lượng cao để đưa ra quyết định kinh doanh tự tin. Tăng tính minh bạch trong các quy trình dữ liệu và các dự án AI với tính năng giám sát mô hình tích hợp để phát hiện sai lệch hoặc báo cáo cách các tính năng đóng góp vào dự đoán dựa trên mô hình của bạn.
Tập trung dữ liệu và bảo mật AI trong SageMaker với các điều khiển truy cập chi tiết, phân loại dữ liệu và quy tắc bảo vệ để đảm bảo dữ liệu, phân tích và mô hình AI được sử dụng một cách thích hợp. Xác định quyền một lần và thực thi chúng trên dữ liệu và mô hình. Với Amazon Bedrock IDE (bản xem trước) được tích hợp nguyên bản, khách hàng có thể sử dụng Quy tắc bảo vệ của Amazon Bedrock trong ứng dụng AI tạo sinh của họ bằng cách chặn nội dung có hại, lọc ảo giác và cho phép các biện pháp bảo vệ tùy chỉnh cho quyền riêng tư, bảo mật và độ chính xác. Tự động xác định thông tin nhạy cảm trong quy trình của bạn bằng Amazon Comprehend.
Đáp ứng kiểm toán và tuân thủ quy định với việc sử dụng dữ liệu và ghi nhật ký và giám sát mô hình. Hỗ trợ việc sử dụng có thể chấp nhận được các tài sản phân tích và AI của bạn trong toàn doanh nghiệp của bạn với cách ly dựa trên dự án. Hiểu cách sử dụng dữ liệu và mô hình trên hồ dữ liệu của bạn để tăng cường bảo mật. Sử dụng Amazon SageMaker Clarify để theo dõi các mô hình về độ lệch, độ chính xác và độ mạnh mẽ, phù hợp với các tiêu chuẩn AI có trách nhiệm của bạn. Điều chỉnh chi phí với các sáng kiến kinh doanh và cung cấp một cái nhìn rõ ràng về các khoản đầu tư kinh doanh của bạn.

Tính năng

Dữ liệu được tuyển chọn để đảm bảo ngữ cảnh và khả năng dễ tìm

Danh mục mang bối cảnh kinh doanh vào siêu dữ liệu kỹ thuật và cho phép bạn làm phong phú siêu dữ liệu của mình với bối cảnh kinh doanh. Bạn có thể hiển thị dữ liệu với ngữ cảnh kinh doanh để tất cả người dùng của bạn có thể nhanh chóng và dễ dàng tìm kiếm, hiểu và tin tưởng dữ liệu.

Đề xuất siêu dữ liệu tự động

Tự động thêm tên và mô tả hoạt động kinh doanh vào dữ liệu, qua đó giúp bạn dễ dàng hiểu ngữ cảnh và tránh xử lý các tên kỹ thuật khó hiểu. Tính năng tự động hóa này có sự hỗ trợ của các mô hình ngôn ngữ lớn (LLM) để tăng độ chính xác và tính nhất quán.

Mang lại mức độ an toàn AI nhất quán trên tất cả các ứng dụng của bạn

Quy tắc bảo vệ của Amazon Bedrock giúp đánh giá đầu vào của người dùng và phản hồi của FM dựa trên các chính sách theo trường hợp sử dụng cụ thể và cung cấp một lớp bảo vệ bổ sung bất kể mô hình nền tảng cơ bản là gì.

Nhanh chóng kiểm tra và theo dõi các mẫu

Nhanh chóng kiểm tra và khắc phục sự cố hiệu suất cho tất cả các mẫu, điểm cuối và tác vụ giám sát mẫu thông qua một chế độ xem hợp nhất. Theo dõi độ lệch so với hành vi mẫu dự kiến, cũng như các tác vụ giám sát bị thiếu hoặc không hoạt động bằng tính năng cảnh báo tự động.

Chất lượng dữ liệu

Với thống kê chất lượng dữ liệu, người dùng dữ liệu có thể xem các chỉ số chất lượng dữ liệu từ AWS hoặc các hệ thống của bên thứ ba. Người dùng dữ liệu có thể tin tưởng vào các nguồn dữ liệu mà họ sử dụng để đưa ra quyết định và có được bối cảnh chất lượng dữ liệu khi họ tìm kiếm tài nguyên. Các nhà tạo dữ liệu và đội ngũ CNTT cũng có thể sử dụng API để kết hợp số liệu thống kê về chất lượng dữ liệu từ các hệ thống của bên thứ ba vào một cổng thông tin hợp nhất, nằm ngoài bảng điều khiển.

Dữ liệu và dòng dữ liệu ML

Hiểu được diễn biến dữ liệu và các mô hình theo thời gian. Dòng dữ liệu có thể nâng cao độ tin cậy và hiểu biết về dữ liệu và AI của một tổ chức bằng cách giúp người sử dụng dữ liệu hiểu được nguồn gốc dữ liệu, lịch sử thay đổi của dữ liệu và việc sử dụng dữ liệu. Bạn có thể giảm thời gian dành cho việc ánh xạ tài sản dữ liệu và AI và các mối quan hệ của chúng, khắc phục sự cố và phát triển quy trình, cũng như xác nhận các biện pháp quản trị dữ liệu và AI.