Функции Amazon SageMaker Lakehouse

Темы страниц

Общие вопросы

Общие вопросы

Получайте доступ к данным и запрашивайте их по месту, используя инструменты и движки, совместимые с Apache Iceberg, по собственному выбору. Запускайте примеры использования для аналитики и искусственного интеллекта (от ETL-заданий Apache Spark до информационных панелей SQL, моделей персонализации машинного обучения (ML) и приложений генеративного искусственного интеллекта), применяя выбранные вами движки и инструменты, совместимые с Apache Iceberg.

Получите гибкость озера данных и производительность хранилища данных, не изменяя существующую архитектуру данных. Используйте максимально оптимизированное хранилище Amazon Redshift и вторичные структуры данных (например, материализованные представления) для ускорения SQL-аналитики в озерах данных.

Запускайте аналитические инструменты и движки по собственному выбору (например, SQL, Apache Spark, средства бизнес-аналитики, искусственного интеллекта и машинного обучения) на одной копии данных, сохраняя данные в формате, наиболее подходящем для ваших рабочих нагрузок.

За счет совместимости с Apache Iceberg все данные в SageMaker Lakehouse полностью поддерживают стандарт ACID (атомарность, согласованность, изолированность, долговечность), что обеспечивает высокую производительность SQL-аналитики.

Выполняйте федеративные запросы к данным, которые хранятся в различных сторонних источниках, чтобы получить доступ к необходимой информации и запросить ее по месту.

Перенесите данные из оперативных баз данных, таких как Amazon DynamoDB, Amazon Aurora MySQL, Amazon Aurora PostgreSQL, Amazon RDS для MySQL, и приложений, в том числе Salesforce, ServiceNow и Zendesk, в SageMaker Lakehouse через интеграцию с нулевым использованием ETL для аналитики почти в режиме реального времени.

Защитите данные в SageMaker Lakehouse с помощью встроенных средств контроля доступа. Установите разрешения один раз, и они будут применяться ко всем вашим данным во всех аналитических инструментах и движках.