- Análisis›
- Amazon Redshift›
- Características de Amazon Redshift
Capacidades de Amazon Redshift
Ofrecer una relación precio/rendimiento inigualable a escala con SQL para su almacén de lago de datosPage Topics
Obtención de un precio, una escalabilidad y una seguridad excepcionales Obtención de información con SQL a través de datos unificados en el lakehouse Aceleración de la toma de decisiones con análisis casi en tiempo real Obtención de análisis de SQL sencillos sin administrar la infraestructura Contextualización de las aplicaciones y aumento de la productividad de los usuarios con IA generativaObtención de un precio, una escalabilidad y una seguridad excepcionales
Instancias RA3
Las instancias RA3 maximizan la velocidad para cargas de trabajo con rendimiento intensivo que necesitan grandes volúmenes de capacidad informática, con la flexibilidad de pagar los recursos informáticos por separado del almacenamiento especificando el número de instancias que necesita.
Almacenamiento eficiente y procesamiento de consultas de alto rendimiento
El almacenamiento en columnas, la compresión de datos y las asignaciones de zona reducen la cantidad de operaciones de E/S necesarias para realizar consultas. Además de las codificaciones estándar del sector, como LZO y Zstandard, Amazon Redshift también ofrece la codificación de compresión AZ64, elaborada específicamente para los tipos numéricos y de fecha y hora, con el fin de proporcionar ahorros en el almacenamiento y rendimiento de consultas optimizado.
Escalado de simultaneidad
Admite consultas y usuarios simultáneos prácticamente ilimitados con niveles de servicio estables mediante la incorporación de capacidad transitoria en segundos a medida que aumenta la simultaneidad. Amplíe con un impacto mínimo en los costos, ya que cada clúster gana hasta una hora de créditos gratuitos de escalado simultáneo por día. Estos créditos gratuitos son suficientes para cubrir las necesidades de simultaneidad del 97 % de los clientes.
Escritura en múltiples almacenamientos de datos mediante uso compartido de datos
Admite consultas y usuarios simultáneos prácticamente ilimitados con niveles de servicio estables mediante la incorporación de capacidad transitoria en segundos a medida que aumenta la simultaneidad. Amplíe con un impacto mínimo en los costos, ya que cada clúster gana hasta una hora de créditos gratuitos de escalado simultáneo por día. Estos créditos gratuitos son suficientes para cubrir las necesidades de simultaneidad del 97 % de los clientes.
Vistas materializadas
Las vistas materializadas de Amazon Redshift permiten lograr un rendimiento de consultas notablemente más rápido para las cargas de trabajo de análisis iterativas o predecibles, como la preparación de paneles y las consultas desde herramientas de inteligencia empresarial (BI), y los trabajos de procesamiento para extraer, transformar y cargar (ELT) datos. Puede utilizar las vistas materializadas para almacenar y administrar los resultados precalculados de una instrucción SELECT que puede hacer referencia a una o más tablas, incluidas las tablas de lagos de datos, sin ETL y las tablas externas. Con la actualización incremental, Amazon Redshift identifica los cambios en la tabla o tablas base que se produjeron después de la actualización anterior y actualiza únicamente los registros correspondientes en la vista materializada. La actualización incremental se ejecuta más rápido que una actualización completa y mejora el rendimiento de la carga de trabajo.
Almacenamiento en caché de resultados
Proporcione tiempos de respuesta inferiores a un segundo para consultas repetidas. Las herramientas de panel, visualización y BI que ejecutan consultas repetidas experimentan un importante aumento del rendimiento. Cuando se ejecuta una consulta, Amazon Redshift busca en la caché para saber si hay un resultado almacenado de una consulta anterior. Si se encuentra un resultado almacenado en caché y los datos no han cambiado, se recupera inmediatamente el resultado almacenado en caché en lugar de volver a ejecutar la consulta.
Diseños de datos multidimensionales (MDDL)
Un nuevo y eficaz mecanismo de clasificación de tablas que mejora el rendimiento de las consultas repetitivas al ordenar automáticamente los datos en función de los filtros de consultas entrantes (por ejemplo, ventas en una región específica). Este método acelera significativamente el rendimiento de los escaneos de tablas en comparación con los métodos tradicionales.
Multi-AZ
Amplíe las capacidades de recuperación al reducir el tiempo de recuperación y garantizar la capacidad de recuperación automática sin pérdida de datos. Un almacén de datos multi-AZ de Amazon Redshift aumenta el rendimiento y el valor al brindar alta disponibilidad sin tener que utilizar recursos en espera, lo que aumenta su disponibilidad al 99,99 % del SLA.
Aislamiento de red
Amazon Redshift le permite configurar las reglas del firewall para controlar el acceso de red al clúster de almacenamiento de datos. Puede ejecutar Amazon Redshift en Amazon Virtual Private Cloud (Amazon VPC) para aislar el clúster del almacén de datos en su propia red virtual y conectarlo a la infraestructura de TI existente empleando una conexión IPsec VPN cifrada estándar del sector.
Cifrado de extremo a extremo
Con tan solo ajustar un par de parámetros, puede configurar Amazon Redshift para que utilice TLS para proteger los datos en tránsito y el cifrado AES-256 con aceleración por hardware para los datos en reposo. Si decide habilitar el cifrado de los datos en reposo, todos los datos que se graben en el disco y las copias de seguridad se cifrarán. De forma predeterminada, Amazon Redshift se ocupa de la administración de claves.
Identidad unificada con integración de AWS IAM Identity Center
La integración con IAM Identity Center permite a las organizaciones respaldar la propagación de identidades confiables entre Amazon Redshift, Amazon QuickSight y AWS Lake Formation. Puede usar la identidad de su organización para acceder a Amazon Redshift en una experiencia de inicio de sesión único mediante proveedores de identidades (IdP) de terceros, como Microsoft Entra ID, Okta, Ping o OneLogin, desde Amazon QuickSight, Amazon Redshift Query Editor, herramientas de BI y editores de SQL de terceros. Los administradores pueden utilizar usuarios y grupos de IdP de terceros para gestionar el acceso detallado a los datos en todos los servicios y auditar el acceso a nivel de usuario en AWS CloudTrail. Con la propagación de identidades de confianza, la identidad de un usuario se transfiere sin problemas entre QuickSight, Amazon Redshift y Lake Formation, lo que reduce el tiempo necesario para obtener información y permite una experiencia de análisis sin problemas.
Controles de acceso pormenorizado
Los controles pormenorizados de seguridad de nivel de columnas y filas garantizan que los usuarios solo vean los datos a los cuales deberían tener acceso. Amazon Redshift se integra a Lake Formation, lo que garantiza que los controles de acceso de nivel de columnas en Lake Formation también se apliquen a las consultas de Amazon Redshift en los datos del lago de datos. El uso compartido de datos de Amazon Redshift es compatible con el control de acceso centralizado con Lake Formation para simplificar la gobernanza de datos compartidos desde Amazon Redshift. Lake Formation es un servicio que facilita la configuración de lagos de datos seguros, para administrar de forma centralizada el acceso pormenorizado a los datos en todos los servicios de consumo, así como para aplicar controles a nivel de fila y de columna. Con el enmascaramiento de datos dinámico, proteja sus datos confidenciales limitando la cantidad de datos identificables visibles para los usuarios. Defina varios niveles de permisos en estos campos para que distintos usuarios y grupos puedan tener distintos niveles de acceso a los datos sin tener que crear varias copias de los datos, todo ello a través de la conocida interfaz SQL de Amazon Redshift.
Obtención de información con SQL a través de datos unificados en el lakehouse
Integración en Amazon SageMaker Lakehouse
Analice todos sus datos unificados mediante SQL con la integración de Amazon Redshift en SageMaker Lakehouse. Consulte los datos de Amazon Simple Storage Service (Amazon S3) en formatos abiertos, lo que elimina el movimiento de datos entre lagos y almacenes. Abra sus datos de Amazon Redshift en SageMaker Lakehouse para permitir el acceso a las herramientas de análisis de AWS y Apache Iceberg, lo que permite el análisis integral de datos y machine learning (ML).
Soporte de consultas de lago de datos para formatos de tablas y datos abiertos, incluido Apache Iceberg
Amazon Redshift admite consultas de solo lectura con ANSI SQL conocido en formatos de tabla Apache Iceberg, Apache Hudi y Delta Lake, y consulta formatos de archivos abiertos, incluidos Apache Parquet, ORC, Avro, JSON y CSV, directamente en Amazon S3. Apache Iceberg es un ejemplo de formato de tabla de código abierto que proporciona coherencia transaccional y una mejor organización de los lagos de datos a través de su estructura de tablas. Amazon Redshift Spectrum le permite leer tablas y datos en formatos de datos abiertos, como Parquet, en su lago de datos y, al mismo tiempo, conservar hasta exabytes de datos estructurados, semiestructurados y no estructurados en Amazon S3. También puede exportar datos a su lago de datos mediante el comando UNLOAD de Amazon Redshift, que incluye la opción de exportar a Parquet. Exportar datos desde Amazon Redshift de regreso a un lago de datos le permite analizar los datos en mayor medida con servicios de AWS como Amazon Athena, Amazon EMR y SageMaker.
Amazon Redshift Query Editor
Utilice SQL para que los datos y los lagos de datos de Amazon Redshift sean más accesibles para los analistas de datos, los ingenieros de datos y otros usuarios de SQL con una mesa de trabajo de analistas basada en la Web para la exploración y el análisis de datos. Editor de consultas le permite visualizar los resultados de las consultas con un solo paso, crear esquemas y tablas, cargar datos de forma visual y explorar objetos de bases de datos. También proporciona un editor intuitivo para crear consultas, análisis, visualizaciones y anotaciones de SQL, y compartirlos de forma segura con su equipo.
Amazon SageMaker Unified Studio (versión preliminar)
Utilice el editor SQL integrado con tecnología de Amazon Redshift en SageMaker Unified Studio, un entorno de desarrollo de datos e IA, para consultar los datos almacenados en lagos de datos, almacenes de datos, bases de datos y aplicaciones.
Aceleración de la toma de decisiones con análisis casi en tiempo real
Soporte de copia automática de Amazon S3
Simplifique y automatice la ingesta de datos desde Amazon S3 y reduzca el tiempo y el esfuerzo para crear soluciones personalizadas o administrar servicios de terceros. Con esta característica, Amazon Redshift elimina la necesidad de ejecutar de manera manual y repetida procedimientos de copia al automatizar la ingesta de archivos y encargarse de los pasos de carga de datos continua entre bastidores. La compatibilidad con la copia automática permite a usuarios de negocio y analistas de datos, incluso sin experiencia en ingeniería de datos, crear reglas de ingesta y configurar fácilmente las ubicaciones de los datos que desean cargar desde Amazon S3.
Ingesta de streaming de Amazon RedShift
Utilice SQL para conectarse a datos de Amazon Kinesis Data Streams y Amazon Managed Streaming para Apache Kafka (Amazon MSK) e ingerir directamente esos datos. La ingesta de streaming de Amazon Redshift facilita las canalizaciones de datos al permitirle crear vistas materializadas sobre los flujos directamente. Las vistas materializadas también pueden incluir transformaciones SQL como parte de la canalización ELT. Puede actualizar de manera manual vistas materializadas definidas para consultar los datos de streaming más recientes.
Consulta federada
Realice consultas de datos en tiempo real desde una o varias instancias de Amazon RDS, entre las que se incluyen Amazon Aurora compatible con PostgreSQL, Amazon RDS para MySQL y Amazon Aurora compatible con MySQL. Obtenga visibilidad instantánea de todas las operaciones empresariales sin necesidad de mover los datos.
Obtención de análisis de SQL sencillos sin administrar la infraestructura
Sin servidor
Ejecute análisis en segundos y escale sin necesidad de configurar y gestionar la infraestructura de almacenamiento de datos. La tecnología de escalado y optimización basada en inteligencia artificial (disponible en versión preliminar) permite a Amazon Redshift sin servidor aprovisionar y escalar de forma automática y proactiva la capacidad del almacén de datos, lo que ofrece un rendimiento rápido incluso para las cargas de trabajo más exigentes. El sistema utiliza técnicas de inteligencia artificial para aprender los patrones de carga de trabajo de los clientes en dimensiones clave, como las consultas simultáneas, la complejidad de las consultas, la afluencia de volumen de datos y los patrones de ETL. A continuación, ajusta continuamente los recursos a lo largo del día y aplica optimizaciones de rendimiento personalizadas. Puede establecer un objetivo de rendimiento deseado y el almacenamiento de datos se escalará automáticamente para mantener un rendimiento consistente.
Autonomía
Algoritmos sofisticados que predicen y clasifican las consultas entrantes en función de sus tiempos de ejecución y los requisitos de los recursos para administrar de forma dinámica el rendimiento y la simultaneidad, mientras también lo ayudan a priorizar las cargas de trabajo clave para la empresa. La aceleración de consultas cortas (SQA) envía consultas breves a partir de aplicaciones como paneles a una cola rápida para que se procesen inmediatamente, en vez de quedar estancadas detrás de consultas largas. La administración automática de cargas de trabajo (WLM) emplea el ML para administrar la memoria y la simultaneidad de forma dinámica, lo que ayuda a maximizar el rendimiento de consultas. Además, ahora puede definir la prioridad de las consultas más importantes, inclusive cuando se envían cientos de ellas. Amazon Redshift Advisor hace recomendaciones cuando se necesita una acción explícita del usuario para impulsar aún más el rendimiento de Amazon Redshift. Para cargas de trabajo dinámicas donde los patrones de consulta no son predecibles, las vistas materializadas automatizadas mejoran el rendimiento de las consultas, reducen la latencia de estas y disminuyen el tiempo de ejecución mediante la actualización automática, la reescritura automática de las consultas, la actualización progresiva y la supervisión continua de los clústeres de Amazon Redshift. La optimización automática de tablas selecciona las claves de organización y distribución para optimizar el rendimiento de la carga de trabajo del clúster. Si Amazon Redshift determina que la aplicación de una clave mejorará el rendimiento del clúster, las tablas se modificarán automáticamente sin necesidad de que el administrador intervenga. Las características adicionales de eliminación automática de limpieza, clasificación automática de tablas y análisis automático eliminan la necesidad de realizar un mantenimiento manual y de efectuar ajustes en los clústeres de Amazon Redshift para obtener el mejor rendimiento para los nuevos clústeres y las cargas de trabajo de producción.
API de datos
Utilice una API simple para interactuar con Amazon Redshift: Amazon Redshift permite acceder fácilmente a los datos con todos los tipos de aplicaciones web tradicionales, nativas en la nube, en contenedores, sin servidor, basadas en servicios y basadas en eventos. La API de datos de Amazon Redshift simplifica el acceso a los datos, su ingesta y egreso desde lenguajes de programación y plataformas compatibles con el AWS SDK, como Python, Go, Java, Node.js, PHP, Ruby y C++. La API de datos elimina la necesidad de configurar controladores y de administrar conexiones de bases de datos. En cambio, puede ejecutar comandos SQL en un clúster de Amazon Redshift mediante una llamada a un punto de conexión de API asegurado, proporcionado por la API Datos. La API Datos se encarga de administrar las conexiones de la base de datos y de almacenar los datos en búfer. La API Datos es asincrónica, por lo que puede recuperar sus resultados luego. Los resultados de la consulta se conservan por 24 horas.
Integración con herramientas de ETL y BI de terceros
Ejecute consultas en la consola o conecte herramientas de cliente SQL, bibliotecas o herramientas de ciencia de datos, como QuickSight, Tableau, Microsoft Power BI, Alteryx, Querybook, cuaderno de Jupyter, Informatica, dbt, MicroStrategy y Looker.
Contextualización de las aplicaciones y aumento de la productividad de los usuarios con IA generativa
SQL generativo de Amazon Q en Query Editor
Utilice un inglés sencillo para escribir consultas en Amazon Redshift Query Editor que generen de forma segura recomendaciones de código SQL precisas dentro del ámbito de sus permisos de acceso a los datos.
ML de Amazon Redshift
El ML de Amazon Redshift facilita la creación, la formación y el despliegue de modelos de SageMaker mediante SQL a los analistas de datos, los científicos de datos, los profesionales de BI y los desarrolladores. Con el ML de Amazon Redshift, puede utilizar instrucciones SQL para crear y formar modelos de SageMaker a partir de los datos de Amazon Redshift y, luego, utilizar esos modelos para hacer predicciones, como la detección de la deserción de clientes, los pronósticos financieros, la personalización y la puntuación de riesgos directamente en sus consultas e informes. Incorpore modelos de lenguaje extensos en Amazon Redshift para realizar tareas avanzadas de procesamiento del lenguaje natural, como el resumen de texto, la extracción de entidades y el análisis de opiniones, para obtener información más profunda de sus datos mediante SQL.