Capacidades do Amazon Redshift

Forneça uma performance de preço incomparável em grande escala com o SQL para o seu data lakehouse

Obtenção de performance de preço, escalabilidade e segurança excepcionais

As instâncias RA3 maximizam a velocidade para workloads de alta performance que requerem grandes quantidades de capacidade de computação, com a flexibilidade de pagar por recursos de computação separadamente do armazenamento ao especificar o número de instâncias necessárias.

O armazenamento colunar, a compactação de dados e os mapas de zona reduzem a quantidade de E/S necessária para realizar consultas. Além da codificações padrão do setor, como LZO e Zstandard, o Amazon Redshift também oferece uma codificação de compressão desenvolvida com propósito específico, chamada AZ64, para tipos numéricos e de data e hora, proporcionando economia de armazenamento e performance otimizada nas consultas.

Fornece suporte para um número praticamente ilimitado de usuários concorrentes e consultas simultâneas, garantindo níveis consistentes de serviço ao adicionar capacidade temporária em segundos conforme a simultaneidade aumenta. Escale com impacto mínimo no custo, visto que cada cluster recebe até uma hora de créditos gratuitos de escalabilidade de simultaneidade por dia. Esses créditos gratuitos são suficientes para as necessidades de simultaneidade de 97% dos clientes.

Fornece suporte para um número praticamente ilimitado de usuários concorrentes e consultas simultâneas, garantindo níveis consistentes de serviço ao adicionar capacidade temporária em segundos conforme a simultaneidade aumenta. Escale com impacto mínimo no custo, visto que cada cluster recebe até uma hora de créditos gratuitos de escalabilidade de simultaneidade por dia. Esses créditos gratuitos são suficientes para as necessidades de simultaneidade de 97% dos clientes.

As visões materializadas do Amazon Redshift permitem que você alcance uma performance de consulta significativamente mais rápida para workloads de analytics iterativas ou previsíveis, como painéis e consultas de ferramentas de business intelligence (BI) e trabalhos de processamento de dados de extração, transformação e carregamento (ETL). Você pode usar as visões materializadas para armazenar e gerenciar resultados computados previamente de uma instrução SELECT, que pode referenciar uma ou mais tabelas, incluindo tabelas de data lake, de ETL zero e de compartilhamento de dados. Com a atualização incremental, o Amazon Redshift identifica as alterações na tabela de base ou nas tabelas que ocorreram após a atualização anterior e atualiza somente os registros correspondentes na visão materializada. Com a atualização incremental, o processo é mais rápido do que uma atualização completa e aprimora a performance da workload.

Garanta tempos de resposta inferiores a um segundo para consultas repetidas. Ferramentas de painéis, de visualização e de BI que executam consultas repetidas experimentam um aumento significativo na performance. Quando uma consulta é executada, o Amazon Redshift pesquisa o cache para ver se existe um resultado armazenado de uma consulta anterior. Se um resultado em cache for encontrado e os dados não tiverem sido alterados, o resultado em cache é retornado imediatamente, em vez de executar novamente a consulta.

Um novo e avançado mecanismo de classificação de tabelas que aprimora a performance de consultas repetitivas ao classificar automaticamente os dados com base nos filtros de consulta recebidos (por exemplo, vendas em uma região específica). Esse método acelera significativamente a performance das varreduras de tabelas em comparação aos métodos tradicionais.

Expanda os recursos de recuperação reduzindo o tempo necessário para o processo e garantindo a capacidade de recuperação automática sem perda de dados. Um data warehouse multi-AZ do Amazon Redshift maximiza a performance e o valor ao fornecer alta disponibilidade sem a necessidade de usar recursos de reserva, elevando sua disponibilidade para um SLA de 99,99%.

O Amazon Redshift permite configurar regras de firewall para controlar o acesso de rede a um cluster de data warehouse. Você pode executar o Amazon Redshift na Amazon Virtual Private Cloud (Amazon VPC) para isolar seu cluster de data warehouse em sua própria rede virtual e conectá-lo à sua infraestrutura de TI existente usando uma VPN IPsec criptografada padrão do setor.

Com poucos ajustes de parâmetro, é possível configurar o Amazon Redshift para usar o protocolo TLS na proteção dos dados em trânsito e criptografia AES-256 com aceleração de hardware para os dados em repouso. Se você optar por habilitar a criptografia dos dados em repouso, todos os dados gravados no disco serão criptografados, assim como qualquer backup. Por padrão, o Amazon Redshift cuida do gerenciamento de chaves.

A integração com o Centro de Identidade do IAM permite que as organizações forneçam suporte para a propagação de identidade confiável entre o Amazon Redshift, o Amazon QuickSight e o AWS Lake Formation. É possível usar a identidade da sua organização para acessar o Amazon Redshift em uma experiência de autenticação única, utilizando provedores de identidade (IdP) de entidades externas, como Microsoft Entra ID, Okta, Ping ou OneLogin, usando o QuickSight, o Editor de Consultas do Amazon Redshift e ferramentas de BI de entidades externas e editores SQL. Os administradores podem usar usuários e grupos de IdP de entidades externas para gerenciar o acesso detalhado aos dados em diversos serviços e auditar o acesso em nível de usuário no AWS CloudTrail. Com a propagação de identidade confiável, a identidade do usuário é transmitida sem complicações entre o QuickSight, o Amazon Redshift e o Lake Formation, reduzindo o tempo para obter insights e possibilitando uma experiência de analytics sem atritos.

Os controles de segurança granulares em nível de linha e de coluna asseguram que os usuários visualizem somente os dados aos quais têm permissão de acesso. O Amazon Redshift é integrado ao Lake Formation, garantindo que os controles de acesso em nível de coluna no Lake Formation também sejam aplicados para consultas do Amazon Redshift nos dados no data lake. O compartilhamento de dados do Amazon Redshift oferece suporte ao controle de acesso centralizado com o Lake Formation para simplificar a governança de dados compartilhados do Amazon Redshift. O Lake Formation é um serviço que facilita a criação de data lakes seguros, o gerenciamento centralizado de acessos granulares aos dados em todos os serviços consumidores e a aplicação de controles em nível de linha e de coluna. Com o mascaramento de dados dinâmico, é possível proteger os dados confidenciais ao limitar a quantidade de dados identificáveis ​​que ficam visíveis aos usuários. Defina diversos níveis de permissões nesses campos para que diferentes usuários e grupos possam ter diferentes níveis de acesso aos dados, sem que haja a necessidade de criar várias cópias dos dados, por meio da interface SQL conhecida do Amazon Redshift.

Revelação de insights ao usar o SQL em dados unificados no lakehouse

Analise todos os seus dados unificados usando SQL com a integração do Amazon Redshift no SageMaker Lakehouse. Realize consultas em dados do Amazon Simple Storage Service (Amazon S3) em formatos abertos, sem a necessidade de mover dados entre data lakes e data warehouses. Acesse seus dados do Amazon Redshift no SageMaker Lakehouse para habilitar o acesso às ferramentas de analytics da AWS e do Apache Iceberg, possibilitando uma análise de dados e de machine learning (ML) abrangente.

O Amazon Redshift oferece suporte para consultas somente leitura usando o SQL padrão ANSI conhecido nos formatos de tabela do Apache Iceberg, do Apache Hudi e do Delta Lake, além de consultar formatos de arquivo abertos, incluindo Apache Parquet, ORC, Avro, JSON e CSV diretamente no Amazon S3. O Apache Iceberg é um exemplo de formato de tabela de código aberto que fornece consistência transacional e organização aprimorada de data lakes por meio de sua estrutura de tabela. O Amazon Redshift Spectrum permite que você realiza a leitura de tabelas e de dados em formatos de dados abertos, como Parquet, no data lake, mantendo até exabytes de dados estruturados, semiestruturados e não estruturados no Amazon S3. Além disso, é possível exportar dados para o data lake usando o comando UNLOAD do Amazon Redshift, incluindo a opção de exportar para Parquet. A exportação de dados do Amazon Redshift para o seu data lake possibilita uma análise mais aprofundada dos dados com os serviços da AWS, como o Amazon Athena, o Amazon EMR e o SageMaker.

Use SQL para tornar seus dados e data lake do Amazon Redshift mais acessíveis para analistas de dados, engenheiros de dados e outros usuários de SQL com um workbench de analista baseado na Web para exploração e análise de dados. O Editor de Consultas permite que você visualize os resultados da consulta em uma única etapa, crie esquemas e tabelas, carregue dados como elementos visuais e navegue pelos objetos do banco de dados. Essa solução também fornece um editor intuitivo para criar e compartilhar consultas SQL, análises, visualizações e anotações, além de compartilhá-las com segurança com sua equipe.

Use o editor SQL integrado, com tecnologia do Amazon Redshift, no SageMaker Unified Studio, um único ambiente de desenvolvimento de dados e de IA, para consultar dados armazenados em data lakes, data warehouses, bancos de dados e aplicações.

Aceleração da tomada de decisões com analytics praticamente em tempo real

A integração sem código entre o Aurora, o Amazon Relational Database Service (Amazon RDS), o Amazon DynamoDB, as aplicações empresariais e o Amazon Redshift possibilita a realização de analytics imediatas e ML em petabytes de dados em bancos de dados e aplicações. Por exemplo, para dados gravados em fontes operacionais, transacionais ou de aplicações empresariais, as integrações ETL zero do Aurora com o Amazon Redshift tornam os dados disponíveis no Amazon Redshift sem complicações, minimizando a necessidade de criar e manter pipelines de ETL complexos.

Simplifique e automatize a ingestão de dados do Amazon S3, reduzindo o tempo e o esforço para o desenvolvimento de soluções personalizadas ou para o gerenciamento de serviços de entidades externas. Com esse recurso, o Amazon Redshift remove a necessidade de executar manualmente e de forma repetitiva os procedimentos de cópia, automatizando a ingestão de arquivos e gerenciando as etapas contínuas de carregamento de dados em segundo plano. O suporte à cópia automática facilita para usuários de áreas de negócios e analistas de dados, sem conhecimento em engenharia de dados, criarem regras de ingestão e configurarem a localização dos dados que desejam carregar do Amazon S3.

Use comandos SQL para estabelecer conexão e realizar a ingestão direta de dados do Amazon Kinesis Data Streams e do Amazon Managed Streaming for Apache Kafka (Amazon MSK). Além disso, a ingestão de transmissão do Amazon Redshift facilita a criação e o gerenciamento de pipelines downstream ao permitir que você crie visões materializadas diretamente sobre os fluxos. As visões materializadas também podem incluir transformações SQL como parte do seu pipeline de ELT. Você pode atualizar manualmente as visualizações materializadas definidas para consultar os dados de streaming mais recentes.

Consulte os dados ativos em uma ou mais instâncias do Amazon RDS, incluindo os bancos de dados com a edição compatível com PostgreSQL do Amazon Aurora, do Amazon Relational Database (Amazon RDS) para MySQL e com a edição compatível com MySQL do Amazon Aurora, para obter visibilidade instantânea de todas as operações de negócios sem a necessidade de movimentação de dados.

Obtenção de SQL analytics de forma simples, sem a necessidade de gerenciar infraestrutura

Execute análises em segundos e escale sem a necessidade de configurar e gerenciar a infraestrutura de data warehouse. A tecnologia de escalabilidade e de otimização orientada por IA (disponível em versão prévia) possibilita que o Amazon Redshift sem servidor provisione e escale a capacidade do data warehouse de forma automática e proativa, proporcionando uma performance mais rápida até mesmo para as workloads mais complexas. O sistema usa técnicas de IA para aprender os padrões de workload do cliente em todas as principais dimensões, como consultas simultâneas, complexidade das consultas, influxo de volume de dados e padrões de ETL. Em seguida, ajusta continuamente os recursos ao longo do dia e aplica otimizações de desempenho personalizadas. Você pode definir uma meta desejada de performance, e o data warehouse escala automaticamente para manter a performance consistente.

Os algoritmos sofisticados realizam a previsão e a classificação das consultas recebidas com base no tempo de execução e nas necessidades de recursos, gerenciando a performance e a concorrência de forma dinâmica, ao mesmo tempo em que ajudam a priorizar as workloads essenciais para o negócio. A aceleração de consultas breves (SQA) envia consultas breves de aplicações, como painéis, para uma fila expressa de processamento imediato, em vez de ficar aguardando a execução de consultas maiores. O gerenciamento automático de workloads (WLM) usa machine learning para gerenciar dinamicamente a memória e a concorrência, ajudando a maximizar o throughput das consultas. Além disso, é possível definir a prioridade das consultas mais importantes, mesmo quando centenas de consultas estão sendo enviadas. O Amazon Redshift Advisor faz recomendações quando uma ação explícita do usuário é necessária para potencializar ainda mais a performance do Amazon Redshift. Para as workloads dinâmicas, nas quais os padrões de consulta não são previsíveis, as visões materializadas automatizadas aprimoram o throughput das consultas, reduzem a latência das consultas e diminuem o tempo de execução por meio de atualização automática, reescrita automática de consultas, atualização incremental e monitoramento contínuo dos clusters do Amazon Redshift. A otimização automática de tabela seleciona as chaves de classificação e de distribuição para otimizar a performance da workload do cluster. Se o Amazon Redshift determinar que a aplicação de uma chave melhorará a performance do cluster, as tabelas serão alteradas automaticamente, sem a necessidade de intervenção do administrador. Os recursos adicionais de exclusão automática de vácuos, classificação automática de tabelas e análise automática removem a necessidade de manutenção manual e de ajustes nos clusters do Amazon Redshift, garantindo a melhor performance para novos clusters e workloads de produção.

Use uma API simples para interagir com o Amazon Redshift: o Amazon Redshift permite o acesso facilitado aos dados por meio de todos os tipos de aplicações, sejam elas tradicionais, nativas da nuvem, em contêineres, com tecnologia sem servidor, baseadas em serviços da Web e orientadas a eventos. A API de dados do Amazon Redshift simplifica o acesso, a ingestão e a saída de dados usando linguagens de programação e plataformas compatíveis com o AWS SDK, como Python, Go, Java, Node.js, PHP, Ruby e C++. A API de dados remove a necessidade de configurar drivers e gerenciar conexões de banco de dados. Em vez disso, é possível executar comandos SQL em um cluster do Amazon Redshift ao chamar um endpoint da API seguro fornecido pela API de dados. A Data API cuida do gerenciamento das conexões do banco de dados e do buffer dos dados. A Data API é assíncrona para que você possa recuperar seus resultados mais tarde. Os resultados da consulta são armazenados por 24 horas.

Execute consultas no console ou conecte ferramentas de cliente SQL, bibliotecas ou ferramentas de ciência de dados, incluindo QuickSight, Tableau, Microsoft Power BI, Alteryx, Querybook, caderno Jupyter, Informatica, dbt, MicroStrategy e Looker.

Contextualização de aplicações e aumento da produtividade dos usuários com a IA generativa

Use linguagem simples para realizar a gravação de consultas no Editor de Consultas do Amazon Redshift que geram recomendações de código SQL precisas e seguras dentro do escopo de suas permissões de acesso a dados.

O Amazon Redshift integra-se ao Amazon Bedrock sem complicações, habilitando funcionalidades de IA generativa diretamente por meio de comandos SQL padrão. Essa integração permite que equipes de dados usem modelos de base, como o Anthropic Claude e o Amazon Titan, para a execução de tarefas como a análise de texto,a tradução e a detecção de sentimento, sem adicionar complexidade à infraestrutura. Os usuários podem invocar modelos de IA com facilidade em seus fluxos de trabalho de data analytics existentes, transformando a maneira como os insights são extraídos dos dados empresariais.

O Amazon Redshift ML facilita para analistas de dados, cientistas de dados, profissionais de BI e desenvolvedores criar, treinar e implantar modelos do SageMaker usando SQL. Com o Amazon Redshift ML, é possível usar instruções SQL para criar e treinar modelos do SageMaker em seus dados no Amazon Redshift e, em seguida, usar esses modelos para realizar previsões como a detecção de rotatividade, a previsão financeira, a personalização e a pontuação de risco diretamente em suas consultas e relatórios. Integre a invocação de grandes modelos de linguagem no Amazon Redshift para tarefas avançadas de processamento de linguagem natural, como o resumo de textos, a extração de entidades e a análise de sentimentos, a fim de obter insights mais aprofundados dos seus dados usando SQL.