- Analytik›
- Amazon Redshift›
- Amazon Redshift – Funktionen
Funktionen von Amazon Redshift
Mit SQL für Ihr Data Lakehouse ein unübertroffenes Preis-Leistungs-Verhältnis in großem Maßstab erzielenPage Topics
Außergewöhnliches Preis-Leistungs-Verhältnis, Skalierbarkeit und Sicherheit erzielen Mit SQL Einblicke in vereinheitlichte Daten im Lakehouse gewinnen Die Entscheidungsfindung mit Analytik nahezu in Echtzeit beschleunigen Einfache SQL-Analytik erhalten, ohne die Infrastruktur verwalten zu müssen Anwendungen kontextualisieren und Benutzerproduktivität mit generativer KI steigernAußergewöhnliches Preis-Leistungs-Verhältnis, Skalierbarkeit und Sicherheit erzielen
RA3-Instances
RA3-Instances maximieren die Geschwindigkeit für leistungsintensive Workloads, die große Mengen an Rechenkapazität erfordern, und bieten die Flexibilität, Rechenressourcen unabhängig vom Speicher zu bezahlen, indem Sie die Anzahl der benötigten Instances angeben.
Effiziente Speicherung und leistungsstarke Abfrageverarbeitung
Spaltenbasierte Speicherung, Datenkomprimierung und Zonenzuordnungen verringern den E/A-Aufwand bei der Ausführung von Abfragen. Neben den Branchenstandards für die Codierung wie LZO und Zstandard ermöglicht Amazon Redshift auch die speziell entwickelte Komprimierungscodierung AZ64 für numerische und Datums-/Uhrzeitdaten und schafft somit sowohl Speichereinsparungen als auch eine optimierte Abfrageleistung.
Nebenläufigkeitsskalierung
Unterstützt praktisch eine unbegrenzte Anzahl gleichzeitiger Benutzer und gleichzeitiger Abfragen mit gleichbleibenden Service-Levels, indem es bei zunehmender Gleichzeitigkeit innerhalb von Sekunden vorübergehende Kapazitäten hinzufügt. Skalieren Sie mit minimalen Auswirkungen auf die Kosten, da jeder Cluster bis zu einer Stunde kostenlose Nebenläufigkeitsskalierungs-Credits pro Tag erhält. Diese kostenlosen Credits reichen für die Nebenläufigkeitsanforderungen von 97 % der Kunden aus.
Schreibvorgänge in mehreren Data Warehouses durch gemeinsame Datennutzung
Unterstützt praktisch eine unbegrenzte Anzahl gleichzeitiger Benutzer und gleichzeitiger Abfragen mit gleichbleibenden Service-Levels, indem es bei zunehmender Gleichzeitigkeit innerhalb von Sekunden vorübergehende Kapazitäten hinzufügt. Skalieren Sie mit minimalen Auswirkungen auf die Kosten, da jeder Cluster bis zu einer Stunde kostenlose Nebenläufigkeitsskalierungs-Credits pro Tag erhält. Diese kostenlosen Credits reichen für die Nebenläufigkeitsanforderungen von 97 % der Kunden aus.
Materialisierte Ansichten
Mit den materialisierten Ansichten von Amazon Redshift erreichen Sie eine deutlich schnellere Abfrageleistung für iterative oder vorhersehbare Analytik-Workloads wie Dashboarding und Abfragen von Business-Intelligence-Tools (BI) sowie Datenverarbeitungsaufträgen von Extract, Transform, Load (ETL). Sie können materialisierte Ansichten verwenden, um vorberechnete Ergebnisse einer SELECT-Anweisung zu speichern und zu verwalten, die sich auf eine oder mehrere Tabellen beziehen kann, einschließlich Data-Lake-, Null-ETL- und Data-Sharing-Tabellen. Bei der inkrementellen Aktualisierung identifiziert Amazon Redshift Änderungen in der Basistabelle oder den Basistabellen, die nach der vorherigen Aktualisierung stattgefunden haben, und aktualisiert nur die entsprechenden Datensätze in der materialisierten Ansicht. Eine inkrementelle Aktualisierung wird schneller ausgeführt als eine vollständige Aktualisierung und verbessert die Workload-Leistung.
Ergebnis-Caching
Bieten Sie Antwortzeiten von weniger als einer Sekunde für wiederholte Abfragen. Dashboard-, Visualisierungs- und BI-Tools, die wiederholte Abfragen ausführen, erzielen bedeutende Leistungssteigerungen. Wenn eine Abfrage ausgeführt wird, durchsucht Amazon Redshift den Cache nach zwischengespeicherten Ergebnissen aus einer vorherigen Ausführung. Wenn ein zwischengespeichertes Ergebnis gefunden wird und sich die Daten nicht geändert haben, wird das zwischengespeicherte Ergebnis sofort zurückgegeben, ohne die Abfrage erneut auszuführen.
Mehrdimensionale Datenlayouts (MDDL)
Ein neuer leistungsstarker Tabellensortiermechanismus, der die Leistung von sich wiederholenden Abfragen verbessert, indem er die Daten automatisch auf der Grundlage der eingehenden Abfragefilter sortiert (z. B.: Verkäufe in einer bestimmten Region). Diese Methode beschleunigt die Leistung von Tabellenscans im Vergleich zu herkömmlichen Methoden erheblich.
Multi-AZ
Erweitern Sie die Wiederherstellungsmöglichkeiten, indem Sie die Wiederherstellungszeit verkürzen und die Fähigkeit zur automatischen Wiederherstellung ohne Datenverlust garantieren. Ein Multi-AZ-Data-Warehouse von Amazon Redshift maximiert die Leistung und den Wert, indem es hohe Verfügbarkeit bietet, ohne Standby-Ressourcen nutzen zu müssen, und steigert Ihre Verfügbarkeit auf 99,99 % SLA.
Netzwerkisolierung
Mit Amazon Redshift können Sie Firewall-Regeln konfigurieren, um den Netzwerkzugang zu Ihrem Data-Warehouse-Cluster zu kontrollieren. Sie können Amazon Redshift auch in Amazon Virtual Private Cloud (Amazon VPC) ausführen, um Ihren Data-Warehouse-Cluster in Ihrem eigenen virtuellen Netzwerk zu isolieren und die Verbindung zur vorhandenen IT-Infrastruktur über dem Branchenstandard entsprechende verschlüsselte IPsec-VPNs herzustellen.
Ende-zu-Ende-Verschlüsselung
Mit nur wenigen Parametereinstellungen können Sie Amazon Redshift so einrichten, dass es TLS zur Sicherung von Daten während der Übertragung und hardwarebeschleunigte AES-256-Verschlüsselung für Daten im Ruhezustand verwendet. Wenn Sie die Verschlüsselung für Daten im Ruhezustand aktivieren, werden alle auf einen Datenträger geschriebenen sowie sämtliche Backups verschlüsselt. Amazon Redshift übernimmt standardmäßig die Schlüsselverwaltung für Sie.
Einheitliche Identität mit der Integration in AWS IAM Identity Center
Die Integration in IAM Identity Center ermöglicht es Unternehmen, eine vertrauenswürdige Identitätsweitergabe zwischen Amazon Redshift, Amazon QuickSight und AWS Lake Formation zu unterstützen. Sie können Ihre Unternehmensidentität verwenden, um über eine Single Sign-On-Anmeldung auf Amazon Redshift zuzugreifen, indem sie externe Identitätsanbieter (IdP) wie Microsoft Entra ID, Okta, Ping oder OneLogin von QuickSight und Amazon Redshift Query Editor sowie BI-Tools und SQL-Editoren von Drittanbietern verwenden. Administratoren können Benutzer und Gruppen von externen Identitätsanbietern verwenden, um den differenzierten Zugriff auf Daten über Services hinweg zu verwalten und den Zugriff auf Benutzerebene in AWS CloudTrail zu überprüfen. Mit der vertrauenswürdigen Identitätsweitergabe wird die Identität eines Benutzers nahtlos zwischen QuickSight, Amazon Redshift und Lake Formation weitergegeben, wodurch die Zeit bis zum Erhalt von Erkenntnissen verkürzt und ein reibungsloses Analytik-Erlebnis ermöglicht wird.
Granulare Zugriffskontrollen
Granulare Sicherheitskontrollen auf Zeilen- und Spaltenebene stellen sicher, dass Benutzer nur die Daten sehen, auf die sie Zugriff haben sollen. Amazon Redshift ist in Lake Formation integriert. Dadurch wird sichergestellt, dass die Zugriffskontrollen auf Spaltenebene in Lake Formation auch für Amazon-Redshift-Abfragen für die Daten im Data Lake angewendet werden. Die gemeinsame Nutzung von Amazon-Redshift-Daten unterstützt die zentralisierte Zugriffskontrolle mit Lake Formation, um die Verwaltung der von Amazon Redshift freigegebenen Daten zu vereinfachen. Lake Formation ist ein Service, mit dem Sie sichere Data Lakes einfacher einrichten, den granularen Zugriff auf Daten über alle nutzenden Services hinweg zentral verwalten und Kontrollen auf Zeilen- und Spaltenebene anwenden können. Schützen Sie Ihre sensiblen Daten mit dynamischer Datenmaskierung, indem Sie einschränken, wie viele identifizierbare Daten für Benutzer sichtbar sind. Definieren Sie mehrere Berechtigungsebenen für diese Felder, sodass verschiedene Benutzer und Gruppen unterschiedliche Datenzugriffsebenen haben können, ohne mehrere Datenkopien erstellen zu müssen, und das alles über die vertraute SQL-Oberfläche von Amazon Redshift.
Mit SQL Einblicke in vereinheitlichte Daten im Lakehouse gewinnen
Integration in Amazon SageMaker Lakehouse
Analysieren Sie all Ihre vereinheitlichten Daten mithilfe von SQL mit der Amazon-Redshift-Integration in SageMaker Lakehouse. Fragen Sie Daten von Amazon Simple Storage Service (Amazon S3) in offenen Formaten ab und verhindern Sie so die Datenverlagerung zwischen Lakes und Warehouses. Öffnen Sie Ihre Amazon-Redshift-Daten in SageMaker Lakehouse, um den Zugriff auf alle Analytik-Tools von AWS und Apache Iceberg zu ermöglichen und umfassende Datenanalysen und Machine Learning (ML) zu unterstützen.
Unterstützung für Data-Lake-Abfragen für offene Tabellen- und offene Datenformate, einschließlich Apache Iceberg
Amazon Redshift unterstützt schreibgeschützte Abfragen mit vertrautem ANSI-SQL in den Tabellenformaten Apache Iceberg, Apache Hudi und Delta Lake und fragt offene Dateiformate wie Apache Parquet, ORC, Avro, JSON und CSV direkt in Amazon S3 ab. Apache Iceberg ist ein Beispiel für ein Open-Source-Tabellenformat, das durch seine Tabellenstruktur Transaktionskonsistenz und eine verbesserte Organisation von Data Lakes bietet. Mit Amazon Redshift Spectrum können Sie aus Tabellen und Daten in offenen Datenformaten wie Parquet in Ihrem Data Lake lesen und gleichzeitig bis zu Exabyte an strukturierten, halbstrukturierten und unstrukturierten Daten in Amazon S3 speichern. Sie können Daten auch mit dem UNLOAD-Befehl von Amazon Redshift in Ihren Data Lake exportieren, einschließlich der Option, in Parquet zu exportieren. Durch den Export von Daten aus Amazon Redshift zurück in Ihren Data Lake können Sie die Daten mit AWS-Services wie zum Beispiel Amazon Athena, Amazon EMR und SageMaker weiter analysieren.
Amazon Redshift Query Editor
Nutzen Sie SQL, um Ihre Amazon-Redshift-Daten und Ihren Data Lake für Datenanalysten, Datentechniker und andere SQL-Benutzer mit einer webbasierten Analysten-Workbench für die Datenexploration und -analyse zugänglicher zu machen. Mit dem Query Editor können Sie Abfrageergebnisse mit einem einzigen Schritt visualisieren, Schemata und Tabellen erstellen, Daten visuell laden und Datenbankobjekte durchsuchen. Darüber hinaus bietet es einen intuitiven Editor für die Erstellung und Freigabe von SQL-Abfragen, Analysen, Visualisierungen und Anmerkungen, die Sie sicher mit Ihrem Team teilen können.
Amazon SageMaker Unified Studio (Vorversion)
Verwenden Sie den integrierten SQL-Editor von Amazon Redshift in SageMaker Unified Studio, einer einzigen Daten- und KI-Entwicklungsumgebung, um Daten abzufragen, die in Data Lakes, Data Warehouses, Datenbanken und Anwendungen gespeichert sind.
Die Entscheidungsfindung mit Analytik nahezu in Echtzeit beschleunigen
Amazon-S3-Unterstützung für automatisches Kopieren
Vereinfachen und automatisieren Sie die Datenaufnahme aus Amazon S3 und reduzieren Sie so den Zeit- und Arbeitsaufwand für die Entwicklung benutzerdefinierter Lösungen oder die Verwaltung von Drittanbieterdiensten. Mit diesem Feature macht Amazon Redshift die manuelle und wiederholte Ausführung von Kopiervorgängen überflüssig, indem es die Dateierfassung automatisiert und die kontinuierlichen Schritte zum Laden der Daten im Hintergrund abwickelt. Die Unterstützung für das automatische Kopieren macht es für Fachanwender und Datenanalysten ohne Kenntnisse in der Datentechnik einfacher, Aufnahmeregeln zu erstellen und den Speicherort der Daten zu konfigurieren, die sie aus Amazon S3 laden möchten.
Streaming-Aufnahme von Amazon Redshift
Verwenden Sie SQL, um sich mit Amazon Kinesis Data Streams und Amazon Managed Streaming für Apache Kafka (MSK) zu verbinden und Daten direkt zu übernehmen. Streaming-Aufnahme von Amazon Redshift erleichtert auch die Erstellung und Verwaltung nachgelagerter Pipelines, da Sie direkt auf Streams materialisierte Ansichten erstellen können. Die materialisierten Ansichten können als Teil Ihrer ELT-Pipeline auch SQL-Transformationenen enthalten. Sie können definierte materialisierte Ansichten manuell aktualisieren, um die neuesten Streaming-Daten abzufragen.
Verbundabfrage
Fragen Sie Live-Daten über eine oder mehrere Amazon-RDS-Instances ab, einschließlich der Amazon-Aurora-PostgreSQL-kompatiblen Edition, Amazon Relational Database (Amazon RDS) für MySQL und Datenbanken der Amazon-Aurora-MySQL-kompatiblen Edition, um einen sofortigen Überblick über den gesamten Geschäftsbetrieb zu erhalten, ohne dass Daten verschoben werden müssen.
Einfache SQL-Analytik erhalten, ohne die Infrastruktur verwalten zu müssen
Serverlos
Führen Sie Analysen in Sekundenschnelle durch und skalieren Sie, ohne eine Data-Warehouse-Infrastruktur einrichten und verwalten zu müssen. Die KI-gesteuerte Skalierungs- und Optimierungstechnologie (als Vorschauversion verfügbar) ermöglicht es Amazon Redshift Serverless, Data-Warehouse-Kapazitäten automatisch und proaktiv bereitzustellen und zu skalieren und so selbst für die anspruchsvollsten Workloads eine schnelle Leistung zu bieten. Das System nutzt KI-Techniken, um die Workload-Muster der Kunden über wichtige Dimensionen wie gleichzeitige Abfragen, Abfragekomplexität, Datenvolumen und ETL-Muster zu lernen. Anschließend passt es die Ressourcen im Laufe des Tages kontinuierlich an und wendet maßgeschneiderte Leistungsoptimierungen an. Sie können ein gewünschtes Leistungsziel festlegen, und das Data Warehouse skaliert automatisch, um eine gleichbleibende Leistung zu gewährleisten.
Autonomik
Hochentwickelte Algorithmen prognostizieren und klassifizieren eingehende Abfragen auf der Grundlage ihrer Laufzeiten und Ressourcenanforderungen, um Leistung und Parallelität dynamisch zu verwalten und gleichzeitig Ihre geschäftskritischen Workloads zu priorisieren. Die Kurzabfragebeschleunigung (engl. Short Query Acceleration, SQA) sendet kurze Abfragen von Anwendungen wie Dashboards an eine Express-Warteschlange zur sofortigen Verarbeitung, statt hinter großen Abfragen zurückzubleiben. Das automatische Workload-Management (WLM) verwendet ML, um Speicher und Konkurrenz dynamisch zu verwalten und so den Abfragedurchsatz zu maximieren. Darüber hinaus können Sie jetzt die Priorität Ihrer wichtigsten Abfragen festlegen, selbst wenn Hunderte von Abfragen übermittelt werden. Amazon Redshift Advisor gibt Empfehlungen, wenn eine explizite Benutzeraktion erforderlich ist, um die Leistung von Amazon Redshift weiter zu steigern. Bei dynamischen Workloads, bei denen Abfragemuster nicht vorhersehbar sind, verbessern automatisch materialisierte Ansichten den Durchsatz von Abfragen, senken die Abfragelatenz und verkürzen die Ausführungszeit durch automatische Aktualisierung, automatisches Umschreiben von Abfragen, inkrementelle Aktualisierung und kontinuierliche Überwachung von Amazon-Redshift-Clustern. Die automatische Tabellenoptimierung wählt Sortier- und Verteilungsschlüssel aus, um die Leistung für den Workload des Clusters zu optimieren. Wenn Amazon Redshift feststellt, dass das Anwenden eines Schlüssels die Clusterleistung verbessert, werden Tabellen automatisch geändert, ohne dass ein Administrator eingreifen muss. Die zusätzlichen Features Automatisches Löschen des Vakuums, automatische Tabellensortierung und automatische Analyse machen die manuelle Wartung und Abstimmung von Amazon-Redshift-Clustern überflüssig, um die beste Leistung für neue Cluster und Produktions-Workloads zu erzielen.
Daten-API
Eine unkomplizierte API zur Interaktion mit Amazon Redshift verwenden: Mit Amazon Redshift können Sie mühelos mit allen Arten von traditionellen, cloudnativen und containerisierten, Serverless-Web-Services-basierten und ereignisgesteuerten Anwendungen auf Daten zugreifen. Die Amazon-Redshift-Daten-API vereinfacht den Zugriff, den Eingang und den Ausgang von Daten durch Programmiersprachen und Plattformen, die vom AWS SDK unterstützt werden, beispielsweise Python, Go, Java, Node.js, PHP, Ruby und C++. Die Daten-API macht die Konfiguration von Treibern und die Verwaltung von Datenbankverbindungen überflüssig. Stattdessen können Sie SQL-Befehle für einen Amazon-Redshift-Cluster ausführen, indem Sie einen gesicherten API-Endpunkt aufrufen, der von der Daten-API bereitgestellt wird. Die Daten-API kümmert sich um die Verwaltung von Datenbankverbindungen und das Puffern von Daten. Die Daten-API ist asynchron gestaltet, sodass Sie Ihre Ergebnisse später abrufen können. Die Abfrageergebnisse werden 24 Stunden lang aufbewahrt.
Integrieren in ETL- und BI-Tools von Drittanbietern
Führen Sie Abfragen in der Konsole aus oder verbinden Sie SQL-Client-Tools, -Bibliotheken oder Datenwissenschafts-Tools wie QuickSight, Tableau, Microsoft Power BI, Alteryx, Querybook, Jupyter Notebook, Informatica, dbt, MicroStrategy und Looker.
Anwendungen kontextualisieren und Benutzerproduktivität mit generativer KI steigern
Amazon Q generative SQL in Query Editor
Verwenden Sie einfaches Englisch, um Abfragen im Amazon Redshift Query Editor zu schreiben, die im Rahmen Ihrer Datenzugriffsberechtigungen sicher genaue SQL-Codeempfehlungen generieren.
Amazon Redshift ML
Amazon Redshift ML macht es Datenanalysten, Datenwissenschaftlern, BI-Experten und Entwicklern leichter, SageMaker-Modelle mit SQL zu erstellen, zu trainieren und einzusetzen. Mit Amazon Redshift ML können Sie mithilfe von SQL-Anweisungen Amazon-SageMaker-Modelle aus Ihren Daten in Amazon Redshift erstellen und trainieren und diese Modelle dann für Vorhersagen wie Abwanderungserkennung, Finanzprognosen, Personalisierung und Risikobewertung direkt in Ihren Abfragen und Berichten verwenden. Integrieren Sie große Sprachmodelle in Amazon Redshift für fortgeschrittene Aufgaben zur natürlichen Sprachverarbeitung wie Textzusammenfassung, Entitätsextraktion und Stimmungsanalyse, um mithilfe von SQL tiefere Einblicke aus Ihren Daten zu gewinnen.