Tabel Amazon S3

Optimalkan performa kueri dan biaya saat skala danau data Anda makin besar

Simpan data yang tersusun di tabel dalam skala besar di S3

Tabel Amazon S3 menghadirkan penyimpanan objek cloud pertama dengan dukungan Apache Iceberg bawaan dan menyederhanakan penyimpanan data yang tersusun di tabel dalam skala besar. Optimisasi tabel berkelanjutan secara otomatis memindai dan menulis ulang data tabel di latar belakang, sehingga mencapai performa kueri hingga 3x lebih cepat dibandingkan dengan tabel Iceberg yang tidak terkelola. Optimisasi performa ini akan terus meningkat dari waktu ke waktu. Selain itu, Tabel S3 mencakup optimisasi khusus untuk beban kerja Iceberg yang memberikan transaksi per detik hingga 10x lebih tinggi dibandingkan dengan tabel Iceberg yang disimpan dalam bucket S3 tujuan umum. Untuk detail selengkapnya tentang peningkatan performa kueri Tabel S3, lihat blog.

Dengan dukungan Tabel S3 untuk standar Apache Iceberg, data yang disusun di tabel dapat dengan mudah dikueri dengan AWS populer dan mesin kueri pihak ketiga termasuk Amazon Athena, Redshift, EMR, dan Apache Spark. Gunakan Tabel S3 untuk menyimpan data yang disusun di tabel, seperti transaksi pembelian harian, data sensor streaming, atau tayangan iklan sebagai tabel Iceberg di S3, dan optimalkan performa dan biaya seiring berkembangnya data menggunakan pemeliharaan tabel otomatis. Baca blog untuk mempelajari selengkapnya.

Manfaat

Sederhanakan danau data dalam skala apa pun, baik Anda baru memulai atau mengelola ribuan tabel di lingkungan Iceberg Anda.

Dapatkan performa kueri hingga 3x lebih cepat melalui optimisasi tabel berkelanjutan dibandingkan dengan tabel Iceberg yang tidak terkelola, dan transaksi per detik hingga 10x lebih tinggi dibandingkan tabel Iceberg yang disimpan dalam bucket S3 tujuan umum.

Lakukan tugas pemeliharaan tabel terus-menerus, seperti pemadatan, manajemen snapshot, dan penghapusan file tanpa referensi untuk secara otomatis mengoptimalkan efisiensi kueri dan biaya dari waktu ke waktu.

Akses kemampuan analitik data kueri Iceberg tingkat lanjut menggunakan layanan AWS yang sudah dikenal, seperti Amazon Athena, Redshift, dan EMR melalui integrasi pratinjau Tabel S3 dengan Katalog Data AWS Glue. Tabel S3 kompatibel dengan alat sumber terbuka populer.

Buat tabel sebagai sumber daya AWS kelas satu dan terapkan izin untuk mengatur akses ke tabel dengan mudah.

Cara kerjanya

Tabel S3 menyediakan penyimpanan S3 yang dibuat khusus untuk menyimpan data terstruktur dalam format Apache Parquet. Dalam bucket tabel, Anda dapat membuat tabel sebagai sumber daya kelas satu langsung di S3. Tabel ini dapat dilindungi dengan izin tingkat tabel yang ditentukan dalam kebijakan berbasis identitas atau sumber daya dan dapat diakses oleh aplikasi atau alat yang mendukung standar Apache Iceberg. Saat Anda membuat tabel di bucket tabel Anda, data yang mendasarinya di S3 disimpan sebagai data Parquet. Kemudian, S3 mempertahankan metadata yang diperlukan agar data Parquet dapat dikueri oleh aplikasi Anda. Bucket tabel menyertakan pustaka klien yang digunakan oleh mesin kueri untuk menavigasi dan memperbarui metadata Iceberg tabel di bucket tabel Anda. Pustaka ini, bersama dengan API S3 yang diperbarui untuk operasi tabel, memungkinkan beberapa klien membaca dan menulis data dengan aman ke tabel Anda. Seiring waktu, S3 secara otomatis mengoptimalkan data Parquet yang mendasarinya dengan menulis ulang, atau "memadatkan" objek Anda. Pemadatan mengoptimalkan data Anda di S3 untuk meningkatkan kinerja kueri dan meminimalkan biaya. Baca panduan pengguna untuk mempelajari selengkapnya

Video demo Tabel Amazon S3

Pelanggan

  • Genesys

    Genesys adalah perusahaan layanan cloud global yang terdepan dalam Orkestrasi Pengalaman Bertenaga AI. Melalui kemampuan AI, digital, dan manajemen keterlibatan tenaga kerja yang canggih, Genesys membantu lebih dari 8.000 organisasi di lebih dari 100 negara untuk memberikan pengalaman pelanggan dan karyawan yang dipersonalisasi dan berempat sekaligus memanfaatkan peningkatan kelincahan dan hasil bisnis.

    Tabel Amazon S3 akan menjadi tambahan transformatif untuk arsitektur data kami, terutama dengan dukungan Iceberg terkelola, yang secara efektif menciptakan lapisan tampilan terwujud untuk beragam kebutuhan analisis data. Penawaran ini berpotensi membantu Genesys menyederhanakan alur kerja data yang kompleks dengan menghilangkan lapisan tambahan manajemen tabel, dengan S3 menangani tugas-tugas pemeliharaan utama, seperti pemadatan, manajemen snapshot, dan pembersihan file tanpa referensi secara otomatis. Kemampuan membaca dan menulis Tabel Iceberg langsung dari S3 akan membantu kami meningkatkan kinerja dan menciptakan kemungkinan baru untuk mengintegrasikan data secara mulus di seluruh ekosistem analitik kami. Interoperabilitas ini, dikombinasikan dengan peningkatan performa, menempatkan Tabel S3 sebagai bagian penting dari strategi masa depan kami untuk menyuguhkan wawasan data yang cepat, fleksibel, dan andal.

    Glenn Nethercutt, Chief Technology Officer - Genesys
  • SnapLogic

    SnapLogic adalah pelopor dalam integrasi yang dipandu AI. Platform SnapLogic untuk Integrasi Generatif mempercepat transformasi digital di seluruh perusahaan untuk mendesain, melakukan deployment, dan mengelola agen AI dan integrasi yang mengotomatiskan tugas, membuat keputusan waktu nyata, dan mengintegrasikan dengan mudah ke dalam alur kerja yang ada.

    Tabel Amazon S3, dengan dukungan Apache Iceberg bawaan dan integrasi layanan Analitik AWS, yang membantu perusahaan mengoptimalkan biaya analitik data sekaligus mengubah cara mereka menggunakan data bisnis untuk analisis, kepatuhan, dan inisiatif AI. Dengan mengotomatiskan tugas manajemen data yang kompleks dan menyediakan jejak audit lengkap dari perubahan data, tim dapat langsung menganalisis data historis, mempertahankan kepatuhan terhadap peraturan, dan mempercepat dihasilkannya wawasan bisnis sekaligus mengurangi biaya teknologi secara signifikan.

    Dominic Wellington, Enterprise Architect - SnapLogic
  • Zus Health

    Zus adalah platform data kesehatan bersama yang dirancang untuk mempercepat interoperabilitas data layanan kesehatan dengan menyediakan data pasien yang mudah digunakan melalui API, komponen tertanam, dan integrasi EHR langsung.

    Sebagai perusahaan layanan kesehatan yang menangani sejumlah besar data pasien yang sering berubah, kami memutuskan untuk berinvestasi di Apache Iceberg karena dengan Apache Hive, beragam masalah seputar partisi dan otomatisasi dapat diselesaikan, dengan manfaat tambahan dari interoperabilitas yang lebih luas. Salah satu tantangan terbesar kami dengan Iceberg adalah memahami dan mengelola pengoptimalan tabel. Inilah sebabnya kami senang menyambut Tabel S3 dan kemampuan pengoptimalan terkelola. Jika mampu menurunkan overhead developer dari pemeliharaan tabel, kami akan bisa lebih fokus untuk menghadirkan data berkualitas tinggi dan wawasan berharga kepada pelanggan kami.

    Sonya Huang, Consulting Software Engineer - Zus Health