Métadonnées Amazon S3 (version préliminaire)

Accélérez la découverte des données grâce à des métadonnées d’objets en temps quasi réel

Trouvez et organisez les données dont vous avez besoin dans S3

Les métadonnées Amazon S3 (Version préliminaire) exploitent tout le potentiel de vos données S3 en rendant les métadonnées des objets facilement accessibles et en facilitant les requêtes. Affichez, enregistrez et interrogez des métadonnées riches pour vos objets enregistrés dans S3, afin de trouver rapidement les données dont vous avez besoin pour les analytiques commerciales, les applications d’inférence en temps réel, etc. Les métadonnées S3 prennent en charge les métadonnées des objets, qui incluent des détails définis par le système tels que la taille et la source de l’objet, ainsi que des métadonnées personnalisées, qui vous permettent d’utiliser des balises pour annoter vos objets avec des informations telles que le SKU du produit, l’ID de transaction ou l’évaluation du contenu. Lire la suite sur le blog

Avantages

Trouvez et récupérez rapidement les données dont vous avez besoin sur des milliers de milliards d’objets dans S3.

Utilisez des balises pour annoter vos objets à l’aide de métadonnées spécifiques à l’entreprise afin d’améliorer l’organisation des données et la facilité de recherche.

Conçu pour capturer et organiser automatiquement les métadonnées des objets dans des tables S3 gérés avec prise en charge intégrée d’Apache Iceberg.

Analysez les métadonnées à l’aide de services AWS courants tels qu’Amazon Athena, Redshift, EMR et QuickSight grâce à l’intégration préliminaire des tables S3 avec le Catalogue de données AWS Glue. Les métadonnées S3 sont compatibles avec les outils open source les plus courants.

Cas d'utilisation

Utilisez des métadonnées enrichies pour cataloguer les données stockées afin de faciliter leur découverte et leur utilisation.

Suivez et gérez les vidéos générées par l’IA, notamment leur origine, leur heure de création et le modèle d’IA utilisé grâce à Amazon Bedrock.

Analysez les métadonnées des objets pour identifier les opportunités de réduction des coûts et d’amélioration des performances.

Identifiez et analysez rapidement les jeux de données pertinents pour l’informatique décisionnelle et la prise de décisions.

Améliorez l’organisation et la conformité des données grâce à des annotations de métadonnées personnalisées.

Clients

  • Cambridge Mobile Telematics

    Cambridge Mobile Telematics (CMT) est le plus grand fournisseur de services télématiques au monde. Sa mission est de rendre les routes et les conducteurs du monde plus sûrs. La plateforme pilotée par l’IA de l’entreprise, DriveWell Fusion®, rassemble les données de capteurs provenant de millions d’appareils IoT, notamment des smartphones, des balises propriétaires, des véhicules connectés, des caméras embarquées et des appareils tiers, et les fusionne avec des données contextuelles pour créer une vue unifiée du comportement du véhicule et du conducteur.

    Chez CMT, nous stockons et analysons plusieurs pétaoctets de données provenant d’appareils IoT mobiles dans le monde entier afin d’améliorer la sécurité des conducteurs et des routes. À mesure que nous mettons à l’échelle, il devient de plus en plus difficile de localiser des données spécifiques pour développer de nouvelles connaissances et de nouveaux modèles. Les métadonnées S3, en particulier leur fonctionnalité de métadonnées personnalisées, nous permettent d’annoter toutes nos données et de conserver les métadonnées dans une table gérée et consultable. Désormais, la recherche de données pertinentes ne nécessite qu’une seule requête SQL efficace et rentable. Les métadonnées S3 changent ainsi la donne en nous permettant de proposer de nouvelles fonctionnalités à nos clients.

    Tim Vogel, directeur des systèmes d’information, chez Cambridge Mobile Telematics
  • PayPal

    PayPal révolutionne le commerce mondial depuis plus de 25 ans. La création d’expériences innovantes qui rendent les transferts d’argent, les ventes et les achats simples, personnalisés et sécurisés, permet aux consommateurs et aux entreprises d’environ 200 marchés de rejoindre l’économie mondiale et d’y prospérer.

    Les métadonnées S3 nous fournissent un mécanisme simple et direct pour analyser des milliards d’objets S3 à l’aide d’outils standard tels qu’Amazon Athena et Amazon QuickSight. Grâce à cette fonctionnalité, nous pouvons passer notre temps à prendre des décisions plutôt que de créer nos pipelines de données complexes pour accéder aux métadonnées des objets S3 et les interroger.

    Jon Southall, vice-président de l’ingénierie, plateformes pour les grandes entreprises chez PayPal
  • Roche

    Roche est une société de biotechnologie qui associe des produits pharmaceutiques et diagnostiques pour réaliser des progrès en matière de soins de santé personnalisés et pour améliorer la vie des gens.

    Les métadonnées S3 accélèrent nos initiatives d’IA générative. Alors que nous développons des applications LLM telles que des chatbots internes pour nos équipes, les données non structurées telles que les PDF prennent de plus en plus de valeur. Nous devons intégrer de nombreux documents spécifiques à un domaine dans une application de génération à enrichissement contextuel (RAG) afin que le chatbot puisse s’adapter aux contextes commerciaux spécifiques de Roche. Cependant, cela signifie également que nous avons de plus en plus de données non structurées à gérer. Nous avons besoin d’un système de métadonnées pour décrire efficacement nos données non structurées afin que nos utilisateurs puissent rapidement parcourir notre vaste lac de données afin d’identifier les jeux de données pertinentes pour l’application d’IA générative particulière qu’ils développent. Avec les métadonnées S3, la création d’un système de métadonnées robuste a été simplifiée en quelques clics dans la Console de gestion AWS. Au fur et à mesure que nous ingérons de plus en plus de données non structurées, les métadonnées S3 affichent automatiquement les métadonnées et les tiennent à jour. Nous employons également notre propre Lambda pour extraire des métadonnées spécifiques à l’entreprise, telles que la classification des documents sur la base d’une taxonomie pertinente pour Roche, et les stocker dans le même catalogue glue avec la table de métadonnées S3, de sorte qu’avec une simple jointure SQL, nous pouvons avoir toutes les métadonnées dont nous avons besoin. Les métadonnées S3 nous aident à créer des applications d’IA génératives plus rapidement, ce qui nous permet de nous concentrer sur la création plutôt que sur l’organisation de nos données.

    Yannick Misteli, responsable de l’ingénierie commerciale pharmaceutique chez Roche
  • SmugMug / Flickr

    SmugMug et Flickr fournissent des plateformes en ligne sur lesquelles les photographes peuvent télécharger et partager des photos et des vidéos. L’entreprise stocke des milliards de photos et de vidéos sur son application.

    Imaginez que vous fassiez voler une machine à remonter le temps à travers vos données Amazon S3. Chez SmugMug et Flickr, nous stockons depuis plus de 22 ans les photos de nos clients, ainsi que des centaines de milliards d’objets, dans S3. La nouvelle fonctionnalité de métadonnées S3 nous permet d’explorer facilement et à moindre coût les métadonnées de nos objets S3, en interrogeant des métadonnées telles que la taille des objets au fil du temps pour mieux comprendre l’évolution de nos données, ce qui impliquait auparavant d’associer des requêtes de base de données coûteuses à des inventaires d’objets. Comprendre comment nos photographes utilisent notre espace de stockage contribue à renforcer notre engagement à construire un monde meilleur grâce au pouvoir de la photographie.

    Andrew Shieh, ingénieur principal chez SmugMug
  • Solink propose des systèmes de sécurité vidéo cloud fiables pour les entreprises de toutes tailles. Son matériel et ses logiciels contribuent à donner de la visibilité aux équipes informatiques, de prévention des pertes, d’exploitation et de sécurité sur des dizaines de milliers de sites dans plus de 40 pays.

    Solink traite plus de 500 millions d’heures de vidéo par mois, intégrant des séquences de sécurité à des données commerciales critiques provenant de plus de 350 sources. AWS prend en charge l’infrastructure sur laquelle nous nous appuyons et les métadonnées Amazon S3 vont encore plus loin en fournissant des informations en temps réel qui améliorent notre gestion de contenu, qu’il s’agisse de surveiller le stockage et l’utilisation ou de suivre les effets en temps réel des modifications de configuration des clients.

    Martin Soukup, directeur technique chez Solink
  • Commvault

    Commvault est la référence en matière de cyber-résilience, aidant plus de 100 000 organisations à préserver la sécurité de leurs données et la résilience de leurs activités. Commvault propose aujourd’hui la seule plateforme de cyber-résilience qui combine la meilleure sécurité des données et une restauration rapide à l’échelle de l’entreprise, quelle que soit la charge de travail, en tout lieu et au coût total de possession le plus bas.

    Amazon S3 est devenu l’un des principaux fournisseurs de stockage dans le cloud pour différents types de données. Les métadonnées Amazon S3 permettront à des fournisseurs comme Commvault d’identifier et de protéger les informations sensibles de manière proactive, tout en aidant à automatiser des éléments tels que la hiérarchisation des données, et à améliorer les résultats pour nos clients communs. Les métadonnées S3 facilitent l’organisation efficace des données et aident à rationaliser la découverte des données, en permettant une annotation détaillée des objets, ce qui est crucial pour la cyber-résilience en cloud.

    Pranay Ahlawat, directeur de la technologie et de l’IA chez Commvault
  • New Relic

    La plateforme d’observabilité intelligente New Relic offre aux clients des analytiques de performance approfondies pour chaque partie de leur environnement logiciel. Les clients peuvent facilement consulter et analyser d’énormes quantités de données et obtenir des informations exploitables en temps réel.

    En tant que leader en matière d’observabilité, le moteur de données de New Relic traite environ 1,3 exaoctet de données Amazon S3 par jour. Les métadonnées S3 accéléreront notre innovation en générant automatiquement des métadonnées d’objets riches, simplifiant ainsi l’exploration des données dont nos équipes ont besoin pour mener des expériences de produits et élaborer des preuves de concept, telles que le développement de nouveaux indicateurs bénéfiques pour nos clients. Les métadonnées S3 réduiront nos efforts pour créer et maintenir un système de métadonnées robuste de plusieurs centaines d’heures à quelques clics sur la console de gestion S3, permettant à nos ingénieurs de se concentrer sur l’analyse des données plutôt que sur leur organisation.

    Siva Padisetty, directrice de la technologie chez New Relic