- Base de données›
- Amazon DocumentDB›
- Questions fréquentes (FAQ)
Questions fréquentes (FAQ) sur Amazon DocumentDB (compatible avec MongoDB)
Sujets de la page
Questions d'ordre généralQuestions d'ordre général
Qu'est-ce qu'Amazon DocumentDB (compatible avec MongoDB) ?
Amazon DocumentDB (compatible avec MongoDB) est un service de base de données document d'entreprise rapide, évolutif, hautement disponible et entièrement géré qui prend en charge les charges de travail JSON natives. En tant que base de données document, Amazon DocumentDB facilite le stockage, l'interrogation et l'indexation des données JSON. Les développeurs peuvent utiliser les mêmes codes applicatifs, pilotes et outils MongoDB qu'ils utilisent aujourd'hui pour exécuter, gérer et mettre à l'échelle les charges de travail sur Amazon DocumentDB. Bénéficiez de performances, d'une capacité de mise à l'échelle et d'une disponibilité améliorées sans vous soucier de la gestion de l'infrastructure sous-jacente.
Les clients peuvent utiliser AWS Database Migration Service (DMS) pour migrer de manière simple et quasi ininterrompue leurs bases de données non relationnelles sur site ou Amazon Elastic Compute Cloud (EC2) MongoDB vers Amazon DocumentDB. Aucun investissement initial n'est requis pour l'utilisation d'Amazon DocumentDB et les clients ne paient que la capacité qu'ils utilisent.
Quels cas d'utilisation conviennent parfaitement à une base de données document comme Amazon DocumentDB ?
Les bases de données axées sur les documents sont l'une des catégories de bases de données noSQL dont la croissance est la plus rapide, la raison principale étant que les bases de données document offrent à la fois des schémas flexibles et des capacités d'interrogation étendues. Le modèle axé sur les documents est un choix idéal pour les cas d'utilisation avec des jeux de données dynamiques qui nécessitent des requêtes, des indexations et des agrégations ad hoc. Avec la mise à l'échelle qu'Amazon DocumentDB propose, ce modèle est utilisé par une grande variété de clients pour des cas d'utilisation tels que la gestion de contenu, la personnalisation, les catalogues, les applications mobiles et web, l'IoT et la gestion des profils.
Que signifie « compatible MongoDB » ?
« Compatible MongoDB » signifie qu'Amazon DocumentDB interagit avec les API open source MongoDB 3.6, 4.0 et 5.0 d'Apache 2.0. Par conséquent, vous pouvez utiliser les mêmes pilotes, applications et outils MongoDB avec Amazon DocumentDB avec peu ou pas de changements. Bien qu'Amazon DocumentDB supporte une grande majorité des API MongoDB que les clients utilisent réellement, toutes les API MongoDB ne sont pas supportées. Notre objectif a été de fournir les capacités que les clients utilisent réellement et dont ils ont besoin.
Depuis le lancement, nous avons continué à travailler à rebours à partir des clients et avons fourni plus de 80 fonctionnalités supplémentaires, notamment la compatibilité, les transactions et le partitionnement MongoDB 4.0 et 5.0. Pour en savoir plus sur les API MongoDB prises en charge, consultez la documentation sur la compatibilité. Pour en savoir plus sur les lancements récents d'Amazon DocumentDB, consultez « Annonces Amazon DocumentDB » sur la page des ressources Amazon DocumentDB.
Amazon DocumentDB est-il limité par la licence SSPL de MongoDB ?
Non. Amazon DocumentDB n'utilise aucun code SSPL MongoDB et n'est donc pas limité par cette licence. En revanche, Amazon DocumentDB interagit avec les API open source MongoDB 3.6, 4.0 et 5.0 d'Apache 2.0. Nous continuerons à écouter et à travailler en amont de nos clients pour leur fournir les capacités dont ils ont besoin. Pour en savoir plus sur les API MongoDB prises en charge, consultez la documentation sur la compatibilité. Pour en savoir plus sur les lancements récents d'Amazon DocumentDB, consultez « Annonces Amazon DocumentDB » sur la page des ressources Amazon DocumentDB.
Comment puis-je migrer des données d'une base de données MongoDB existante vers Amazon DocumentDB ?
Les clients peuvent utiliser AWS Database Migration Service (DMS) pour migrer de manière simple et quasi ininterrompue leurs bases de données sur site ou Amazon Elastic Compute Cloud (EC2) MongoDB vers Amazon DocumentDB. Grâce à DMS, vous pouvez migrer depuis un ensemble de réplicas MongoDB ou depuis un cluster partitionné vers Amazon DocumentDB. De plus, vous pouvez utiliser la plupart des outils existants pour procéder à la migration des données d'une base de données MongoDB vers Amazon DocumentDB, notamment mongodump/mongorestore, mongoexport/mongoimport et des outils tiers qui prennent en charge la capture de données modifiées (CDC) via l'oplog. Pour en savoir plus, consultez Migration vers Amazon DocumentDB.
Faut-il changer les pilotes clients pour utiliser Amazon DocumentDB ?
Non, Amazon DocumentDB fonctionne avec la grande majorité des pilotes MongoDB compatibles avec la version MongoDB 3.4+.
Les transactions ACID sont-elles prises en charge par Amazon DocumentDB ?
Oui. Avec le lancement de la prise en charge de la compatibilité MongoDB 4.0, Amazon DocumentDB prend en charge l'exécution de transactions ACID (atomicité, cohérence, isolation, durabilité) sur plusieurs documents, instructions, collections et bases de données.
Le service Amazon DocumentDB est-il soumis à la planification de fin de vie (EOL) de MongoDB ?
Non. Amazon DocumentDB ne suit pas les mêmes cycles de vie de support que MongoDB, et la programmation de fin de vie de MongoDB ne s'applique pas à Amazon DocumentDB.
Comment accéder à mon cluster Amazon DocumentDB ?
Les clusters Amazon DocumentDB sont déployés au sein de l'Amazon VPC (VPC) d'un client, et sont accessibles directement par les instances Amazon Elastic Compute Cloud (EC2) ou d'autres services AWS déployés dans le même VPC. En outre, Amazon DocumentDB est accessible par les instances Amazon EC2 ou d'autres services AWS dans différents VPC de la même région ou d'autres régions grâce à l'appairage de VPC. L'accès aux clusters Amazon DocumentDB doit s'effectuer via le shell mongo ou avec les pilotes MongoDB. Amazon DocumentDB nécessite que vous vous authentifiiez lorsque vous vous connectez à un cluster. Pour plus d'options, consultez Connexion à un cluster Amazon DocumentDB de l'extérieur d'un Amazon VPC.
Pourquoi les autorisations et ressources d'Amazon RDS nécessitent-elles l'utilisation d'Amazon DocumentDB ?
Pour certaines fonctionnalités de gestion telles que la gestion de cycle de vie des instances, le chiffrement au repos avec les clés Amazon Key Management Service (KMS) et la gestion de groupes de sécurité, Amazon DocumentDB utilise une technologie opérationnelle partagée avec Amazon Relational Database Service (RDS) et Amazon Neptune. Lors de l'utilisation des API AWS CLI describe-db-instances et describe-db-clusters, nous vous recommandons de filtrer les ressources Amazon DocumentDB à l'aide du paramètre suivant : « --filter Name=engine,Values=docdb ».
Quels sont les types d'instance proposés par Amazon DocumentDB ?
Consultez la page de tarification d'Amazon DocumentDB pour obtenir des informations à jour concernant les types d'instance disponibles par région.
Comment essayer Amazon DocumentDB ?
Pour essayer Amazon DocumentDB, consultez le guide de démarrage.
Existe-t-il une SLA pour Amazon DocumentDB ?
Oui. Pour obtenir plus d'informations, consultez le Contrat de niveau de service (SLA) Amazon DocumentDB (compatible avec MongoDB).
Performances
Quel type de performances puis-je attendre d'Amazon DocumentDB ?
Lorsqu'il écrit en stockage, Amazon DocumentDB ne conserve qu'un journal write-ahead, et n'a pas besoin d'écrire des synchronisations de page tampon complètes. En conséquence de cette optimisation qui ne compromet pas la durabilité, les écritures Amazon DocumentDB sont généralement plus rapides que les bases de données traditionnelles. Les clusters Amazon DocumentDB peuvent monter en puissance vers des millions de lectures par seconde avec jusqu'à 15 réplicas en lecture.
Tarification
Quel est le tarif d'Amazon DocumentDB et dans quelles régions AWS le service est-il disponible ?
Consultez la page de tarification d'Amazon DocumentDB pour obtenir des informations à jour concernant les régions et les tarifs.
Existe-t-il une offre gratuite pour Amazon DocumentDB et est-il possible de l'essayer gratuitement ?
Oui, vous pouvez essayer Amazon DocumentDB avec d'une période d'essai gratuit d'un mois. Si vous n'avez encore jamais utilisé Amazon DocumentDB, vous pouvez bénéficier d'une période d'essai gratuit d'un mois. Votre organisation bénéficiera ainsi gratuitement de 750 heures d'utilisation d'instances t3.medium, de 30 millions d'E/S, de 5 Go de stockage et de 5 Go de stockage de sauvegarde pendant 30 jours. Lorsque l'essai gratuit d'un mois arrive à expiration ou que votre utilisation dépasse le quota d'heures gratuit, vous pouvez fermer votre cluster pour éviter de payer des frais, ou continuer à l'exécuter en étant facturé selon nos tarifs standard à la demande. Pour en savoir plus, consultez la page d'essai gratuit de DocumentDB.
Pourquoi utiliser la version optimisée E/S d'Amazon DocumentDB ?
La version optimisée E/S d'Amazon DocumentDB est le choix idéal lorsque vous avez besoin de coûts prévisibles ou que vous avez des applications gourmandes en E/S. Si vous pensez que vos coûts d'E/S dépasseront 25 % du coût total de votre base de données Amazon DocumentDB, cette option offre un meilleur rapport qualité-prix. Consultez notre documentation sur la version optimisée E/S d'Amazon DocumentDB pour en savoir plus, notamment pour savoir comment démarrer.
Puis-je alterner entre la configuration de stockage optimisée pour les E/S et la configuration de stockage standard ?
Vous pouvez migrer vos clusters de bases de données existants tous les 30 jours vers la version optimisée E/S d'Amazon DocumentDB. Vous pouvez revenir aux configurations de stockage standard d'Amazon DocumentDB à tout moment.
Avec la version optimisée E/S d'Amazon DocumentDB, est-ce que je continue à payer pour les E/S nécessaires à la réplication des données entre les régions avec des clusters mondiaux ?
Oui, les frais liés aux opérations d'E/S requises pour répliquer les données entre les régions continuent de s'appliquer. La version optimisée E/S d'Amazon DocumentDB ne facture pas les opérations d'E/S en lecture et en écriture, ce qui est différent de la réplication de données. Consultez notre documentation sur la version optimisée E/S d'Amazon DocumentDB pour en savoir plus.
Clusters élastiques
Qu'est-ce qu'Amazon DocumentDB Elastic Clusters ?
Les clusters Elastic Clusters Amazon DocumentDB vous permettent de mettre à l'échelle de manière élastique votre base de données document pour gérer des millions de lectures et d'écritures, avec plusieurs pétaoctets de capacité de stockage. Les clusters Elastic Clusters simplifient la façon dont les clients interagissent avec Amazon DocumentDB en gérant automatiquement l'infrastructure sous-jacente et en éliminant la nécessité de créer, de supprimer, de mettre à niveau ou de mettre à l'échelle des instances.
Comment démarrer avec les clusters Elastic Clusters ?
Vous pouvez créer un cluster Elastic Clusters à l'aide de l'API Amazon DocumentDB, du kit SDK, de la CLI, de CloudFormation (CFN) ou de la console AWS. Lorsque vous allouez votre cluster, vous spécifiez le nombre de partitions et le calcul par partition dont votre charge de travail a besoin. Une fois que vous avez créé votre cluster, vous pouvez commencer à exploiter la capacité de mise à l'échelle Elastic d'Elastic Clusters. Vous pouvez maintenant vous connecter au cluster Elastic Clusters et lire ou écrire des données à partir de votre application. Les clusters Elastic Clusters sont Elastic. En fonction des besoins de votre charge de travail, vous pouvez ajouter ou supprimer du calcul en modifiant le nombre de partitions ou le calcul par partition à l'aide de la console, de l'API, de la CLI ou du kit SDK AWS. Les clusters Elastic Clusters mettent en service et hors service l'infrastructure sous-jacente et rééquilibrent vos données automatiquement.
Fonctionnement des clusters Elastic Clusters
Les clusters Elastic Clusters utilisent le partitionnement pour partitionner les données à travers le système de stockage distribué d'Amazon DocumentDB. Le partitionnement divise de grands jeux de données en petits jeux de données dans plusieurs nœuds, permettant ainsi aux clients de monter en puissance leur base de données au-delà des limites de mise à l'échelle verticale d'une seule base de données. Les clusters Elastic Clusters utilisent la séparation du calcul et du stockage dans Amazon DocumentDB. Plutôt que de partitionner à nouveau des collections en déplaçant de petites portions de données entre les nœuds de calcul, les clusters Elastic Clusters peuvent copier les données de manière efficace au sein du système de stockage distribué.
Quels types de partitionnement les clusters Elastic Clusters prennent-ils en charge ?
Les clusters Elastic Clusters prennent en charge le partitionnement basé sur le hachage.
Quelle est la différence entre les clusters Elastic Clusters et le partitionnement MongoDB ?
Avec les clusters Elastic Clusters, vous pouvez facilement monter en puissance ou effectuer une mise à l'échelle horizontale de votre charge de travail sur Amazon DocumentDB, généralement avec peu ou pas de temps d'arrêt d'application ou d'impact sur les performances, quel que soit le volume de données. Une opération similaire sur MongoDB affecterait la performance d'application et prendrait des heures, voire des jours dans certains cas. Les clusters Elastic Clusters offrent également des capacités de gestion différenciées telles que les sauvegardes sans impact et la restauration à un instant dans le passé rapide, permettant ainsi aux clients de consacrer plus de temps à leurs applications et moins de temps à la gestion de leur base de données.
Dois-je apporter des modifications à mon application pour utiliser des clusters Elastic Clusters ?
Non. Vous n'avez pas besoin d'apporter des modifications à votre application pour utiliser des clusters Elastic Clusters.
Puis-je convertir mon cluster Amazon DocumentDB existant en cluster Elastic Clusters ?
Non. Pour le moment, vous pouvez utiliser le service AWS Database Migration (DMS) pour migrer les données d'un cluster Amazon DocumentDB existant vers un cluster Elastic Clusters.
Comment puis-je définir une clé de partition ?
La procédure pour choisir une clé de partition optimale pour des clusters Elastic Clusters est la même qu'avec les autres bases de données. Une bonne clé de partition présente deux caractéristiques : une fréquence élevée et une cardinalité élevée. Par exemple, si votre application stocke les commandes user_orders dans DocumentDB, vous devez généralement récupérer les données en passant par l'utilisateur. Par conséquent, toutes les commandes liées à un utilisateur donné doivent se trouver dans une seule et même partition. Dans ce cas, user_id serait une bonne clé de partition. Découvrez-en davantage.
Quels sont les concepts associés aux clusters Elastic Clusters ?
- Elastic Clusters : cluster Amazon DocumentDB qui vous permet de mettre à l'échelle le débit de votre charge de travail vers des millions de lectures/d'écritures par seconde et le stockage vers plusieurs pétaoctets. Un cluster Elastic Clusters comprend une ou plusieurs partitions pour le calcul et un volume de stockage, et est hautement disponible dans plusieurs zones de disponibilité par défaut.
- Partition : une partition fournit le calcul pour les clusters Elastic Clusters. Par défaut, elle présente trois nœuds : un en écriture et deux en lecture. Vous pouvez avoir 32 partitions maximum, et chaque partition peut avoir 64 vCPU maximum.
- Clé de partition : la clé de partition est un champ facultatif dans vos documents JSON que les clusters Elastic Clusters utilisent pour distribuer le trafic de lecture et d'écriture dans la partition correspondante. Nous vous conseillons de choisir une clé qui contient beaucoup de valeurs uniques. Une bonne clé de partition partitionne vos données de manière uniforme à travers les partitions sous-jacentes afin de donner à votre charge de travail le meilleur débit et la meilleure performance possibles.
- Collection partitionnée : collection dont les données sont distribuées à travers un cluster Elastic Clusters.
Quelle relation existe-t-il entre les clusters Elastic Clusters et les autres services AWS ?
Les clusters Elastic Clusters s'intègrent avec les autres services AWS de la même manière que DocumentDB. Tout d'abord, vous pouvez utiliser AWS Database Migration Service (DMS) pour migrer de MongoDB et d'autres bases de données relationnelles vers des clusters Elastic Clusters. Ensuite, vous pouvez surveiller l'état et la performance de votre cluster Elastic Clusters à l'aide d'Amazon CloudWatch. Vous pouvez également configurer l'authentification et les autorisations via les utilisateurs et les rôles IAM AWS et utiliser AWS VPC pour les connections par VPC uniquement sécurisées. Enfin, vous pouvez utiliser AWS Glue pour importer et exporter des données depuis et vers d'autres services AWS tels que S3, Redshift et OpenSearch.
Puis-je migrer mes charges de travail partitionnées MongoDB existantes vers des clusters Elastic Clusters ?
Oui. Vous pouvez migrer vos charges de travail partitionnées MongoDB existantes vers des clusters Elastic Clusters. Vous pouvez utiliser AWS Database Migration Service ou les outils MongoDB natifs, tels que mongodump et mongorestore, pour migrer votre charge de travail MongoDB vers des clusters Elastic Clusters. Les clusters élastiques prennent également en charge les API MongoDB les plus utilisées, telles que shardCollection(), ce qui vous permet de réutiliser les outils et les scripts existants avec Amazon DocumentDB.
Matériel, mise à l'échelle et stockage
Quelles sont les limites de stockage minimales et maximales d'un cluster Amazon DocumentDB ?
L'espace de stockage minimal est de 10 Go. Selon l'usage que vous faites de votre cluster, votre stockage Amazon DocumentDB augmente automatiquement jusqu'à 128 Tio, par paliers de 10 Go, sans affecter les performances. Avec les clusters Elastic Clusters Amazon DocumentDB, le stockage augmente automatiquement jusqu'à 4 Pio par paliers de 10 Go. Dans les deux cas, il n'est pas nécessaire d'allouer un espace de stockage à l'avance.
Comment la base de données Amazon DocumentDB se met-elle à l'échelle ?
Amazon DocumentDB se met à l'échelle sur deux dimensions : le stockage et le calcul. Le stockage d'Amazon DocumentDB augmente automatiquement de 10 Go à 128 Tio dans les clusters basés sur les instances, et jusqu'à 4 Pio pour les clusters Elastic Clusters Amazon DocumentDB. Vous pouvez augmenter la capacité de calcul d'Amazon DocumentDB en créant des instances plus volumineuses. Vous pouvez également mettre le service à l'échelle horizontale (pour un meilleur débit de lecture) en ajoutant des instances de réplicas supplémentaires au cluster.
Comment mettre à l'échelle les ressources de calcul associées à mon cluster Amazon DocumentDB ?
Vous pouvez dimensionner les ressources de calcul attribuées à votre instance dans la console de gestion AWS en sélectionnant les instances souhaitées et en cliquant sur le bouton « Modifier ». Les ressources de mémoire et de CPU sont modifiées en changeant votre classe d'instance.
Lorsque vous modifiez votre classe d'instance, les changements requis sont appliqués au cours de la fenêtre de maintenance que vous avez définie. Vous pouvez aussi utiliser l'indicateur « Appliquer immédiatement » pour appliquer immédiatement vos demandes de dimensionnement. Ces deux options affecteront la disponibilité pendant quelques minutes, le temps de l'opération de dimensionnement. N'oubliez pas que toutes les modifications système en attente seront également appliquées.
Sauvegarde et restauration
Comment activer les sauvegardes pour mon cluster ?
Les sauvegardes automatisées sont toujours activées sur les clusters Amazon DocumentDB. La fonctionnalité de sauvegarde de base de données simple d'Amazon DocumentDB active la restauration ponctuelle de vos clusters. Vous pouvez augmenter votre fenêtre de sauvegarde pour permettre des restaurations à un instant dans le passé allant jusqu'à 35 jours. Les sauvegardes n'affectent pas la performance de la base de données.
Puis-je faire des instantanés de clusters et les conserver aussi longtemps que je le souhaite ?
Oui. Vous pouvez conserver des instantanés manuels au-delà de la fenêtre de sauvegarde. Effectuer un instantané n'a aucune répercussion sur les performances du cluster. Notez que la restauration de données à partir des instantanés de cluster requiert la création d'un nouveau cluster.
Si mon instance connaît une défaillance, quel est mon chemin de récupération ?
Amazon DocumentDB rend automatiquement vos données durables dans trois zones de disponibilité (AZ) au sein d'une région et tente automatiquement de récupérer votre instance dans une zone de disponibilité saine sans aucune perte de données. Dans le cas improbable où vos données ne sont pas disponibles dans l'espace de stockage d'Amazon DocumentDB, vous pouvez les restaurer à partir d'un instantané de cluster ou effectuer une opération de restauration ponctuelle au sein d'un nouveau cluster. Notez que la sauvegarde à des fins de restauration la plus récente possible remonte à cinq minutes en arrière.
Qu'arrive-t-il à mes sauvegardes et instantanés de clusters automatisés si je supprime mon cluster ?
Vous pouvez choisir de créer un instantané final au moment de supprimer votre instance. De cette manière, vous pourrez utiliser cet instantané pour restaurer l'instance supprimée ultérieurement. Amazon DocumentDB conserve cet instantané final créé par l'utilisateur avec les autres instantanés créés manuellement et ce, même après la suppression de l'instance. Seuls les instantanés sont conservés après la suppression de l'instance (c'est-à-dire que les sauvegardes automatisées créées pour la restauration à un moment précis ne sont pas conservées).
Qu'arrive-t-il à mes sauvegardes et clusters instantanés automatisés si je supprime mon compte ?
Supprimer votre compte AWS entraînera la suppression de toutes les sauvegardes automatisées et de toutes les sauvegardes d'instantanés contenus sur le compte.
Puis-je partager mes instantanés avec un autre compte AWS ?
Oui. Amazon DocumentDB vous offre la possibilité de créer des instantanés de votre cluster, afin de les utiliser ultérieurement pour restaurer un cluster. Vous pouvez partager un instantané avec un autre compte AWS, et le propriétaire du compte destinataire pourra utiliser votre instantané pour restaurer un cluster contenant vos données. Il est même possible de créer des instantanés publics, qui pourront être utilisés par n'importe quel utilisateur pour restaurer un cluster contenant vos données (publiques). Vous pouvez utiliser cette fonctionnalité pour partager des données entre vos différents environnements (production, dev/test, transfert, etc.) liés à des comptes AWS différents, ainsi que pour conserver des sauvegardes de toutes vos données dans un compte séparé au cas où votre compte AWS principal serait compromis.
Les instantanés partagés me seront-ils facturés ?
Le partage d'instantanés entre les comptes ne fait pas l'objet de frais supplémentaires. Toutefois, vous pourrez être facturé pour les instantanés en eux-mêmes, ainsi que pour les clusters restaurés à partir d'instantanés partagés.
Puis-je partager automatiquement les instantanés ?
Nous ne prenons pas en charge le partage automatique d'instantanés de clusters. Pour partager un instantané automatique, vous devez créer manuellement une copie de celui-ci, puis partager cette copie.
Puis-je partager mes instantanés Amazon DocumentDB entre les régions ?
Non, vos instantanés Amazon DocumentDB partagés ne seront accessibles que par les comptes de la même région que le compte qui les partage.
Puis-je partager un instantané Amazon DocumentDB chiffré ?
Oui. Vous pouvez partager des instantanés Amazon DocumentDB chiffrés. Le destinataire de l'instantané partagé doit avoir accès à la clé KMS utilisée pour chiffrer l'instantané.
Puis-je utiliser les instantanés Amazon DocumentDB en dehors du service ?
Non, les instantanés Amazon DocumentDB ne peuvent être utilisés qu'au sein du service.
Qu'advient-il de mes sauvegardes lorsque je supprime mon cluster ?
Vous pouvez choisir de créer un instantané final lorsque vous supprimez votre cluster. De cette manière, vous pourrez utiliser cet instantané pour restaurer le cluster supprimé ultérieurement. Amazon DocumentDB conserve cet instantané final créé par l'utilisateur avec les autres instantanés créés manuellement et ce, même après la suppression du cluster.
Haute disponibilité et réplication
Comment le service Amazon DocumentDB améliore-t-il la tolérance aux pannes de disques durs de mon cluster ?
Amazon DocumentDB divise automatiquement le volume de votre stockage en segments de 10 Go répartis sur plusieurs disques. Chaque segment de 10 Go du volume de votre stockage est répliqué six fois dans trois zones de disponibilité (AZ). Amazon DocumentDB est conçu pour prendre en charge de manière fluide la perte d'un maximum de deux copies de données sans compromettre la disponibilité en écriture, et d'un maximum de trois copies sans compromettre la disponibilité en lecture. Le volume du stockage d'Amazon DocumentDB se répare également automatiquement. Les blocs de données et les disques sont continuellement analysés pour trouver des erreurs et sont réparés automatiquement.
Comment Amazon DocumentDB améliore-t-il le temps de récupération après le plantage d'une base de données ?
Contrairement aux autres bases de données, après le plantage d'une base de données, Amazon DocumentDB n'a pas besoin de relire le journal de reprise à partir du dernier point de vérification de la base de données (généralement cinq minutes) et de confirmer toutes les modifications qui ont été apportés avant de rendre la base de données disponible pour des opérations. Cela permet de réduire la durée de redémarrage de la base de données à moins de 60 secondes dans la plupart des cas. Amazon DocumentDB supprime le cache du processus de la base de données et la met immédiatement à votre disposition au moment du redémarrage. Cela vous évite de limiter l'accès jusqu'à ce que le cache soit rempli à nouveau afin d'éviter les baisses de tension.
Quels types de réplicas Amazon DocumentDB prend-il en charge ?
Amazon DocumentDB prend en charge les réplicas en lecture, qui partagent le même volume de stockage sous-jacent que l'instance principale. Les mises à jour effectuées par l'instance principale sont visibles pour tous les réplicas Amazon DocumentDB.
- Fonctionnalité : réplicas en lecture Amazon DocumentDB
- Nombre de réplicas : jusqu'à 15
- Type de réplication : asynchrone (quelques millisecondes, en général)
- Impact sur les performances de l'instance principale : faible
- Agit en tant que cible de basculement : oui (aucune perte de données)
- Basculement automatique : oui
Puis-je profiter des réplicas sur plusieurs régions avec Amazon DocumentDB ?
Oui, vous pouvez répliquer vos données entre les régions à l'aide de la fonctionnalité Global Cluster. Les Global Clusters s'étendent sur plusieurs régions AWS. Les Global Clusters répliquent vos données vers des clusters situés dans un maximum de cinq régions, avec un impact minime ou nul sur les performances. Les Global Clusters permettent une reprise plus rapide en cas de panne à l'échelle de la région et permettent des lectures globales à faible latence. Pour en savoir plus, consultez notre article de blog.
Puis-je accorder la priorité à certains réplicas en tant que cibles de basculement ?
Oui. Vous pouvez attribuer un niveau de priorité à chaque instance sur votre cluster. En cas d'échec de l'instance principale, Amazon DocumentDB choisit le réplica dont le niveau de priorité est le plus élevé et le définit comme la nouvelle instance principale. En cas d'incohérence entre deux réplicas ou plus du même niveau de priorité, Amazon DocumentDB choisit le réplica dont la taille est identique à celle de l'instance principale.
Puis-je modifier les niveaux de priorité des instances après leur création ?
Vous pouvez modifier le niveau de priorité d'une instance à tout moment. Le simple fait de modifier les niveaux de priorité ne déclenchera pas de basculement.
Puis-je empêcher certains réplicas d'être promus comme instance primaire ?
Vous pouvez attribuer des niveaux de priorité inférieurs aux réplicas que vous ne souhaitez pas voir définies comme l'instance principale. Cependant, si les réplicas de niveau supérieur du cluster sont défectueux ou indisponibles pour quelque raison que ce soit, Amazon DocumentDB choisit un réplica de niveau inférieur.
Comment Amazon DocumentDB assure-t-il la disponibilité élevée de mon cluster ?
Il est possible de déployer Amazon DocumentDB avec une configuration de disponibilité élevée en utilisant des instances de réplicas sur plusieurs zones de disponibilité AWS en tant que cibles du basculement. Si l'instance principale connaît une défaillance, une instance de réplica est promue automatiquement et devient la nouvelle instance principale avec une interruption du service minimale.
Comment améliorer la disponibilité d'une seule instance Amazon DocumentDB ?
Vous pouvez ajouter des réplicas Amazon DocumentDB supplémentaires. Les réplicas Amazon DocumentDB partagent le même stockage sous-jacent en tant qu'instance principale. Tout réplica Amazon DocumentDB peut être promu pour devenir un réplica principal sans aucune perte de données. Il peut ainsi être utilisé pour améliorer la tolérance aux pannes en cas de défaillance de l'instance principale. Pour augmenter la disponibilité d'un cluster, il suffit de créer de 1 à 15 réplicas, dans plusieurs zones de disponibilité, et Amazon DocumentDB les inclura automatiquement dans la sélection principale de basculement en cas de panne d'une instance.
Que se passe-t-il au cours du basculement et combien de temps dure-t-il ?
Le basculement est automatiquement traité par Amazon DocumentDB afin que vos applications puissent reprendre vos opérations de base de données aussi vite que possible, sans intervention manuelle d'un administrateur.
- Si vous disposez d'une instance de réplica Amazon DocumentDB dans la même zone de disponibilité ou dans une autre zone de disponibilité, lors du basculement, Amazon DocumentDB retourne l'enregistrement de nom canonique (CNAME) de votre instance pour pointer vers le réplica sain, qui est promu à son tour afin de devenir la nouvelle instance principale. Du début à la fin, le basculement s'effectue généralement en 30 secondes.
- Si vous ne disposez pas d’une instance de réplica Amazon DocumentDB (c’est-à-dire un cluster d’instance unique), Amazon DocumentDB tentera de créer une nouvelle instance dans la même zone de disponibilité que l'instance d'origine. Ce remplacement de l'instance d'origine s'effectue de manière optimale et peut échouer, par exemple s'il existe un problème qui affecte de manière générale la zone de disponibilité.
Votre application devrait tenter une nouvelle connexion à la base de données dans le cas d'une perte de connexion.
Si je possède une instance principale et une instance de réplica Amazon DocumentDB enregistrant activement le trafic en lecture et qu'un basculement se produit, que se passe-t-il ?
Amazon DocumentDB détectera automatiquement un problème dans votre instance principale et commencera l'acheminement du trafic en lecture/écriture vers l'instance de réplica Amazon DocumentDB. En moyenne, ce basculement dure 30 secondes. En outre, le trafic en lecture servi par vos instances de réplicas Amazon DocumentDB sera interrompu momentanément.
À quel point mes réplicas seront-ils en retard sur l'instance principale ?
Comme les réplicas Amazon DocumentDB partagent le même volume de données que l'instance principale, il n'y a quasiment pas de retard de réplication. Nous constatons généralement des périodes de retard de l'ordre d'une dizaine de millisecondes.
Sécurité et conformité
Puis-je utiliser Amazon DocumentDB dans Amazon Virtual Private Cloud (Amazon VPC) ?
Oui. Tous les clusters d'Amazon DocumentDB doivent être créés dans un VPC. Avec Amazon VPC, vous pouvez définir une topologie virtuelle de réseau qui ressemble étroitement à un réseau traditionnel que vous pourriez faire fonctionner dans votre propre centre de données. Vous disposez d'un contrôle total sur les utilisateurs pouvant accéder à vos clusters Amazon DocumentDB.
Amazon DocumentDB prend-il en charge le contrôle d'accès basé sur le rôle (RBAC) ?
Amazon DocumentDB prend en charge le contrôle d'accès basé sur le rôle (RBAC) avec des rôles intégrés. Le contrôle d'accès basé sur le rôle (RBAC) permet d'appliquer la règle du moindre privilège en tant que bonne pratique en restreignant les actions que les utilisateurs sont autorisés à effectuer. Pour plus d'informations, consultez Contrôle d'accès basé sur le rôle d'Amazon DocumentDB.
Comment les modes d'authentification MongoDB existants fonctionnent-ils avec Amazon DocumentDB ?
Amazon DocumentDB utilise le réseau strict et les limites d'autorisation du VPC. Ce sont les utilisateurs, les rôles et les politiques IAM qui fournissent l'authentification et l'autorisation pour les API de gestion Amazon DocumentDB. L'authentification sur une base de données Amazon DocumentDB s'effectue à partir des outils et des pilotes MongoDB standard avec un mécanisme SCRAM (Salted Challenge Response Authentication Mechanism), le mécanisme d'authentification par défaut de MongoDB.
Le service Amazon DocumentDB prend-il en charge le chiffrement de mes données au repos ?
Oui. Amazon DocumentDB vous permet de chiffrer vos clusters à l'aide de clés que vous gérez par l'intermédiaire d'AWS Key Management Service (KMS). Sur un cluster en cours d'exécution utilisant le chiffrement Amazon DocumentDB, les données stockées au repos dans le stockage sous-jacent sont chiffrées, tout comme les sauvegardes automatisées, les instantanés et les réplicas dans le même cluster. Le chiffrement et le déchiffrement sont gérés de manière transparente. Pour plus d'informations concernant l'utilisation de KMS avec Amazon DocumentDB, consultez Chiffrement de données au repos Amazon DocumentDB.
Puis-je chiffrer un cluster non chiffré existant ?
Le chiffrement des clusters Amazon DocumentDB non chiffrés existants n'est actuellement pas pris en charge. Pour utiliser le chiffrement Amazon DocumentDB pour un cluster non chiffré existant, créez un nouveau cluster avec chiffrement activé, puis migrez vos données vers celui-ci.
À quelles certifications de conformité le service Amazon DocumentDB satisfait-il ?
Amazon DocumentDB a été conçu pour satisfaire aux normes de sécurité les plus élevées, ainsi que pour vous aider à facilement vérifier notre sécurité et répondre à vos propres exigences règlementaires et de conformité. Amazon DocumentDB a été jugé conforme aux normes PCI DSS, ISO 9001, 27001, 27017 et 27018, SOC 1, 2 et 3, ainsi qu'à la certification Health Information Trust Alliance (HITRUST) Common Security Framework (CSF), et est éligible HIPAA. Les rapports de conformité AWS sont disponibles et téléchargeables sur AWS Artifact.
Mise à niveau de la version majeure
Qu'est-ce qu'une mise à niveau de version majeure sur place ?
La mise à niveau des versions majeures (MVU) sur place vous permet de mettre à niveau des clusters Amazon DocumentDB 3.6 ou 4.0 vers Amazon DocumentDB 5.0 à l'aide de la console AWS, du kit de développement logiciel (SDK) ou de l'interface de ligne de commande (CLI). Avec le MVU sur place, il n'est pas nécessaire de créer de nouveaux clusters ou de modifier vos points de terminaison. La fonctionnalité MVU sur place est disponible dans toutes les régions où Amazon DocumentDB 5.0 est disponible. Pour commencer à utiliser la fonctionnalité MVU sur place, veuillez consulter la documentation de la fonctionnalité MVU sur place.
Pourquoi utiliser le MVU sur place ?
Le MVU sur place vous permet de mettre à niveau facilement vos clusters Amazon DocumentDB 3.6 ou 4.0 vers la version 5.0 sans avoir à effectuer de sauvegarde et de restauration sur un autre cluster et sans utiliser d'autres outils de migration de données. Cela réduit le temps et les efforts associés au processus de mise à niveau habituel, qui implique la configuration des points de terminaison source et cible, la migration des index et des données, la modification du code de l'application, etc.
Vous n'aurez pas besoin de modifier votre point de terminaison dans vos applications après la mise à niveau. Comme les données restent dans le même cluster, la mise à niveau à l'aide de cette fonctionnalité n'entraîne aucun coût supplémentaire.
Quel est le temps d'arrêt lors de la mise à niveau avec un MVU sur place ?
Les temps d'arrêt peuvent varier d'un cluster à l'autre en fonction du nombre de collections, d'index, de bases de données et d'instances. Avant d'exécuter une mise à jour de version majeure sur votre cluster de production, nous vous recommandons fortement de l'exécuter dans un environnement inférieur afin de tester les temps d'arrêt, les performances et de vérifier que vos applications fonctionnent comme prévu après la mise à jour.
Vous pouvez également utiliser la fonctionnalité de clonage rapide d'Amazon DocumentDB pour cloner les données de votre cluster à des fins de test. En fonction de la complexité de votre implémentation Amazon DocumentDB, vous pouvez faire appel à notre architecte de solutions de base de données pour obtenir de l'aide supplémentaire.
Quelles sont les versions du moteur prises en charge par le MVU en place aujourd'hui ?
Le MVU sur place n'est pris en charge qu'avec Amazon DocumentDB 3.6 ou 4.0 comme source et la version 5.0 comme cible. Il n'est pas pris en charge pour les clusters globaux ou les clusters élastiques Amazon DocumentDB ou avec DocumentDB 4.0 comme cible.
Machine learning
Comment puis-je utiliser mes données dans Amazon DocumentDB pour créer des modèles de machine learning ?
Amazon DocumentDB s'intègre à Amazon SageMaker Canvas, ce qui facilite la création de modèles de machine learning (ML) et la personnalisation de modèles de base à l'aide de données stockées dans Amazon DocumentDB sans avoir à écrire une seule ligne de code. Il n'est plus nécessaire de développer des données personnalisées et des pipelines de machine learning entre Amazon DocumentDB et SageMaker Canvas. Vous pouvez lancer SageMaker Canvas depuis la console Amazon DocumentDB et ajouter des bases de données Amazon DocumentDB existantes en tant que source de données pour commencer à créer vos modèles de machine learning. Vous pouvez utiliser vos données dans DocumentDB dans SageMaker Canvas pour créer des modèles permettant de prévoir la perte de clients, de détecter les fraudes, de prévoir les défaillances de maintenance, de prévoir les indicateurs financiers et les ventes, d'optimiser les stocks, de résumer le contenu et de générer du contenu.
IA générative et machine learning
Qu'est-ce que la recherche vectorielle ?
La recherche vectorielle est une méthode utilisée dans le machine learning (ML) pour trouver des points de données similaires à un point de données donné en comparant leurs représentations vectorielles à l'aide de mesures de distance ou de similarité. Plus les deux vecteurs sont proches dans l'espace vectoriel, plus les éléments sous-jacents sont considérés comme similaires. Cette technique permet de saisir le sens ou la sémantique des données. Cette approche est utile dans diverses applications, telles que les systèmes de recommandation, le traitement du langage naturel et la reconnaissance d'images.
Quel est le coût associé à l'utilisation d'Amazon DocumentDB comme source de données dans Amazon SageMaker Canvas pour créer des modèles de machine learning ?
Amazon SageMaker Canvas propose une interface sans code permettant de créer des modèles de machine learning à partir de données provenant de différentes sources de données, notamment Amazon DocumentDB. Vous êtes facturé pour votre utilisation de SageMaker Canvas et pour les E/S qui en résultent lorsque SageMaker Canvas lit les données de votre instance Amazon DocumentDB. L'utilisation de DocumentDB comme source de données dans Amazon SageMaker Canvas est gratuite. Consultez la page de tarification d’Amazon DocumentDB et la page de tarification de SageMaker Canvas pour en savoir plus.
Pourquoi utiliser la recherche vectorielle pour Amazon DocumentDB ?
La recherche vectorielle pour Amazon DocumentDB associe la flexibilité et la riche capacité d'interrogation d'une base de données document basée sur JSON à la puissance de la recherche vectorielle. Vous pouvez utiliser vos données Amazon DocumentDB existantes, ou une structure de données documentaire flexible, pour créer des cas d'utilisation de machine learning et d'IA générative, tels que des expériences de recherche sémantique, des recommandations de produits, la personnalisation, des chatbots, la détection des fraudes et des anomalies. Consultez la recherche vectorielle de la documentation Amazon DocumentDB pour en savoir plus.
Quelles versions d'Amazon DocumentDB prennent en charge la recherche vectorielle ?
La recherche vectorielle pour Amazon DocumentDB est disponible sur les clusters basés sur des instances Amazon DocumentDB 5.0.
En quoi l'implémentation de la recherche sémantique diffère-t-elle de la recherche par mot clé avec Amazon DocumentDB ?
La recherche vectorielle pour Amazon DocumentDB permet d'utiliser la recherche sémantique afin que vous puissiez saisir le sens, le contexte et l'intention qui sous-tendent vos données. La recherche par mot clé permet de trouver le document en fonction du texte réel ou de mappages de synonymes prédéfinis. Par exemple, dans une application de commerce électronique traditionnelle, une robe rouge peut renvoyer des produits dont la description contient les mots « rouge » et « robe ». La recherche sémantique permettra d'obtenir des résultats avec des robes dans différentes nuances de rouge, ce qui peut améliorer l'expérience utilisateur.
Quel est le coût associé à l'utilisation de la recherche vectorielle pour Amazon DocumentDB ?
L'utilisation de la recherche vectorielle pour Amazon DocumentDB n'entraîne aucun coût supplémentaire. Les frais standard de calcul, d'E/S, de stockage et de sauvegarde s'appliqueront lorsque vous stockez, indexez et recherchez des vecteurs dans Amazon DocumentDB. Pour en savoir plus, consultez la page de tarification d'Amazon DocumentDB.
Pourquoi utiliser le machine learning sans code avec Amazon DocumentDB et Amazon SageMaker Canvas ?
Amazon DocumentDB s'intègre à Amazon SageMaker Canvas, ce qui facilite la création d'applications d'intelligence artificielle (IA) générative et de machine learning (ML) à l'aide de données stockées dans Amazon DocumentDB. Il n'est plus nécessaire de développer des données personnalisées et des pipelines de machine learning entre Amazon DocumentDB et SageMaker Canvas. L'intégration dans la console élimine les tâches fastidieuses liées à la connexion et à l'accès aux données afin d'accélérer votre développement de machine learning avec une expérience « low code no code (LCNC) ». Vous pouvez lancer SageMaker Canvas depuis la console Amazon DocumentDB et ajouter des bases de données Amazon DocumentDB existantes en tant que source de données.
Intégration zéro ETL
Pourquoi devrais-je utiliser l’intégration zéro ETL d’Amazon DocumentDB avec Amazon OpenSearch Service ?
Cette intégration zéro ETL avec Amazon OpenSearch Service élimine la complexité opérationnelle liée à l’extraction, à la transformation et au chargement des données d’une collection Amazon DocumentDB vers un cluster géré ou une collection sans serveur Amazon OpenSearch. Avec cette intégration, vous n’avez plus besoin de créer ni de gérer des pipelines de données, ni de transformer celles-ci.
Lorsque je souhaite effectuer une recherche vectorielle pour mon cas d’utilisation d’IA générative, quand dois-je utiliser les fonctionnalités de recherche vectorielle natives d’Amazon DocumentDB au lieu d’une intégration zéro ETL avec Amazon OpenSearch Service ?
Si vous souhaitez employer les API MongoDB, vous devez utiliser les fonctionnalités de bases de données natives d’Amazon DocumentDB pour effectuer une recherche vectorielle sur vos documents. L’intégration zéro ETL d’Amazon DocumentDB à Amazon OpenSearch Service est parfaitement adaptée à la recherche dans des collections ainsi qu’au stockage et à l’indexation de vecteurs de plus de 2 000 dimensions.
Comment cette intégration zéro ETL réplique-t-elle les données d’Amazon DocumentDB vers Amazon OpenSearch Service ?
L’intégration zéro ETL d’Amazon DocumentDB avec Amazon OpenSearch Service utilise l’ingestion Amazon OpenSearch pour transférer de manière fluide les données opérationnelles d’Amazon DocumentDB vers Amazon OpenSearch Service. Pour démarrer, vous devez activer la fonctionnalité de flux de modifications sur la collection Amazon DocumentDB à répliquer. La fonctionnalité d’intégration zéro ETL met en place dans votre compte un pipeline d’ingestion Amazon OpenSearch qui réplique automatiquement les données vers un cluster géré ou une collection sans serveur Amazon OpenSearch Service.
L’ingestion Amazon OpenSearch comprend automatiquement le format des données des collections Amazon DocumentDB et mappe les données vers Amazon OpenSearch Service pour obtenir les résultats de recherche les plus pertinents. Vous pouvez synchroniser les données de multiples collections Amazon DocumentDB via plusieurs pipelines en un cluster géré ou une collection sans serveur Amazon OpenSearch afin de fournir des informations holistiques dans de nombreuses applications. Vous pouvez éventuellement spécifier des processeurs de données personnalisés lors de la définition de la configuration d’ingestion dans Amazon OpenSearch Service. Les mises à jour ultérieures des collections DocumentDB sont également répliquées sur Amazon OpenSearch Service sans aucune intervention manuelle.
Comment fonctionne la transformation des données lors du transfert de données d’Amazon DocumentDB vers Amazon OpenSearch Service ?
Ce zéro ETL s’appuie sur les capacités natives de transformation des données des pipelines d’ingestion OpenSearch pour agréger et filtrer les données en transit.
Quelles sont les options qui s’offrent à moi si je ne souhaite pas utiliser la logique de transformation fournie par l’ingestion Amazon OpenSearch ?
Vous pouvez également écrire une logique de transformation personnalisée si vous désirez des fonctionnalités de transformation personnalisées, et l’ingestion Amazon OpenSearch gérera le processus de transformation. Sinon, si vous souhaitez transférer l’intégralité des données de la source vers le récepteur sans personnalisation, l’ingestion Amazon OpenSearch fournit des plans prêts à l’emploi de sorte que vous puissiez effectuer les intégrations en quelques clics.
Quelles autorisations de sécurité sont-elles requises pour utiliser l’intégration zéro ETL à Amazon OpenSearch ?
Pour faire en sorte que l’ingestion Amazon OpenSearch dispose des autorisations nécessaires pour répliquer les données à partir d’Amazon DocumentDB, la fonctionnalité d’intégration zéro ETL crée un rôle IAM doté des autorisations nécessaires pour lire les données de la collection Amazon DocumentDB et les écrire dans un domaine ou une collection Amazon OpenSearch. Ce rôle est ensuite assumé par les pipelines d'ingestion Amazon OpenSearch afin de garantir que la bonne posture de sécurité est toujours maintenue lors du déplacement des données de la source vers la destination.
Comment puis-je surveiller l’état de mon intégration entre Amazon DocumentDB et Amazon OpenSearch Service ?
Vous pouvez afficher toutes les métriques relatives à votre intégration zéro ETL avec Amazon DocumentDB sur les tableaux de bord de console fournis par Amazon DocumentDB et le pipeline d’ingestion OpenSearch. Vous pouvez également interroger les journaux en temps réel dans Amazon CloudWatch et configurer à l’aide d’Amazon CloudWatch des alertes personnalisées qui sont déclenchées lorsque les seuils définis par l’utilisateur sont dépassés.