Questions fréquentes (FAQ) sur Amazon SageMaker Ground Truth

Questions d’ordre général

L'humain dans la boucle est le processus qui consiste à exploiter les données humaines tout au long du cycle de vie du ML afin d'améliorer la précision et la pertinence des modèles. Les humains peuvent effectuer diverses tâches, de la génération et l’annotation de données, à la révision, la personnalisation et l’évaluation de modèles. L'intervention humaine est particulièrement importante pour les applications d'IA générative, où les humains sont généralement à la fois le demandeur et le consommateur du contenu. Il est donc essentiel que les humains entraînent les modèles de fondation (FM) à répondre de manière précise, sûre et pertinente aux demandes des utilisateurs. Les commentaires humains peuvent être appliqués pour vous aider à accomplir plusieurs tâches. Tout d'abord, en créant des jeux de données d'entraînement labellisés de haute qualité pour des applications d'IA générative via un apprentissage supervisé (où un humain simule le style, la longueur et la précision de la manière dont un modèle doit répondre aux instructions de l'utilisateur) et un apprentissage de renforcement avec des commentaires humains (où un humain classe et classifie les réponses du modèle). Ensuite, en utilisant des données générées par l'homme pour personnaliser les FM en fonction de tâches spécifiques ou avec des données spécifiques à votre entreprise et à votre domaine et pour rendre les résultats du modèle pertinents pour vous. Enfin, utilisez l’évaluation et la comparaison humaines pour sélectionner le modèle de fondation le mieux adapté à votre cas d’utilisation et aux exigences de votre projet.

Amazon SageMaker Ground Truth propose l'ensemble le plus complet de fonctionnalités de l'humain dans la boucle. Il existe deux manières d'utiliser Amazon SageMaker Ground Truth : une offre en libre-service et une offre gérée par AWS. Dans le cadre de l'offre en libre-service, vos annotateurs de données, vos créateurs de contenu et vos ingénieurs de requête (en interne, gérés par le fournisseur ou tirant parti du public) peuvent utiliser notre interface utilisateur à faible code pour accélérer les tâches de l'humain dans la boucle, tout en ayant la flexibilité nécessaire pour créer et gérer vos propres flux de travail personnalisés. Dans le cadre de l'offre gérée par AWS (SageMaker Ground Truth Plus), nous nous chargeons du gros du travail à votre place, notamment en sélectionnant et en gérant la main-d'œuvre adaptée à votre cas d'utilisation. SageMaker Ground Truth Plus conçoit et personnalise un flux de travail de bout en bout (y compris la formation détaillée du personnel et les étapes d'assurance qualité) et fournit une équipe qualifiée dirigée par AWS qui est formée aux tâches spécifiques et répond à vos exigences en matière de qualité, de sécurité et de conformité des données.

Les fonctionnalités de l'humain dans la boucle jouent un rôle important dans la création et l'amélioration des applications d'IA générative à technologie de FM. Une main-d'œuvre humaine hautement qualifiée formée selon les directives relatives aux tâches peut fournir des commentaires, des conseils, des contributions et des évaluations dans le cadre d'activités telles que la génération de données de démonstration pour entraîner les FM, la correction et l'amélioration des exemples de réponse, l'affinement d'un modèle basé sur les données de l'entreprise et de l'industrie, la protection contre la toxicité et les biais, etc. Les fonctionnalités de l'humain dans la boucle peuvent donc améliorer la précision et les performances des modèles.

Pour démarrer avec Amazon SageMaker Ground Truth Plus (offre gérée par AWS), remplissez le formulaire des exigences du projet. Notre équipe vous contactera pour discuter de votre projet de type human‑in‑the‑loop (humain dans la boucle).

Pour démarrer avec Amazon SageMaker Ground Truth (offre en libre-service), connectez-vous à la Console de gestion AWS, puis accédez à la console SageMaker. À partir de là, sélectionnez tâches d’étiquetage sous Ground Truth. Vous pouvez créer une tâche d’étiquetage à cet endroit. Tout d'abord, dans le cadre du processus de création d'une tâche d'étiquetage, vous fournissez un pointeur vers le compartiment S3 qui contient votre jeu de données à étiqueter. Ground Truth propose des modèles pour les tâches d'étiquetage courantes dans lesquelles il vous suffit de cliquer sur quelques choix et de fournir des instructions minimales sur la manière d'étiqueter vos données. Vous pouvez également créer votre propre modèle personnalisé. Lors de la dernière étape de la création d'une tâche d'étiquetage, vous sélectionnez l'une des trois options de main-d'œuvre humaine : (1) une main-d'œuvre publique participative, (2) un ensemble de fournisseurs de services tiers d'étiquetage de données sélectionnés, ou (3) vos propres employés. Vous avez également la possibilité d’activer l’étiquetage des données automatisé.

Par défaut, Amazon SageMaker Ground Truth chiffre les données stockées dans un compartiment Amazon S3 au repos ou en transit. En outre, l’accès à vos données est contrôlé à l’aide d’AWS Identity and Access Management (IAM). SageMaker Ground Truth ne stocke ni ne copie vos données en dehors de votre environnement AWS (créé par vous ou via un service géré AWS), et vos données restent sous votre contrôle. De plus, Ground Truth prend en charge les normes de conformité telles que le règlement général sur la protection des données (RGPD), et journalise et audite tous les accès à vos données à l’aide d’Amazon CloudWatch et d’Amazon CloudTrail. Consultez la documentation d’Amazon SageMaker Ground Truth pour plus d’informations.

Avec Amazon SageMaker Ground Truth Plus (offre gérée par AWS), vous avez accès à la demande à du personnel expert, formé à vos tâches spécifiques d’IA/ML. Celui-ci est capable de mettre à l’échelle dynamiquement vos flux de travail à la hausse ou à la baisse en fonction des exigences spécifiques du projet et vous permet de répondre à vos exigences de qualité, de sécurité et de conformité des données. Notre équipe travaillera avec vous pour comprendre les compétences requises pour votre projet et y assigner le personnel approprié.

Veuillez vous reporter à la page de tarification de SageMaker Ground Truth pour obtenir les informations de tarification actuelles. Les projets SageMaker Ground Truth Plus sont facturés individuellement et notre équipe étudiera les options de tarification avec vous une fois que vous aurez soumis le formulaire des exigences du projet. Le tableau des régions AWS répertorie toutes les régions AWS où Amazon SageMaker Ground Truth est actuellement disponible.