Qu’est-ce qu’Amazon SageMaker HyperPod ?
Amazon SageMaker HyperPod permet d’éliminer les tâches fastidieuses liées à la création de modèles d’IA générative. Il permet de rapidement mettre à l’échelle les tâches de développement de modèles telles que l’entraînement, l’optimisation ou l’inférence sur un cluster de centaines ou de milliers d’accélérateurs d’IA. SageMaker HyperPod permet une gouvernance centralisée de toutes vos tâches de développement de modèles, vous offrant ainsi une visibilité et un contrôle complets sur la priorisation des différentes tâches et sur la manière dont les ressources de calcul sont allouées à chaque tâche, ce qui vous permet d’optimiser l’utilisation du GPU et d’AWS Trainium de votre cluster, mais aussi d’accélérer l’innovation.
Avec SageMaker HyperPod, vous pouvez répartir et paralléliser efficacement votre charge de travail d’entraînement sur tous les accélérateurs. SageMaker HyperPod applique automatiquement les meilleures configurations d’entraînement pour les modèles les plus courants disponibles au public, afin de vous aider à atteindre rapidement des performances optimales. Il surveille également en permanence votre cluster pour détecter tout défaut d’infrastructure, répare automatiquement le problème et restaure vos charges de travail sans intervention humaine, ce qui vous permet d’économiser jusqu’à 40 % du temps d’entraînement.
Avantages de SageMaker HyperPod
Présentation de la gouvernance des tâches dans SageMaker HyperPod
Optimisez l’utilisation et bénéficiez d’une visibilité complète des ressources informatiques tout en réduisant les coûts.