Machine-Learning-Experimente mit Amazon SageMaker mit MLflow

Effizientes Management von Machine-Learning-Modellen und generativen KI-Anwendungsexperimenten im großen Maßstab mit MLflow

Warum Amazon SageMaker mit MLflow verwenden?

Amazon SageMaker bietet eine verwaltete MLflow-Funktion für Machine Learning (ML)- und generative KI-Experimente. Diese Funktion erleichtert es Datenwissenschaftlerinnen und -wissenschaftlern, MLflow in SageMaker für Modelltraining, Registrierung und Bereitstellung zu verwenden. Administrierende können schnell sichere und skalierbare MLflow-Umgebungen in AWS einrichten. Datenwissenschaftlerinnen und -wissenschaftler sowie ML-Entwickelnde können ML-Experimente effizient verfolgen und das richtige Modell für ein Geschäftsproblem finden.

Vorteile von Amazon SageMaker mit MLflow

Datenwissenschaftlerinnen und -wissenschaftler können MLflow verwenden, um den Überblick über alle Metriken zu behalten, die bei der Feinabstimmung eines Basismodells generiert wurden, das Modell zu evaluieren, das Modell mit Beispieldaten zu testen, die Ergebnisse der einzelnen Modelle auf der MLflow-Benutzeroberfläche nebeneinander zu vergleichen und das richtige Modell für ihren Anwendungsfall zu registrieren. Sobald sie das Modell registriert haben, können ML-Ingenieurinnen und -ingenieure das Modell für die SageMaker-Inferenz bereitstellen.
Sie müssen keine Infrastruktur verwalten, die zum Hosten von MLflow erforderlich ist. Datenwissenschaftlerinnen und -wissenschaftler können alle Open-Source-Funktionen von MLflow nutzen, ohne dass sich Administrierende Gedanken über den Infrastrukturaufwand machen müssen. Das spart Zeit und Kosten bei der Einrichtung von Datenwissenschaftsumgebungen. MLflow ist in Amazon Identity and Access Management (IAM) integriert, sodass Sie die rollenbasierte Zugriffskontrolle (RBAC) für MLflow-Tracking-Server einrichten können.
In MLflow registrierte Modelle werden automatisch mit einer zugehörigen Amazon SageMaker Model Card in der Amazon SageMaker Model Registry registriert. Auf diese Weise können Datenwissenschaftlerinnen und -wissenschaftler ihre Modelle für den Produktionseinsatz an ML-Ingenieurinnen und -ingenieure weitergeben, ohne den Kontext wechseln zu müssen. ML-Ingenieurinnen und -ingenieure können Modelle von MLflow auf SageMaker-Endpunkten bereitstellen, ohne benutzerdefinierte Container zu erstellen oder die MLflow-Modellartefakte neu zu verpacken.
Während sich das MLflow-Projekt weiterentwickelt, profitieren Kundinnen und Kunden von SageMaker AI von der Open-Source-Innovation der MLflow-Community und genießen gleichzeitig das von AWS bereitgestellte Infrastrukturmanagement.

Experimente von überall aus verfolgen

ML-Experimente werden in verschiedenen Umgebungen durchgeführt, einschließlich lokaler Notebooks, IDEs, cloudbasiertem Trainingscode oder verwalteten IDEs in Amazon SageMaker Studio. Mit SageMaker AI und MLflow können Sie Ihre bevorzugte Umgebung verwenden, um Modelle zu trainieren, Ihre Experimente in MLflow zu verfolgen und die MLflow-Benutzeroberfläche direkt oder über SageMaker Studio zur Analyse zu starten.

Experimente protokollieren

Gemeinsam an Modellexperimenten arbeiten

Effektive Teamzusammenarbeit ist für erfolgreiche Datenwissenschaftsprojekte unerlässlich. Mit SageMaker Studio können Sie die MLflow-Tracking-Server und -Experimente verwalten und darauf zugreifen, sodass Teammitglieder Informationen austauschen und konsistente Experimentergebnisse sicherstellen können, was die Zusammenarbeit erleichtert.

Metadaten von ML-Experimenten zentral verwalten

Experimente auswerten

Um das beste Modell aus mehreren Iterationen zu identifizieren, sind eine Analyse und ein Vergleich der Modellleistung erforderlich. MLflow bietet Visualisierungen wie Streudiagramme, Balkendiagramme und Histogramme, um Trainingsiterationen zu vergleichen. Darüber hinaus ermöglicht MLflow die Bewertung von Modellen auf Vorurteile und Fairness.

Ihre ML-Experimente auswerten

MLflow-Modelle zentral verwalten

Oft verwenden mehrere Teams MLflow, um ihre Experimente zu verwalten, wobei nur einige Modelle für die Produktion in Frage kommen. Unternehmen benötigen eine einfache Möglichkeit, den Überblick über alle Kandidatenmodelle zu behalten, um fundierte Entscheidungen darüber treffen zu können, welche Modelle in Produktion gehen. MLflow lässt sich nahtlos in SageMaker Model Registry integrieren. Dadurch können Unternehmen sehen, dass ihre in MLflow registrierten Modelle automatisch in der SageMaker Model Registry erscheinen, komplett mit einer SageMaker-Modellkarte für die Governance. Diese Integration ermöglicht es Datenwissenschaftlerinnen und -wissenschaftlern sowie ML-Ingenieurinnen und -ingenieuren, unterschiedliche Tools für ihre jeweiligen Aufgaben zu verwenden: MLflow für Experimente und SageMaker Model Registry für die Verwaltung des Produktionslebenszyklus mit umfassender Modelllinie.

Updates und Ergebnisse teilen

MLflow-Modelle auf SageMaker-Endpunkten bereitstellen

Die Bereitstellung von MLflow-Modellen auf SageMaker-Endpunkten ist nahtlos, sodass keine benutzerdefinierten Container für die Modellspeicherung erstellt werden müssen. Diese Integration ermöglicht es Kundinnen und Kunden, die optimierten Inferenzcontainer von SageMaker zu nutzen und gleichzeitig die benutzerfreundliche Erfahrung von MLflow für die Protokollierung und Registrierung von Modellen beizubehalten.

ML-Experimente reproduzieren und prüfen