Domande frequenti su Amazon SageMaker Ground Truth

Argomenti della pagina

Domande generali

Domande generali

Human-in-the-loop è il processo che sfrutta l'input umano durante tutto il ciclo di vita del ML per migliorare l'accuratezza e la pertinenza dei modelli. Gli esseri umani possono eseguire una serie di attività, dalla generazione e annotazione dei dati, alla revisione, personalizzazione e valutazione del modello. L'intervento umano è particolarmente importante per le applicazioni di IA generativa, in cui gli umani sono in genere sia il richiedente che il consumatore del contenuto. È quindi fondamentale che gli umani addestrino i modelli di fondazione (FM) a rispondere in modo accurato, sicuro e pertinente alle richieste degli utenti. Il feedback umano può essere applicato per aiutarti a completare più attività. Innanzitutto, la creazione di set di dati di addestramento etichettati di alta qualità per applicazioni di IA generativa tramite l'apprendimento supervisionato (in cui un essere umano simula lo stile, la lunghezza e la precisione di come un modello dovrebbe rispondere alle richieste dell'utente) e l'apprendimento per rinforzo con feedback umano (in cui un essere umano classifica le risposte del modello). In secondo luogo, utilizza i dati generati dall'uomo per personalizzare i modelli di fondazione su attività specifiche o con dati specifici dell'azienda e del dominio e rendere l'output del modello pertinente per te. Infine, utilizza la valutazione e il confronto umani per selezionare il modello di fondazione (FM) più adatto al proprio caso d'uso e ai requisiti del progetto.

Amazon SageMaker Ground Truth offre il set più completo di funzionalità human-in-the-loop. Esistono due modi per utilizzare Amazon SageMaker Ground Truth: un'offerta self-service e una gestita da AWS. Nell'offerta self-service, gli annotatori di dati, i creatori di contenuti e i tecnici di supporto (interni, gestiti dal fornitore o che sfruttano il pubblico) possono utilizzare la nostra interfaccia utente a basso codice per accelerare le attività human-in-the-loop, garantendo al contempo la flessibilità necessaria per creare e gestire i propri flussi di lavoro personalizzati. Nell'offerta gestita da AWS (SageMaker Ground Truth Plus), ci occupiamo del lavoro pesante, che include la selezione e la gestione della forza lavoro giusta per il tuo caso d'uso. SageMaker Ground Truth Plus progetta e personalizza un flusso di lavoro completo (inclusa la formazione dettagliata della forza lavoro e le fasi di garanzia della qualità) e fornisce un team qualificato gestito da AWS, formato su attività specifiche e che soddisfa i requisiti di qualità, sicurezza e conformità dei dati.

Le funzionalità human-in-the-loop svolgono un ruolo importante nella creazione e nel miglioramento delle applicazioni di IA generativa basate sui modelli di fondazione. Una forza lavoro umana altamente qualificata e addestrata sulle linee guida degli incarichi può fornire feedback, indicazioni, input e valutazioni in attività come la generazione di dati dimostrativi per la formazione dei modelli di fondazione, la correzione e il miglioramento delle risposte dei campioni, la messa a punto di un modello basato su dati aziendali e di settore, la protezione dalla tossicità e dalle distorsioni e altro ancora. Quindi, le funzionalità human-in-the-loop possono migliorare la precisione e le prestazioni del modello.

Per iniziare a utilizzare Amazon SageMaker Ground Truth Plus (offerta gestita da AWS), completa il modulo di requisiti del progetto. Il nostro team ti contatterà per discutere del tuo progetto human-in-the-loop.

Per iniziare a utilizzare Amazon SageMaker Ground Truth (offerta self-service), accedi alla Console di gestione AWS e vai alla console di SageMaker. Quindi seleziona Lavori di etichettatura in Ground Truth. Qui puoi creare un lavoro di etichettatura. Per prima cosa, come parte del flusso di creazione del lavoro di etichettatura, fornisci un puntatore al bucket S3 che contiene il set di dati da etichettare. Ground Truth offre modelli per attività di etichettatura comuni in cui è sufficiente fare clic su alcune scelte e fornire istruzioni minime su come ottenere l’etichettatura dei propri dati. In alternativa, puoi creare il tuo modello personalizzato. Come ultima fase della creazione di un lavoro di etichettatura, seleziona una delle tre opzioni umane di forza lavoro: (1) una forza lavoro pubblica crowdsourcing, (2) un insieme selezionato di fornitori di servizi di terze parti per l’etichettatura dati, oppure (3) usa lavoratori di tua scelta. Hai inoltre la possibilità di abilitare l'etichettatura automatica dei dati.

Per impostazione predefinita, Amazon SageMaker Ground Truth codifica i dati archiviati in un bucket di Amazon S3 a riposo e in transito. L'accesso ai dati è controllato tramite AWS Identity and Access Management (AWS IAM). SageMaker Ground Truth non archivia o crea copie dei tuoi dati al di fuori del tuo ambiente AWS (creato da te o tramite il servizio gestito da AWS) e i tuoi dati rimangono sotto il tuo controllo. Inoltre, Ground Truth supporta standard di conformità come il Regolamento generale sulla protezione dei dati (RGPD), oltre a registrare e verificare tutti gli accessi ai tuoi dati utilizzando Amazon CloudWatch e Amazon CloudTrail. Per maggiori informazioni, consulta la documentazione di Amazon SageMaker Ground Truth.

Con Amazon SageMaker Ground Truth Plus (offerta gestita da AWS), puoi accedere a una forza lavoro esperta, su richiesta, formata sulle tue attività specifiche di IA/ML, che può aumentare o ridurre dinamicamente i tuoi flussi di lavoro in base a requisiti di progetto specifici e può aiutarti a soddisfare i requisiti di qualità, sicurezza e conformità dei dati. Il nostro team collaborerà con te per comprendere le competenze necessarie per lo sviluppo del tuo progetto e dotarlo della forza lavoro adeguata.

Per informazioni sui prezzi attuali, consulta la pagina dei prezzi di SageMaker Ground Truth. I progetti SageMaker Ground Truth Plus hanno prezzi diversi e il nostro team esaminerà le varie opzioni con te, dopo che avrai inviato il modulo dei requisiti del progetto. La tabella della Regione AWS elenca tutte le regioni AWS in cui Amazon SageMaker Ground Truth è attualmente disponibile.