Human-in-the-loop é o processo de aproveitar a contribuição humana em todo o ciclo de vida do ML para melhorar a precisão e a relevância dos modelos. As pessoas podem realizar uma variedade de tarefas, desde a geração e anotação de dados até a revisão, personalização e avaliação de modelos. A intervenção humana é especialmente importante para aplicações de IA generativa, em que os humanos normalmente são tanto o solicitante quanto o consumidor do conteúdo. Portanto, é fundamental que as pessoas treinem os modelos de base (FMs) para responder com precisão, segurança e relevância às solicitações dos usuários. O feedback humano pode ser aplicado para ajudar você a concluir várias tarefas. Primeiro, criar conjuntos de dados de treinamento rotulados de alta qualidade para aplicações de IA generativa por meio de aprendizado supervisionado (em que uma pessoa simula o estilo, a duração e a precisão de como um modelo deve responder às solicitações do usuário) e o aprendizado por reforço com feedback humano (em que uma pessoa ordena e classifica as respostas do modelo). Segundo, usar dados gerados por humanos para personalizar FMs em tarefas específicas ou com dados específicos da empresa e domínio e tornar a saída do modelo relevante para você. E, por fim, usando avaliação e comparação humanas para selecionar o FM mais adequado ao seu caso de uso e aos requisitos do projeto.
O Amazon SageMaker Ground Truth oferece o conjunto mais abrangente de recursos human-in-the-loop. Há duas maneiras de usar o Amazon SageMaker Ground Truth: uma oferta de autoatendimento e uma oferta gerenciada pela AWS. Na oferta de autoatendimento, seus anotadores de dados, criadores de conteúdo e engenheiros de prompts (internos, gerenciados pelo fornecedor ou público) podem usar nossa interface de usuário de baixo código para acelerar tarefas simples e ter flexibilidade para criar e gerenciar fluxos de trabalho personalizados. Na oferta gerenciada pela AWS (SageMaker Ground Truth Plus), cuidamos do trabalho pesado para você, que inclui selecionar e gerenciar a força de trabalho certa para seu caso de uso. O SageMaker Ground Truth Plus projeta e personaliza um fluxo de trabalho de ponta a ponta (incluindo treinamento detalhado da força de trabalho e etapas de garantia de qualidade) e fornece uma equipe qualificada gerenciada pela AWS que é treinada nas tarefas específicas e atende aos requisitos de qualidade, segurança e conformidade de dados da empresa.
Os recursos human-in-the-loop desempenham um papel importante na criação e no aprimoramento de aplicações de IA generativa alimentadas por FMs. Uma força de trabalho humana altamente qualificada, treinada de acordo com as diretrizes das tarefas, pode fornecer feedback, orientação, contribuições e avaliação em atividades, como gerar dados de demonstração para treinar FMs, corrigir e melhorar as respostas das amostras, ajustar um modelo com base em dados da empresa e do setor, agir como uma proteção contra toxicidade e preconceitos e muito mais. Os recursos human-in-the-loop, portanto, podem melhorar a precisão e a performance do modelo.
Para começar a usar o Amazon SageMaker Ground Truth Plus (oferta gerenciada da AWS), preencha o formulário de requisitos do projeto. Nossa equipe entrará em contato com você para discutir seu projeto com envolvimento humano.
Para começar a usar o Amazon SageMaker Ground Truth (ofertas de autoatendimento), faça login no Console de Gerenciamento da AWS e navegue até o console do SageMaker. Neste ponto, selecione Labeling jobs em Ground Truth. Crie uma tarefa de rotulagem. Primeiro, como parte do fluxo de criação da tarefa de rotulagem, você fornece um ponteiro para o bucket do S3 que contém o conjunto de dados a ser rotulado. O Ground Truth oferece modelos para tarefas comuns de rotulagem, bastando clicar em algumas opções e fornecer instruções mínimas sobre como rotular os dados. Como alternativa, crie seu próprio modelo personalizado. Como última etapa da criação de uma tarefa de rotulagem, você seleciona uma das três opções de força de trabalho humana: (1) uma força de trabalho colaborativa pública, (2) um conjunto selecionado de provedores de serviços de rotulagem de dados e (3) use seus próprios funcionários. Além disso, há a opção de habilitar a rotulagem de dados automatizada.
Por padrão, o Amazon SageMaker Ground Truth criptografa os dados armazenados em um bucket do Amazon S3 em repouso e em trânsito. Além disso, o acesso a seus dados é controlado usando o AWS Identity and Access Management (IAM). O SageMaker Ground Truth não armazena nem faz cópias dos seus dados fora do seu ambiente da AWS (criado por você ou por meio de um serviço gerenciado da AWS), e eles permanecem sob seu controle. Além disso, o Ground Truth oferece suporte a padrões de conformidade, como o Regulamento Geral de Proteção de Dados (RGPD), além de registrar em log e auditar todo o acesso aos seus dados usando o Amazon CloudWatch e o Amazon CloudTrail. Acesse a documentação do Amazon SageMaker Ground Truth para obter mais informações.
Com o Amazon SageMaker Ground Truth Plus (oferta gerenciada da AWS), você pode acessar uma força de trabalho especializada, sob demanda, treinada em suas tarefas específicas de IA/ML, pode aumentar ou diminuir dinamicamente a escala vertical dos seus fluxos de trabalho com base em requisitos específicos do projeto e pode ajudar a atender a requisitos de qualidade, segurança e conformidade dos dados. Nossa equipe trabalhará com você para entender as habilidades exigidas pelo seu projeto e poderá equipá-lo com a força de trabalho adequada.
Consulte a página de preços do SageMaker Ground Truth para obter as informações atuais sobre preços. Os projetos do SageMaker Ground Truth Plus têm preços individuais, e nossa equipe analisará as opções de preços com você depois de enviar um formulário de requisitos do projeto. A tabela de regiões da AWS lista todas as regiões da AWS em que o Amazon SageMaker Ground Truth está disponível no momento.