ヒューマンインザループとは、機械学習のライフサイクル全体にわたって人間の意見を活用して、モデルの精度と関連性を向上させるプロセスです。人間は、データの生成や注釈付けから、モデルのレビュー、カスタマイズ、および評価まで、さまざまなタスクを実行できます。人間がコンテンツの要求者であり消費者でもあるジェネレーティブAIアプリケーションでは、人間の介入が特に重要です。したがって、ファンデーションモデル (FM) に、ユーザーのプロンプトに正確かつ安全かつ適切に対応する方法を人間がトレーニングすることが重要です。人間からのフィードバックを応用して、複数のタスクを完了することができます。まず、教師あり学習(モデルがユーザーのプロンプトにどのように反応すべきかのスタイル、長さ、精度を人間がシミュレートする)と人間のフィードバックによる強化学習(人間がモデルの応答をランク付けして分類する)を通じて、生成型AIアプリケーション向けの高品質のラベル付きトレーニングデータセットを作成します。次に、人間が生成したデータを使用して、特定のタスクや会社やドメイン固有のデータに合わせてFMをカスタマイズし、モデル出力を自分に合ったものにします。最後に、人間による評価と比較を使用して、ユースケースとプロジェクトの要件に最も適した FM を選択します。
Amazon SageMaker Ground Truth は、最も包括的なヒューマンインザループ機能を備えています。Amazon SageMaker Ground Truth を利用するには、セルフサービスサービスと AWS マネージドサービスの 2 つの方法があります。セルフサービスサービスでは、データアノテーター、コンテンツクリエーター、プロンプトエンジニア(社内、ベンダー管理、または一般ユーザーの活用)は、当社のローコードユーザーインターフェイスを使用して、独自のカスタムワークフローを柔軟に構築および管理しながら、ヒューマンインザループタスクを加速できます。AWS マネージドサービス (SageMaker Ground Truth Plus) では、お客様のユースケースに適した人材の選択と管理など、面倒な作業をお客様に代わって処理します。SageMaker Ground Truth Plus は、エンドツーエンドのワークフロー (詳細な人材トレーニングと品質保証手順を含む) を設計およびカスタマイズし、特定のタスクについてトレーニングを受けた熟練した AWS マネージドチームを提供し、お客様のデータ品質、セキュリティ、コンプライアンス要件を満たします。
ヒューマン・イン・ザ・ループ機能は、FMを活用した生成型AIアプリケーションの作成と改善において重要な役割を果たします。タスクのガイドラインに基づいてトレーニングを受けた高度なスキルを持つ人材は、FMを訓練するためのデモンストレーションデータの作成、サンプル応答の修正と改善、企業および業界データに基づくモデルの微調整、毒性や偏見に対する保護手段としての機能などの活動において、フィードバック、ガイダンス、インプット、評価を提供できます。したがって、ヒューマンインザループ機能により、モデルの精度とパフォーマンスを向上させることができます。
Amazon SageMaker Ground Truth Plus (AWS マネージド型サービス) の使用を開始するには、プロジェクト要件フォームに入力してください。お客様のヒューマンインザループプロジェクトについてご説明するために、私たちのチームがご連絡いたします。
Amazon SageMaker Ground Truth (セルフサービス型サービス) の使用を開始するには、AWS マネジメントコンソールにサインインして、SageMaker コンソールを開きます。そこで、[Ground Truth] の下にある [ラベリングジョブ] を選択します。これで、ラベル付けジョブを作成できます。まず、ラベル付けジョブ作成フローの一部として、ラベルを付けるデータセットを含む S3 バケットへのポインタを指定します。Ground Truth には、一般的なラベル付け作業のためのテンプレートが用意されており、いくつかの選択肢をクリックするだけで、データをラベル付けするための最短のステップを提供します。独自のカスタムテンプレートを作成することもできます。ラベル付けジョブを作成する最後のステップとして、人手による作業について 3 つのオプションから選択します。(1) クラウドソーシングの労働力を利用する、(2) 推奨されるサードパーティーデータラベリングサービスプロバイダーを利用する、(3) 自社従業員が作業する。また、自動データラベリングを有効にするオプションもあります。
デフォルトで、Amazon SageMaker Ground Truth は、Amazon S3 バケットに保存されたデータを、静止時と転送時に暗号化します。さらに、データへのアクセスは AWS Identity and Access Management (IAM) を使用して制御されます。SageMaker Ground Truth は、データを (お客様によって、または AWS マネージド型サービスを通じて作成された) AWS 環境外に保存したりコピーしたりすることはないので、データはコントロール下にあります。さらに、Ground Truth は一般データ保護規則 (GDPR) などのコンプライアンス基準をサポートしているほか、Amazon CloudWatch および Amazon CloudTrail を使用してデータへのすべてのアクセスのログ記録および監査を行います。詳細については、Amazon SageMaker Ground Truth のドキュメントを参照してください。
Amazon SageMaker Ground Truth Plus (AWS マネージド型サービス) を使用すると、特定の AI/ML タスクのトレーニングを受けたオンデマンドのワークフォースであるエキスパートにアクセスでき、特定のプロジェクト要件に基づいてワークフローを動的にスケールアップまたはスケールダウンでき、データ品質、セキュリティ、コンプライアンス要件を満たすのに役立ちます。私たちのチームはお客様と協力して、お客様のプロジェクトに必要なスキルを理解し、適切な人材を配置します。
最新の価格情報については、SageMaker Ground Truth の料金ページを参照してください。SageMaker Ground Truth Plus プロジェクトは個別に料金設定されており、プロジェクト要件フォームを送信していただいた後、当社のチームが料金オプションを検討します。Amazon SageMaker Ground Truth が現在利用可能な AWS リージョンの一覧 は、製品およびサービス一覧 (リージョン別)でご確認いただけます。