人工參與是在整個機器學習生命週期中利用人工輸入來提高模型的準確性和相關性的過程。可以透過人工執行多種任務,從資料產生和註釋,到模型審查、客製化和評估。人工干預對於生成式 AI 應用程式尤其重要,此處的「人」通常是指內容的申請者和消費者。因此,必須人工訓練基礎模型 (FM) 如何準確、安全和相關地回應使用者的提示。您可以套用人工回饋來協助您完成多個任務。首先,透過監督式學習 (人工模擬模型應如何回應使用者提示的風格、長度和準確性),以及使用人工回饋的強化學習 (人工對模型回應進行排名和分類),為生成式 AI 應用程式建立高品質的標籤訓練資料集。其次,使用人工產生的資料對特定任務自訂 FM,或使用您公司和領域的特定資料,並使模型輸出與您相關。最後,使用人工評估和比較來選取最適合您的使用案例和項目要求的 FM。
Amazon SageMaker Ground Truth 提供最全面的人工參與功能。您有兩種方法可以使用 Amazon SageMaker Ground Truth:自助服務產品和 AWS 受管產品。在自助服務產品中,您的資料註釋者、內容創作者和提示工程師 (內部、供應商管理或利用公眾人群) 可以使用我們的低程式碼使用者介面來加速人工參與工作,同時可以靈活地建立和管理自己的自訂工作流程。在 AWS 受管產品 (SageMaker Ground Truth Plus) 中,我們會為您處理繁重的工作,其中包括為您的使用案例選擇和管理合適的員工團隊。SageMaker Ground Truth Plus 可設計和客製化端對端工作流程 (包括詳細的員工訓練和品質保證步驟),提供技術熟練且對特定任務進行過訓練的 AWS 受管團隊,能滿足您對資料品質、安全性和合規的要求。
人工參與功能在建立和改進由 FM 支援的生成式 AI 應用程式中發揮著重要作用。經過任務指南訓練的高技能勞動力可以在活動 (如產生示範資料以訓練 FM、糾正和改善樣本回應、根據公司和產業資料微調模型等) 中提供回饋、指導、輸入和評估,作為防止毒害和偏見等的保障措施。因此,人工參與功能可以提高模型準確度和效能。
若要開始使用 Amazon SageMaker Ground Truth Plus (AWS 受管產品),請完成專案要求表單。我們的團隊會聯絡您,以討論您的人工參與專案。
若要開始使用 Amazon SageMaker Ground Truth (自助服務產品),請登入 AWS 管理主控台,然後導覽至 SageMaker 主控台。從那裡,在 Ground Truth 之下選取 Labeling jobs。您可以在這裡建立標記任務。首先,做為標記任務建立流程的一部分,您要提供指向 S3 儲存貯體的指標,而該儲存貯體包含您要標記的資料集。Ground Truth 為常見的標記任務提供範本,您只需要按幾個選項,並為如何標記您的資料提供最少指示,就能完成標記。或者,您可以建立自己的自訂範本。做為建立標記任務的最後一個步驟,您要選取下列三個人力選項之一:(1) 公有群眾外包人力、(2) 一組專業的第三方資料標記服務供應商,或 (3) 使用自己的工作者。您還可以選擇啟用自動資料標記功能。
預設情況下,Amazon SageMaker Ground Truth 會對存放在 Amazon S3 儲存貯體中的靜態和傳輸中資料進行加密。此外,AWS Identity and Access Management (IAM) 也用於控制對資料的存取。SageMaker Ground Truth 不會在 AWS 環境 (由您建立或透過 AWS 受管服務建立) 之外存放資料或製作資料副本,您的資料仍保持在您的控制之中。此外,Ground Truth 支援各種合規標準,例如一般資料保護規範 (GDPR),並使用 Amazon CloudWatch 和 Amazon CloudTrail 日誌記錄和稽核對您資料的所有存取權。請瀏覽 Amazon SageMaker Ground Truth 文件以取得詳細資訊。
使用 Amazon SageMaker Ground Truth Plus (AWS 受管產品),您可以依需求存取專家和員工,這些員工接受特定人工智能/機器學習任務的培訓,可以根據特定專案需求動態擴展或縮減工作流程,並協助滿足您的資料品質、安全和合規要求。我們的團隊將與您合作,以了解您的專案所需的技能,並為專案指派合適的員工。