Amazon Bedrock のナレッジベース

Amazon Bedrock のナレッジベースを使用することで、会社のプライベートデータソースからのコンテキスト情報を基盤モデルおよびエージェントに提供し、より正確で関連性の高い、カスタマイズされた応答を生成できます

エンドツーエンドのRAGワークフローのフルマネージドサポート

組織は、基盤モデル (FM) に最新情報と専有情報を実装するために検索拡張生成 (RAG) を使用します。RAG は、企業のデータソースからデータを取得し、プロンプトを強化することで、より正確で関連性の高い応答を提供する手法です。Amazon Bedrock のナレッジベースは、取り込み、取得、およびプロンプト拡張に及ぶ RAG ワークフロー全体の実装に役立つ、セッションコンテキスト管理とソースの帰属が組み込まれたフルマネージド機能です。データソースへのカスタム統合を構築してデータフローを管理する必要はありません。また、ベクトルデータベースを設定せずに、質問をしたり、単一のドキュメントからデータを要約したりすることもできます。データに構造化ソースが含まれている場合、Amazon Bedrock のナレッジベースは、データを取得することを目的としたクエリコマンドを生成するための、自然言語から構造化クエリ言語への組み込みマネージド変換機能を提供します。別のストアに移動する必要はありません。

ナレッジベースの概要の正式な表現

FM とエージェントをデータソースに安全に接続します

非構造化データソースがある場合、Amazon Bedrock のナレッジベースは、Amazon Simple Storage Service (Amazon S3)、Confluence (プレビュー)、Salesforce (プレビュー)、SharePoint (プレビュー)、Web Crawler (プレビュー) などのソースから自動的にデータを取得します。さらに、プログラムによるドキュメント取り込み機能も使用できるため、お客様はストリーミングデータやサポートされていないソースからのデータを取り込むことができます。コンテンツが取り込まれると、Amazon Bedrock のナレッジベースがコンテンツをテキストブロックに分割し、テキストを埋め込みに変換してベクトルデータベースに保存します。Amazon Aurora、Amazon Opensearch Serverless、Amazon Neptune Analytics、MongoDB、Pinecone、Redis Enterprise Cloud など、サポートされている複数のベクトルストアから選択できます。また、マネージド検索のために Amazon Kendra ハイブリッド検索インデックスに接続することもできます。

Amazon Bedrock のナレッジベースを使用すると、構造化データストアに接続して根拠のある応答を生成することもできます。これは、データウェアハウスやデータレイクに保存されているトランザクションの詳細などのソースマテリアルがある場合に特に便利です。Amazon Bedrock のナレッジベースは、自然言語から SQL への変換を使用してクエリを SQL コマンドに変換し、そのコマンドを実行してデータを取得します。ソースデータソースからデータを移動する必要はありません。

ナレッジベースを作成し、データソースを設定する画面

Amazon Bedrock のナレッジベースをカスタマイズして、実行時に正確な応答を提供する

Amazon Bedrock のナレッジベースをフルマネージド RAG ソリューションとして使用すると、検索精度をカスタマイズして改善する柔軟性が得られます。画像や、複雑なレイアウトを持つ視覚的にリッチなドキュメント (例: 表、図、グラフを含むドキュメント) などのマルチモーダルデータを含む非構造化データソースの場合、Bedrock のナレッジベースを設定して解析および分析し、有意義なインサイトを抽出できます。パーサーとして、Bedrock のデータオートメーションまたは基盤モデルを選択できます。これにより、複雑なマルチモーダルデータをシームレスに処理できるため、高精度の生成 AI アプリケーションを構築できます。

Amazon Bedrock のナレッジベースは、セマンティック、階層、固定サイズのチャンキングなど、各種の高度なデータチャンキングオプションを提供します。フルコントロールの場合、独自のチャンキングコードを Lambda 関数で記述でき、LangChain や LlamaIndex などのフレームワークの既製のコンポーネントを使用することもできます。ベクトルストアとして Amazon Neptune Analytics を選択した場合、Amazon Bedrock のナレッジベースは、埋め込みと、データソース間で関連コンテンツをリンクするグラフを自動的に作成します。Bedrock のナレッジベースは、GraphRAG とのこれらのコンテンツ関係を活用して検索精度を高め、エンドユーザーに対する、より包括的で関連性が高く説明可能な応答を可能にします。

Bedrock チャンク解析設定のスクリーンショット

データを取得してプロンプトを強化

Retrieve API を使用すると、画像、図、グラフ、表などのビジュアル要素、または該当する場合はデータベースからの構造化データを含むナレッジベースから、ユーザークエリに関連する結果を取得できます。RetrieveAndGenerate API はさらに一歩進んで、取得した結果を直接使用して FM プロンプトを拡張し、応答を返します。また、Amazon Bedrock のエージェントに Amazon Bedrock のナレッジベースを追加して、エージェントにコンテキスト情報を提供することもできます。また、フィルターを指定したり、FM を使用して暗黙的なフィルターを生成したりして、返される結果を、関連するコンテンツのみに制限することもできます。Amazon Bedrock のナレッジベースは、取得したドキュメントチャンクの関連性を高めるためのリランカーモデルを提供します。

API の取得と生成

ソースの帰属を提供する

Amazon Bedrock のナレッジベースから取得したすべての情報には、透明性を高め、ハルシネーションを最小限に抑えるための引用が含まれています (これにはビジュアルも含まれます)。

ユーザーがエージェントと会話しているチャットウィンドウ