Precios de Amazon Bedrock

Información general sobre precios

Amazon Bedrock es un servicio totalmente administrado que ofrece una selección de modelos fundacionales (FM) de alto rendimiento a través de una única API, junto con un amplio conjunto de funcionalidades que necesita para crear aplicaciones de IA generativa con seguridad, privacidad e IA responsable.

Con Amazon Bedrock, se le cobrará por la inferencia y personalización del modelo. Puede elegir entre dos precios de planes a modo de inferencia: 1. Bajo demanda y por lotes: este modo le permite usar FM con la modalidad de pago por uso sin compromisos temporales. 2. Rendimiento aprovisionado: este modo le permite aprovisionar un rendimiento suficiente para cumplir con los requisitos de rendimiento de su aplicación a cambio de un compromiso temporal.

Modelos de precios

Con el modo bajo demanda, solo paga por lo que utiliza, sin compromisos de plazo basados en el tiempo. En el caso de los modelos de generación de texto, se le cobra por cada token de entrada procesado y por cada token de salida generado. En el caso de los modelos de incrustación, se le cobra por cada token de entrada procesado. Un token está compuesto de unos pocos caracteres y se refiere a la unidad básica de texto que un modelo aprende para entender la entrada y el mensaje del usuario. En el caso de los modelos de generación de imágenes, se le cobra por cada imagen generada.

Inferencia entre regiones: el modo bajo demanda también admite la inferencia entre regiones para algunos modelos. Permite a los desarrolladores administrar sin problemas las ráfagas de tráfico mediante el uso informático en diferentes regiones de AWS y obtener límites de rendimiento más altos y una mayor resiliencia. El uso de la inferencia interregional no conlleva ningún costo adicional, y el precio se calcula en función de la región en la que se realizó la solicitud (región de origen).

Con el modo por lotes, puede proporcionar un conjunto de solicitudes como un único archivo de entrada y recibir respuestas como un único archivo de salida, lo que le permite obtener predicciones simultáneas a gran escala. Las respuestas se procesan y almacenan en su bucket de Amazon S3 para que pueda acceder a ellas más adelante. Amazon Bedrock ofrece modelos fundacionales (FM) exclusivos de los principales proveedores de inteligencia artificial, como Anthropic, Meta, Mistral AI y Amazon, para la inferencia por lotes a un precio un 50 % más bajo en comparación con los precios de inferencia bajo demanda. Consulte la lista de modelos aquí.

El uso de un inferencia optimizada para latencia con modelos básicos en Amazon Bedrock brinda tiempos de respuesta más rápidos para los modelos y mejora la capacidad de respuesta de sus aplicaciones de IA generativa. Puede usar la inferencia optimizada para latencia con el modelo Claude 3.5 Haiku de Anthropic y los modelos Llama 3.1 405B y 70B de Meta. Según lo verificado por Anthropic, con la inferencia optimizada para la latencia en Amazon Bedrock, Claude 3.5 Haiku se ejecuta más rápido en AWS que en cualquier otro lugar. Además, con la inferencia optimizada para la latencia en Bedrock, Llama 3.1 405B y 70B se ejecuta más rápido en AWS que en cualquier otro proveedor de nube relevante. Obtenga más información aquí.

Con el modo de rendimiento aprovisionado, puede comprar unidades de modelo para un modelo base o personalizado específico. El modo de rendimiento aprovisionado se ha diseñado principalmente para grandes cargas de trabajo de inferencia consistentes que necesitan un rendimiento garantizado. Solo se puede acceder a los modelos personalizados mediante el rendimiento aprovisionado. Una unidad de modelo proporciona un rendimiento determinado, que se mide por la cantidad máxima de tokens de entrada o salida procesados por minuto. Con el rendimiento aprovisionado, se le cobra por hora y tiene la flexibilidad de elegir entre plazos de compromiso de 1 o 6 meses.

Custom Model Import le permite aprovechar sus inversiones anteriores en personalización de modelos en Amazon Bedrock y consumirlas de la misma manera totalmente administrada que los modelos existentes de Bedrock. Puede importar pesos personalizados para las arquitecturas de modelos compatibles y servir el modelo personalizado mediante el modo bajo de demanda. La importación de un modelo personalizado a Bedrock es gratuita. Una vez que importe un modelo, podrá acceder a él bajo demanda sin necesidad de realizar ninguna acción en el plano de control. Solo se le cobra por la inferencia del modelo, en función del número de copias de su modelo personalizado necesarias para atender su volumen de inferencias y del tiempo que cada copia del modelo esté activa, facturado en intervalos de 5 minutos. Una copia del modelo es una instancia única de un modelo importado lista para atender las solicitudes de inferencia. El precio por copia del modelo por minuto depende de factores como la arquitectura, la longitud del contexto, la región de AWS y la versión de la unidad de procesamiento (generación de hardware) y se distribuye por niveles según el tamaño de la copia del modelo.

Amazon Bedrock Marketplace le permite descubrir, probar y usar más de 100 modelos fundacionales populares, emergentes y especializados en Bedrock. Los modelos de Amazon Bedrock Marketplace se implementan en puntos de enlace donde usted puede seleccionar el número deseado de instancias y los tipos de instancias, así como configurar sus políticas de escalado automático para satisfacer las demandas de su carga de trabajo. En el caso de los modelos propietarios, se le cobra el precio del software establecido por el proveedor del modelo (por hora, facturable en incrementos por segundo o por solicitud) y un precio de infraestructura en función de la instancia que seleccione. Puede ver estos precios antes de suscribirse al modelo de proveedor y también en la lista de modelos de AWS Marketplace. En el caso de los modelos disponibles públicamente, solo se le cobra el precio de la infraestructura en función de la instancia que seleccione. Obtenga más información aquí.

Personalización y optimización

Con Amazon Bedrock, puede personalizar los FM con sus datos para ofrecer respuestas personalizadas a tareas específicas y su contexto empresarial. Puede ajustar de forma precisa los modelos con datos etiquetados o utilizar un entrenamiento previo continuo con datos sin etiquetar. Para personalizar un modelo de generación de texto, se le cobra por el entrenamiento del modelo en función de la cantidad total de tokens procesados por el modelo (la cantidad de tokens en el corpus de datos de entrenamiento × por la cantidad de épocas) y el almacenamiento del modelo se cobra por mes por modelo. Una época es un ciclo completo a través de su conjunto de datos de entrenamiento durante el ajuste de precisión o el entrenamiento previo continuo. Las inferencias que utilizan modelos personalizados se cobran en función del plan de rendimiento aprovisionado y requieren que compre este plan. Una unidad de modelo se encuentra disponible sin plazo de compromiso para su inferencia en un modelo personalizado. Se le cobrará por la cantidad de horas que utilice en la primera unidad de modelo para la inferencia de modelos personalizados. Si desea aumentar su rendimiento más allá de una unidad de modelo, debe adquirir un plazo de compromiso de 1 o 6 meses.

Con la destilación de modelos de Amazon Bedrock, usted paga por lo que usa. La generación de datos sintéticos se cobra al precio bajo demanda del modelo de profesor seleccionado. El refinamiento del modelo de estudiante se cobra según las tarifas de personalización del modelo. Dado que un modelo destilado es un modelo personalizado, las inferencias que utilizan modelos personalizados se cobran en función del plan de rendimiento aprovisionado y requieren que los clientes compren este plan.

Con el almacenamiento en caché de peticiones en Amazon Bedrock, puede almacenar en caché el contexto repetido en las llamadas a la API para reducir los costos y las latencias de respuesta. Las peticiones suelen incluir un contexto o prefijos comunes, como conversaciones largas de varios turnos, ejemplos de varias tomas e instrucciones detalladas que refinan el comportamiento del modelo. Con las API de Amazon Bedrock existentes, puede especificar los prefijos de petición que desea almacenar en caché durante cinco minutos en una caché específica de la cuenta de AWS. Durante ese tiempo, cualquier solicitud con prefijos coincidentes recibirá un descuento de hasta el 90 % en los tokens almacenados en caché y una mejora en la latencia de hasta un 85 %. Los precios y las mejoras de rendimiento varían según el modelo y la longitud de la petición, pero sus cachés siempre están aisladas en su cuenta de AWS.

Herramientas

Las barreras de protección de Amazon Bedrock lo ayudan a implementar barreras de seguridad personalizadas y políticas de IA responsable para sus aplicaciones de IA generativa. Proporciona protecciones de seguridad personalizables adicionales además de las protecciones nativas que ofrecen los FM. Es la única capacidad de IA responsable ofrecida por un proveedor de nube importante que ayuda a habilitar a los clientes a crear y personalizar protecciones de seguridad, privacidad y veracidad para las aplicaciones de IA generativa en una única solución. Son compatibles con todos los FM de Amazon Bedrock, así como con modelos refinados. Las barreras de protección de Bedrock también se pueden integrar en los agentes y las bases de conocimiento de Amazon Bedrock para crear aplicaciones de IA generativa alineadas con sus políticas de IA responsable. Además, ofrecen una API ApplyGuardrail para ayudar a evaluar las entradas de los usuarios y modelar las respuestas que genera cualquier modelo fundacional personalizado o externo por fuera de Bedrock.

Las bases de conocimiento de Amazon Bedrock son flujos de trabajo de generación aumentada de recuperación (RAG) completamente administrados que permiten a los clientes crear aplicaciones de IA generativa de alta precisión, baja latencia, seguras y personalizadas mediante la incorporación de información contextual de sus propios orígenes de datos. Son compatibles con varios orígenes de datos, incluidos S3 y Confluence, Salesforce y SharePoint, en versión preliminar. También ofrecen la ingesta de documentos para la transmisión de datos. Las bases de conocimiento de Bedrock convierten los datos no estructurados en incrustaciones, los almacenan en bases de datos vectoriales y permiten la recuperación de diversos almacenes de datos. También se integran con Kendra para la recuperación administrada y admiten la recuperación de datos estructurados mediante lenguaje natural para SQL.

Amazon Bedrock Data Automation transforma el contenido no estructurado y multimodal en formatos de datos estructurados para casos de uso como el procesamiento inteligente de documentos, el análisis de video y la RAG. Bedrock Data Automation puede generar contenido de salida estándar mediante valores predeterminados definidos previamente que son específicos de cada modalidad, como descripciones de videos escena por escena, transcripciones de audio o análisis automatizado de documentos. Además, los clientes también pueden crear salidas personalizadas especificando sus requisitos de salida en los esquemas en función de su propio esquema de datos, que luego pueden cargar fácilmente en una base de datos o almacén de datos existente. Mediante una integración con las bases de conocimiento, Bedrock Data Automation también se puede utilizar para analizar el contenido de las aplicaciones RAG, lo que mejora la precisión y la relevancia de los resultados mediante la inclusión de información incrustada en imágenes y texto.

Los agentes de Amazon Bedrock le ofrecen la posibilidad de crear y configurar agentes autónomos dentro de su aplicación. Estos agentes se conectan de manera segura a los orígenes de datos de su empresa y mejoran las solicitudes de los usuarios con la información correcta para generar respuestas precisas. En tan solo unos pasos rápidos, puede crear una aplicación de agente único o múltiple, así como acelerar el tiempo de creación de aplicaciones de IA generativa. Estos agentes admiten la interpretación de código para generar y ejecutar código de forma dinámica, así como para devolver el control, lo que permite definir un esquema de acción y recuperar el control cada vez que el agente invoca la acción. Además, los agentes de Amazon Bedrock pueden retener la memoria entre todas las interacciones, lo que ofrece experiencias de usuario más personalizadas y fluidas.

Amazon Bedrock Flows es una característica de creación y ejecución de flujos de trabajo de Bedrock para aplicaciones de IA generativas. Acelera la creación, las pruebas y la implementación de flujos de trabajo de IA generativa definidos por el usuario a través de un generador visual intuitivo y un conjunto de API. Le permite vincular sin problemas los últimos modelos básicos, peticiones, agentes, base de conocimientos, barreras de protección, y servicios de AWS (como Amazon Lex, AWS Lambda y Amazon S3) con la lógica empresarial para crear flujos de trabajo de IA generativa. Puede probar y versionar fácilmente sus flujos de trabajo y ejecutarlos en un entorno seguro sin servidores a través de una interfaz visual o una API sin tener que instalar su propia infraestructura.

Evaluación del modelo: con la evaluación del modelo en Amazon Bedrock, paga por lo que usa, sin compromisos de volumen en cuanto al número de solicitudes o respuestas. En el caso de la evaluación automática, solo pague por la inferencia del modelo que haya elegido en la evaluación. Las puntuaciones algorítmicas generadas automáticamente se proporcionan sin costo adicional. Durante la versión preliminar pública de la evaluación automática (modelo o LLM como juez), usted solo paga por la inferencia basada en el modelo de generador y el modelo de evaluador que elija. En un trabajo de evaluación del modelo de LLM como juez, las métricas integradas utilizan plantillas de solicitudes de evaluación del sistema exclusivas para cada métrica y un modelo de juez disponible que se cobrará como parte del uso de los tokens, y las instrucciones de los jueces están disponibles en la documentación pública de AWS por motivos de transparencia. En el caso de la evaluación realizada por humanos a la que lleve a su propio equipo de trabajo, se le cobrará por la inferencia del modelo en la evaluación y un cargo de 0,21 USD por tarea humana completada. Una tarea humana se define como la instancia en la que un trabajador humano envía una evaluación de una sola solicitud y las respuestas de inferencia asociadas en la interfaz de usuario de la evaluación humana. El precio es el mismo sin importar si tiene uno o dos modelos en el trabajo de evaluación; también es el mismo sin importar el número de métricas de la evaluación y los métodos de calificación que incluya. Los cargos por las tareas humanas aparecerán en la sección Amazon SageMaker de su factura de AWS y son los mismos para todas las regiones de AWS. No hay ningún cargo adicional por el personal, ya que lo suministra usted. En el caso de una evaluación administrada por AWS, los precios varían según las necesidades de evaluación en un contrato privado mientras trabaja con el equipo de evaluaciones de expertos de AWS.

Evaluación de bases de conocimiento de Amazon Bedrock (evaluación RAG): con la evaluación de bases de conocimiento de Amazon Bedrock (evaluación RAG), paga por lo que usa, sin compromisos de volumen mínimos en cuanto al número de solicitudes o respuestas. Durante la versión preliminar pública, solo pagará por la inferencia a partir del modelo de generador y el modelo de evaluador que elija (el trabajo de evaluación utiliza un LLM como juez), así como los cargos incurridos por el uso de la base de conocimientos en el trabajo de evaluación de acuerdo con los precios de Amazon Bedrock Knowledge Bases. En un trabajo de evaluación de la base de conocimientos (evaluación RAG), las métricas integradas utilizan plantillas de solicitudes de evaluación del sistema exclusivas para cada métrica y un modelo de evaluación disponible que se cobrará como parte del uso de los tokens, y las solicitudes de los jueces están disponibles en la documentación pública de AWS por motivos de transparencia. Algunas métricas implican juzgar la inferencia del modelo a partir del contexto recuperado de su base de conocimientos o de sus respuestas básicas, además de la indicación de la solicitud, lo que afecta a los costes asociados a cada métrica. Puede encontrar más información sobre cada métrica en la documentación pública de AWS para las evaluaciones.

Información sobre precios

El precio depende de la modalidad, el proveedor y el modelo. Seleccione el proveedor del modelo para ver los precios detallados.

Amazon Bedrock ofrece modelos fundacionales (FM) exclusivos de los principales proveedores de inteligencia artificial, como Anthropic, Meta, Mistral AI y Amazon, para la inferencia por lotes a un precio un 50 % más bajo en comparación con los precios de inferencia bajo demanda. Consulte la lista de modelos aquí.

  • AI21 Labs
  • AI21 Labs

    Precios bajo demanda

    Modelos de AI21 Labs Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida
    Jamba 1.5 Large 0,002 USD 0,008 USD
    Jamba 1.5 Mini 0,0002 USD 0,0004 USD
    Jurassic-2 Mid 0,0125 USD 0,0125 USD
    Jurassic-2 Ultra 0,0188 USD 0,0188 USD
    Jamba-Instruct 0,0005 USD 0,0007 USD
  • Amazon
    • Amazon Nova
    • Amazon Nova

      Precios para comprender los modelos

      Precios por los modelos de generación de contenido creativo

    • Amazon Titan
    • Amazon Titan

    • Otro Amazon
  • Anthropic
  • Anthropic

    Precios bajo demanda y por lotes

    Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Precio por cada 1000 tokens de entrada (escritura en caché) Precio por cada 1000 tokens de entrada (lectura de caché)

    Claude 3.5 Sonnet**
     

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    0,00375 USD

    0,0003 USD

    Claude 3.5 Haiku
     

    0,0008 USD

    0,004 USD

    0,0005 USD

    0,0025 USD

    0,001 USD

    0,00008 USD

    Claude 3 Opus*
     

    0,015 USD

    0,075 USD

    0,0075 USD

    0,0375 USD

    ND

    ND

    Claude 3 Haiku
     

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    ND

    ND

    Claude 3 Sonnet
     

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    ND

    ND

    Claude 2.1
     

    0,008 USD

    0,024 USD

    ND

    ND

    ND

    ND

    Claude 2.0
     

    0,008 USD

    0,024 USD

    ND

    ND

    ND

    ND

    Claude Instant
     

    0,0008 USD

    0,0024 USD

    ND

    ND

    ND

    ND
    *Actualmente, Claude 3 Opus se encuentra disponible en la región Oeste de EE. UU. (Oregón)
    **Los precios de Claude 3.5 Sonnet se aplican a cada versión de Claude 3.5 Sonnet (v1 y v2). Claude 3.5 Sonnet v2 está disponible actualmente en la región Oeste de EE. UU. (Oregón)
    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Precio por cada 1000 tokens de entrada (escritura en caché) Precio por cada 1000 tokens de entrada (lectura de caché)

    Claude 3.5 Sonnet**

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    0,00375 USD 0,0003 USD

    Claude 3.5 Haiku

    0,001 USD

    0,005 USD

    0,0005 USD

    0,0025 USD

    0,001 USD 0,00008 USD

    Claude 3 Opus*

    0,015 USD

    0,075 USD

    0,0075 USD

    0,0375 USD

       

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

       

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

       

    Claude 2.1

    0,008 USD

    0,024 USD

    N/D

    N/D

       

    Claude 2.0

    0,008 USD

    0,024 USD

    N/D

    N/D

       

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/D

    N/D

       
    *Actualmente, Claude 3 Opus se encuentra disponible en la región Oeste de EE. UU. (Oregón)    
    **Los precios de Claude 3.5 Sonnet se aplican a cada versión de Claude 3.5 Sonnet (v1 y v2). Claude 3.5 Sonnet v2 está disponible actualmente en la región del oeste de EE. UU. (Oregón)    

    Región: Europa (Londres)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD 0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    Región: Europa (Zúrich)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

     

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

     

    Región: América del Sur (San Pablo)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

     

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

     

    Región: Canadá (centro)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Región: Asia-Pacífico (Bombay)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Región: Asia-Pacífico (Sídney)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Región: Asia-Pacífico (Tokio)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/D

     

    N/D

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    N/D

    N/D

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Región: Asia-Pacífico (Singapur)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude Instant

    0,0008 USD

    0,0024 USD

    0,0004 USD

     

    0,0012 USD

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    0,004 USD

     

    0,012 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/D

    N/D

    Región: Europa (París)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Región: Europa (Fráncfort)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/D

    N/D

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    N/D

    N/D

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Región: Asia-Pacífico (Seúl)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/D

     

    N/D

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    N/D

     

    N/D

    Región: Este de EE. UU. (Ohio)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/D

     

    N/D

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    N/D

     

    N/D

    Región: AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

    Claude 3.5 Sonnet

    0,0036 USD

    0,018 USD

    Claude 3 Haiku

    0,0003 USD

    0,0015 USD

    Inferencia optimizada para latencia

    Región: Este de EE. UU. (Ohio)

      Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida
    Claude 3.5 Haiku 0,001 USD 0,005 USD

    Precios del rendimiento aprovisionado

    Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

    Modelos de Anthropic Precio por hora y modelo
    sin compromiso
    Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

    Claude Instant

    44,00 USD

    39,60 USD

    22,00 USD

    Claude 2.0 y 2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Modelos de Anthropic Precio por hora y modelo
    sin compromiso
    Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

    Claude Instant

    44,00 USD

    39,60 USD

    22,00 USD

    Claude 2.0 y 2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Región: Asia-Pacífico (Tokio)

    Modelos de Anthropic Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

    Claude Instant

    53,00 USD

    29,00 USD

    Claude 2.0/2.1

    86,00 USD

    48,00 USD

    Región: Europa (Fráncfort)

    Modelos de Anthropic Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

    Claude Instant

    49,00 USD

    27,00 USD

    Claude 2.0/2.1

    79,00 USD

    44,00 USD

    Póngase en contacto con su equipo de cuentas de AWS para obtener más información sobre las unidades de modelo. 

     

  • Cohere
  • Cohere

    Precios bajo demanda

    Modelos de Cohere Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida
    Command 0,0015 USD 0,0020 USD
    Command-Light 0,0003 USD 0,0006 USD
    Command R+ 0,0030 USD 0,0150 USD
    Command R 0,0005 USD 0,0015 USD
    Embed: inglés 0,0001 USD N/D
    Embed: multilingüe 0,0001 USD N/D
    Modelos de Cohere Precio por cada 1000 consultas**
    Rerank 3.5 2,00 USD
    **Se le cobrará por el número de consultas en las que una consulta puede contener hasta 100 fragmentos de documentos. Si la consulta contiene más de 100 fragmentos de documentos, se contabiliza como consultas múltiples. Por ejemplo, si una solicitud contiene 350 documentos, se tratará como 4 consultas. Tenga en cuenta que cada documento solo puede contener un máximo de 500 tokens (incluidos los tokens totales de la consulta y del documento) y, si la longitud del token es superior a 512 tokens, se divide en varios documentos.

    Precios por la personalización (ajuste preciso)

    Modelos de Cohere Precio por entrenar 1000 tokens Precio por el almacenamiento mensual de cada modelo personalizado Precio a deducir de un modelo personalizado por unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso)

    Cohere Command

    0,004 USD

    1,95 USD

    49,50 USD

    Cohere Command-Light 0,001 USD

    1,95 USD

    8,56 USD

    * El total de tokens entrenados es igual a la cantidad de tokens en el corpus de datos de entrenamiento multiplicado por la cantidad de épocas

    Precios del rendimiento aprovisionado

    Modelos de Cohere Precio por hora y modelo 
    sin compromiso
    Precio por hora por unidad de modelo con un compromiso de 1 mes

    Precio por hora por unidad de modelo con un compromiso de 6 mes

    Cohere Command

    49,50 USD

    39,60 USD

    23,77 USD

    Cohere Command: Light 8,56 USD

    6,85 USD

    4,11 USD
    Embed: inglés 7,12 USD

    6,76 USD

    6,41 USD
    Embed: multilingüe 7,12 USD

    6,76 USD

    6,41 USD

    Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo. 

  • Meta Llama
  • Meta Llama

    Llama 3.3

    Precios bajo demanda y por lotes

    Llama 3.2

    Precios bajo demanda y por lotes

    Llama 3.1

    Precios bajo demanda y por lotes

    Precios por la personalización del modelo (ajuste preciso)

    Precios del rendimiento aprovisionado

    Llama 3

    Precios bajo demanda 

    Llama 2

    Precios bajo demanda 

    Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

    Modelos de Meta Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

    Llama 2 Chat (13B)

    0,00075 USD

    0,001 USD

    Llama 2 Chat (70B)

    0,00195 USD

    0,00256 USD

    Precios por la personalización del modelo (ajuste preciso)

    Modelos de Meta Precio por entrenar 1000 tokens Precio por el almacenamiento mensual de cada modelo personalizado* Precio por inferencia de un modelo personalizado por 1 unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso)

    Llama 2 Pretrained (13B)

    0,00149 USD

    1,95 USD

    23,50 USD

    Llama 2 Pretrained (70B)

    0,00799 USD

    1,95 USD 23,50 USD

    * Almacenamiento de modelo personalizado = 1,95 USD

    Precios del rendimiento aprovisionado

    Modelos de Meta Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

    Llama 2 Pretrained y Chat (13B)

    21,18 USD

    13,08 USD

    Llama 2 Pretrained (70B)

    21,18 USD

    13,08 USD

    * Los modelos de Llama 2 Pre-trained solo se encuentran disponibles con un rendimiento aprovisionado después de la personalización. 

    Póngase en contacto con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

  • Mistral AI
  • Mistral AI

  • Stability AI
  • Stability AI

    Precios bajo demanda

    Modelo de Stability AI Precio por imagen generada
    Stable Diffusion 3.5 Large 0,08 USD
    Stable Image Core 0,04 USD
    Stable Diffusion 3 Large 0,08 USD
    Stable Image Ultra 0,14 USD

    Los modelos de imagen de la generación anterior ofrecidos por Stability AI tienen un precio por imagen, en función del número de pasos y de la resolución de la imagen.

    Modelo de Stability AI Resolución de imagen Precio por imagen generada de calidad estándar (<=50 pasos) Precio por imagen generada de calidad premium (>50 pasos)
    SDXL 1.0 Hasta 1024 x 1024 0,04 USD 0,08 USD

    Precios del rendimiento aprovisionado

    Modelo de Stability AI Precio por hora por unidad de modelo con un compromiso de 1 mes* Precio por hora por unidad de modelo con un compromiso de 6 mes*

    SDXL 1.0

    49,86 USD

    46,18 USD

    *Incluye inferencia para modelos básicos y personalizados

    Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

    Actualmente, la personalización del modelo (ajuste preciso) no es compatible con los modelos de Stability AI en Amazon Bedrock.

  • Importación de modelos personalizados
  • Importación de modelos personalizados

    • Llama
    • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

      Versión de unidad modelo personalizada v1.0
      Precio por unidad modelo personalizada por minuto* 0,0785 USD
      Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD
       
      Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.
      *Facturado en intervalos de 5 minutos
    • Llama multimodal
    • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

      Versión de unidad modelo personalizada v1.0
      Precio por unidad modelo personalizada por minuto* 0,0785 USD
      Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD
       
      Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.2 11B 128K requiere 4 unidades de modelos personalizados.
      *Facturado en intervalos de 5 minutos
    • Mistral
    • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

      Versión de unidad modelo personalizada v1.0
      Precio por unidad modelo personalizada por minuto* 0,0785 USD
      Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD
       
      Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Mistral 7B 32K requiere 1 unidad de modelo personalizado.
      *Facturado en intervalos de 5 minutos
    • Mixtral
    • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

      Versión de unidad modelo personalizada v1.0
      Precio por unidad modelo personalizada por minuto* 0,0785 USD
      Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD
       
      Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Mixtral 8x7B 32K requiere 4 unidades de modelos personalizados.
      *Facturado en intervalos de 5 minutos
    • Flan
    • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

      Versión de unidad modelo personalizada v1.0
      Precio por unidad modelo personalizada por minuto* 0,0785 USD
      Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD
       
      Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Flan-T5 XL 512 requiere 1 unidad de modelo personalizado. 
      *Facturado en intervalos de 5 minutos

    Precios de inferencia bajo demanda:
    Se le facturará en intervalos de 5 minutos mientras la copia del modelo esté activa a partir de la primera invocación exitosa. El límite máximo de rendimiento y simultaneidad por copia de modelo depende de factores como la combinación de tokens de entrada/salida, el tipo de hardware, el tamaño del modelo, la arquitectura y las optimizaciones de inferencia, y se determina durante el flujo de trabajo de importación del modelo.

    Bedrock escala automáticamente el número de copias del modelo en función de sus patrones de uso. Si no hay invocaciones durante un período de 5 minutos, Bedrock reducirá la escala a cero y volverá a escalar hacia arriba cuando invoques su modelo. Al reducir la escala, es posible que experimente una duración de arranque en frío (en decenas de segundos) según el tamaño del modelo. Bedrock también aumenta la cantidad de copias del modelo si el volumen de la inferencia supera constantemente los límites de simultaneidad de una sola copia del modelo. Nota: Hay un máximo predeterminado de 3 copias del modelo por cuenta y modelo importado que se puede aumentar mediante Service Quotas.

Herramientas de precios (detalles)

  • Flujos
  • Amazon Bedrock Flows

    Se le cobra en función de la cantidad de transiciones de nodo que se requieran para ejecutar su aplicación. Bedrock Flows cuenta una transición de nodo cada vez que se ejecuta un nodo en su flujo de trabajo. Se le cobra por la cantidad total de transiciones de nodo en todos sus flujos.

    Todos los cargos se miden a diario y se facturan de forma mensual a partir del 1 de febrero de 2025.

    Precio por cada 1000 transiciones de nodo
    0,035 USD

    Cargos adicionales

    Puede incurrir en cargos adicionales si la ejecución del flujo de trabajo de su aplicación utiliza otros servicios de AWS o transfiere datos. Por ejemplo, si su flujo de trabajo invoca una política de barrera de protección de Amazon Bedrock, se le facturará por la cantidad de unidades de texto que procese la política. 

  • Bases de conocimiento
  • Recuperación de datos estructurados (generación de SQL)

    La recuperación de datos estructurados se cobra por cada solicitud para generar una consulta SQL. La consulta SQL generada se usa para recuperar los datos de los almacenes de datos estructurados.

    Modelos de Rerank

    Los modelos de Rerank están diseñados para mejorar la relevancia y precisión de las respuestas en las aplicaciones de generación aumentada por recuperación (RAG). Se cobran por consulta.

    **Se le cobrará por el número de consultas en las que una consulta puede contener hasta 100 fragmentos de documentos. Si la consulta contiene más de 100 fragmentos de documentos, se contabiliza como consultas múltiples. Por ejemplo, si una solicitud contiene 350 documentos, se tratará como 4 consultas. Tenga en cuenta que cada documento solo puede contener un máximo de 512 tokens (incluidos los tokens totales de la consulta y del documento) y, si la longitud del token es superior a 512 tokens, se divide en varios documentos. Una consulta equivale a una unidad de búsqueda.

  • Barreras de protección
  • Barreras de protección de Amazon Bedrock

    Política de barreras de protección*

    Precio por 1000 unidades de texto**

    Filtros de contenido (contenido de texto) ****

    0,15 USD

    Temas denegados

    0,15 USD

    Verificación de la base contextual***

    0,1 USD

    Filtros de información confidencial (PII)

    0,1 USD

    Filtros de información confidencial (expresión regular) 

    Gratis

    Filtros de palabras

    Gratis

    Precios bajo demanda

    * Cada política de barreras de protección es opcional y se puede habilitar según los requisitos de su aplicación. Se incurrirá en cargos según el tipo de política utilizada en la barrera de protección. Por ejemplo, si una barrera de protección está configurada con filtros de contenido y temas denegados, se cobrarán estas dos políticas, pero no habrá cargos asociados a los filtros de información confidencial.

    ** Una unidad de texto puede contener hasta 1000 caracteres. Si una entrada de texto tiene más de 1000 caracteres, se procesa como varias unidades de texto, con 1000 caracteres o menos cada una de ellas. Por ejemplo, si una entrada de texto contiene 5600 caracteres, se cobrarán 6 unidades de texto.

    ***La verificación de base contextual utiliza un origen de referencia y una consulta para determinar si la respuesta del modelo se basa en el origen y es relevante para la consulta. El número total de unidades de texto cobradas se calcula mediante la combinación de todos los caracteres del origen, la consulta y la respuesta del modelo.

    ****Los precios de los filtros de contenido para detectar y filtrar el contenido de imágenes dañinas se anunciarán cuando la característica esté disponible de forma general.

  • Evaluación del modelo
  • Evaluación del modelo

    La evaluación del modelo se cobra por la inferencia a partir del modelo que elija. Las puntuaciones algorítmicas generadas automáticamente se proporcionan sin costo adicional. En el caso de la evaluación realizada por humanos a la que lleve a su propio equipo de trabajo, se le cobrará por la inferencia del modelo en la evaluación y un cargo de 0,21 USD por tarea humana completada.

    Model

    Precio por cada 1000 tokens de entrada

    Precio por cada 1000 tokens de salida

    Precio por tarea humana

     

    Modelo seleccionado para la evaluación

    Basado en el modelo seleccionado

    Basado en el modelo seleccionado

     

    0,21 USD

     
  • Automatización de datos
  • Automatización de datos

    • Las bases de conocimiento de Amazon Bedrock ofrecen una integración de Bedrock Data Automation para proporcionar respuestas más relevantes y precisas para los datos multimodales. Al configurar una base de conocimientos, puede seleccionar Bedrock Data Automation como método de análisis para analizar y extraer información significativa de imágenes o documentos, que pueden incluir figuras, gráficos y diagramas. Durante el procesamiento, Bedrock Data Automation extrae información significativa de los documentos e imágenes ingeridos, que luego se utiliza en los pasos posteriores de la base de conocimientos para fragmentar, incrustar y almacenar. Cuando se integra con las bases de conocimiento, Bedrock Data Automation entrega y cobra por los resultados estandarizados.

Ejemplos de precios

  • Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Jurrasic-2 Mid de AI21 para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 10 000 tokens/1000 * 0,0125 USD + 2000 tokens/1000 * 0,0125 USD = 0,15 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Amazon Titan Text Lite para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,0003 USD + 1000 tokens/1000 * 0,0004 USD = 0,001 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo base Amazon Titan Image Generator para generar 1000 imágenes de 1024 x 1024 de tamaño y de calidad estándar.

    Costo total incurrido = 1000 imágenes * 0,01 USD por imagen = 10 USD

    Precios de la personalización (ajuste preciso y entrenamiento previo continuo)

    Un desarrollador de aplicaciones personaliza un modelo de Amazon Titan Image Generator con 1000 pares de imagen y texto. Tras el entrenamiento, el desarrollador utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (plazo de compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,005 USD * 500 * 64), donde 0,005 USD es el precio por imagen vista, 500 es el número de pasos y 64 es el tamaño del lote + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra dos unidades de modelo de Amazon Titan Text Express con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

    Costo total mensual incurrido = 2 unidades de modelo * 18,40 USD/hora * 24 horas* 31 días = 27 379,20 USD

    Un desarrollador de aplicaciones compra una unidad de modelo del modelo básico de Amazon Titan Image Generator con un compromiso de 1 mes.

    Costo total incurrido = 1 unidad de modelo * 16,20 USD * 24 horas * 31 días = 12 052,80 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock, en la región Oeste de EE. UU. (Oregón): una solicitud al modelo Claude de Anthropic para resumir una entrada de 11 000 tokens de texto de entrada en una salida de 4000 tokens.

    Costo total incurrido =11 000 tokens/1000 * 0,008 USD + 4000 tokens/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo de Anthropic Claude Instant en la región Oeste de EE. UU. (Oregón):

    Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 6000 tokens/1000 * 0,0015 USD + 2000 tokens/1000 * 0,0020 USD = 0,013 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command Light de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 6000 tokens/1000 * 0,0003 USD + 2000 tokens/1000 * 0,0006 USD = 0,003 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Embed (inglés) o al modelo Embed (multilingüe) de Cohere para generar incrustaciones para 10 000 tokens de entrada.

    Costo total incurrido = 10 000 tokens/1000 * 0,0001 USD = 0,001 USD

    Precios de la personalización (ajuste preciso)

    Un desarrollador de aplicaciones personaliza un modelo Command de Cohere con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,004 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (49,50 USD) = 55,45 USD

    El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 39,60 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad modelo Command de Cohere con un compromiso de 1 mes para su caso de uso de resumen de texto.

    Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Llama 2 Chat (13B) de Meta para resumir una entrada de 2000 tokens de texto de entrada en una salida de 500 tokens.

    Costo total incurrido = 2000 tokens/1000 * 0,00075 USD + 500 tokens/1000 * 0,001 USD = 0,002 USD

    Precios de la personalización (ajuste preciso)

    Un desarrollador de aplicaciones personaliza el modelo Llama 2 Pretrained (70B) con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,00799 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (23,50 USD) = 33,44 USD

    El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 21,18 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo Llama 2 de Meta con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

    Costo total mensual incurrido = 1 unidad de modelo * 21,18 USD * 24 horas * 31 días = 15 757,92 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mistral 7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,00015 USD + 1000 tokens/1000 * 0,0002 USD = 0,0005 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mixtral 8x7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,00045 USD + 1000 tokens/1000 * 0,0007 USD = 0,0016 USD

    Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo Mistral Large para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens. 

    Costo total por hora = 2000 tokens/1000 * 0,008 USD + 1000 tokens/1000 * 0,024 USD = 0,04 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL para generar una imagen de 512 x 512 con un tamaño de paso de 70 (calidad premium).

    Costo total incurrido = 1 imagen * 0,036 USD por imagen = 0,036 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL 1.0 para generar una imagen de 1024 x 1024 con un tamaño de paso de 70 (calidad premium).

    Costo total incurrido = 1 imagen * 0,08 USD por imagen = 0,08 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo de SDXL 1.0 con un compromiso de 1 mes.

    Costo total incurrido = 1 * 49,86 USD * 24 horas * 31 días = 37 095,84 USD

  • Ejemplo 1 de evaluación del modelo:

    Precios bajo demanda
    Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).

    El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que un trabajador califique cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”).

    Habrá 50 tareas en este trabajo de evaluación (un conjunto de tareas por cada par de solicitud y respuesta por trabajador). Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

    Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

    Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total
    Inferencia de Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Inferencia de Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tareas humanas             50 0,21 USD 10,50 USD 10,50 USD
    Total                   11,06 USD

    Ejemplo 2 de evaluación del modelo:

    Precios bajo demanda
    Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).

    El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que dos trabajadores califiquen cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”). Este trabajo de evaluación constará de 100 tareas (1 por cada conjunto de solicitud y respuesta por cada trabajador: 2 trabajadores x 50 conjuntos de solicitud y respuesta = 100 tareas humanas).

    Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

    Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

    Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total
    Inferencia de Claude Instant 5000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Inferencia de Claude 2.1 5000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tareas humanas             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD
  • Ejemplo 1: chatbot de atención al cliente
    Un desarrollador de aplicaciones crea un chatbot de atención al cliente y usa filtros de contenido para bloquear el contenido dañino y los temas denegados para filtrar las consultas y respuestas no deseadas.

    El chatbot atiende 1000 consultas de usuarios por hora. Cada consulta de usuario tiene una longitud de entrada promedio de 200 caracteres y recibe una respuesta del FM de 1500 caracteres.

    Cada consulta de usuario de 200 caracteres corresponde a 1 unidad de texto.

    Cada respuesta del FM de 1500 caracteres corresponde a 2 unidades de texto.

    Unidades de texto procesadas cada hora = (1 + 2) * 1000 consultas = 3000 unidades de texto

    Costo total incurrido por hora por los filtros de contenido y el tema denegado = 3000 * (0,15 USD + 0,15 USD) / 1000 = 0,90 USD

     

    Ejemplo 2: resumen de la transcripción del centro de llamadas
    Un desarrollador de aplicaciones crea una aplicación para resumir las transcripciones de los chats entre los usuarios y los agentes de soporte. Utiliza un filtro de información confidencial para eliminar la información de identificación personal (PII) en los resúmenes generados para 10 000 conversaciones.

    Cada resumen generado tiene un promedio de 3500 caracteres que corresponden a 4 unidades de texto.

    Costo total incurrido para resumir 10 000 conversaciones = 10 000 * 4 * (0,1/1000 USD) = 4 USD

    Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total
    Inferencia de Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Inferencia de Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tareas humanas             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD
  • Ejemplo de precios: Un desarrollador de aplicaciones importa un modelo personalizado tipo Llama 3.1 con un tamaño de parámetro de 8B y una longitud de secuencia de 128 000 en la región us-east-1, y lo elimina después de un mes. Esto requiere 2 unidades de modelos personalizados. Por lo tanto, el precio por minuto será de 0,1570 USD porque se requieren 2 unidades de modelos personalizados. Los costos de almacenamiento del modelo para 2 unidades de modelos personalizados serían de 3,90 USD al mes.

    La importación del modelo es gratuita. La primera invocación exitosa es a las 8:03 a. m., momento en el que comienza la medición. Los intervalos de medición de 5 minutos son de 8:03 a. m. a 8:07 a. m.; de 8:07 a. m. a 8:11 a. m., y así sucesivamente. Si hay al menos una invocación durante un período de 5 minutos, el intervalo se considerará activa para la facturación. Si no hay ninguna invocación entre las 8:07 a. m. y las 8:11 a. m., la medición se detendrá a las 8:11 a. m. En este caso, la factura se calcularía de la siguiente manera: 0,1570 USD * 5 minutos * 3 intervalos de cinco minutos = 2,355 USD.

  • Ejemplo de precios 1 (cambio de clasificación mediante el modelo Amazon Rerank 1.0)

    En un mes determinado, realiza 2 millones de solicitudes a la API de Rerank con el modelo Amazon Rerank 1.0; 1 millón de solicitudes contienen menos de 100 documentos cada una y, por lo tanto, se cobrará una solicitud por cada una. El millón de solicitudes restantes contienen entre 120 y 150 documentos y, por lo tanto, a cada solicitud se le cobrarán 2 solicitudes.

    Precio de una solicitud = 0,001 USD
    Costo total = 1,000,000 USD × 0.001 + 1,000,000 USD × 2 = 0.001 USD = 3000 USD 

    Ejemplo de precios 2: (Recuperación de datos estructurados)

    Un desarrollador de aplicaciones crea un chatbot de soporte que consulta los datos estructurados almacenados en Amazon Redshift. El desarrollador crea una base de conocimientos de Bedrock y se conecta a Amazon Redshift. El chatbot atiende 10000 consultas de usuarios por hora. Cada consulta de usuario costará 0,002 USD por API de GenerateQuery para generar SQL a partir de la consulta del usuario.

    Costo total incurrido para generar SQL por hora = 0,002 USD*10000 = 20 USD.
    Costo total incurrido en el mes = 20 USD*24 USD*30 USD = 1440 USD

  • Ejemplo: resumen de noticias
    Un desarrollador de aplicaciones crea un flujo para automatizar el resumen de noticias para los comerciantes. El flujo incluye un nodo de entrada que ocupa una ubicación de S3 y un nodo de recuperación de S3 que recupera 10 archivos que incluyen artículos de 10 de las principales agencias de noticias de S3 (transiciones de 2 nodos). A continuación, utiliza un nodo iterador para invocar un modelo con un nodo de petición para resumir cada archivo (+ 10 archivos x 2 transiciones de nodos). A continuación, recopila todos los resultados mediante un nodo recopilador, escribe los resultados en S3 mediante el nodo de almacenamiento de S3 y los completa en un nodo de salida (+ 3 transiciones de nodo). El desarrollador ejecuta este flujo cada media hora de cada día de la semana.

    La cantidad de transiciones de nodo por ejecución de flujo es: 2+1+10*2 + 3 = 25 transiciones de nodo/ejecución de flujo

    La cantidad de ejecuciones de flujo por mes es: 24 horas *2* 5 días * 4 semanas = 960 ejecuciones de flujo/mes.

    La factura mensual total es: 25 * 960 * 0,035 USD/1000 = 0,84 USD

    Cargos adicionales
    La factura también incluirá cargos adicionales por los servicios de AWS que se utilicen en la ejecución del flujo de trabajo, incluidos los usos de Amazon S3 en los nodos de recuperación y almacenamiento, y el uso del modelo fundacional de Amazon Bedrock en el nodo de petición.

  • Ejemplo de precios 1:
    Supongamos que procesa un documento de 1000 páginas con BDA Custom Output. Las 1000 páginas se procesan mediante el esquema 1, que tiene 15 campos. El precio por página de cualquier esquema con 30 campos o menos es de 0,040 USD. El costo total sería de 40 USD.

    Total de páginas procesadas = 1000
    Precio por página para esquemas con menos de 30 campos = 0,040 USD
    Costo total = 1000 × 0.040 USD = 40 USD

     

    Ejemplo de precios 2:
    Supongamos que procesa 2 documentos con BDA Custom Output. El documento 1 tiene 40 páginas y se procesa con el esquema 1, que tiene 20 campos. El documento 2 tiene 10 páginas y se procesa con el esquema 2, que tiene 40 campos. El precio por página del esquema 1 es de 0,040 USD, ya que contiene 30 campos o menos. El precio por página del esquema 2 es de 0,045 USD. El costo de procesamiento del documento 1 con el esquema 1 es de 1,60 USD. El costo de procesamiento del documento 2 con el esquema 2 es de 0,45 USD. El costo total de procesar ambos documentos sería de 2,05 USD.

    Total de páginas procesadas = 50
    Precio por página para el esquema 1 con menos de 30 campos = 0,040 USD
    Precio por página para el esquema 2 con 40 campos = 0,040 USD + (número de campos adicionales superiores a 30 *0,0005 USD por campo)
    Número de campos adicionales por encima de 30 = 40 - 30 = 10
    Precio por página para el esquema 2 con 40 campos = 0,040 USD + (10 *0,0005 USD por campo) = 0,045 USD
    Cargo por el documento 1 con el esquema 1 = 40 páginas x 0,040 USD por página = 1,6 USD
    Cargo por el documento 2 con el esquema 2 = 10 páginas x 0,045 USD por página = 0,45 USD
    Cargo total = cargo por el documento 1 + cargo por el documento 2 = 1,6 USD + 0,45 USD = 2,05 USD

     

    Ejemplo de precios 3:
    Supongamos que procesa un video de 60 minutos con la salida estándar BDA. El precio por minuto de la salida estándar de video es de 0,050 USD. El costo total sería de 3.00 USD.

    Total de minutos procesados = 60
    Precio por minuto para la salida estándar de video = 0,050 USD
    Costo total = 60 × 0.050 USD = 3.00 USD

     

    Ejemplo de precios 4:
    Supongamos que procesa 2000 imágenes con BDA Custom Output. Las primeras 1000 imágenes se procesan con el esquema 1, que tiene 10 campos. Las últimas 1000 páginas se procesan con el esquema 2, que tiene 40 campos. El precio por imagen del esquema 1 es de 0,005 USD, ya que contiene 30 campos o menos. El precio por imagen del esquema 2 es de 0,01 USD. El costo de procesamiento de las primeras 1000 imágenes con el esquema 1 es de 5,00 USD. El costo de procesamiento de las primeras 1000 imágenes con el esquema 2 es de 10,00 USD. El costo total de procesar las 2000 imágenes sería de 15,00 USD

    Costo de las primeras 1000 imágenes = 1000 imágenes* 0,005 USD por imagen = 5,00 USD
    Costo de 1000 imágenes secundarias = 1000 imágenes * (0,005 USD + [número de campos adicionales superiores a 30 x 0,0005 USD por campo])
    = 1000 x (0,005 USD + ([40-30] x 0,0005 USD])
    = 1000 x (0,005 USD + [10 x 0,0005 USD]) = 10,00 USD
    Costo total = 5,00 USD + 10,00 USD = 15,00 USD

     

    Ejemplo de precios 5:
    Supongamos que desea utilizar Bedrock Data Automation Standard Output para procesar 15 000 minutos de grabaciones de audio de reuniones en su organización. El costo total de procesar los 15 000 minutos de audio sería de 90 USD.

    Total de minutos procesados = 15 000 minutos
    Carga total = 15 000 minutos × 0,006 USD = 90 USD


    Ejemplo de precios 6:
    Supongamos que configura las bases de conocimiento de Bedrock para usar Bedrock Data Automation como analizador y, a continuación, ingiere un documento de 1000 páginas. Tenga en cuenta que la integración de las bases de conocimiento de Bedrock y Bedrock Data Automation utiliza una salida estándar. El precio por página para la salida estándar es de 0,010 USD. El costo total sería de 10 USD.

    Total de páginas procesadas = 1000
    Precio por página para la salida estándar = 0,010 USD
    Costo total = 1000 x 0.010 USD = 10 USD