Tarifs d'Amazon Bedrock

Vue d'ensemble des tarifs

Amazon Bedrock est un service entièrement géré qui propose un choix de modèles de fondation (FM) performants via une API unique, ainsi qu’un large éventail de capacités permettant de créer des applications d’IA génératives alliant sécurité, confidentialité et IA responsable.

Avec Amazon Bedrock, l’inférence et la personnalisation des modèles vous sont facturées. Vous avez le choix entre deux plans tarifaires pour l’inférence : 1. À la demande et par lots : ce plan vous permet d’utiliser les FM sur la base du paiement à l’utilisation sans avoir à prendre d’engagements temporels. 2. Débit alloué : ce plan vous permet d’allouer un débit suffisant pour répondre aux exigences de performances de votre application en échange d’un engagement à durée déterminée.

Modèles de tarification

Avec le mode à la demande, vous ne payez que ce que vous consommez, sans engagement de durée. Pour les modèles de génération de texte, vous êtes facturé pour chaque jeton d’entrée traité et chaque jeton de sortie généré. Pour les modèles d’intégration, vous êtes facturé pour chaque jeton d’entrée traité. Un jeton est composé de quelques caractères et se réfère à l’unité de base du texte qu’un modèle apprend pour comprendre la saisie et l’invite de l’utilisateur. Pour les modèles de génération d’images, vous êtes facturé pour chaque image générée. Inférence entre régions : le mode à la demande prend également en charge l’inférence entre régions pour certains modèles. Il permet aux développeurs de gérer de manière fluide les pics de trafic en utilisant le calcul dans différentes Régions AWS et d’obtenir des limites de débit plus élevées et une résilience accrue. L’utilisation de l’inférence entre régions n’entraîne aucun coût supplémentaire et le prix est calculé sur la base de la région dans laquelle vous avez fait la demande (région source).

Avec le mode par lots, vous pouvez fournir un ensemble d’invites dans un seul fichier d’entrée et recevoir les réponses dans un seul fichier de sortie, ce qui vous permet d’obtenir des prédictions simultanées à grande échelle. Les réponses sont traitées et stockées dans votre compartiment Amazon S3 afin que vous puissiez y accéder ultérieurement. Amazon Bedrock propose certains modèles de fondation (FM) provenant des principaux fournisseurs d’IA tels qu’Anthropic, Meta, Mistral AI et Amazon pour l’inférence par lots à un prix 50 % inférieur à celui de la tarification d’inférence à la demande. Consultez la liste des modèles ici.

Avec le mode de débit provisionné, vous pouvez acheter des unités de modèle pour un modèle de base ou un modèle personnalisé spécifique. Le mode de débit provisionné est principalement conçu pour les charges de travail d’inférence cohérentes importantes qui nécessitent un débit garanti. Les modèles personnalisés ne sont accessibles qu’à l’aide du débit provisionné. Une unité modèle fournit un certain débit, qui est mesuré par le nombre maximum de jetons d’entrée ou de sortie traités par minute. Avec la tarification du débit provisionné, vous êtes facturé à l’heure, vous avez la possibilité de choisir entre des conditions d’engagement d’un mois ou de six mois.

Avec Amazon Bedrock, vous pouvez personnaliser les FM en fonction de vos données afin de fournir des réponses adaptées à des tâches spécifiques et à votre contexte commercial. Vous pouvez affiner les modèles à l’aide de données étiquetées ou utiliser un pré-entraînement continu avec des données non étiquetées. Pour la personnalisation d’un modèle de génération de texte, vous êtes facturé pour l’entraînement du modèle en fonction du nombre total de jetons traités par le modèle (nombre de jetons dans le corpus de données d’entraînement multiplié par le nombre d’époques) et pour le stockage du modèle facturé par mois et par modèle. Une époque correspond à un passage complet dans votre jeu de données d’entraînement lors d’un ajustement ou d’un pré-entraînement continu. Les inférences utilisant des modèles personnalisés sont facturées dans le cadre du plan de débit provisionné et nécessitent que vous achetiez le débit provisionné. Une unité de modèle est mise à disposition sans engagement de durée pour l’inférence sur un modèle personnalisé. Vous serez facturé pour le nombre d'heures que vous utilisez dans la première unité du modèle pour l'inférence de modèle personnalisé. Si vous souhaitez augmenter votre débit au-delà d’une unité de modèle, vous devez souscrire un engagement d’un mois ou de six mois.

L’importation de modèles personnalisés vous permet de tirer parti de vos investissements antérieurs en matière de personnalisation de modèles dans Amazon Bedrock et de les utiliser de la même manière entièrement gérée que les modèles de base hébergés existants de Bedrock. Vous pouvez importer des pondérations personnalisées pour les architectures de modèles prises en charge et diffuser le modèle personnalisé en mode à la demande. L’importation d’un modèle personnalisé dans Bedrock est gratuite. Une fois que vous avez importé un modèle, vous pouvez y accéder à la demande sans avoir à effectuer aucune action sur le plan de contrôle. L’inférence de modèle ne vous est facturée que sur la base du nombre de copies de votre modèle personnalisé nécessaires pour gérer votre volume d'inférence et de la durée pendant laquelle chaque copie de modèle est active, facturée par périodes de 5 minutes. Une copie de modèle est une instance unique d’un modèle importé prête à répondre aux demandes d’inférence. Le prix par copie de modèle par minute dépend de facteurs tels que l’architecture, la longueur du contexte, la Région AWS, la version de l’unité de calcul (génération de matériel) et est hiérarchisé en fonction de la taille de copie du modèle.

Outils avancés

Les agents Amazon Bedrock vous permettent de créer et de configurer des agents autonomes au sein de votre application. Ces agents se connectent en toute sécurité aux sources de données de votre entreprise et répondent aux demandes des utilisateurs avec les bonnes informations afin de générer des réponses précises. Vous pouvez créer un agent dans Amazon Bedrock en quelques étapes rapides, ce qui accélère le temps nécessaire à la création d'applications d'IA génératives. Ces agents prennent en charge l'interprétation du code pour générer et exécuter du code de manière dynamique, ainsi que le retour du contrôle, ce qui vous permet de définir un schéma d'action et de récupérer le contrôle chaque fois que l'agent invoque l'action. En outre, les agents Amazon Bedrock peuvent conserver la mémoire lors des interactions, offrant ainsi des expériences utilisateur plus personnalisées et plus fluides.

Les barrières de protection Amazon Bedrock vous permettent de mettre en œuvre des mesures de protection personnalisées et des politiques d'IA responsables pour vos applications d'IA génératives. Il fournit des protections de sécurité personnalisables supplémentaires en plus des protections natives proposées par les FM. Il s'agit de la seule fonctionnalité d'IA responsable proposée par un important fournisseur de cloud qui permet aux clients de créer et de personnaliser des protections de sécurité, de confidentialité et de véracité pour leurs applications d'IA génératives dans une solution unique, et elle fonctionne avec tous les FM d'Amazon Bedrock, ainsi qu'avec des modèles affinés. Les barrières de protection Bedrock peuvent également être intégrées aux agents et aux bases de connaissances Amazon Bedrock afin de créer des applications d’IA générative conformes à vos politiques d’IA responsable. En outre, il propose une API ApplyGuardRail pour évaluer les entrées des utilisateurs et modéliser les réponses générées par tout FM personnalisé ou tiers en dehors de Bedrock.

Avec l'évaluation des modèles sur Amazon Bedrock, vous payez en fonction de ce que vous utilisez, sans engagement de volume de demandes et de réponses. Pour l'évaluation automatique, vous ne payez que pour l'inférence à partir du modèle que vous avez choisi lors de l'évaluation. Les scores algorithmiques générés automatiquement sont fournis sans frais supplémentaires. Dans le cas d'une évaluation basée sur l'humain où vous apportez votre propre équipe de travail, l'inférence du modèle lors de l'évaluation vous est facturée à 0,21 USD par tâche humaine effectuée. Une tâche humaine est définie comme une instance dans laquelle un travailleur humain soumet une évaluation d'une seule invite et de ses réponses d'inférence associées dans l'interface utilisateur d'évaluation humaine. Le prix est le même que vous utilisiez un ou deux modèles pour votre travail d'évaluation et quel que soit le nombre de mesures d'évaluation et de méthodes de notation que vous incluez. Les frais liés aux tâches humaines apparaîtront dans la section Amazon SageMaker de votre facture AWS et sont les mêmes pour toutes les régions AWS. Il n'y a pas de frais distincts pour la main-d'œuvre, car c’est vous qui la fournissez. Pour une évaluation par un expert gérée par AWS, la tarification est personnalisée en fonction de vos besoins d'évaluation dans le cadre d'un engagement privé en collaboration avec l'équipe d'évaluation d'AWS.

Les bases de connaissances Amazon Bedrock fournissent un flux de travail RAG (Retrieval-Augmented Generation) entièrement géré de bout en bout, permettant aux responsables de la maintenance et aux agents d'accéder à des informations contextuelles provenant des sources de données privées de votre entreprise. Cela leur permet de fournir des réponses plus pertinentes, précises et personnalisées. Vous pouvez connecter en toute sécurité les FM et les agents à plusieurs sources de données telles qu'Amazon S3, Confluence, Salesforce et SharePoint. Si vous ne possédez pas de base de données vectorielles, Amazon Bedrock crée pour vous une boutique vectorielle Amazon OpenSearch Serverless. Vous pouvez également spécifier un magasin vectoriel existant dans les bases de données prises en charge, telles qu'Amazon OpenSearch sans serveur, Pinecone, Redis Enterprise Cloud, Amazon Aurora et MongoDB. Vous pouvez également affiner la récupération et l'ingestion pour obtenir une meilleure précision dans tous les cas d'utilisation grâce à des options d'analyse avancées pour les données non structurées, à des options de découpage des données telles que le découpage personnalisé, ou à des stratégies de découpage intégrées, notamment la taille par défaut, la taille fixe, l'absence de découpage, le découpage hiérarchique ou le découpage sémantique.

Informations de tarification

La tarification dépend de la modalité, du fournisseur et du modèle. Sélectionnez le fournisseur du modèle pour voir les tarifs détaillés.

Amazon Bedrock propose certains modèles de fondation (FM) provenant des principaux fournisseurs d’IA tels qu’Anthropic, Meta, Mistral AI et Amazon pour l’inférence par lots à un prix 50 % inférieur à celui de la tarification d’inférence à la demande. Consultez la liste des modèles ici.

  • AI21 Labs
  • AI21 Labs

    Tarification à la demande

    Modèles AI21 Labs Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie
    Jamba 1.5 Large 0,002 USD 0,008 USD
    Jamba 1.5 Mini 0,0002 USD 0,0004 USD
    Jurassic-2 Mid 0,0125 USD 0,0125 USD
    Jurassic 2 Ultra 0,0188 USD 0,0188 USD
    Jamba-Instruct 0,0005 USD 0,0007 USD
  • Amazon
  • Amazon

  • Anthropic
  • Anthropic

    Tarification à la demande et par lots

    Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude 3.5 Sonnet**

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    Claude 3 Opus*

    0,015 USD

    0,075 USD

    0,0075 USD

    0,0375 USD

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    Claude 2.1

    0,008 USD

    0,024 USD

    N/A

    N/A

    Claude 2.0

    0,008 USD

    0,024 USD

    N/A

    N/A

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/A

    N/A

    *Claude 3 Opus est actuellement disponible dans la région USA Ouest (Oregon)
    **La tarification de Claude 3.5 Sonnet est applicable à chaque version de Claude 3.5 Sonnet (v1 et v2). Claude 3.5 Sonnet v2 est actuellement disponible dans la région de l'Ouest des États-Unis (Oregon)

    Région : Europe (Londres)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD 0,0075 USD

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    Région AWS : Amérique du Sud (Sao Paulo)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

     

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

     

    Région AWS : Canada (Centre)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Région : Asie-Pacifique (Mumbai)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Région : Asie-Pacifique (Sydney)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Région : Asie-Pacifique (Tokyo)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/A

     

    N/A

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    N/A

    N/A

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Région : Asie-Pacifique (Singapour)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude Instant

    0,0008 USD

    0,0024 USD

    0,0004 USD

     

    0,0012 USD

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    0,004 USD

     

    0,012 USD

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/A

    N/A

    Région : Europe (Paris)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Région : Europe (Francfort)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/A

    N/A

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    N/A

    N/A

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Région : Asie-Pacifique (Séoul)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/A

     

    N/A

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    N/A

     

    N/A

    Région : USA Est (Ohio)

    Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/A

     

    N/A

    Claude 3 Haïku

    0,00025 USD

    0,00125 USD

    N/A

     

    N/A

    Tarification du débit alloué

    Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)

    Modèles Anthropic Prix par heure par modèle avec
    aucun engagement
    Tarif horaire par unité modèle pour un engagement d'un mois Tarif horaire par unité modèle pour un engagement de six mois

    Claude Instant

    44,00 USD

    39,60 USD

    22 USD

    Claude 2.0/2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Modèles Anthropic Prix par heure par modèle avec
    aucun engagement
    Tarif horaire par unité modèle pour un engagement d'un mois Tarif horaire par unité modèle pour un engagement de six mois

    Claude Instant

    44,00 USD

    39,60 USD

    22 USD

    Claude 2.0/2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Région : Asie-Pacifique (Tokyo)

    Modèles Anthropic Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité modèle pour un engagement de six mois

    Claude Instant

    53 USD

    29 USD

    Claude 2.0/2.1

    86 USD

    48 USD

    Région : Europe (Francfort)

    Modèles Anthropic Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité modèle pour un engagement de six mois

    Claude Instant

    49 USD

    27 USD

    Claude 2.0/2.1

    79 USD

    44 USD

    Contactez l’équipe responsable de votre compte AWS pour plus de détails sur les unités modèles. 

  • Cohere
  • Cohere

    Tarification à la demande

    Modèles Cohere Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie
    Command 0,0015 USD 0,002 USD
    Command-Light 0,0003 USD 0,0006 USD
    Command R+ 0,0030 USD 0,0150 USD
    Command R 0,0005 USD 0,0015 USD
    Embed – anglais 0,0001 USD N/A
    Embed – multilingue 0,0001 USD N/A

    Tarification pour la personnalisation (ajustement)

    Modèles Cohere Prix pour entraîner 1 000 jetons Prix pour stocker chaque modèle personnalisé par mois Prix à déduire d’un modèle personnalisé par unité de modèle par heure (avec une tarification de débit provisionné sans engagement)

    Command de Cohere

    0,004 USD

    1,95 USD

    49,5 USD

    Command-Light de Cohere 0,001 USD

    1,95 USD

    8,56 USD

    *Nombre total de jetons entraînés = nombre de jetons dans le corpus de données d’entraînement multipliés par le nombre d’époques

    Tarification du débit provisionné

    Modèles Cohere Prix par heure et par modèle 
    sans engagement
    Tarif horaire par unité modèle pour un engagement d'un mois

    Tarif horaire par unité modèle pour un engagement de six mois

    Command de Cohere

    49,5 USD

    39,60 USD

    23,77 USD

    Cohere Command - Light 8,56 USD

    6,85 USD

    4,11 USD
    Embed – anglais 7,12 USD

    6,76 USD

    6,41 USD
    Embed – multilingue 7,12 USD

    6,76 USD

    6,41 USD

    Contactez l’équipe responsable de votre compte AWS ou l’équipe des ventes pour plus de détails sur les unités modèles. 

  • Meta Llama
  • Meta Llama

    Llama 3.2

    Tarification à la demande et par lots

    Llama 3.1

    Tarification à la demande et par lots

    Tarification du débit alloué

    Llama 3

    Tarification à la demande

    Llama 2

    Tarification à la demande

    Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)

    Modèles Meta Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

    Lama 2 Chat (13B)

    0,00075 USD

    0,001 USD

    Llama 2 Chat (70B)

    0,00195 USD

    0,00256 USD

    Tarification pour la personnalisation de modèle (ajustement)

    Modèles Meta Prix pour entraîner 1 000 jetons Prix pour stocker chaque modèle personnalisé* par mois Prix à déduire d’un modèle personnalisé pour une unité de modèle par heure (avec une tarification de débit provisionné sans engagement)

    Llama 2 Pretrained (13B)

    0,00149 USD

    1,95 USD

    23,50 USD

    Llama 2 Pretrained (70B)

    0,00799 USD

    1,95 USD 23,5 USD

    *Stockage de modèles personnalisés = 1,95 USD

    Tarification du débit provisionné

    Modèles Meta Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité de modèle pour un engagement de six mois

    Llama 2 Pretrained et Chat (13B)

    21,18 USD

    13,08 USD

    Llama 2 Pretrained (70B)

    21,18 USD

    13,08 USD

    *Les modèles préentraînés de Llama 2 ne sont disponibles qu’en débit provisionné après personnalisation.

    Pour plus de détails sur les unités de modèle, veuillez contacter l’équipe responsable de votre compte AWS ou l’équipe des ventes.

  • Mistral AI
  • Mistral AI

  • Stability AI
  • Stability AI

    Tarification à la demande

    Modèle Stability AI Prix par image générée
    Stable Image Core 0,04 USD
    SD3 Large 0,08 USD
    Stable Image Ultra 0,14 USD

    Les modèles d’images de la génération précédente proposés par Stability AI sont facturés par image, en fonction du nombre d’étapes et de la résolution de l’image.

    Modèle Stability AI Résolution de l’image Prix par image générée pour la qualité standard (<=50 étapes) Prix par image générée pour la qualité supérieure (>50 étapes)
    SDXL 1.0 Jusqu’à 1024 × 1024 0,04 USD 0,08 USD

    Tarification du débit provisionné

    Modèle Stability AI Tarif horaire par unité modèle pour un engagement d’un mois* Tarif horaire par unité modèle pour un engagement de six mois*

    SDXL 1.0

    49,86 USD

    46,18 USD

    **Comprend l’inférence pour les modèles de base et les modèles personnalisés

    Contactez l’équipe responsable de votre compte AWS ou l’équipe des ventes pour plus de détails sur les unités modèles.

    Actuellement, la personnalisation des modèles (ajustement) n’est pas prise en charge pour les modèles Stability AI sur Amazon Bedrock.

  • Importation de modèles personnalisés
  • Importation de modèles personnalisés

    • Llama
    • Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

      Version d'unité modèle personnalisée v1.0
      Prix par unité de modèle personnalisée par min* 0,0785 USD
      Coût de stockage mensuel par unité modèle personnalisée 1,95 USD
       
      Les unités de modèle personnalisées nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisées nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.1 8B 128K nécessite 2 unités de modèle personnalisées, un modèle Llama 3.1 70B 128k nécessite 8 unités de modèle personnalisées.
      *Facturé par créneaux de 5 minutes
    • Lama multimodal
    • Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

      Version d'unité modèle personnalisée v1.0
      Prix par unité de modèle personnalisée par min* 0,0785 USD
      Coût de stockage mensuel par unité modèle personnalisée 1,95 USD
       
      Les unités de modèle personnalisées nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisées nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.2 11B 128K nécessite 4 unités de modèle personnalisées.
      *Facturé par créneaux de 5 minutes
    • Mistral
    • Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

      Version d'unité modèle personnalisée v1.0
      Prix par unité de modèle personnalisée par min* 0,0785 USD
      Coût de stockage mensuel par unité modèle personnalisée 1,95 USD
       
      Les unités de modèle personnalisées nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisées nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Mistral 7B 32K nécessite 1 unité de modèle personnalisée.
      *Facturé par créneaux de 5 minutes
    • Mixtral
    • Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

      Version d'unité modèle personnalisée v1.0
      Prix par unité de modèle personnalisée par min* 0,0785 USD
      Coût de stockage mensuel par unité modèle personnalisée 1,95 USD
       
      Les unités de modèle personnalisées nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisées nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Mixtral 8x7B 32K nécessite 4 unités de modèle personnalisées.
      *Facturé par créneaux de 5 minutes
    • Flan
    • Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

      Version d'unité modèle personnalisée v1.0
      Prix par unité de modèle personnalisée par min* 0,0785 USD
      Coût de stockage mensuel par unité modèle personnalisée 1,95 USD
       
      Les unités de modèle personnalisées nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisées nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Flan-T5 XL 512 nécessite 1 unité de modèle personnalisée. 
      *Facturé par créneaux de 5 minutes

    Tarification par inférence à la demande :
    Vous êtes facturé dans des fenêtres de 5 minutes pour la durée pendant laquelle votre copie de modèle est active à compter de la première invocation réussie. La limite maximale de débit et de simultanéité par copie de modèle dépend de facteurs tels que la combinaison de jetons d’entrée/sortie, le type de matériel, la taille du modèle, l’architecture, les optimisations d’inférence et est déterminée lors du flux de travail d’importation du modèle.

    Bedrock met automatiquement à l’échelle le nombre de copies du modèle en fonction de vos habitudes d’utilisation. S'il n’y a aucune invocation pendant une période de 5 minutes, Bedrock sera réduit verticalement à zéro puis redimensionné lorsque vous invoquerez votre modèle. Lors de la redimensionnement, vous pouvez rencontrer un temps de démarrage à froid (en dizaines de secondes) en fonction de la taille du modèle. Bedrock augmente verticalement également le nombre de copies du modèle si votre volume d’inférence dépasse systématiquement les limites de simultanéité d’une seule copie de modèle. Remarque : Il existe un maximum par défaut de 3 copies de modèle par compte et par modèle importé, qui peut être augmenté par le biais de Service Quotas.

Outils avancés de tarification (détails)

  • Garde-fous Amazon Bedrock
  • Garde-fous Amazon Bedrock

    Politique en matière de barrières de protections *

    Prix pour 1 000 unités de texte**

    Filtres de contenu

    0,75 USD

    Sujets refusés

    1 USD

    Contrôle de l’ancrage contextuel***

    0,1 USD

    Filtre d’informations sensibles (PII)

    0,1 USD

    Filtre d’informations sensibles (expression régulière) 

    Gratuit

    Filtres de mots

    Gratuit

    Tarification à la demande

    * Chaque politique de barrière de protections est facultative et peut être activée en fonction des exigences de votre application. Des frais seront facturés en fonction du type de police utilisé pour la barrière de protections. Par exemple, si une barrière de protections est configurée avec des filtres de contenu et des sujets refusés, des frais seront facturés pour ces deux politiques, alors qu'aucun frais ne sera associé aux filtres d'informations sensibles.

    **Une unité de texte peut contenir jusqu'à 1 000 caractères. Si une saisie de texte comporte plus de 1 000 caractères, elle est traitée comme plusieurs unités de texte, chacune contenant 1 000 caractères ou moins. Par exemple, si une saisie de texte contient 5 600 caractères, elle sera facturée pour 6 unités de texte.

    *** Le contrôle de l’ancrage contextuel utilise une source de référence et une requête pour déterminer si la réponse du modèle est fondée sur la source et pertinente pour la requête. Le nombre total d’unités de texte facturées est calculé en combinant tous les caractères de la source, de la requête et de la réponse du modèle.

    Les barrières de protections ne sont pas prises en charge pour les images et les vectorisations.

  • Évaluation du modèle
  • Évaluation du modèle

    L'évaluation du modèle est facturée pour l'inférence à partir du modèle que vous avez choisi. Les scores algorithmiques générés automatiquement sont fournis sans frais supplémentaires. Pour l'évaluation basée sur l'humain dans laquelle vous apportez votre propre flux de travail, l'inférence du modèle dans l'évaluation vous est facturée et des frais de 0,21 USD par tâche humaine effectuée vous sont facturés.

    Modèle

    Prix pour 1 000 jetons d’entrée

    Prix pour 1 000 jetons de sortie

    Prix par tâche humaine

     

    Modèle sélectionné pour l'évaluation

    Sur la base du modèle sélectionné

    Sur la base du modèle sélectionné

     

    0,21 USD

     

Exemples de tarification

  • Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Jurrasic-2 Mid d’AI21 pour résumer une entrée de 10 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

    Coût total encouru = 10 000 jetons/1 000 x 0,0125 USD + 2 000 jetons/1 000 x 0,0125 USD = 0,15 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Amazon Titan Text Lite pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

    Coût horaire total encouru = 2 000 jetons/1 000 x 0,0003 USD + 1 000 jetons/1 000 x 0,0004 USD = 0,001 USD.

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle de base Amazon Titan Image Generator pour générer 1 000 images de taille 1 024 × 1 024 au format de qualité standard.

    Coût total encouru = 1 000 images x 0,01 USD par image = 10 USD

    Tarification de la personnalisation (ajustement et pré-entraînement continu)

    Un développeur d’applications personnalise un modèle Amazon Titan Image Generator à l’aide de 1 000 paires image-texte. Après l’entraînement, le développeur utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer la performance du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.

    Le coût mensuel encouru pour l’ajustement est le suivant : entraînement de l’ajustement (0,005 USD x 500 x 64), où 0,005 USD est le prix par image vue, 500 est le nombre d’étapes et 64 est la taille du lot, + stockage du modèle personnalisé par mois (1,95 USD) + une heure d’inférence de modèle personnalisé (21 USD) = 160 USD + 1,95 USD + 21 USD = 182,95 USD

    Tarification du débit provisionné

    Un développeur d’applications achète deux unités de modèles Amazon Titan Text Express avec un engagement d'un mois pour son cas d'utilisation de résumé de texte.

    Coût mensuel total encouru = 2 unités de modèles x 18,40 USD/heure x 24 heures x 31 jours = 27 379,20 USD

    Un développeur d’applications achète une unité de modèle du modèle de base Amazon Titan Image Generator avec un engagement d’un mois.

    Coût total engagé = 1 unité modèle x 16,20 USD x 24 heures x 31 jours = 12 052,80 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock dans la région USA Ouest (Oregon) : une demande au modèle Anthropic Claude pour résumer une entrée de 11 000 jetons de texte d’entrée en une sortie de 4 000 jetons.

    Coût total encouru = 11 000 jetons/1 000 x 0,008 USD + 4 000 jetons/1 000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Tarification du débit provisionné

    Un développeur d’applications achète une unité de modèle Anthropic Claude Instant dans la région USA Ouest (Oregon) :

    Coût mensuel total encouru = 1 unité de modèle x 39,60 USD x 24 heures x 31 jours = 29 462,40 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Command pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

    Coût total encouru = 6 000 jetons/1 000 x 0,0015 USD + 2 000 jetons/1 000 x 0,0020 USD = 0,013 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Command - Light pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

    Coût total encouru = 6 000 jetons/1 000 x 0,0003 USD + 2 000 jetons/1 000 x 0,0006 USD = 0,003 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Embed anglais ou multilingue pour générer des intégrations pour 10 000 jetons d’entrée.

    Coût total encouru = 10 000 jetons/1 000 x 0,0001 USD = 0,001 USD

    Tarification de la personnalisation (ajustement)

    Un développeur d’applications personnalise un modèle Cohere Command à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.

    Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,004 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (49,50 USD) = 55,45 USD

    Coût mensuel encouru pour le débit provisionné (engagement d’un mois) du modèle personnalisé = 39,60 USD

    Tarification du débit provisionné

    Un développeur d’applications achète une unité de modèle de Cohere Command avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.

    Coût mensuel total encouru = 1 unité de modèle x 39,60 USD x 24 heures x 31 jours = 29 462,40 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Meta Llama 2 Chat (13B) pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 500 jetons.

    Coût total encouru = 2 000 jetons/1 000 x 0,00075 USD + 500 jetons/1 000 x 0,001 USD = 0,002 USD

    Tarification de la personnalisation (ajustement)

    Un développeur d’applications personnalise le modèle Llama 2 Pretrained (70B) à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.

    Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,00799 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (23,50 USD) = 33,44 USD

    Coût mensuel encouru pour le débit provisionné (engagement d’un mois) du modèle personnalisé = 21,18 USD

    Tarification du débit provisionné

    Un développeur d’applications achète une unité de modèle de Meta Llama 2 avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.

    Coût mensuel total encouru = 1 unité de modèle x 21,18 USD x 24 heures x 31 jours = 15 757,92 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral 7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

    Coût horaire total encouru = 2 000 jetons/1 000 x 0,00015 USD + 1 000 jetons/1 000 x 0,0002 USD = 0,0005 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mixtral 8x7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

    Coût horaire total encouru = 2 000 jetons/1 000 x 0,00045 USD + 1 000 jetons/1 000 x 0,0007 USD = 0,0016 USD

    Un développeur d'application effectue les appels d'API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral Large pour résumer une entrée de 2 000 jetons de texte d'entrée en une sortie de 1 000 jetons. 

    Coût horaire total encouru = 2 000 jetons/1 000 x 0,008 USD + 1 000 jetons/1 000 x 0,024 USD = 0,04 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL pour générer une image de 512 x 512 avec une taille d’étape de 70 (qualité supérieure).

    Coût total encouru = 1 image x 0,036 USD par image = 0,036 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL1.0 pour générer une image de 1 024 x 1 024 avec une taille d’étape de 70 (qualité supérieure).

    Coût total encouru = 1 image x 0,08 USD par image = 0,08 USD

    Tarification du débit provisionné

    Un développeur d’applications achète une unité de modèle de SDXL 1.0 avec un engagement d’un mois.

    Coût total = 1 x 49,86 USD x 24 heures x 31 jours = 37 095,84 USD

  • Exemple d'évaluation du modèle 1 :

    Tarification à la demande
    Un développeur d'applications soumet un jeu de données pour l'évaluation de modèles humains à l'aide d'Anthropic Claude 2.1 et d'Anthropic Claude Instant dans la région AWS de l'USA Est (Virginie du Nord).

    Le jeu de données contient 50 invites, et le développeur a besoin d’un travailleur pour évaluer chaque ensemble invite-réponse (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par invite »).

    Cette tâche d'évaluation comportera 50 tâches (1 tâche pour chaque paire d’invite-réponse par travailleur). Les 50 invites totalisent 5 000 jetons d'entrée, et les réponses associées totalisent 15 000 jetons pour Anthropic Claude Instant et 20 000 jetons pour Anthropic Claude 2.1.

    Les frais suivants sont encourus pour ce travail d'évaluation de modèles :

    Élément Nombre de jetons d'entrée Prix pour 1000 jetons d'entrée Coût des intrants Nombre de jetons de sortie Prix pour 1000 jetons de sortie Coût de production Nombre de tâches humaines Prix par tâche humaine Coût des tâches humaines Total
    Inférence instantanée Claude 5 000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5 000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tâches humaines             50 0,21 USD 10,50 USD 10,50 USD
    Total                   11,06 USD

    Exemple d'évaluation du modèle 2 :

    Tarification à la demande
    Un développeur d'applications soumet un jeu de données pour l'évaluation de modèles humains à l'aide d'Anthropic Claude 2.1 et d'Anthropic Claude Instant dans la région AWS de l'USA Est (Virginie du Nord).

    Le jeu de données contient 50 invites, et le développeur a besoin de 2 travailleurs pour évaluer chaque ensemble invites-réponses (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par invite »). Ce travail d'évaluation comportera 100 tâches (1 tâche pour chaque ensemble invites-réponses par travailleur : 2 travailleurs x 50 ensembles invites-réponses = 100 tâches humaines).

    Les 50 invites totalisent 5 000 jetons d'entrée, et les réponses associées totalisent 15 000 jetons pour Anthropic Claude Instant et 20 000 jetons pour Anthropic Claude 2.1.

    Les frais suivants sont encourus pour ce travail d'évaluation de modèles :

    Élément Nombre de jetons d'entrée Prix pour 1000 jetons d'entrée Coût des intrants Nombre de jetons de sortie Prix pour 1000 jetons de sortie Coût de production Nombre de tâches humaines Prix par tâche humaine Coût des tâches humaines Total
    Inférence instantanée Claude 5 000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5 000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tâches humaines             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD
  • Exemple 1 : chatbot d'assistance à la clientèle
    Un développeur d'applications crée un chatbot d'assistance à la clientèle et utilise des filtres de contenu pour bloquer le contenu préjudiciable et les sujets refusés pour filtrer les requêtes et les réponses indésirables.

    Le chatbot répond à 1 000 requêtes d'utilisateurs par heure. Chaque requête utilisateur a une longueur d'entrée moyenne de 200 caractères et reçoit une réponse FM de 1 500 caractères.

    Chaque requête utilisateur de 200 caractères correspond à une unité de texte.

    Chaque réponse FM de 1 500 caractères correspond à 2 unités de texte.

    Unités de texte traitées chaque heure = (1 + 2) x 1 000 requêtes = 3 000 unités de texte

    Coût total par heure pour les filtres de contenu et les sujets refusés = 3 000 x (0,75 USD + 1,00 USD) / 1 000 = 5,25 USD

     

    Exemple 2 : résumé des transcriptions d’un centre d'appels
    Un développeur d'applications crée une application pour résumer les transcriptions des discussions entre les utilisateurs et les agents d’assistance. Il utilise un filtre d'informations sensibles pour supprimer les données d’identification personnelles (PII) dans les résumés générés pour 10 000 conversations.

    Chaque résumé généré comporte en moyenne 3 500 caractères, ce qui correspond à 4 unités de texte.

    Coût total engagé pour résumer 10 000 conversations = 10 000 x 4 x (0,1 / 1 000 USD) = 4 USD

    Élément Nombre de jetons d'entrée Prix pour 1000 jetons d'entrée Coût des intrants Nombre de jetons de sortie Prix pour 1000 jetons de sortie Coût de production Nombre de tâches humaines Prix par tâche humaine Coût des tâches humaines Total
    Inférence instantanée Claude 5 000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5 000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tâches humaines             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD
  • Exemple de tarification  : un développeur d'applications importe un modèle de type Llama 3.1 personnalisé d'une taille de paramètre 8B avec une longueur de séquence de 128 Ko dans la région us-est-1 et supprime le modèle au bout d'un mois. Cela nécessite 2 unités de modèle personnalisées. Ainsi, le prix par minute sera de 0,1570 USD car 2 unités de modèle personnalisées sont requises. Les coûts de stockage des modèles pour 2 unités modèles personnalisées seraient de 3,90 USD par mois.

    L’importation du modèle est gratuite. La première invocation réussie a lieu à 8 h 03, heure à laquelle le comptage commence. Les fenêtres de comptage de 5 minutes vont de 8 h 03 à 8 h 07 ; de 8 h 07 à 8 h 11, etc. S’il y a au moins une invocation pendant une période de 5 minutes, la fenêtre sera considérée comme active pour la facturation. S'il n’y a pas d’invocation entre 8 h 07 et 8 h 11, le compteur s’arrêtera à 8 h 11. Dans ce cas, la facture serait calculée comme suit : 0,1570 USD * 5 minutes * 3 fenêtres de cinq minutes = 2,355 USD.