Tarification d'Amazon SageMaker
Vue d'ensemble des tarifs
Amazon SageMaker aide les scientifiques des données et les développeurs à préparer, créer, entraîner et déployer rapidement des modèles de machine learning (ML) de haute qualité en rassemblant un large éventail de fonctionnalités conçues spécialement pour le ML. SageMaker prend en charge les cadres, boîtes à outils et langages de programmation de machine learning majeurs.
Avec SageMaker, vous ne payez que ce que vous consommez. Deux options de paiement vous sont proposées : la tarification à la demande (sans frais minimums ni engagements initiaux) et SageMaker Savings Plans (qui vous offre un modèle de tarification flexible basé sur l'utilisation, en échange d'un engagement sur une quantité constante d'utilisation).
Offre gratuite Amazon SageMaker
Vous pouvez essayer Amazon SageMaker gratuitement. Dans le cadre de l'offre gratuite d'AWS, vous pouvez commencer à utiliser Amazon SageMaker gratuitement. Votre offre gratuite commence à partir du premier mois où vous créez votre première ressource SageMaker. Les informations concernant l'offre gratuite d'Amazon SageMaker se trouvent dans le tableau ci-dessous.
Capacité d'Amazon SageMaker | Utilisation mensuelle de l'offre gratuite pendant les 2 premiers mois |
Blocs-notes Studio et instances de blocs-notes | 250 heures d'utilisation des instances ml.t3.medium sur des blocs-notes Studio OU 250 heures d'utilisations des instances ml.t2.medium ou ml.t3.medium sur des instances de blocs-notes |
RStudio sur SageMaker | 250 heures d'utilisation des instances ml.t3.medium sur l'application RSession ET des instances ml.t3.medium gratuites pour l'application RStudioServerPro |
Data Wrangler | 25 heures d'instance ml.m5.4xlarge |
Magasin de fonctionnalités | 10 millions d'unités d'écriture, 10 millions d'unités de lecture, 25 Go de stockage (magasin en ligne standard) |
Formation | 50 heures d'instances m4.xlarge ou m5.xlarge |
Amazon SageMaker avec TensorBoard | 300 heures d'instance ml.r5.large |
Inférence en temps réel | 125 heures d'instances m4.xlarge ou m5.xlarge |
Inférence sans serveur | 150 000 secondes de durée d'inférence à la demande |
Canvas | 160 heures par mois pour la durée de la session |
HyperPod | 50 heures d’utilisation de l’instance m5.xlarge |
Tarification à la demande
-
Studio classique
-
JupyterLab
-
Éditeur de code
-
RStudio
-
Instances de bloc-notes
-
Traitement
-
TensorBoard
-
Data Wrangler
-
Feature Store
-
Formation
-
MLflow
-
Inférence en temps réel
-
Inférence asynchrone
-
Batch Transform
-
Inférence sans serveur
-
JumpStart
-
Profileur
-
HyperPod
-
Optimisation d’inférence
-
Studio classique
-
Amazon SageMaker Studio Classic
Studio Classic propose des blocs-notes Jupyter en une étape dans le cadre de notre expérience IDE traditionnelle. Les ressources informatiques sous-jacentes sont totalement élastiques et les blocs-notes peuvent être facilement partagés avec d'autres, ce qui permet une collaboration transparente. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation. -
JupyterLab
-
Amazon SageMaker JupyterLab
Lancez un JupyterLab entièrement géré en quelques secondes. Utilisez l'environnement de développement interactif basé sur le Web le plus récent pour les blocs-notes, le code et les données. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation. -
Éditeur de code
-
Éditeur de code Amazon SageMaker
L'éditeur de code, basé sur Code-OSS (Visual Studio Code — Open Source), vous permet d'écrire, de tester, de déboguer et d'exécuter vos analyses et votre code ML. Il est entièrement intégré à SageMaker Studio et prend en charge les extensions IDE disponibles dans le registre d'extensions Open VSX. -
RStudio
-
RStudio
RStudio offre des ressources de calcul dans le cloud à la demande afin d'accélérer le développement de modèles et d'améliorer la productivité. Vous êtes facturé pour les types d'instance que vous choisissez d'exécuter sur l'application RStudio Session et l'application RStudio Server Pro.
RStudioServerPro App
-
Instances de bloc-notes
-
Instances de bloc-notes
Les instances de bloc-notes sont des instances de calcul qui exécutent l'application bloc-notes Jupyter. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.
-
Traitement
-
Amazon SageMaker Processing
Amazon SageMaker Processing permet d'exécuter simplement les charges de travail de prétraitement, de post-traitement et d'évaluation du modèle sur une infrastructure entièrement gérée. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.
-
TensorBoard
-
Amazon SageMaker avec TensorBoard
Amazon SageMaker avec TensorBoard fournit une expérience TensorBoard hébergée qui permet de visualiser et de résoudre les problèmes de convergence des modèles pour les tâches de formation Amazon SageMaker.
-
Data Wrangler
-
Amazon SageMaker Data Wrangler
Amazon SageMaker Data Wrangler réduit, de plusieurs semaines à quelques minutes, le temps nécessaire à l'agrégation et à la préparation des données pour le machine learning. Vous payez pour le temps utilisé pour nettoyer, explorer et visualiser les données. Les clients qui utilisent des instances de SageMaker Data Wrangler sont soumis aux tarifs ci-dessous.* Les clients qui utilisent des instances d'espace de travail SageMaker Data Wrangler sur des instances d'espace de travail SageMaker Canvas sont soumis aux tarifs de SageMaker Canvas. Consultez la page de tarification de SageMaker Canvas pour plus de détails.
Tâches Amazon SageMaker Data Wrangler
Une tâche de Amazon SageMaker Data Wrangler est créée lorsqu'un flux de données est exporté depuis SageMaker Data Wrangler. Avec les tâches SageMaker Data Wrangler, vous pouvez automatiser vos flux de préparation de données. Les tâches SageMaker Data Wrangler vous aident à appliquer de nouveau vos flux de préparation de données sur de nouveaux jeux de données, afin de vous faire gagner du temps. Elles sont facturées à la seconde.
-
Feature Store
-
Amazon SageMaker Feature Store
Amazon SageMaker Feature Store est un référentiel central permettant d’ingérer, de stocker et de proposer des fonctionnalités de machine learning. Les écritures, les lectures de groupes de fonctionnalités, ainsi que le stockage de données dans SageMaker Feature Store vous sont facturés, avec des tarifs différents pour la boutique en ligne standard et pour le magasin en ligne en mémoire.Pour le magasin en ligne standard, le stockage de données est facturé par Go et par mois. Pour le débit, vous pouvez choisir entre le mode de capacité à la demande ou le mode de capacité allouée. Pour le mode de capacité à la demande, les écritures sont facturées en unités de demande d’écriture par Ko et les lectures sont facturées en unités de demande de lecture par 4 Ko. Pour e mode de capacité allouée, vous spécifiez la capacité de lecture et d’écriture que votre application doit exiger. Sagemaker Feature Store facture une unité de capacité de lecture (WCU) pour chaque écriture par seconde (jusqu’à 1 Ko) et une RCU pour chaque lecture par seconde (jusqu’à 4 Ko). Vous serez facturé pour la capacité de débit (lectures et écritures) que vous allouez pour votre groupe de fonctionnalités, même si vous n’utilisez pas entièrement la capacité allouée.
Pour le magasin en ligne en mémoire, les écritures sont facturées en unités de demande d’écriture par Ko avec un minimum d’une unité par écriture, les lectures sont facturées en unités de demande de lecture par Ko avec un minimum d’une unité par lecture, et le stockage de données est facturé par Go et par heure. Les frais de stockage de données minimaux sont de 5 Go (5,37 Go) par heure pour la boutique en ligne en mémoire.
-
Formation
-
Amazon SageMaker Training
Amazon SageMaker facilite la formation des modèles de machine learning (ML) en fournissant tout ce dont vous avez besoin pour former, ajuster et déboguer les modèles. La facturation est établie en fonction de l'utilisation du type d'instance que vous choisissez. Lorsque vous utilisez Amazon SageMaker Debugger pour déboguer des problèmes et surveiller les ressources pendant la formation, vous pouvez utiliser les règles intégrées pour déboguer vos travaux de formation ou rédiger vos propres règles personnalisées. L'utilisation des règles intégrées pour déboguer vos offres de formation est gratuite. Concernant les règles personnalisées, vous êtes facturé au type d'instance que vous choisissez et en fonction de la durée d'utilisation.
-
MLflow
-
Amazon SageMaker avec MLflow
Amazon SageMaker avec MLflow permet aux clients de payer uniquement ce qu’ils utilisent. Les clients paient les serveurs de suivi MLflow en fonction des coûts de calcul et de stockage.
Les clients paieront le calcul en fonction de la taille du serveur de suivi et du nombre d’heures pendant lesquelles il a fonctionné. En outre, les clients paieront toutes les métadonnées stockées sur le serveur de suivi MLflow.
-
Inférence en temps réel
-
Hébergement Amazon SageMaker : inférence en temps réel
Amazon SageMaker fournit une inférence en temps réel pour vos cas d'utilisation nécessitant des prédictions en temps réel. La facturation est établie en fonction de l'utilisation du type d'instance que vous choisissez. Lorsque vous utilisez Amazon SageMaker Model Monitor pour conserver des modèles très précis fournissant une inférence en temps réel, vous pouvez utiliser des règles intégrées pour surveiller vos modèles ou rédiger vos propres règles personnalisées. Quant aux règles intégrées, vous bénéficiez de 30 heures de surveillance gratuite. Les frais supplémentaires seront fixés en fonction de la durée d'utilisation. Vous êtes facturé séparément lorsque vous utilisez vos propres règles personnalisées.
-
Inférence asynchrone
-
Inférence asynchrone Amazon SageMaker :
L'inférence asynchrone Amazon SageMaker est une option d'inférence en temps quasi réel qui met les requêtes entrantes en file d'attente, puis les traite de manière asynchrone. Utilisez cette option lorsque vous devez traiter des charges utiles importantes au fur et à mesure de l'arrivée des données ou exécuter des modèles dont les temps de traitement d'inférence sont longs et qui n'ont pas d'exigences de latence inférieure à la seconde. Vous êtes facturé pour le type d'instance que vous choisissez. -
Batch Transform
-
Amazon SageMaker Batch Transform
Avec Amazon SageMaker Batch Transform, il n'est pas nécessaire de décomposer l'ensemble de données ni de gérer les points de terminaison en temps réel. SageMaker Batch Transform vous permet d'exécuter des prédictions sur des ensembles de données de grande ou petite capacité. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.
-
Inférence sans serveur
-
Amazon SageMaker Serverless Inference
L'Inférence sans serveur Amazon SageMaker vous permet de déployer des modèles de machine learning pour l'inférence, sans avoir à configurer ou à gérer une quelconque infrastructure sous-jacente. Vous pouvez utiliser l’Inférence sans serveur à la demande ou ajouter une simultanéité provisionnée à votre point de terminaison pour des performances prévisibles.Avec l’Inférence sans serveur à la demande, vous ne payez que la capacité de calcul utilisée pour traiter les demandes d'inférence, facturées à la milliseconde, et la quantité de données traitées. Les frais de calcul dépendent de la configuration de mémoire choisie.
Simultanéité allouéeÉventuellement, vous pouvez aussi activer la simultanéité provisionnée pour vos points de terminaison sans serveur. La simultanéité provisionnée vous permet de déployer des modèles sur des points de terminaison sans serveur avec des performances prévisibles et une capacité de mise à l'échelle élevée en maintenant vos points de terminaison au chaud pour un nombre spécifié de demandes simultanées et pour des périodes précises. Comme pour l’inférence sans serveur à la demande, lorsque la simultanéité provisionnée est activée, vous payez en fonction de la capacité de calcul utilisée pour traiter les demandes d'inférence, facturée à la milliseconde, et de la quantité de données traitées. Vous payez également pour l'utilisation de la simultanéité provisionnée, en fonction de la mémoire configurée, de la durée accordée et de la quantité de simultanéité activée.
-
JumpStart
-
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart vous aide à démarrer rapidement et facilement avec le machine learning grâce à un accès en un clic aux ensembles de modèles courants (également appelés « Model Zoos »). JumpStart offre également des solutions de bout en bout, permettant de résoudre les cas d'utilisation ML courants, qui peuvent être personnalisés en fonction de vos besoins. L'utilisation de modèles ou des solutions JumpStart n'entraîne aucuns frais supplémentaires. Vous êtes facturé pour les heures d'instances d'entraînement et d'inférence sous-jacentes utilisées, et ce de la même manière que si vous les aviez créées manuellement.
-
Profileur
-
Le profileur Amazon SageMaker collecte des données au niveau du système pour la visualisation de tracés haute résolution du processeur et du processeur graphique. Cet outil est conçu pour aider les spécialistes de données et les ingénieurs à identifier les problèmes de performance liés au matériel dans leurs modèles de deep learning, réduisant ainsi le temps et les coûts de formation de bout en bout. Actuellement, le profileur SageMaker prend uniquement en charge le profilage des tâches de formation en utilisant les types d'instances de calcul d'entraînement ml.g4dn.12xlarge, ml.p3dn.24xlarge et ml.p4d.24xlarge.
Régions : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon), Europe (Francfort), Europe (Irlande) et Israël (Tel Aviv).Le profileur Amazon SageMaker est actuellement en version préliminaire et est disponible gratuitement pour les clients des régions prises en charge.
-
HyperPod
-
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod est spécialement conçu pour accélérer le développement du modèle de fondation (FM). Pour rendre l'entraînement FM plus résilient, il surveille en permanence l'état du cluster, répare et remplace les nœuds défectueux à la volée, et enregistre les points de contrôle fréquents pour reprendre automatiquement l'entraînement sans perdre de progression. SageMaker HyperPod est préconfiguré avec les bibliothèques d’entraînement distribué SageMaker qui vous permettent d’améliorer les performances d’entraînement FM tout en utilisant pleinement l’infrastructure informatique et réseau du clusterRemarque : la tarification de SageMaker HyperPod ne couvre pas les frais liés aux services connectés aux clusters HyperPod, tels qu’Amazon EKS, Amazon FSx pour Lustre et Amazon Simple Storage Service (Amazon S3).
-
Optimisation d’inférence
-
La boîte à outils d’optimisation d’inférence vous permet de mettre en œuvre facilement les dernières techniques d’optimisation d’inférence afin d’atteindre des performances de pointe en matière de coûts (SOTA) sur Amazon SageMaker, tout en faisant gagner des mois de travail aux développeurs. Vous pouvez choisir parmi un menu de techniques d’optimisation courantes proposées par SageMaker et exécuter des tâches d’optimisation à l’avance, tester les mesures de performances et de précision du modèle, puis déployer le modèle optimisé sur un point de terminaison SageMaker à des fins d’inférence.
Détails de l’instance
Détails du produit de l'instance Amazon SageMaker P5
Taille d'instance | vCPU | Mémoire d'instance (TiB) | Modèle GPU | GPU | Mémoire GPU totale (Go) | Mémoire par GPU (Go) | Bande passante du réseau (Gbit/s) | GPUDirect RDMA | Pair à pair GPU | Storage d'instance (To) | Bande passante EBS (Gbit/s) |
ml.p5.48xlarge | 192 | 2 | NVIDIA H100 | 8 | 640 HM3 | 80 | 3200 EFAv2 | Oui | NVSwitch 900 Go/s | 8x3.84 NVMe SSD | 80 |
Détails de l’instance P4d Amazon Sagemaker
Taille d'instance | vCPU | Mémoire d'instance (Gio) | Modèle GPU | GPU | Mémoire GPU totale (Go) | Mémoire par GPU (Go) | Bande passante du réseau (Gbit/s) | GPUDirect RDMA | Pair à pair GPU | Stockage d'instance (Go) | Bande passante EBS (Go/s) |
ml.p4d.24xlarge | 96 | 1 152 | NVIDIA A100 | 8 | 320 HBM 2 | 40 | ENA et EFA 400 | Oui | NVSwitch 600 Go/s | 8 SSD NVMe de 1000 | 19 |
ml.p4de.24xlarge | 96 | 1 152 | NVIDIA A100 | 8 | 640 HNM2e | 80 | 400 ENA et EFA | Oui | NVSwitch 600 Go/s | 8 SSD NVMe de 1000 | 19 |
Détail du produit de l’instance P3 Amazon Sagemaker
Taille d'instance | vCPU | Mémoire d'instance (Gio) | Modèle GPU | GPU | Mémoire GPU totale (Go) | Mémoire par GPU (Go) | Bande passante du réseau (Gbit/s) | Pair à pair GPU | Stockage d'instance (Go) | Bande passante EBS (Gbit/s) |
ml.p3.2xlarge | 8 | 61 | NVIDIA V100 | 1 | 16 | 16 | Jusqu'à 10 | N/A | EBS uniquement | 1,5 |
ml.p3.8xlarge | 32 | 244 | NVIDIA V100 | 4 | 64 | 16 | 10 | NVLink | EBS uniquement | 7 |
ml.p3.16xlarge | 64 | 488 | NVIDIA V100 | 8 | 128 | 16 | 25 | NVLink | EBS uniquement | 14 |
ml.p3dn.24xlarge | 96 | 768 | NVIDIA V100 | 8 | 256 | 32 | 100 | NVLink | 2 disques SSD NVMe de 900 | 19 |
Détails du produit de l'instance Amazon SageMaker P2
Taille d'instance | vCPU | Mémoire d'instance (Gio) | Modèle GPU | GPU | Mémoire GPU totale (Go) | Mémoire par GPU (Go) | Bande passante du réseau (Gbit/s) | Bande passante EBS (Gbit/s) |
ml.p2.xlarge | 4 | 61 | NVIDIA K80 | 1 | 12 | 12 | Jusqu'à 10 | Élevées |
ml.p2.8xlarge | 32 | 488 | NVIDIA K80 | 8 | 96 | 12 | 10 | 10 |
ml.p2.16xlarge | 64 | 732 | NVIDIA K80 | 16 | 192 | 12 | 25 | 20 |
Détail du produit de l’instance G4 Amazon SageMaker
Taille d'instance | vCPU | Mémoire d'instance (Gio) | Modèle GPU | GPU | Mémoire GPU totale (Go) | Mémoire par GPU (Go) | Bande passante du réseau (Gbit/s) | Stockage d'instance (Go) | Bande passante EBS (Go/s) |
ml.g4dn.xlarge | 4 | 16 | NVIDIA T4 | 1 | 16 | 16 | Jusqu'à 25 | 1 disque SSD NVMe de 125 | Jusqu'à 3,5 |
ml.g4dn.2xlarge | 8 | 32 | NVIDIA T4 | 1 | 16 | 16 | Jusqu'à 25 | 1 disque SSD NVMe de 125 | Jusqu'à 3,5 |
ml.g4dn.4xlarge | 16 | 64 | NVIDIA T4 | 1 | 16 | 16 | Jusqu'à 25 | 1 disque SSD NVMe de 125 | 4,75 |
ml.g4dn.8xlarge | 32 | 128 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 disque SSD NVMe de 900 | 9,5 |
ml.g4dn.16xlarge | 64 | 256 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 disque SSD NVMe de 900 | 9,5 |
ml.g4dn.12xlarge | 48 | 192 | NVIDIA T4 | 4 | 64 | 16 | 50 | 1 disque SSD NVMe de 900 | 9,5 |
Détail du produit de l’instance G5 Amazon SageMaker
Taille d'instance | vCPU | Mémoire d'instance (Gio) | Modèle GPU | GPU | Mémoire GPU totale (Go) | Mémoire par GPU (Go) | Bande passante du réseau (Gbit/s) | Bande passante EBS (Go/s) | Stockage d'instance (Go) |
ml.g5n.xlarge | 4 | 16 | NVIDIA A10G | 1 | 24 | 24 | Jusqu'à 10 | Jusqu'à 3,5 | 1 x 250 |
ml.g5.2xlarge | 8 | 32 | NVIDIA A10G | 1 | 24 | 24 | Jusqu'à 10 | Jusqu'à 3,5 | 1 x 450 |
ml.g5.4xlarge | 16 | 64 | NVIDIA A10G | 1 | 24 | 24 | Jusqu'à 25 | 8 | 1 x 600 |
ml.g5.8xlarge | 32 | 128 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x900 |
ml.g5.16xlarge | 64 | 256 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x1900 |
ml.g5.12xlarge | 48 | 192 | NVIDIA A10G | 4 | 96 | 24 | 40 | 16 | 1x3800 |
ml.g5.24xlarge | 96 | 384 | NVIDIA A10G | 4 | 96 | 24 | 50 | 19 | 1x3800 |
ml.g5.48xlarge | 192 | 768 | NVIDIA A10G | 8 | 192 | 24 | 100 | 19 | 2 x 3 800 |
Détails du produit de l'instance Amazon SageMaker Trn1
Taille d'instance | vCPU | Mémoire (Gio) | Accélérateurs Trainium | Mémoire totale de l'accélérateur (Go) | Mémoire par accélérateur (Go) | Stockage d'instance (Go) | Bande passante réseau (Gbit/s) | Bande passante EBS (Gbit/s) |
ml.trn 1,2 x large | 8 | 32 | 1 | 32 | 32 | 1 disque SSD NVMe de 500 | Jusqu'à 12,5 | Jusqu'à 20 |
ml.trn1.32xlarge | 128 | 512 | 16 | 512 | 32 | 4 disques SSD NVMe de 2000 | 800 | 80 |
Détails du produit de l'instance Amazon SageMaker Inf1
Taille d'instance | vCPU | Mémoire (Gio) | Accélérateurs Inferentia | Mémoire totale de l'accélérateur (Go) | Mémoire par accélérateur (Go) | Accélérateurs d'inférence | Interconnexion inter-accélérateur | Bande passante du réseau (Gbit/s) | Bande passante EBS (Gbit/s) |
ml.inf1.xlarge | 4 | 8 | 1 | 8 | 8 | EBS uniquement | S/O | Jusqu'à 25 | Jusqu'à 4,75 |
ml.inf1.2xlarge | 8 | 16 | 1 | 8 | 8 | EBS uniquement | S/O | Jusqu'à 25 | Jusqu'à 4,75 |
ml.inf1.6xlarge | 24 | 48 | 4 | 32 | 8 | EBS uniquement | Oui | 25 | 4,75 |
ml.inf1.24xlarge | 96 | 192 | 16 | 128 | 8 | EBS uniquement | oui | 100 | 19 |
Détails du produit de l'instance Amazon SageMaker Inf.2
Taille d'instance | vCPU | Mémoire (Gio) | Accélérateurs Inferentia | Mémoire totale de l'accélérateur (Go) | Mémoire par accélérateur (Go) | Accélérateurs d'inférence | Interconnexion inter-accélérateur | Bande passante du réseau (Gbit/s) | Bande passante EBS (Gbit/s) |
ml.inf2.x large | 4 | 16 | 1 | 32 | 32 | EBS uniquement | S/O | Jusqu'à 25 | Jusqu'à 10 |
ml.inf2.8 x large | 32 | 128 | 1 | 32 | 32 | EBS uniquement | S/O | Jusqu'à 25 | 10 |
ml.inf 2,24 x large | 96 | 384 | 6 | 196 | 32 | EBS uniquement | Oui | 50 | 30 |
ml.inf 2,48 x large | 192 | 768 | 12 | 384 | 32 | EBS uniquement | Oui | 100 | 60 |
Amazon SageMaker Studio
Amazon SageMaker Studio est une interface Web unique pour le développement complet de machine learning, offrant un choix d'environnements de développement intégrés (IDE) entièrement gérés et d'outils spécifiques. Vous pouvez accéder à SageMaker Studio gratuitement. Vous êtes uniquement facturé pour le calcul et le stockage sous-jacents que vous utilisez pour différents IDE et outils de machine learning au sein de SageMaker Studio.
Vous pouvez utiliser de nombreux services de SageMaker Studio, AWS SDK pour Python (Boto3) ou de l’interface de la ligne de commande AWS (AWS CLI), notamment les suivants :
- Des IDE sur SageMaker Studio pour réaliser un développement ML complet avec un large éventail d’IDE entièrement gérés, notamment JupyterLab, un éditeur de code basé sur Code-OSS (Visual Studio Code – Open Source) et RStudio
- SageMaker Pipelines pour l’automatisation et la gestion des flux ML
- SageMaker Autopilot pour créer automatiquement des modèles de ML avec une visibilité totale
- SageMaker Experiments pour organiser et suivre vos offres et versions de la formation
- SageMaker Debugger pour déboguer les anomalies en cours d'entraînement
- SageMaker Model Monitor pour maintenir des modèles de qualité supérieure
- SageMaker Clarify pour mieux expliquer vos modèles ML et détecter les biais
- SageMaker JumpStart pour déployer facilement des solutions ML pour de nombreux cas d'utilisation. Des frais peuvent vous être facturés à partir des autres services AWS utilisés dans la solution pour les appels d'API sous-jacents effectués par Amazon SageMaker en votre nom.
- SageMaker Inference Recommender pour obtenir des recommandations sur la configuration idéale du point de terminaison
Vous ne payez que les ressources de calcul et de stockage sous-jacentes dans SageMaker ou d’autres services AWS, en fonction de votre utilisation.
Pour utiliser l’offre gratuite d’Amazon Q Developer, suivez les instructions ici. Pour utiliser Amazon Q Developer Pro, vous devez vous abonner à Amazon Q Developer. La tarification Amazon Q Developer est disponible ici.
Évaluations du modèle de base
SageMaker Clarify prend en charge les évaluations des modèles de fondation à l'aide de méthodes d'évaluation automatiques et fondées sur l'être humain. Chacun d'entre eux a une tarification différente. Si vous évaluez un modèle de fondation d'Amazon SageMaker JumpStart qui n'est pas encore déployé sur votre compte, SageMaker déploiera temporairement le modèle JumpStart sur une instance de SageMaker pendant la durée de l'inférence. L'instance spécifique sera conforme à la recommandation d'instance fournie par JumpStart pour ce modèle.
Évaluation automatique :
Les évaluations des modèles de fondation s'exécutent en tant que tâche de traitement SageMaker. La tâche d'évaluation fera appel à SageMaker Inference. Les clients sont facturés pour l'inférence et pour le travail d'évaluation. Les clients ne sont facturés que pour la durée du travail d'évaluation. Le coût de la tâche d'évaluation serait la somme du coût par heure de l'instance d'évaluation et de la somme du coût par heure de l'instance d'hébergement.
Évaluations fondées sur l'être humain :
Lorsque vous utilisez la fonction d'évaluation fondée sur l'être humain qui vous permet d'amener votre propre personnel, trois éléments vous sont facturés : 1) l'instance SageMaker utilisée pour l'inférence, 2) l'instance utilisée pour exécuter la tâche de traitement SageMaker qui héberge l'évaluation fondée sur l’être humain, et 3) des frais de 0,21 USD par tâche d'évaluation humaine terminée. Une tâche humaine est définie comme l'occurrence par laquelle un travailleur humain soumet une évaluation d'un seul prompt et de ses réponses d'inférence associées dans l'interface utilisateur d'évaluation humaine. Le prix est le même, que vous ayez 1 ou 2 modèles dans votre travail d'évaluation ou que vous apportiez votre propre inférence, et quel que soit le nombre de dimensions d'évaluation et de méthodes de notation que vous incluez. Le prix de 0,21 USD par tâche est le même pour toutes les régions AWS. Il n'y a pas de frais distincts pour la main-d'œuvre, car la main-d'œuvre est fournie par vous.
Évaluation gérée par AWS :
Pour une évaluation par un expert gérée par AWS, la tarification est personnalisée en fonction de vos besoins d'évaluation dans le cadre d'un engagement privé en collaboration avec l'équipe d'évaluation d'AWS.
Amazon SageMaker Studio Lab
Vous pouvez créer et entraîner gratuitement des modèles de ML à l'aide d'Amazon SageMaker Studio Lab. SageMaker Studio Lab met gratuitement à la disposition des développeurs, des universitaires et des scientifiques des données, un environnement de développement sans configuration pour apprendre et expérimenter le ML.
Amazon SageMaker Canvas
Amazon SageMaker Canvas étend l'accès ML en offrant aux analystes métier la possibilité de faire des prédictions ML précises à l'aide d'une interface visuelle par pointer-cliquer, sans exiger la moindre expérience en ML ou en codage.
Amazon SageMaker Data Labeling
Amazon SageMaker Data Labeling propose deux offres en matière d'étiquetage des données : Amazon SageMaker Ground Truth Plus et Amazon SageMaker Ground Truth. En savoir plus sur Amazon SageMaker Data Labeling, un service d'étiquetage des données entièrement géré qui facilite la création de jeux de données d'entraînement hautement précis pour le ML.
Shadow testing d'Amazon SageMaker
SageMaker vous aide à exécuter des shadow tests pour évaluer un nouveau modèle ML avant la mise en production en testant ses performances par rapport au modèle actuellement déployé. Il n'y a pas de frais supplémentaires pour les tests de SageMaker shadow, à l'exception des frais d'utilisation des instances ML et du stockage ML provisionnés pour héberger le modèle shadow. La tarification des instances ML et des dimensions de stockage ML est la même que celle de l'option d'inférence en temps réel spécifiée dans le tableau de tarification précédent. Il n'y a pas de frais supplémentaires pour les données traitées dans et hors des déploiements shadow.
Amazon SageMaker Edge
En savoir plus sur la tarification d'Amazon SageMaker Edge pour optimiser, exécuter et surveiller les modèles ML sur des flottes d'appareils périphériques.
Savings Plans Amazon SageMaker
Amazon SageMaker Savings Plans vous offre jusqu'à 64 % de réduction sur les coûts. Les plans s'appliquent automatiquement à l'utilisation des instances ML SageMaker éligibles, y compris les blocs-notes SageMaker Studio, les instances de blocs-notes SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference et SageMaker Batch Transform, indépendamment de la famille, de la taille ou de la région de l'instance. Par exemple, vous pouvez à tout moment passer d'une instance de processeur ml.c5.xlarge s'exécutant dans la région USA Est (Ohio) à une instance ml.Inf1 s'exécutant dans la région USA Ouest (Oregon) pour des charges de travail d'inférence, et toujours bénéficier automatiquement de la tarification Savings Plans.
Coût total de possession (TCO) avec Amazon SageMaker
Par rapport à d'autres solutions autogérées basées sur le cloud, Amazon SageMaker permet de réduire d'au moins 54 % le coût total de possession (TCO) sur trois ans. En savoir plus sur l'analyse complète du TCO sur Amazon SageMaker.
Exemples de tarification
-
Exemple de tarification #1 : JupyterLab
En tant que spécialiste des données, vous passez 20 jours à utiliser JupyterLab pour expérimenter rapidement sur des blocs-notes, du code et des données pendant 6 heures par jour sur une instance ml.g4dn.xlarge. Vous créez puis exécutez un espace JupyterLab pour accéder à l'IDE JupyterLab. Le calcul n’est facturé que pour l’instance utilisée lorsque l’espace JupyterLab est en cours d’exécution. Les frais de stockage d’un espace JupyterLab s’accumulent jusqu’à sa suppression.Calcul
Instance Durée Jours Durée totale Prix par heure Total ml.g4dn.xlarge 6 heures 20 6 * 20 = 120 heures 0,7364 USD 88,368 USD Stockage
Vous utiliserez un stockage SSD à usage général pendant 480 heures (24 heures * 20 jours). Dans une région qui facture 0,1125 USD par Go/mois :
0,112 USD par Go/mois x 5 Go x 480 (24 heures/jour x mois de 30 jours) = 0,373 USD -
Exemple de tarification #2 : Éditeur de code
En tant qu'ingénieur ML, vous passez 20 jours à utiliser Code Editor pour l'édition, l'exécution et le débogage du code de production ML pendant 6 heures par jour sur une instance ml.g4dn.xlarge. Vous créez puis exécutez un espace d'éditeur de code pour accéder à l'IDE de l'éditeur de code. Le calcul n’est facturé que pour l’instance utilisée lorsque l’espace de l’éditeur de code est en cours d’exécution. Les frais de stockage pour un espace d’éditeur de code s’accumulent jusqu’à sa suppression.Calcul
Instance Durée Jours Durée totale Prix par heure Total ml.g4dn.xlarge 6 heures 20 6 * 20 = 120 heures 0,7364 USD 88,368 USD Stockage
Vous utiliserez un stockage SSD à usage général pendant 480 heures (24 heures * 20 jours). Dans une région qui facture 0,1125 USD par Go/mois :
0,112 USD par Go/mois x 5 Go x 480 (24 heures/jour x mois de 30 jours) = 0,373 USD
-
Exemple de tarification #3 : Studio Classic
Un spécialiste des données suit la séquence d'actions suivante lorsqu'il utilise des blocs-notes dans Amazon SageMaker Studio Classic.
- Ouvre le bloc-notes 1 dans un noyau TensorFlow sur une instance ml.c5.xlarge et travaille ensuite sur ce bloc-notes pendant 1 heure.
- Ouvre le bloc-notes 2 sur une instance ml.c5.xlarge. Il s'ouvrira automatiquement dans la même instance ml.c5.xlarge que celle qui exécute le bloc-notes 1.
- Il travaille simultanément sur le bloc-notes 1 et le bloc-notes 2 pendant 1 heure.
- Le spécialiste des données sera facturé pour un total de deux (2) heures d'utilisation de ml.c5.xlarge. Pour l'heure de chevauchement où elle a travaillé simultanément sur le bloc-notes 1 et le bloc-notes 2, chaque application de noyau sera mesurée pendant 0,5 heure et elle sera facturée pour 1 heure.
Application de noyau Instance de bloc-notes Heures Prix par heure Total TensorFlow ml.c5.xlarge 1 0,204 USD 0,204 USD TensorFlow ml.c5.xlarge 0,5 0,204 USD 0,102 USD Science des données ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Exemple de tarification #4 : RStudio
Un spécialiste des données passe par la séquence d'actions suivante lorsqu'il utilise RStudio :
- Lance RSession 1 sur une instance ml.c5.xlarge, puis travaille sur ce bloc-notes pendant 1 heure.
- Lance RSession 2 sur une instance ml.c5.xlarge. Il s'ouvrira automatiquement dans la même instance ml.c5.xlarge que celle qui exécute RSession 1.
- Travaille sur la RSesssion 1 et la RSession 2 simultanément pendant 1 heure.
- Le scientifique des données sera facturé pour un total de deux (2) heures d'utilisation de ml.c5.xlarge. Pour l'heure de chevauchement où elle a travaillé simultanément sur RSession 1 et RSession 2, chaque application RSession sera mesurée pendant 0,5 heure et elle sera facturée pour 1 heure.
Pendant ce temps, le RServer fonctionne 24 heures sur 24 et 7 jours sur 7, qu'il y ait des RSessions en cours ou non. Si l'administrateur choisit « Small » (ml.t3.medium), alors il est gratuit. En revanche, s'il choisit « Medium » (ml.c5.4xlarge) ou « Large » (ml.c5.9xlarge), il est facturé à l'heure dans la mesure où RStudio est activé pour le domaine SageMaker.
Application RSession Instance RSession Heures Prix par heure Total Base R ml.c5.xlarge 1 0,204 USD 0,204 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Exemple de tarification 5 : traitement
Amazon SageMaker Processing ne facture que les instances utilisées pendant l'exécution de vos tâches. Lorsque vous fournissez les données d'entrées à traiter dans Simple Storage Service (Amazon S3), Amazon SageMaker télécharge les données à partir de Simple Storage Service (Amazon S3) sur un stockage de fichiers local au démarrage d'une tâche de traitement.
L'analyste de données exécute une tâche de traitement pour prétraiter et valider les données sur deux instances ml.m5.4xlarge pour une durée de 10 minutes. Elle charge un ensemble de données de 100 Go dans S3 comme entrée pour la tâche de traitement, et les données générées (avec à peu près la même taille) sont à nouveau stockées dans S3.
Heures Instances de traitement Prix par heure Total 1 * 2 * 0,167 = 0,334 ml.m5.4xlarge 0,922 USD 0,308 USD Stockage (Go) polyvalent (SSD) Prix par heure Total 100 Go * 2 = 200 0,14 USD 0,0032 USD Le sous-total de la tâche de traitement Amazon SageMaker = 0,308 USD.
Le sous-total du stockage SSD polyvalent de 200 Go = 0,0032 USD.
Dans cet exemple, le prix total serait de 0,3112 USD.
-
Exemple de tarification #6 : Data Wrangler
D'après le tableau, vous utilisez Amazon SageMaker Data Wrangler pendant un total de 18 heures sur 3 jours pour préparer vos données. De plus, vous créez une tâche SageMaker Data Wrangler pour préparer des données mises à jour chaque semaine. Chaque tâche dure 40 minutes et s'exécute chaque semaine pendant un mois.
Total des frais mensuels d'utilisation de Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD
Application Instance SageMaker Studio Jours Durée Durée totale Prix par heure Sous-total du prix SageMaker Data Wrangler ml.m5.4xlarge 3 6 heures 18 heures 0,922 USD 16,596 USD Tâche SageMaker Data Wrangler ml.m5.4xlarge - 40 minutes 2,67 heures 0,922 USD 2,461 USD En tant que spécialiste des données, vous utilisez Amazon SageMaker Data Wrangler pendant trois jours pour nettoyer, explorer et visualiser vos données pendant 6 heures par jour. Pour exécuter votre pipeline de préparation des données, vous lancez ensuite une tâche SageMaker Data Wrangler programmée pour s'exécuter chaque semaine.
Le tableau ci-dessous résume votre utilisation totale pour le mois et les frais associés à l'utilisation d'Amazon SageMaker Data Wrangler.
-
Exemple de tarification #7 : magasin des fonctionnalités
++ Toutes les unités de lecture fractionnaires sont arrondies au nombre entier suivant
Stockage de données
Total de données stockées = 31,5 Go
Frais mensuels pour le stockage des données = 31,5 Go x 0,45 USD = 14,175 USDTotal des frais mensuels Amazon SageMaker Feature Store = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD
Jour du mois Écritures totales Unités d'écriture totales Lectures totales Unités de lecture totales Jours 1 à 10 100.000 écritures
(10.000 écritures x 10 jours)2.500.000
(100,000 x 25 Ko)100.000
(10.000 x 10 jours)700.000++
(100 000 x 25/4 Ko )Jour 11 200 000 écritures 5.000.000
(200.000 x 25 Ko)200.000 lectures 1.400.000++
(200.000 x 25/4Ko)Jours 12 à 30 1 520 000 écritures
(80.000 x 19 jours)38.000.000
(1 520 000 x 25 Ko)1 520 000 écritures
(80 000 x 19 jours)10 640 000++
(1 520 000 x 25/4 Ko)Unités chargeables totales 45.500.000 unités d’écriture 12.740.000 unités de lecture Frais mensuels des écritures et lectures 56,875 USD
(45,5 millions unités d’écriture x 1,25 USD par million d’écriture)3,185 USD
(12,74 millions d'unités de lecture x 0,25 USD par million de lecture)Vous disposez d'une application web qui émet des lectures et des écritures de 25 Ko chacune dans Amazon SageMaker Feature Store. Pendant les 10 premiers jours d'un mois, vous recevez peu de notifications vers votre application, à savoir 10 000 écritures et 10 000 lectures par jour dans SageMaker Feature Store. Cependant, le jour 11, votre application attire l'attention sur les réseaux sociaux et son flux atteint 200 000 lectures et 200 000 écritures ce jour-là. Votre application s'installe alors via un flux plus régulier, avec une moyenne de 80 000 lectures et de 80 000 écritures chaque jour jusqu'à la fin du mois.
Le tableau ci-dessous résume votre utilisation totale mensuelle et les frais associés à l'utilisation de Amazon SageMaker Feature Store.
-
Exemple de tarification #8 : entraînement
Dans cet exemple, les frais totaux pour l'entraînement et le débogage s'élèvent à 2,38 USD. Les instances de calcul et les volumes de stockage polyvalents utilisés par les règles intégrées d'Amazon SageMaker Debugger n'engendrent pas de frais supplémentaires.
Stockage polyvalent (SSD) pour l'entraînement (Go) Stockage polyvalent (SSD) pour les règles Debugger intégrées (Go) Stockage polyvalent (SSD) pour les règles Debugger personnalisées (Go) Coût par Go/mois Sous-total Capacité utilisée 3 2 1 Coût 0 USD Aucun frais supplémentaire pour les volumes de stockage de règle intégrée 0 USD 0,10 USD 0 USD Heures Instance d'entraînement Instance de débogage Prix par heure Sous-total 4 x 0,5 = 2,00 ml.m4.4xlarge Non applicable 0,96 USD 1,92 USD 4 * 0,5 * 2 = 4 Non applicable Aucun frais supplémentaire pour les instances de règle intégrée 0 USD 0 USD 4 * 0,5 = 2 ml.m5.xlarge Non applicable 0,23 USD 0,46 USD ------- 2,38 USD Un spécialiste des données a travaillé pendant une semaine sur un modèle afin de donner forme à une nouvelle idée. Elle forme le modèle 4 fois sur une instance ml.m4.4xlarge pendant 30 minutes par exécution de formation avec le Amazon SageMaker Debugger activé en utilisant deux règles intégrées et une règle personnalisée qu'elle a écrite. Pour la règle personnalisée, elle a spécifié une instance ml.m5.xlarge. Elle entraîne le modèle en utilisant 3 Go de données d'entraînement dans Simple Storage Service (Amazon S3) et envoie 1 Go de données générées dans Simple Storage Service (Amazon S3). SageMaker crée des volumes SSD polyvalents (gp2) pour chaque instance d'entraînement. SageMaker crée également des volumes SSD polyvalents (gp2) pour chaque règle spécifiée. Dans cet exemple, un total de quatre volumes SSD polyvalents (gp2) seront créés. SageMaker Debugger émet 1 Go de données de débogage vers le compartiment Simple Storage Service (Amazon S3) du client.
-
Exemple de tarification 9 : MLflow
Vous disposez de deux équipes de scientifiques des données. Une équipe composée de 10 scientifiques des données et l’autre de 40 scientifiques des données. Pour répondre aux besoins de ces deux équipes, vous choisissez d’activer deux serveurs de suivi MLflow différents : l’un de petite taille et l’autre de taille moyenne. Chaque équipe mène des expériences de machine learning (ML) et doit enregistrer les métriques, les paramètres et les artefacts produits par ses tentatives de formation. Les équipes souhaitent utiliser les serveurs de suivi MLflow 160 heures par mois. Supposons que chaque équipe de science des données stocke 1 Go de métadonnées pour suivre les essais. La facture à fin du mois serait calculée comme suit :
Frais de calcul pour une petite instance : 160 * 0,60 USD = 96 USD
Frais de calcul pour une instance moyenne : 160 * 1,40 USD = 166,4 USD
Frais de stockage pour deux équipes : 2 * 1 * 0,10 = 0,20 USDTotal = 262,60 USD
-
Exemple de tarification 10 : inférence en temps réel
Le sous-total pour l'entraînement, l'hébergement et la surveillance s'élève à 305,827 USD. Le sous-total pour 3 100 Mo de données traitées entrantes et 310 Mo de données traitées sortantes pour l'hébergement par mois = 0,054 USD. Dans cet exemple, le coût total s'élèverait à 305,881 USD par mois.
Remarque : pour les règles intégrées à l'instance ml.m5.xlarge, vous obtenez chaque mois, gratuitement, jusqu'à 30 heures de surveillance regroupées sur tous les points de terminaison.
Données entrantes par mois – Hébergement Données sortantes par mois – Hébergement Prix par Go entrant ou sortant Total 100 Mo * 31 = 3 100 Mo 0,016 USD 0,0496 USD 10 Mo * 31 = 310 Mo 0,016 USD 0,00496 USD Heures par mois Instances d'hébergement Instances Model Monitor Prix par heure Total 24 * 31 * 2 = 1 488 ml.c5.xlarge 0,204 USD 303,522 USD 31 * 0,08 = 2,5 ml.m5.4xlarge 0,922 USD 2,305 USD Le modèle de l'exemple #5 est ensuite déployé en production vers deux (2) instances ml.c5.xlarge pour un hébergement Multi-AZ fiable. Amazon SageMaker Model Monitor est activé avec une (1) instance ml.m5.4xlarge et des tâches de surveillance sont programmées une fois par jour. Chaque tâche de surveillance nécessite cinq minutes pour être exécutée. Le modèle reçoit 100 Mo de données par jour, et les inférences représentent 1/10e de la taille des données d'entrée.
-
Exemple de tarification #11 : inférence asynchrone
Le sous-total de l'inférence asynchrone SageMaker s'obtient en faisant le calcul suivant : 15,81 USD + 0,56 USD + 2 * 0,0048 = 16,38 USD. Dans cet exemple, le coût total de l'inférence asynchrone s'élèverait à 16,38 USD par mois.
Données entrantes par mois Données sortantes par mois Prix par Go entrant ou sortant Total 10 Ko * 1 024 * 31 = 310 Mo 10 Ko * 1 024 * 31 = 310 Mo 0,02 USD 0,0048 10 Ko * 1 024 * 31 = 310 Mo 0,02 USD 0,0048 Stockage (Go) polyvalent (SSD) Coût par Go/mois Total 4 0,14 USD 0,56 USD Heures par mois Instances d'hébergement Prix par heure Total 2,5 x 31 x 1 = 77,5 ml.c5.xlarge 0,20 USD 15,81 USD L'inférence asynchrone Amazon SageMaker vous facture les instances utilisées par votre point de terminaison. Lorsque les instances ne traitent pas activement les requêtes, vous avez la possibilité de configurer la mise à l'échelle automatique pour réduire le nombre d'instances à zéro afin de réduire les coûts. Pour les charges utiles entrantes dans Simple Storage Service (Amazon S3), il n'y a pas de coût pour lire les données entrantes à partir de Simple Storage Service (Amazon S3) et écrire les données sortantes sur S3 dans la même région.
Le modèle de l'exemple n° 5 est utilisé pour exécuter un point de terminaison d'inférence asynchrone SageMaker. Le point de terminaison est configuré pour fonctionner sur une instance ml.c5.xlarge et réduire le nombre d'instances à zéro lorsqu'il ne traite pas activement des requêtes. L'instance ml.c5.xlarge du point de terminaison a un stockage polyvalent (SSD) de 4 Go qui lui est attaché. Dans cet exemple, le point de terminaison maintient un nombre d'instances de 1 pendant deux heures par jour et dispose d'un temps de stabilisation de 30 minutes, après quoi il réduit à zéro le nombre d'instances pour le reste de la journée. Par conséquent, vous êtes facturé pour 2,5 heures d'utilisation par jour.
Le point de terminaison traite 1 024 requêtes par jour. La taille de chaque corps de requête/réponse d'appel est de 10 Ko, et celle de chaque charge utile de requête d'inférence dans Simple Storage Service (Amazon S3) de 100 Mo. Les sorties d'inférence font 1/10e de la taille des données d'entrée qui sont stockées dans Simple Storage Service (Amazon S3) dans la même région. Dans cet exemple, les frais de traitement des données s'appliquent au corps de requête et de réponse, mais pas aux données transférées vers/depuis Simple Storage Service (Amazon S3).
-
Exemple de tarification #12 : Batch Transform
Dans cet exemple, le prix total pour l’inférence serait de 2,88 USD.
Heures Instances d'hébergement Prix par heure Total 3 x 0,25 x 4 = 3 heures ml.m4.4xlarge 0,96 USD 2,88 USD Le modèle de l'exemple #5 est utilisé pour exécuter SageMaker Batch Transform. La scientifique des données exécute quatre tâches SageMaker Batch Transform distinctes sur 3 ml.m4.4xlarge à raison de 15 minutes par tâche. Elle charge un jeu de données d'évaluation de 1 Go dans S3 pour chaque cycle, et les inférences représentent 1/10e de la taille des données d'entrée, lesquelles sont stockées dans S3.
-
Exemple de tarification #13 : inférence sans serveur à la demande
Frais de traitement de données mensuels
Traitement de données (Go) Prix par Go entrant ou sortant Frais de traitement de données mensuels 10 Go 0,016 USD 0,16 USD Le sous-total des frais de durée de l’inférence sans serveur SageMaker à la demande est de 40 USD. Le sous-total des frais de traitement de 10 Go de données est de 0,16 USD. Dans cet exemple, le prix total serait de 40,16 USD.
Frais de calcul mensuels
Nombre de requêtes Durée de chaque requête Durée d'inférence totale (s) Coût par seconde Frais de durée d'inférence mensuels 10 millions 100 ms 1 million 0,00004 USD 40 USD
Avec l'Inférence sans serveur à la demande, vous ne payez que la capacité de calcul utilisée pour traiter les demandes d'inférence, facturées à la milliseconde, et la quantité de données traitées. Les frais de calcul dépendent de la configuration de mémoire choisie.
Si vous allouez 2 Go de mémoire à votre point de terminaison, que vous l'exécutez 10 millions de fois en un mois pendant 100 minutes à chaque fois et que vous traitez 10 Go de données entrantes/sortantes au total, vos frais seront calculés comme suit :
-
Exemple de tarification #14 : simultanéité provisionnée sur l'inférence sans serveur
Supposons que vous gérez un service de chatbot pour une société de traitement des salaires. Vous vous attendez à une augmentation du nombre de demandes des clients à la fin du mois de mars, avant la date limite de déclaration fiscale. Toutefois, pour le reste du mois, le trafic devrait être faible. Vous déployez donc un point de terminaison sans serveur doté de 2 Go de mémoire et vous ajoutez une simultanéité provisionnée de 100 pendant les 5 derniers jours du mois, de 9 h à 17 h (8 h), pendant laquelle votre point de terminaison traite 10 millions de demandes et 10 Go d'entrées/sorties de données au total. Le reste du mois, le chatbot fonctionne sur l'inférence sans serveur à la demande et traite 3 millions de requêtes et 3 Go d'entrées/sorties de données. Supposons que la durée de chaque demande soit de 100 ms.
Frais pour la simultanéité allouée
Le prix du PC est de 0,000010 USD/sec
Durée d'utilisation du PC (secondes) = 5 jours* 100 PC* 8 heures* 3600 sec = 14 400 000 secondes
Frais d'utilisation du PC = 14 400 000 secs* 0,000010 USD/sec = 144 USD.Frais de durée d'inférence pour le trafic desservi par la simultanéité allouée
Le prix de la durée d'inférence est de 0,000023 USD/sec
Durée totale d'inférence pour PC (sec) = 10 M* (100 ms) /1 000 = 1 million de secondes.
Frais de durée d'inférence pour PC = 1 000 000 sec * 0,000023/sec = 23 USDFrais de durée d'inférence à la demande
Le prix de calcul mensuel est de 0,00004 USD par seconde et le niveau gratuit fournit 150 000 secondes.
Calcul total (secondes) = (3) M* (100 ms) /1 000 = 0,3 millions de secondes.
Taux de calcul total – Taux de calcul offert = Taux de calcul facturable par mois en secondes
0,3 millions de secondes — 150 000 secondes = 150 000 secondes
Frais de calcul mensuels = 150 000 *0,00004 USD = 6 USDTraitement de données
Coût/Go de données traitées à l'entrée/sortie = 0,016 USD
Nombre total de Go traités = 10+3 = 13
Coût total = 0,016 USD*13 = 0,208 USD
Total des frais pour mars
Frais totaux = Frais de concurrence provisionnés+ Durée d'inférence pour la concurrence provisionnée + Durée d'inférence pour le calcul à la demande + Frais de traitement des données
= 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD -
Exemple de tarification 15 : Jumpstart
Le client utilise JumpStart pour déployer un modèle BERT Base Uncased pré-entraîné afin de classer comme positif ou négatif le ressenti issu des commentaires des clients.
Le client déploie le modèle sur deux (2) instances ml.c5.xlarge pour un hébergement Multi-AZ fiable. Le modèle reçoit 100 Mo de données par jour, et les inférences représentent 1/10e de la taille des données entrantes.
Heures par mois Instances d'hébergement Prix par heure Total 24 * 31 * 2 = 1 488 ml.c5.xlarge 0,204 USD 303,55 USD Données entrantes par mois – Hébergement Données sortantes par mois – Hébergement Prix par Go entrant ou sortant
Total
100 Mo * 31 = 3 100 Mo 0,02 USD 0,06 USD 10 Mo * 31 = 310 Mo 0,02 USD 0,01 USD Le sous-total pour l'entraînement, l'hébergement et la surveillance s'élève à 305,827 USD. Le sous-total pour 3 100 Mo de données traitées entrantes et 310 Mo de données traitées sortantes pour l'hébergement par mois = 0,06 USD. Dans cet exemple, le coût total s'élèverait à 305,887 USD par mois.
-
Exemple de tarification 16 : cluster HyperPod
Supposons que vous souhaitiez provisionner un cluster de 4 ml.g5.24xlarge pendant 1 mois (30 jours) avec 100 Go de stockage supplémentaires par instance pour prendre en charge le développement de modèles. Dans cet exemple, le coût total du cluster et du stockage supplémentaire s’élève à 29 374,40 USD.Calcul
Instance Durée Instances Coût par heure Sous-total ml.g5.24xlarge 30 jours * 24 heures = 720 heures 4 10,18 USD 29 318,40 USD Stockage
Stockage à usage général (SSD) Durée Instances Coût par Go/mois Sous-total 100 Go 30 jours * 24 heures = 720 heures 4 0,14 USD 56,00 USD -
Exemple de tarification 17 : évaluations des modèles de fondation (évaluation automatique)
Les évaluations des modèles de fondation avec SageMaker Clarify ne vous facturent que les instances utilisées pendant l'exécution de vos tâches d'évaluation automatique. Lorsque vous sélectionnez une tâche d'évaluation automatique et un jeu de données, SageMaker charge le jeu de données rapide depuis Amazon S3 sur une instance d'évaluations SageMaker.
Dans l'exemple suivant, un ingénieur ML effectue une évaluation du modèle Llama2 7B dans les USA Est (Virginie du Nord) pour vérifier la précision des tâches de synthèse. Le type d'instance recommandé pour l'inférence pour Llama 2 7B est ml.g5.2xlarge. L'instance minimale recommandée pour une évaluation est ml.m5.2xlarge. Dans cet exemple, la tâche s'exécute pendant 45 minutes (en fonction de la taille du jeu de données). Dans cet exemple, le coût serait de 1,48 USD pour le travail d'évaluation et les résultats détaillés.Traitement des heures de travail (exemple)
Région
Type d’instance
Instance
Prix par heure
Coût
0,45
US-east-1
Hébergement LLM
ml.g5.2xlarge
1.52 USD
1,14 USD
0,45
US-east-1
évaluation
ml.m5.2xlarge
0,46 USD
0,35 USD
Total
1,48 USD
Dans l'exemple suivant, le même ingénieur en Virginie exécute une autre tâche d'évaluation pour la précision des tâches de synthèse, mais utilise une version personnalisée de Llama 2 7B qui est déployée sur son compte et est opérationnelle. Dans ce cas, étant donné que le modèle est déjà déployé sur leur compte, le seul coût supplémentaire serait lié à l'instance d'évaluation.
Traitement des heures de travail
Région
Type d’instance
Instance
Prix par heure
Coût
0,45
US-east-1
évaluation
ml.m5.2xlarge
0,46 USD
0,35 USD
Total
0,35 USD
-
Exemple de tarification n°18 : évaluations des modèles de fondation (évaluation fondée sur l’être humain)
Dans l'exemple suivant, un ingénieur en machine learning des USA Est (Virginie du Nord) effectue une évaluation humaine de Llama-2-7B en ce qui concerne la précision des tâches de synthèse et fait appel à sa propre main-d'œuvre privée pour l'évaluation. Le type d'instance recommandé pour Llama-2-7B est ml.g5.2xlarge. L'instance minimale recommandée pour une tâche de traitement d'évaluation fondée sur l'humain est ml.t3.medium. L'inférence sur Llama-2-7B s'exécute pendant 45 minutes (en fonction de la taille du jeu de données). Le jeu de données contient 50 prompts, et le développeur a besoin de 2 travailleurs pour évaluer chaque ensemble de réponses rapides (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par prompt »). Cette tâche d'évaluation comportera 100 tâches (1 tâche pour chaque paire de réponses rapides pour chaque travailleur : 2 travailleurs x 50 ensembles de réponses rapides = 100 tâches humaines). La main-d'œuvre humaine met une journée (24 heures) à effectuer les 100 tâches d'évaluation humaine du poste d'évaluation (cela dépend du nombre et du niveau de compétence des travailleurs, ainsi que de la longueur/de la complexité des prompts et des réponses d'inférence).
Heures de calcul
Tâches humaines
Région
Type d’instance
Instance
Prix par heure
Coût par tâche humaine
Coût total
0,45
USA Est (Virginie du Nord)
Hébergement LLM
ml.g5.2xlarge
1.52 USD
1,14 USD
24
USA Est (Virginie du Nord)
Tâche de traitement
ml.t3.medium
0,05 USD
1,20 USD
100
N'importe lequel
0,21 USD
21,00 USD
Total
23,34 USD
Dans l'exemple suivant, le même ingénieur des USA Est (Virginie du Nord) exécute la même tâche d'évaluation mais utilise Llama-2-7B déjà déployé sur son compte et opérationnel. Dans ce cas, le seul coût supplémentaire serait lié à la tâche de traitement de l'évaluation et aux tâches humaines.
Heures de calcul
Tâches humaines
Région
Type d’instance
Instance
Prix par heure
Coût par tâche humaine
Coût total
24
USA Est (Virginie du Nord)
Tâche de traitement
ml.t3.medium
0,05 USD
1,20 USD
100
N'importe lequel
0,21 USD
21,00 USD
Total
22,20 USD