Service de machine learning - Tarification Amazon SageMaker

Offre gratuite Amazon SageMaker

Vous pouvez essayer Amazon SageMaker gratuitement. Dans le cadre de l'offre gratuite d'AWS, vous pouvez commencer à utiliser Amazon SageMaker gratuitement. Votre offre gratuite commence à partir du premier mois où vous créez votre première ressource SageMaker. Les informations concernant l'offre gratuite d'Amazon SageMaker se trouvent dans le tableau ci-dessous.

Capacité d'Amazon SageMaker	Utilisation mensuelle de l'offre gratuite pendant les 2 premiers mois
Blocs-notes Studio et instances de blocs-notes	250 heures d'utilisation des instances ml.t3.medium sur des blocs-notes Studio OU 250 heures d'utilisations des instances ml.t2.medium ou ml.t3.medium sur des instances de blocs-notes
RStudio sur SageMaker	250 heures d'utilisation des instances ml.t3.medium sur l'application RSession ET des instances ml.t3.medium gratuites pour l'application RStudioServerPro
Data Wrangler	25 heures d'instance ml.m5.4xlarge
Magasin de fonctionnalités	10 millions d'unités d'écriture, 10 millions d'unités de lecture, 25 Go de stockage (magasin en ligne standard)
Formation	50 heures d'instances m4.xlarge ou m5.xlarge
Amazon SageMaker avec TensorBoard	300 heures d'instance ml.r5.large
Inférence en temps réel	125 heures d'instances m4.xlarge ou m5.xlarge
Inférence sans serveur	150 000 secondes de durée d'inférence à la demande
Canvas	160 heures par mois pour la durée de la session
HyperPod	50 heures d’utilisation de l’instance m5.xlarge

Calculateur de tarification AWS

Calculez le coût de votre Amazon SageMaker et de votre architecture en une seule estimation.

Créer votre estimation personnalisée maintenant »

Tarification à la demande

Studio classique
Amazon SageMaker Studio Classic
Studio Classic propose des blocs-notes Jupyter en une étape dans le cadre de notre expérience IDE traditionnelle. Les ressources informatiques sous-jacentes sont totalement élastiques et les blocs-notes peuvent être facilement partagés avec d'autres, ce qui permet une collaboration transparente. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.
JupyterLab
Amazon SageMaker JupyterLab
Lancez un JupyterLab entièrement géré en quelques secondes. Utilisez l'environnement de développement interactif basé sur le Web le plus récent pour les blocs-notes, le code et les données. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.
Éditeur de code
Éditeur de code Amazon SageMaker
L'éditeur de code, basé sur Code-OSS (Visual Studio Code — Open Source), vous permet d'écrire, de tester, de déboguer et d'exécuter vos analyses et votre code ML. Il est entièrement intégré à SageMaker Studio et prend en charge les extensions IDE disponibles dans le registre d'extensions Open VSX.
RStudio
RStudio
RStudio offre des ressources de calcul dans le cloud à la demande afin d'accélérer le développement de modèles et d'améliorer la productivité. Vous êtes facturé pour les types d'instance que vous choisissez d'exécuter sur l'application RStudio Session et l'application RStudio Server Pro.

RStudioServerPro App
Instances de bloc-notes
Instances de bloc-notes
Les instances de bloc-notes sont des instances de calcul qui exécutent l'application bloc-notes Jupyter. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.
Traitement
Amazon SageMaker Processing
Amazon SageMaker Processing permet d'exécuter simplement les charges de travail de prétraitement, de post-traitement et d'évaluation du modèle sur une infrastructure entièrement gérée. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.
TensorBoard
Amazon SageMaker avec TensorBoard
Amazon SageMaker avec TensorBoard fournit une expérience TensorBoard hébergée qui permet de visualiser et de résoudre les problèmes de convergence des modèles pour les tâches de formation Amazon SageMaker.
Data Wrangler
Amazon SageMaker Data Wrangler

Amazon SageMaker Data Wrangler réduit, de plusieurs semaines à quelques minutes, le temps nécessaire à l'agrégation et à la préparation des données pour le machine learning. Vous payez pour le temps utilisé pour nettoyer, explorer et visualiser les données. Les clients qui utilisent des instances de SageMaker Data Wrangler sont soumis aux tarifs ci-dessous.* Les clients qui utilisent des instances d'espace de travail SageMaker Data Wrangler sur des instances d'espace de travail SageMaker Canvas sont soumis aux tarifs de SageMaker Canvas. Consultez la page de tarification de SageMaker Canvas pour plus de détails.

Tâches Amazon SageMaker Data Wrangler

Une tâche de Amazon SageMaker Data Wrangler est créée lorsqu'un flux de données est exporté depuis SageMaker Data Wrangler. Avec les tâches SageMaker Data Wrangler, vous pouvez automatiser vos flux de préparation de données. Les tâches SageMaker Data Wrangler vous aident à appliquer de nouveau vos flux de préparation de données sur de nouveaux jeux de données, afin de vous faire gagner du temps. Elles sont facturées à la seconde.
Feature Store
Amazon SageMaker Feature Store
Amazon SageMaker Feature Store est un référentiel central permettant d’ingérer, de stocker et de proposer des fonctionnalités de machine learning. Les écritures, les lectures de groupes de fonctionnalités, ainsi que le stockage de données dans SageMaker Feature Store vous sont facturés, avec des tarifs différents pour la boutique en ligne standard et pour le magasin en ligne en mémoire.

Pour le magasin en ligne standard, le stockage de données est facturé par Go et par mois. Pour le débit, vous pouvez choisir entre le mode de capacité à la demande ou le mode de capacité allouée. Pour le mode de capacité à la demande, les écritures sont facturées en unités de demande d’écriture par Ko et les lectures sont facturées en unités de demande de lecture par 4 Ko. Pour e mode de capacité allouée, vous spécifiez la capacité de lecture et d’écriture que votre application doit exiger. Sagemaker Feature Store facture une unité de capacité de lecture (WCU) pour chaque écriture par seconde (jusqu’à 1 Ko) et une RCU pour chaque lecture par seconde (jusqu’à 4 Ko). Vous serez facturé pour la capacité de débit (lectures et écritures) que vous allouez pour votre groupe de fonctionnalités, même si vous n’utilisez pas entièrement la capacité allouée.

Pour le magasin en ligne en mémoire, les écritures sont facturées en unités de demande d’écriture par Ko avec un minimum d’une unité par écriture, les lectures sont facturées en unités de demande de lecture par Ko avec un minimum d’une unité par lecture, et le stockage de données est facturé par Go et par heure. Les frais de stockage de données minimaux sont de 5 Go (5,37 Go) par heure pour la boutique en ligne en mémoire.
Formation
Amazon SageMaker Training
Amazon SageMaker facilite la formation des modèles de machine learning (ML) en fournissant tout ce dont vous avez besoin pour former, ajuster et déboguer les modèles. La facturation est établie en fonction de l'utilisation du type d'instance que vous choisissez. Lorsque vous utilisez Amazon SageMaker Debugger pour déboguer des problèmes et surveiller les ressources pendant la formation, vous pouvez utiliser les règles intégrées pour déboguer vos travaux de formation ou rédiger vos propres règles personnalisées. L'utilisation des règles intégrées pour déboguer vos offres de formation est gratuite. Concernant les règles personnalisées, vous êtes facturé au type d'instance que vous choisissez et en fonction de la durée d'utilisation.
MLflow
Amazon SageMaker avec MLflow
Amazon SageMaker avec MLflow permet aux clients de payer uniquement ce qu’ils utilisent. Les clients paient les serveurs de suivi MLflow en fonction des coûts de calcul et de stockage.

Les clients paieront le calcul en fonction de la taille du serveur de suivi et du nombre d’heures pendant lesquelles il a fonctionné. En outre, les clients paieront toutes les métadonnées stockées sur le serveur de suivi MLflow.
Inférence en temps réel
Hébergement Amazon SageMaker : inférence en temps réel
Amazon SageMaker fournit une inférence en temps réel pour vos cas d'utilisation nécessitant des prédictions en temps réel. La facturation est établie en fonction de l'utilisation du type d'instance que vous choisissez. Lorsque vous utilisez Amazon SageMaker Model Monitor pour conserver des modèles très précis fournissant une inférence en temps réel, vous pouvez utiliser des règles intégrées pour surveiller vos modèles ou rédiger vos propres règles personnalisées. Quant aux règles intégrées, vous bénéficiez de 30 heures de surveillance gratuite. Les frais supplémentaires seront fixés en fonction de la durée d'utilisation. Vous êtes facturé séparément lorsque vous utilisez vos propres règles personnalisées.
Inférence asynchrone
Inférence asynchrone Amazon SageMaker :
L'inférence asynchrone Amazon SageMaker est une option d'inférence en temps quasi réel qui met les requêtes entrantes en file d'attente, puis les traite de manière asynchrone. Utilisez cette option lorsque vous devez traiter des charges utiles importantes au fur et à mesure de l'arrivée des données ou exécuter des modèles dont les temps de traitement d'inférence sont longs et qui n'ont pas d'exigences de latence inférieure à la seconde. Vous êtes facturé pour le type d'instance que vous choisissez.
Batch Transform
Amazon SageMaker Batch Transform
Avec Amazon SageMaker Batch Transform, il n'est pas nécessaire de décomposer l'ensemble de données ni de gérer les points de terminaison en temps réel. SageMaker Batch Transform vous permet d'exécuter des prédictions sur des ensembles de données de grande ou petite capacité. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.
Inférence sans serveur
Amazon SageMaker Serverless Inference
L'Inférence sans serveur Amazon SageMaker vous permet de déployer des modèles de machine learning pour l'inférence, sans avoir à configurer ou à gérer une quelconque infrastructure sous-jacente. Vous pouvez utiliser l’Inférence sans serveur à la demande ou ajouter une simultanéité provisionnée à votre point de terminaison pour des performances prévisibles.

Avec l’Inférence sans serveur à la demande, vous ne payez que la capacité de calcul utilisée pour traiter les demandes d'inférence, facturées à la milliseconde, et la quantité de données traitées. Les frais de calcul dépendent de la configuration de mémoire choisie.

Simultanéité allouée

Éventuellement, vous pouvez aussi activer la simultanéité provisionnée pour vos points de terminaison sans serveur. La simultanéité provisionnée vous permet de déployer des modèles sur des points de terminaison sans serveur avec des performances prévisibles et une capacité de mise à l'échelle élevée en maintenant vos points de terminaison au chaud pour un nombre spécifié de demandes simultanées et pour des périodes précises. Comme pour l’inférence sans serveur à la demande, lorsque la simultanéité provisionnée est activée, vous payez en fonction de la capacité de calcul utilisée pour traiter les demandes d'inférence, facturée à la milliseconde, et de la quantité de données traitées. Vous payez également pour l'utilisation de la simultanéité provisionnée, en fonction de la mémoire configurée, de la durée accordée et de la quantité de simultanéité activée.
JumpStart
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart vous aide à démarrer rapidement et facilement avec le machine learning grâce à un accès en un clic aux ensembles de modèles courants (également appelés « Model Zoos »). JumpStart offre également des solutions de bout en bout, permettant de résoudre les cas d'utilisation ML courants, qui peuvent être personnalisés en fonction de vos besoins. L'utilisation de modèles ou des solutions JumpStart n'entraîne aucuns frais supplémentaires. Vous êtes facturé pour les heures d'instances d'entraînement et d'inférence sous-jacentes utilisées, et ce de la même manière que si vous les aviez créées manuellement.
Profileur
Le profileur Amazon SageMaker collecte des données au niveau du système pour la visualisation de tracés haute résolution du processeur et du processeur graphique. Cet outil est conçu pour aider les spécialistes de données et les ingénieurs à identifier les problèmes de performance liés au matériel dans leurs modèles de deep learning, réduisant ainsi le temps et les coûts de formation de bout en bout. Actuellement, le profileur SageMaker prend uniquement en charge le profilage des tâches de formation en utilisant les types d'instances de calcul d'entraînement ml.g4dn.12xlarge, ml.p3dn.24xlarge et ml.p4d.24xlarge.

Régions : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon), Europe (Francfort), Europe (Irlande) et Israël (Tel Aviv).

Le profileur Amazon SageMaker est actuellement en version préliminaire et est disponible gratuitement pour les clients des régions prises en charge.
HyperPod
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod est spécialement conçu pour accélérer le développement du modèle de fondation (FM). Pour rendre l'entraînement FM plus résilient, il surveille en permanence l'état du cluster, répare et remplace les nœuds défectueux à la volée, et enregistre les points de contrôle fréquents pour reprendre automatiquement l'entraînement sans perdre de progression. SageMaker HyperPod est préconfiguré avec les bibliothèques d’entraînement distribué SageMaker qui vous permettent d’améliorer les performances d’entraînement FM tout en utilisant pleinement l’infrastructure informatique et réseau du cluster

Remarque : la tarification de SageMaker HyperPod ne couvre pas les frais liés aux services connectés aux clusters HyperPod, tels qu’Amazon EKS, Amazon FSx pour Lustre et Amazon Simple Storage Service (Amazon S3).
Optimisation d’inférence
La boîte à outils d’optimisation d’inférence vous permet de mettre en œuvre facilement les dernières techniques d’optimisation d’inférence afin d’atteindre des performances de pointe en matière de coûts (SOTA) sur Amazon SageMaker, tout en faisant gagner des mois de travail aux développeurs. Vous pouvez choisir parmi un menu de techniques d’optimisation courantes proposées par SageMaker et exécuter des tâches d’optimisation à l’avance, tester les mesures de performances et de précision du modèle, puis déployer le modèle optimisé sur un point de terminaison SageMaker à des fins d’inférence.

Détails de l’instance

Détails du produit de l'instance Amazon SageMaker P5

Taille d'instance	vCPU	Mémoire d'instance (TiB)	Modèle GPU	GPU	Mémoire GPU totale (Go)	Mémoire par GPU (Go)	Bande passante du réseau (Gbit/s)	GPUDirect RDMA	Pair à pair GPU	Storage d'instance (To)	Bande passante EBS (Gbit/s)
ml.p5.48xlarge	192	2	NVIDIA H100	8	640 HM3	80	3200 EFAv2	Oui	NVSwitch 900 Go/s	8x3.84 NVMe SSD	80

Détails de l’instance P4d Amazon Sagemaker

Taille d'instance	vCPU	Mémoire d'instance (Gio)	Modèle GPU	GPU	Mémoire GPU totale (Go)	Mémoire par GPU (Go)	Bande passante du réseau (Gbit/s)	GPUDirect RDMA	Pair à pair GPU	Stockage d'instance (Go)	Bande passante EBS (Go/s)
ml.p4d.24xlarge	96	1 152	NVIDIA A100	8	320 HBM 2	40	ENA et EFA 400	Oui	NVSwitch 600 Go/s	8 SSD NVMe de 1000	19
ml.p4de.24xlarge	96	1 152	NVIDIA A100	8	640 HNM2e	80	400 ENA et EFA	Oui	NVSwitch 600 Go/s	8 SSD NVMe de 1000	19

Détail du produit de l’instance P3 Amazon Sagemaker

Taille d'instance	vCPU	Mémoire d'instance (Gio)	Modèle GPU	GPU	Mémoire GPU totale (Go)	Mémoire par GPU (Go)	Bande passante du réseau (Gbit/s)	Pair à pair GPU	Stockage d'instance (Go)	Bande passante EBS (Gbit/s)
ml.p3.2xlarge	8	61	NVIDIA V100	1	16	16	Jusqu'à 10	N/A	EBS uniquement	1,5
ml.p3.8xlarge	32	244	NVIDIA V100	4	64	16	10	NVLink	EBS uniquement	7
ml.p3.16xlarge	64	488	NVIDIA V100	8	128	16	25	NVLink	EBS uniquement	14
ml.p3dn.24xlarge	96	768	NVIDIA V100	8	256	32	100	NVLink	2 disques SSD NVMe de 900	19

Détails du produit de l'instance Amazon SageMaker P2

Taille d'instance	vCPU	Mémoire d'instance (Gio)	Modèle GPU	GPU	Mémoire GPU totale (Go)	Mémoire par GPU (Go)	Bande passante du réseau (Gbit/s)	Bande passante EBS (Gbit/s)
ml.p2.xlarge	4	61	NVIDIA K80	1	12	12	Jusqu'à 10	Élevées
ml.p2.8xlarge	32	488	NVIDIA K80	8	96	12	10	10
ml.p2.16xlarge	64	732	NVIDIA K80	16	192	12	25	20

Détail du produit de l’instance G4 Amazon SageMaker

Taille d'instance	vCPU	Mémoire d'instance (Gio)	Modèle GPU	GPU	Mémoire GPU totale (Go)	Mémoire par GPU (Go)	Bande passante du réseau (Gbit/s)	Stockage d'instance (Go)	Bande passante EBS (Go/s)
ml.g4dn.xlarge	4	16	NVIDIA T4	1	16	16	Jusqu'à 25	1 disque SSD NVMe de 125	Jusqu'à 3,5
ml.g4dn.2xlarge	8	32	NVIDIA T4	1	16	16	Jusqu'à 25	1 disque SSD NVMe de 125	Jusqu'à 3,5
ml.g4dn.4xlarge	16	64	NVIDIA T4	1	16	16	Jusqu'à 25	1 disque SSD NVMe de 125	4,75
ml.g4dn.8xlarge	32	128	NVIDIA T4	1	16	16	50	1 disque SSD NVMe de 900	9,5
ml.g4dn.16xlarge	64	256	NVIDIA T4	1	16	16	50	1 disque SSD NVMe de 900	9,5
ml.g4dn.12xlarge	48	192	NVIDIA T4	4	64	16	50	1 disque SSD NVMe de 900	9,5

Détail du produit de l’instance G5 Amazon SageMaker

Taille d'instance	vCPU	Mémoire d'instance (Gio)	Modèle GPU	GPU	Mémoire GPU totale (Go)	Mémoire par GPU (Go)	Bande passante du réseau (Gbit/s)	Bande passante EBS (Go/s)	Stockage d'instance (Go)
ml.g5n.xlarge	4	16	NVIDIA A10G	1	24	24	Jusqu'à 10	Jusqu'à 3,5	1 x 250
ml.g5.2xlarge	8	32	NVIDIA A10G	1	24	24	Jusqu'à 10	Jusqu'à 3,5	1 x 450
ml.g5.4xlarge	16	64	NVIDIA A10G	1	24	24	Jusqu'à 25	8	1 x 600
ml.g5.8xlarge	32	128	NVIDIA A10G	1	24	24	25	16	1x900
ml.g5.16xlarge	64	256	NVIDIA A10G	1	24	24	25	16	1x1900
ml.g5.12xlarge	48	192	NVIDIA A10G	4	96	24	40	16	1x3800
ml.g5.24xlarge	96	384	NVIDIA A10G	4	96	24	50	19	1x3800
ml.g5.48xlarge	192	768	NVIDIA A10G	8	192	24	100	19	2 x 3 800

Détails du produit de l'instance Amazon SageMaker Trn1

Taille d'instance	vCPU	Mémoire (Gio)	Accélérateurs Trainium	Mémoire totale de l'accélérateur (Go)	Mémoire par accélérateur (Go)	Stockage d'instance (Go)	Bande passante réseau (Gbit/s)	Bande passante EBS (Gbit/s)
ml.trn 1,2 x large	8	32	1	32	32	1 disque SSD NVMe de 500	Jusqu'à 12,5	Jusqu'à 20
ml.trn1.32xlarge	128	512	16	512	32	4 disques SSD NVMe de 2000	800	80

Détails du produit de l'instance Amazon SageMaker Inf1

Taille d'instance	vCPU	Mémoire (Gio)	Accélérateurs Inferentia	Mémoire totale de l'accélérateur (Go)	Mémoire par accélérateur (Go)	Accélérateurs d'inférence	Interconnexion inter-accélérateur	Bande passante du réseau (Gbit/s)	Bande passante EBS (Gbit/s)
ml.inf1.xlarge	4	8	1	8	8	EBS uniquement	S/O	Jusqu'à 25	Jusqu'à 4,75
ml.inf1.2xlarge	8	16	1	8	8	EBS uniquement	S/O	Jusqu'à 25	Jusqu'à 4,75
ml.inf1.6xlarge	24	48	4	32	8	EBS uniquement	Oui	25	4,75
ml.inf1.24xlarge	96	192	16	128	8	EBS uniquement	oui	100	19

Détails du produit de l'instance Amazon SageMaker Inf.2

Taille d'instance	vCPU	Mémoire (Gio)	Accélérateurs Inferentia	Mémoire totale de l'accélérateur (Go)	Mémoire par accélérateur (Go)	Accélérateurs d'inférence	Interconnexion inter-accélérateur	Bande passante du réseau (Gbit/s)	Bande passante EBS (Gbit/s)
ml.inf2.x large	4	16	1	32	32	EBS uniquement	S/O	Jusqu'à 25	Jusqu'à 10
ml.inf2.8 x large	32	128	1	32	32	EBS uniquement	S/O	Jusqu'à 25	10
ml.inf 2,24 x large	96	384	6	196	32	EBS uniquement	Oui	50	30
ml.inf 2,48 x large	192	768	12	384	32	EBS uniquement	Oui	100	60

Amazon SageMaker Studio

Amazon SageMaker Studio est une interface Web unique pour le développement complet de machine learning, offrant un choix d'environnements de développement intégrés (IDE) entièrement gérés et d'outils spécifiques. Vous pouvez accéder à SageMaker Studio gratuitement. Vous êtes uniquement facturé pour le calcul et le stockage sous-jacents que vous utilisez pour différents IDE et outils de machine learning au sein de SageMaker Studio.

Vous pouvez utiliser de nombreux services de SageMaker Studio, AWS SDK pour Python (Boto3) ou de l’interface de la ligne de commande AWS (AWS CLI), notamment les suivants :

Des IDE sur SageMaker Studio pour réaliser un développement ML complet avec un large éventail d’IDE entièrement gérés, notamment JupyterLab, un éditeur de code basé sur Code-OSS (Visual Studio Code – Open Source) et RStudio
SageMaker Pipelines pour l’automatisation et la gestion des flux ML
SageMaker Autopilot pour créer automatiquement des modèles de ML avec une visibilité totale
SageMaker Experiments pour organiser et suivre vos offres et versions de la formation
SageMaker Debugger pour déboguer les anomalies en cours d'entraînement
SageMaker Model Monitor pour maintenir des modèles de qualité supérieure
SageMaker Clarify pour mieux expliquer vos modèles ML et détecter les biais
SageMaker JumpStart pour déployer facilement des solutions ML pour de nombreux cas d'utilisation. Des frais peuvent vous être facturés à partir des autres services AWS utilisés dans la solution pour les appels d'API sous-jacents effectués par Amazon SageMaker en votre nom.
SageMaker Inference Recommender pour obtenir des recommandations sur la configuration idéale du point de terminaison

Vous ne payez que les ressources de calcul et de stockage sous-jacentes dans SageMaker ou d’autres services AWS, en fonction de votre utilisation.

Pour utiliser Amazon Q Developer Free Tier sur Jupyter Lab et Code Editor, suivez les instructions ici. Pour utiliser Amazon Q Developer Pro sur Jupyter Lab, vous devez vous abonner à Amazon Q Developer. La tarification Amazon Q Developer est disponible ici.

Évaluations du modèle de base

SageMaker Clarify prend en charge les évaluations des modèles de fondation à l'aide de méthodes d'évaluation automatiques et fondées sur l'être humain. Chacun d'entre eux a une tarification différente. Si vous évaluez un modèle de fondation d'Amazon SageMaker JumpStart qui n'est pas encore déployé sur votre compte, SageMaker déploiera temporairement le modèle JumpStart sur une instance de SageMaker pendant la durée de l'inférence. L'instance spécifique sera conforme à la recommandation d'instance fournie par JumpStart pour ce modèle.

Évaluation automatique :
Les évaluations des modèles de fondation s'exécutent en tant que tâche de traitement SageMaker. La tâche d'évaluation fera appel à SageMaker Inference. Les clients sont facturés pour l'inférence et pour le travail d'évaluation. Les clients ne sont facturés que pour la durée du travail d'évaluation. Le coût de la tâche d'évaluation serait la somme du coût par heure de l'instance d'évaluation et de la somme du coût par heure de l'instance d'hébergement.

Évaluations fondées sur l'être humain :
Lorsque vous utilisez la fonction d'évaluation fondée sur l'être humain qui vous permet d'amener votre propre personnel, trois éléments vous sont facturés : 1) l'instance SageMaker utilisée pour l'inférence, 2) l'instance utilisée pour exécuter la tâche de traitement SageMaker qui héberge l'évaluation fondée sur l’être humain, et 3) des frais de 0,21 USD par tâche d'évaluation humaine terminée. Une tâche humaine est définie comme l'occurrence par laquelle un travailleur humain soumet une évaluation d'un seul prompt et de ses réponses d'inférence associées dans l'interface utilisateur d'évaluation humaine. Le prix est le même, que vous ayez 1 ou 2 modèles dans votre travail d'évaluation ou que vous apportiez votre propre inférence, et quel que soit le nombre de dimensions d'évaluation et de méthodes de notation que vous incluez. Le prix de 0,21 USD par tâche est le même pour toutes les régions AWS. Il n'y a pas de frais distincts pour la main-d'œuvre, car la main-d'œuvre est fournie par vous.

Évaluation gérée par AWS :
Pour une évaluation par un expert gérée par AWS, la tarification est personnalisée en fonction de vos besoins d'évaluation dans le cadre d'un engagement privé en collaboration avec l'équipe d'évaluation d'AWS.

Amazon SageMaker Studio Lab

Vous pouvez créer et entraîner gratuitement des modèles de ML à l'aide d'Amazon SageMaker Studio Lab. SageMaker Studio Lab met gratuitement à la disposition des développeurs, des universitaires et des scientifiques des données, un environnement de développement sans configuration pour apprendre et expérimenter le ML.

Amazon SageMaker Canvas

Amazon SageMaker Canvas étend l'accès ML en offrant aux analystes métier la possibilité de faire des prédictions ML précises à l'aide d'une interface visuelle par pointer-cliquer, sans exiger la moindre expérience en ML ou en codage.

Amazon SageMaker Data Labeling

Amazon SageMaker Data Labeling propose deux offres en matière d'étiquetage des données : Amazon SageMaker Ground Truth Plus et Amazon SageMaker Ground Truth. En savoir plus sur Amazon SageMaker Data Labeling, un service d'étiquetage des données entièrement géré qui facilite la création de jeux de données d'entraînement hautement précis pour le ML.

Shadow testing d'Amazon SageMaker

SageMaker vous aide à exécuter des shadow tests pour évaluer un nouveau modèle ML avant la mise en production en testant ses performances par rapport au modèle actuellement déployé. Il n'y a pas de frais supplémentaires pour les tests de SageMaker shadow, à l'exception des frais d'utilisation des instances ML et du stockage ML provisionnés pour héberger le modèle shadow. La tarification des instances ML et des dimensions de stockage ML est la même que celle de l'option d'inférence en temps réel spécifiée dans le tableau de tarification précédent. Il n'y a pas de frais supplémentaires pour les données traitées dans et hors des déploiements shadow.

Amazon SageMaker Edge

En savoir plus sur la tarification d'Amazon SageMaker Edge pour optimiser, exécuter et surveiller les modèles ML sur des flottes d'appareils périphériques.

Savings Plans Amazon SageMaker

Amazon SageMaker Savings Plans vous offre jusqu'à 64 % de réduction sur les coûts. Les plans s'appliquent automatiquement à l'utilisation des instances ML SageMaker éligibles, y compris les blocs-notes SageMaker Studio, les instances de blocs-notes SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference et SageMaker Batch Transform, indépendamment de la famille, de la taille ou de la région de l'instance. Par exemple, vous pouvez à tout moment passer d'une instance de processeur ml.c5.xlarge s'exécutant dans la région USA Est (Ohio) à une instance ml.Inf1 s'exécutant dans la région USA Ouest (Oregon) pour des charges de travail d'inférence, et toujours bénéficier automatiquement de la tarification Savings Plans.

Coût total de possession (TCO) avec Amazon SageMaker

Par rapport à d'autres solutions autogérées basées sur le cloud, Amazon SageMaker permet de réduire d'au moins 54 % le coût total de possession (TCO) sur trois ans. En savoir plus sur l'analyse complète du TCO sur Amazon SageMaker.

Exemples de tarification

Exemple de tarification #1 : JupyterLab

En tant que spécialiste des données, vous passez 20 jours à utiliser JupyterLab pour expérimenter rapidement sur des blocs-notes, du code et des données pendant 6 heures par jour sur une instance ml.g4dn.xlarge. Vous créez puis exécutez un espace JupyterLab pour accéder à l'IDE JupyterLab. Le calcul n’est facturé que pour l’instance utilisée lorsque l’espace JupyterLab est en cours d’exécution. Les frais de stockage d’un espace JupyterLab s’accumulent jusqu’à sa suppression.

Calcul

Instance	Durée	Jours	Durée totale	Prix par heure	Total
ml.g4dn.xlarge	6 heures	20	6 * 20 = 120 heures	0,7364 USD	88,368 USD

Stockage

Vous utiliserez un stockage SSD à usage général pendant 480 heures (24 heures * 20 jours). Dans une région qui facture 0,1125 USD par Go/mois :
0,112 USD par Go/mois x 5 Go x 480 (24 heures/jour x mois de 30 jours) = 0,373 USD

Exemple de tarification #2 : Éditeur de code

En tant qu'ingénieur ML, vous passez 20 jours à utiliser Code Editor pour l'édition, l'exécution et le débogage du code de production ML pendant 6 heures par jour sur une instance ml.g4dn.xlarge. Vous créez puis exécutez un espace d'éditeur de code pour accéder à l'IDE de l'éditeur de code. Le calcul n’est facturé que pour l’instance utilisée lorsque l’espace de l’éditeur de code est en cours d’exécution. Les frais de stockage pour un espace d’éditeur de code s’accumulent jusqu’à sa suppression.

Calcul

Instance	Durée	Jours	Durée totale	Prix par heure	Total
ml.g4dn.xlarge	6 heures	20	6 * 20 = 120 heures	0,7364 USD	88,368 USD

Stockage

Exemple de tarification #3 : Studio Classic

Un spécialiste des données suit la séquence d'actions suivante lorsqu'il utilise des blocs-notes dans Amazon SageMaker Studio Classic.

Ouvre le bloc-notes 1 dans un noyau TensorFlow sur une instance ml.c5.xlarge et travaille ensuite sur ce bloc-notes pendant 1 heure.
Ouvre le bloc-notes 2 sur une instance ml.c5.xlarge. Il s'ouvrira automatiquement dans la même instance ml.c5.xlarge que celle qui exécute le bloc-notes 1.
Il travaille simultanément sur le bloc-notes 1 et le bloc-notes 2 pendant 1 heure.
Le spécialiste des données sera facturé pour un total de deux (2) heures d'utilisation de ml.c5.xlarge. Pour l'heure de chevauchement où elle a travaillé simultanément sur le bloc-notes 1 et le bloc-notes 2, chaque application de noyau sera mesurée pendant 0,5 heure et elle sera facturée pour 1 heure.

Application de noyau	Instance de bloc-notes	Heures	Prix par heure	Total
TensorFlow	ml.c5.xlarge	1	0,204 USD	0,204 USD
TensorFlow	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
Science des données	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
				0,408 USD

Exemple de tarification #4 : RStudio

Un spécialiste des données passe par la séquence d'actions suivante lorsqu'il utilise RStudio :

Lance RSession 1 sur une instance ml.c5.xlarge, puis travaille sur ce bloc-notes pendant 1 heure.
Lance RSession 2 sur une instance ml.c5.xlarge. Il s'ouvrira automatiquement dans la même instance ml.c5.xlarge que celle qui exécute RSession 1.
Travaille sur la RSesssion 1 et la RSession 2 simultanément pendant 1 heure.
Le scientifique des données sera facturé pour un total de deux (2) heures d'utilisation de ml.c5.xlarge. Pour l'heure de chevauchement où elle a travaillé simultanément sur RSession 1 et RSession 2, chaque application RSession sera mesurée pendant 0,5 heure et elle sera facturée pour 1 heure.

Pendant ce temps, le RServer fonctionne 24 heures sur 24 et 7 jours sur 7, qu'il y ait des RSessions en cours ou non. Si l'administrateur choisit « Small » (ml.t3.medium), alors il est gratuit. En revanche, s'il choisit « Medium » (ml.c5.4xlarge) ou « Large » (ml.c5.9xlarge), il est facturé à l'heure dans la mesure où RStudio est activé pour le domaine SageMaker.

Application RSession	Instance RSession	Heures	Prix par heure	Total
Base R	ml.c5.xlarge	1	0,204 USD	0,204 USD
Base R	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
Base R	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
				0,408 USD

Exemple de tarification 5 : traitement

Amazon SageMaker Processing ne facture que les instances utilisées pendant l'exécution de vos tâches. Lorsque vous fournissez les données d'entrées à traiter dans Simple Storage Service (Amazon S3), Amazon SageMaker télécharge les données à partir de Simple Storage Service (Amazon S3) sur un stockage de fichiers local au démarrage d'une tâche de traitement.

L'analyste de données exécute une tâche de traitement pour prétraiter et valider les données sur deux instances ml.m5.4xlarge pour une durée de 10 minutes. Elle charge un ensemble de données de 100 Go dans S3 comme entrée pour la tâche de traitement, et les données générées (avec à peu près la même taille) sont à nouveau stockées dans S3.

Heures	Instances de traitement	Prix par heure	Total
1 * 2 * 0,167 = 0,334	ml.m5.4xlarge	0,922 USD	0,308 USD

Stockage (Go) polyvalent (SSD)	Prix par heure	Total
100 Go * 2 = 200	0,14 USD	0,0032 USD

Le sous-total de la tâche de traitement Amazon SageMaker = 0,308 USD.
Le sous-total du stockage SSD polyvalent de 200 Go = 0,0032 USD.
Dans cet exemple, le prix total serait de 0,3112 USD.

Exemple de tarification #6 : Data Wrangler

D'après le tableau, vous utilisez Amazon SageMaker Data Wrangler pendant un total de 18 heures sur 3 jours pour préparer vos données. De plus, vous créez une tâche SageMaker Data Wrangler pour préparer des données mises à jour chaque semaine. Chaque tâche dure 40 minutes et s'exécute chaque semaine pendant un mois.

Total des frais mensuels d'utilisation de Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD

Application	Instance SageMaker Studio	Jours	Durée	Durée totale	Prix par heure	Sous-total du prix
SageMaker Data Wrangler	ml.m5.4xlarge	3	6 heures	18 heures	0,922 USD	16,596 USD
Tâche SageMaker Data Wrangler	ml.m5.4xlarge	-	40 minutes	2,67 heures	0,922 USD	2,461 USD

En tant que spécialiste des données, vous utilisez Amazon SageMaker Data Wrangler pendant trois jours pour nettoyer, explorer et visualiser vos données pendant 6 heures par jour. Pour exécuter votre pipeline de préparation des données, vous lancez ensuite une tâche SageMaker Data Wrangler programmée pour s'exécuter chaque semaine.

Le tableau ci-dessous résume votre utilisation totale pour le mois et les frais associés à l'utilisation d'Amazon SageMaker Data Wrangler.

Exemple de tarification #7 : magasin des fonctionnalités

++ Toutes les unités de lecture fractionnaires sont arrondies au nombre entier suivant

Stockage de données
Total de données stockées = 31,5 Go
Frais mensuels pour le stockage des données = 31,5 Go x 0,45 USD = 14,175 USD

Total des frais mensuels Amazon SageMaker Feature Store = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD

Jour du mois	Écritures totales	Unités d'écriture totales	Lectures totales	Unités de lecture totales
Jours 1 à 10	100.000 écritures (10.000 écritures x 10 jours)	2.500.000 (100,000 x 25 Ko)	100.000 (10.000 x 10 jours)	700.000++ (100 000 x 25/4 Ko )

Jour 11	200 000 écritures	5.000.000 (200.000 x 25 Ko)	200.000 lectures	1.400.000++ (200.000 x 25/4Ko)

Jours 12 à 30	1 520 000 écritures (80.000 x 19 jours)	38.000.000 (1 520 000 x 25 Ko)	1 520 000 écritures (80 000 x 19 jours)	10 640 000++ (1 520 000 x 25/4 Ko)

Unités chargeables totales		45.500.000 unités d’écriture		12.740.000 unités de lecture
Frais mensuels des écritures et lectures		56,875 USD (45,5 millions unités d’écriture x 1,25 USD par million d’écriture)		3,185 USD (12,74 millions d'unités de lecture x 0,25 USD par million de lecture)

Vous disposez d'une application web qui émet des lectures et des écritures de 25 Ko chacune dans Amazon SageMaker Feature Store. Pendant les 10 premiers jours d'un mois, vous recevez peu de notifications vers votre application, à savoir 10 000 écritures et 10 000 lectures par jour dans SageMaker Feature Store. Cependant, le jour 11, votre application attire l'attention sur les réseaux sociaux et son flux atteint 200 000 lectures et 200 000 écritures ce jour-là. Votre application s'installe alors via un flux plus régulier, avec une moyenne de 80 000 lectures et de 80 000 écritures chaque jour jusqu'à la fin du mois.

Le tableau ci-dessous résume votre utilisation totale mensuelle et les frais associés à l'utilisation de Amazon SageMaker Feature Store.

Exemple de tarification #8 : entraînement

Dans cet exemple, les frais totaux pour l'entraînement et le débogage s'élèvent à 2,38 USD. Les instances de calcul et les volumes de stockage polyvalents utilisés par les règles intégrées d'Amazon SageMaker Debugger n'engendrent pas de frais supplémentaires.

	Stockage polyvalent (SSD) pour l'entraînement (Go)	Stockage polyvalent (SSD) pour les règles Debugger intégrées (Go)	Stockage polyvalent (SSD) pour les règles Debugger personnalisées (Go)	Coût par Go/mois	Sous-total
Capacité utilisée	3	2	1
Coût	0 USD	Aucun frais supplémentaire pour les volumes de stockage de règle intégrée	0 USD	0,10 USD	0 USD

Heures	Instance d'entraînement	Instance de débogage	Prix par heure	Sous-total
4 x 0,5 = 2,00	ml.m4.4xlarge	Non applicable	0,96 USD	1,92 USD
4 * 0,5 * 2 = 4	Non applicable	Aucun frais supplémentaire pour les instances de règle intégrée	0 USD	0 USD
4 * 0,5 = 2	ml.m5.xlarge	Non applicable	0,23 USD	0,46 USD
				-------
				2,38 USD

Un spécialiste des données a travaillé pendant une semaine sur un modèle afin de donner forme à une nouvelle idée. Elle forme le modèle 4 fois sur une instance ml.m4.4xlarge pendant 30 minutes par exécution de formation avec le Amazon SageMaker Debugger activé en utilisant deux règles intégrées et une règle personnalisée qu'elle a écrite. Pour la règle personnalisée, elle a spécifié une instance ml.m5.xlarge. Elle entraîne le modèle en utilisant 3 Go de données d'entraînement dans Simple Storage Service (Amazon S3) et envoie 1 Go de données générées dans Simple Storage Service (Amazon S3). SageMaker crée des volumes SSD polyvalents (gp2) pour chaque instance d'entraînement. SageMaker crée également des volumes SSD polyvalents (gp2) pour chaque règle spécifiée. Dans cet exemple, un total de quatre volumes SSD polyvalents (gp2) seront créés. SageMaker Debugger émet 1 Go de données de débogage vers le compartiment Simple Storage Service (Amazon S3) du client.

Exemple de tarification 9 : MLflow

Vous disposez de deux équipes de scientifiques des données. Une équipe composée de 10 scientifiques des données et l’autre de 40 scientifiques des données. Pour répondre aux besoins de ces deux équipes, vous choisissez d’activer deux serveurs de suivi MLflow différents : l’un de petite taille et l’autre de taille moyenne. Chaque équipe mène des expériences de machine learning (ML) et doit enregistrer les métriques, les paramètres et les artefacts produits par ses tentatives de formation. Les équipes souhaitent utiliser les serveurs de suivi MLflow 160 heures par mois. Supposons que chaque équipe de science des données stocke 1 Go de métadonnées pour suivre les essais. La facture à fin du mois serait calculée comme suit :

Frais de calcul pour une petite instance : 160 * 0,60 USD = 96 USD
Frais de calcul pour une instance moyenne : 160 * 1,40 USD = 166,4 USD
Frais de stockage pour deux équipes : 2 * 1 * 0,10 = 0,20 USD

Total = 262,60 USD

Exemple de tarification 10 : inférence en temps réel

Le sous-total pour l'entraînement, l'hébergement et la surveillance s'élève à 305,827 USD. Le sous-total pour 3 100 Mo de données traitées entrantes et 310 Mo de données traitées sortantes pour l'hébergement par mois = 0,054 USD. Dans cet exemple, le coût total s'élèverait à 305,881 USD par mois.

Remarque : pour les règles intégrées à l'instance ml.m5.xlarge, vous obtenez chaque mois, gratuitement, jusqu'à 30 heures de surveillance regroupées sur tous les points de terminaison.

Données entrantes par mois – Hébergement	Données sortantes par mois – Hébergement	Prix par Go entrant ou sortant	Total
100 Mo * 31 = 3 100 Mo		0,016 USD	0,0496 USD
	10 Mo * 31 = 310 Mo	0,016 USD	0,00496 USD

Heures par mois	Instances d'hébergement	Instances Model Monitor	Prix par heure	Total
24 * 31 * 2 = 1 488	ml.c5.xlarge		0,204 USD	303,522 USD
31 * 0,08 = 2,5		ml.m5.4xlarge	0,922 USD	2,305 USD

Le modèle de l'exemple #5 est ensuite déployé en production vers deux (2) instances ml.c5.xlarge pour un hébergement Multi-AZ fiable. Amazon SageMaker Model Monitor est activé avec une (1) instance ml.m5.4xlarge et des tâches de surveillance sont programmées une fois par jour. Chaque tâche de surveillance nécessite cinq minutes pour être exécutée. Le modèle reçoit 100 Mo de données par jour, et les inférences représentent 1/10e de la taille des données d'entrée.

Exemple de tarification #11 : inférence asynchrone

Le sous-total de l'inférence asynchrone SageMaker s'obtient en faisant le calcul suivant : 15,81 USD + 0,56 USD + 2 * 0,0048 = 16,38 USD. Dans cet exemple, le coût total de l'inférence asynchrone s'élèverait à 16,38 USD par mois.

Données entrantes par mois	Données sortantes par mois	Prix par Go entrant ou sortant	Total
10 Ko * 1 024 * 31 = 310 Mo	10 Ko * 1 024 * 31 = 310 Mo	0,02 USD	0,0048
	10 Ko * 1 024 * 31 = 310 Mo	0,02 USD	0,0048

Stockage (Go) polyvalent (SSD)	Coût par Go/mois	Total
4	0,14 USD	0,56 USD

Heures par mois	Instances d'hébergement	Prix par heure	Total
2,5 x 31 x 1 = 77,5	ml.c5.xlarge	0,20 USD	15,81 USD

L'inférence asynchrone Amazon SageMaker vous facture les instances utilisées par votre point de terminaison. Lorsque les instances ne traitent pas activement les requêtes, vous avez la possibilité de configurer la mise à l'échelle automatique pour réduire le nombre d'instances à zéro afin de réduire les coûts. Pour les charges utiles entrantes dans Simple Storage Service (Amazon S3), il n'y a pas de coût pour lire les données entrantes à partir de Simple Storage Service (Amazon S3) et écrire les données sortantes sur S3 dans la même région.

Le modèle de l'exemple n° 5 est utilisé pour exécuter un point de terminaison d'inférence asynchrone SageMaker. Le point de terminaison est configuré pour fonctionner sur une instance ml.c5.xlarge et réduire le nombre d'instances à zéro lorsqu'il ne traite pas activement des requêtes. L'instance ml.c5.xlarge du point de terminaison a un stockage polyvalent (SSD) de 4 Go qui lui est attaché. Dans cet exemple, le point de terminaison maintient un nombre d'instances de 1 pendant deux heures par jour et dispose d'un temps de stabilisation de 30 minutes, après quoi il réduit à zéro le nombre d'instances pour le reste de la journée. Par conséquent, vous êtes facturé pour 2,5 heures d'utilisation par jour.

Le point de terminaison traite 1 024 requêtes par jour. La taille de chaque corps de requête/réponse d'appel est de 10 Ko, et celle de chaque charge utile de requête d'inférence dans Simple Storage Service (Amazon S3) de 100 Mo. Les sorties d'inférence font 1/10e de la taille des données d'entrée qui sont stockées dans Simple Storage Service (Amazon S3) dans la même région. Dans cet exemple, les frais de traitement des données s'appliquent au corps de requête et de réponse, mais pas aux données transférées vers/depuis Simple Storage Service (Amazon S3).

Exemple de tarification #12 : Batch Transform

Dans cet exemple, le prix total pour l’inférence serait de 2,88 USD.

Heures	Instances d'hébergement	Prix par heure	Total
3 x 0,25 x 4 = 3 heures	ml.m4.4xlarge	0,96 USD	2,88 USD

Le modèle de l'exemple #5 est utilisé pour exécuter SageMaker Batch Transform. La scientifique des données exécute quatre tâches SageMaker Batch Transform distinctes sur 3 ml.m4.4xlarge à raison de 15 minutes par tâche. Elle charge un jeu de données d'évaluation de 1 Go dans S3 pour chaque cycle, et les inférences représentent 1/10e de la taille des données d'entrée, lesquelles sont stockées dans S3.

Exemple de tarification #13 : inférence sans serveur à la demande

Frais de traitement de données mensuels

Traitement de données (Go)	Prix par Go entrant ou sortant	Frais de traitement de données mensuels
10 Go	0,016 USD	0,16 USD

Le sous-total des frais de durée de l’inférence sans serveur SageMaker à la demande est de 40 USD. Le sous-total des frais de traitement de 10 Go de données est de 0,16 USD. Dans cet exemple, le prix total serait de 40,16 USD.

Frais de calcul mensuels

Nombre de requêtes	Durée de chaque requête	Durée d'inférence totale (s)	Coût par seconde	Frais de durée d'inférence mensuels
10 millions	100 ms	1 million	0,00004 USD	40 USD

Avec l'Inférence sans serveur à la demande, vous ne payez que la capacité de calcul utilisée pour traiter les demandes d'inférence, facturées à la milliseconde, et la quantité de données traitées. Les frais de calcul dépendent de la configuration de mémoire choisie.

Si vous allouez 2 Go de mémoire à votre point de terminaison, que vous l'exécutez 10 millions de fois en un mois pendant 100 minutes à chaque fois et que vous traitez 10 Go de données entrantes/sortantes au total, vos frais seront calculés comme suit :

Exemple de tarification #14 : simultanéité provisionnée sur l'inférence sans serveur

Supposons que vous gérez un service de chatbot pour une société de traitement des salaires. Vous vous attendez à une augmentation du nombre de demandes des clients à la fin du mois de mars, avant la date limite de déclaration fiscale. Toutefois, pour le reste du mois, le trafic devrait être faible. Vous déployez donc un point de terminaison sans serveur doté de 2 Go de mémoire et vous ajoutez une simultanéité provisionnée de 100 pendant les 5 derniers jours du mois, de 9 h à 17 h (8 h), pendant laquelle votre point de terminaison traite 10 millions de demandes et 10 Go d'entrées/sorties de données au total. Le reste du mois, le chatbot fonctionne sur l'inférence sans serveur à la demande et traite 3 millions de requêtes et 3 Go d'entrées/sorties de données. Supposons que la durée de chaque demande soit de 100 ms.

Frais pour la simultanéité allouée
Le prix du PC est de 0,000010 USD/sec
Durée d'utilisation du PC (secondes) = 5 jours* 100 PC* 8 heures* 3600 sec = 14 400 000 secondes
Frais d'utilisation du PC = 14 400 000 secs* 0,000010 USD/sec = 144 USD.

Frais de durée d'inférence pour le trafic desservi par la simultanéité allouée
Le prix de la durée d'inférence est de 0,000023 USD/sec
Durée totale d'inférence pour PC (sec) = 10 M* (100 ms) /1 000 = 1 million de secondes.
Frais de durée d'inférence pour PC = 1 000 000 sec * 0,000023/sec = 23 USD

Frais de durée d'inférence à la demande
Le prix de calcul mensuel est de 0,00004 USD par seconde et le niveau gratuit fournit 150 000 secondes.
Calcul total (secondes) = (3) M* (100 ms) /1 000 = 0,3 millions de secondes.
Taux de calcul total – Taux de calcul offert = Taux de calcul facturable par mois en secondes
0,3 millions de secondes — 150 000 secondes = 150 000 secondes
Frais de calcul mensuels = 150 000 *0,00004 USD = 6 USD

Traitement de données
Coût/Go de données traitées à l'entrée/sortie = 0,016 USD
Nombre total de Go traités = 10+3 = 13
Coût total = 0,016 USD*13 = 0,208 USD

Total des frais pour mars
Frais totaux = Frais de concurrence provisionnés+ Durée d'inférence pour la concurrence provisionnée + Durée d'inférence pour le calcul à la demande + Frais de traitement des données
= 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD

Exemple de tarification 15 : Jumpstart

Le client utilise JumpStart pour déployer un modèle BERT Base Uncased pré-entraîné afin de classer comme positif ou négatif le ressenti issu des commentaires des clients.

Le client déploie le modèle sur deux (2) instances ml.c5.xlarge pour un hébergement Multi-AZ fiable. Le modèle reçoit 100 Mo de données par jour, et les inférences représentent 1/10e de la taille des données entrantes.

Heures par mois	Instances d'hébergement	Prix par heure	Total
24 * 31 * 2 = 1 488	ml.c5.xlarge	0,204 USD	303,55 USD

Données entrantes par mois – Hébergement	Données sortantes par mois – Hébergement	Prix par Go entrant ou sortant	Total
100 Mo * 31 = 3 100 Mo		0,02 USD	0,06 USD
	10 Mo * 31 = 310 Mo	0,02 USD	0,01 USD

Le sous-total pour l'entraînement, l'hébergement et la surveillance s'élève à 305,827 USD. Le sous-total pour 3 100 Mo de données traitées entrantes et 310 Mo de données traitées sortantes pour l'hébergement par mois = 0,06 USD. Dans cet exemple, le coût total s'élèverait à 305,887 USD par mois.

Exemple de tarification 16 : cluster HyperPod

Supposons que vous souhaitiez provisionner un cluster de 4 ml.g5.24xlarge pendant 1 mois (30 jours) avec 100 Go de stockage supplémentaires par instance pour prendre en charge le développement de modèles. Dans cet exemple, le coût total du cluster et du stockage supplémentaire s’élève à 29 374,40 USD.

Calcul

Instance	Durée	Instances	Coût par heure	Sous-total
ml.g5.24xlarge	30 jours * 24 heures = 720 heures	4	10,18 USD	29 318,40 USD

Stockage

Stockage à usage général (SSD)	Durée	Instances	Coût par Go/mois	Sous-total
100 Go	30 jours * 24 heures = 720 heures	4	0,14 USD	56,00 USD

Exemple de tarification 17 : évaluations des modèles de fondation (évaluation automatique)

Les évaluations des modèles de fondation avec SageMaker Clarify ne vous facturent que les instances utilisées pendant l'exécution de vos tâches d'évaluation automatique. Lorsque vous sélectionnez une tâche d'évaluation automatique et un jeu de données, SageMaker charge le jeu de données rapide depuis Amazon S3 sur une instance d'évaluations SageMaker.

Dans l'exemple suivant, un ingénieur ML effectue une évaluation du modèle Llama2 7B dans les USA Est (Virginie du Nord) pour vérifier la précision des tâches de synthèse. Le type d'instance recommandé pour l'inférence pour Llama 2 7B est ml.g5.2xlarge. L'instance minimale recommandée pour une évaluation est ml.m5.2xlarge. Dans cet exemple, la tâche s'exécute pendant 45 minutes (en fonction de la taille du jeu de données). Dans cet exemple, le coût serait de 1,48 USD pour le travail d'évaluation et les résultats détaillés.

Traitement des heures de travail (exemple)	Région	Type d’instance	Instance	Prix par heure	Coût
0,45	US-east-1	Hébergement LLM	ml.g5.2xlarge	1.52 USD	1,14 USD
0,45	US-east-1	évaluation	ml.m5.2xlarge	0,46 USD	0,35 USD
Total					1,48 USD

Dans l'exemple suivant, le même ingénieur en Virginie exécute une autre tâche d'évaluation pour la précision des tâches de synthèse, mais utilise une version personnalisée de Llama 2 7B qui est déployée sur son compte et est opérationnelle. Dans ce cas, étant donné que le modèle est déjà déployé sur leur compte, le seul coût supplémentaire serait lié à l'instance d'évaluation.

Traitement des heures de travail	Région	Type d’instance	Instance	Prix par heure	Coût
0,45	US-east-1	évaluation	ml.m5.2xlarge	0,46 USD	0,35 USD
Total					0,35 USD

Exemple de tarification n°18 : évaluations des modèles de fondation (évaluation fondée sur l’être humain)

Dans l'exemple suivant, un ingénieur en machine learning des USA Est (Virginie du Nord) effectue une évaluation humaine de Llama-2-7B en ce qui concerne la précision des tâches de synthèse et fait appel à sa propre main-d'œuvre privée pour l'évaluation. Le type d'instance recommandé pour Llama-2-7B est ml.g5.2xlarge. L'instance minimale recommandée pour une tâche de traitement d'évaluation fondée sur l'humain est ml.t3.medium. L'inférence sur Llama-2-7B s'exécute pendant 45 minutes (en fonction de la taille du jeu de données). Le jeu de données contient 50 prompts, et le développeur a besoin de 2 travailleurs pour évaluer chaque ensemble de réponses rapides (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par prompt »). Cette tâche d'évaluation comportera 100 tâches (1 tâche pour chaque paire de réponses rapides pour chaque travailleur : 2 travailleurs x 50 ensembles de réponses rapides = 100 tâches humaines). La main-d'œuvre humaine met une journée (24 heures) à effectuer les 100 tâches d'évaluation humaine du poste d'évaluation (cela dépend du nombre et du niveau de compétence des travailleurs, ainsi que de la longueur/de la complexité des prompts et des réponses d'inférence).

Heures de calcul	Tâches humaines	Région	Type d’instance	Instance	Prix par heure	Coût par tâche humaine	Coût total
0,45		USA Est (Virginie du Nord)	Hébergement LLM	ml.g5.2xlarge	1.52 USD		1,14 USD
24		USA Est (Virginie du Nord)	Tâche de traitement	ml.t3.medium	0,05 USD		1,20 USD
	100	N'importe lequel				0,21 USD	21,00 USD
Total							23,34 USD

Dans l'exemple suivant, le même ingénieur des USA Est (Virginie du Nord) exécute la même tâche d'évaluation mais utilise Llama-2-7B déjà déployé sur son compte et opérationnel. Dans ce cas, le seul coût supplémentaire serait lié à la tâche de traitement de l'évaluation et aux tâches humaines.

Heures de calcul	Tâches humaines	Région	Type d’instance	Instance	Prix par heure	Coût par tâche humaine	Coût total
24		USA Est (Virginie du Nord)	Tâche de traitement	ml.t3.medium	0,05 USD		1,20 USD
	100	N'importe lequel				0,21 USD	21,00 USD
Total							22,20 USD

Étapes suivantes

Features page

Découvrez un large éventail de fonctionnalités de SageMaker

Console

Commencez à créer avec SageMaker dans la console de gestion AWS

S'inscrire maintenant

Tarification d'Amazon SageMaker

Vue d'ensemble des tarifs

Offre gratuite Amazon SageMaker

Calculateur de tarification AWS

Tarification à la demande

Détails de l’instance

Amazon SageMaker Studio

Évaluations du modèle de base

Amazon SageMaker Studio Lab

Amazon SageMaker Canvas

Amazon SageMaker Data Labeling

Shadow testing d'Amazon SageMaker

Amazon SageMaker Edge

Savings Plans Amazon SageMaker

Coût total de possession (TCO) avec Amazon SageMaker

Exemples de tarification

Exemple de tarification #1 : JupyterLab

Exemple de tarification #2 : Éditeur de code

Exemple de tarification #3 : Studio Classic

Exemple de tarification #4 : RStudio

Exemple de tarification 5 : traitement

Exemple de tarification #6 : Data Wrangler

Exemple de tarification #7 : magasin des fonctionnalités

Exemple de tarification #8 : entraînement

Exemple de tarification 9 : MLflow

Exemple de tarification 10 : inférence en temps réel

Exemple de tarification #11 : inférence asynchrone

Exemple de tarification #12 : Batch Transform

Exemple de tarification #13 : inférence sans serveur à la demande

Exemple de tarification #14 : simultanéité provisionnée sur l'inférence sans serveur

Exemple de tarification 15 : Jumpstart

Exemple de tarification 16 : cluster HyperPod

Exemple de tarification 17 : évaluations des modèles de fondation (évaluation automatique)

Exemple de tarification n°18 : évaluations des modèles de fondation (évaluation fondée sur l’être humain)

Étapes suivantes

Découvrez un large éventail de fonctionnalités de SageMaker

Commencez à créer avec SageMaker dans la console de gestion AWS

Tarification d'Amazon SageMaker

Vue d'ensemble des tarifs

Offre gratuite Amazon SageMaker

Calculateur de tarification AWS

Tarification à la demande

Détails de l’instance

Amazon SageMaker Studio

Évaluations du modèle de base

Amazon SageMaker Studio Lab

Amazon SageMaker Canvas

Amazon SageMaker Data Labeling

Shadow testing d'Amazon SageMaker

Amazon SageMaker Edge

Savings Plans Amazon SageMaker

Coût total de possession (TCO) avec Amazon SageMaker

Exemples de tarification

Exemple de tarification #1 : JupyterLab

Exemple de tarification #2 : Éditeur de code

Exemple de tarification #3 : Studio Classic

Exemple de tarification #4 : RStudio

Exemple de tarification 5 : traitement

Exemple de tarification #6 : Data Wrangler

Exemple de tarification #7 : magasin des fonctionnalités

Exemple de tarification #8 : entraînement

Exemple de tarification 9 : MLflow

Exemple de tarification 10 : inférence en temps réel

Exemple de tarification #11 : inférence asynchrone

Exemple de tarification #12 : Batch Transform

Exemple de tarification #13 : inférence sans serveur à la demande

Exemple de tarification #14 : simultanéité provisionnée sur l'inférence sans serveur

Exemple de tarification 15 : Jumpstart

Exemple de tarification 16 : cluster HyperPod

Exemple de tarification 17 : évaluations des modèles de fondation (évaluation automatique)

Exemple de tarification n°18 : évaluations des modèles de fondation (évaluation fondée sur l’être humain)

Étapes suivantes

Découvrez un large éventail de fonctionnalités de SageMaker

Commencez à créer avec SageMaker dans la console de gestion AWS

Fin de la prise en charge d'Internet Explorer