ProduitsMachine learningAWS HealthOmics › Tarification d'AWS HealthOmics

 

 

Tarification AWS HealthOmics

Présentation

AWS HealthOmics aide ses clients à accélérer les avancées scientifiques grâce à une infrastructure de bioinformatique et de découverte de médicaments entièrement gérée, conçue pour gérer les flux de travail et le stockage à grande échelle. Avec HealthOmics, vous ne payez que pour ce que vous utilisez et il n'y a aucun coût de licence HealthOmics.

HealthOmics propose deux types de flux de travail. Les flux de travail privés sont des flux de travail personnalisés définis par l'utilisateur qui vous permettent d'apporter vos propres scripts bioinformatiques écrits dans les langages de flux de travail les plus couramment utilisés. La tarification des flux de travail privés est basée sur les ressources de calcul et de système de fichiers demandées pour chaque exécution. Les flux de travail Ready2Run sont des pipelines bioinformatiques prédéfinis basés sur des analyses industrielles courantes et vous payez un coût fixe par exécution.

HealthOmics propose deux types de stockage. Les magasins de référence et de séquences sont des magasins de données pour les objets qui utilisent la hiérarchisation, la compression et le catalogage des métadonnées afin de permettre un stockage et une organisation rentables des données bioinformatiques. La tarification est basée sur la taille de l'objet stocké et le niveau de données. Les magasins de variantes et d'annotations sont des magasins zéro ETL qui extraient les données clés des données bioinformatiques afin de créer un lac de données optimisé pour la recherche et la création de cohortes. La tarification est basée sur la taille de stockage des informations extraites.

Vous pouvez utiliser les flux de travail et les magasins de données ensemble ou séparément, selon les besoins. Si vous êtes prêt à prendre un engagement d'utilisation pendant trois ou cinq ans, veuillez nous contacter pour bénéficier de tarifs réduits.

Découvrez la tarification par type

Avec AWS HealthOmics, vous ne payez que pour ce que vous utilisez. Découvrez les types de tarification ci-dessous.

Offre gratuite

Dans le cadre de l'Offre gratuite d'AWS,vous pouvez commencer à utiliser AWS HealthOmics gratuitement. Lors de leur inscription, les nouveaux clients AWS bénéficient d'un maximum de 275 heures d'instance omics.m.xlarge (ou équivalent) et de 49 000 gigaoctets-heures de stockage pour l'exécution de flux de travail privés, de 1 500 gigaoctets-mois de stockage actif et d'archivage dans le magasin de séquences et de 200 gigaoctets-mois de stockage dans le magasin de variantes. Votre utilisation de l'offre gratuite est calculée chaque mois dans toutes les régions, à l’exception des régions AWS GovCloud (US), et est appliquée automatiquement à votre facture. L'utilisation mensuelle non utilisée ne sera pas reportée. Certaines restrictions s'appliquent, consultez les conditions de l'offre pour plus de détails.

 

Utilisation mensuelle de l'offre gratuite pendant les deux premiers mois

Flux de travail HealthOmics

Flux de travail privés : 275 heures d'instance omics.m.xlarge ou instances de calcul équivalentes, et 49 000 Go-heures de stockage d'exécution

Magasins de données HealthOmics Magasin de séquences : 1500 gigabits-mois dans la classe de stockage active et 1500 gigabits-mois dans la classe de stockage d'archives

Magasin de variantes : 200 gigaoctets-mois

Les clients AWS bénéficient de 100 Go gratuits de transfert de données sortantes vers Internet chaque mois, cumulés sur l'ensemble des services et régions AWS (à l'exception de la Chine et de GovCloud).

Tarification des flux de travail privés

Les flux de travail privés sont des flux de travail personnalisés que vous définissez en fonction du langage de flux de travail que vous avez choisi pour exécuter des pipelines de bioinformatique ou de découverte de médicaments. Le coût comprend deux éléments : les instances de tâches de flux de travail et le stockage d'exécution.

L'instance omics utilisée pour chaque tâche de votre flux de travail vous est facturée. Chaque tâche de votre flux de travail est mappée à la plus petite instance omics disponible qui satisfait les vCPU, la mémoire et/ou les GPU demandés pour la tâche. Par exemple, une tâche définie pour utiliser 8 CPU et 60 Go de RAM sera mappée au type d'instance omics.r.2xlarge pour son exécution. HealthOmics fournit toujours exactement les ressources demandées. Dans cet exemple, 8 CPU et 60 Go de RAM seront disponibles pour la tâche. Les tâches sont facturées par tranches d'une seconde, toutefois, il existe un seuil de facturation minimum de 60 secondes par tâche. Si vous ne spécifiez pas de vCPU ou de mémoire pour une tâche, HealthOmics provisionnera automatiquement le plus petit type d'instance disponible, omics.c.large, pour ces tâches. Vous n'êtes pas non plus facturé pour le calcul associé au staging des données (c'est-à-dire les importations et les exportations) et il n'y a aucun frais inter-AZ.

Pour exécuter le stockage, vous pouvez choisir un système de fichiers provisionné de manière statistique avec un débit de système de fichiers supérieur ou un système de fichiers qui évolue de manière dynamique. Le stockage d'exécution statique est disponible dans les tailles suivantes : 1 200 Go, 2 400 Go, puis par incréments de 2 400 Go, avec une taille minimale provisionnée de 1 200 Go. Le stockage à exécution dynamique évolue en fonction de l'utilisation et ne nécessite pas de provisionnement de stockage minimum.

Les ressources ne vous sont facturées que lorsque l'exécution est en cours d'exécution. Aucun frais n’est facturé pour les exécutions en attente, en cours de démarrage ou en cours d'arrêt. Pour les exécutions annulées ou échouées, toutes les ressources utilisées jusqu'au moment de l'annulation ou de l'échec vous sont facturées.

Vous pouvez consulter vos coûts totaux pour chaque exécution sur votre facture AWS, ce qui vous permet de déterminer rapidement et facilement vos coûts. HealthOmics fournit également un outil d'analyse d'exécution open source pour vous aider à optimiser les ressources d'exécution, les coûts et les performances. Si vous envisagez d'exécuter des flux de production à grande échelle et que vous êtes prêt à vous engager à l'utiliser pendant trois ou cinq ans, veuillez nous contacter pour bénéficier de tarifs réduits.

 

Tarification des flux de travail Ready2Run

Les flux de travail Ready2Run sont des flux de travail prédéfinis conçus par des éditeurs de logiciels tiers de premier plan tels que NVIDIA, Sentieon, Element Biosciences et Ultima, ainsi que des pipelines open source courants tels que les flux de travail GATK du Broad Institute et AlphaFold pour la prédiction de la structure des protéines. Vous pouvez simplement utiliser les flux de travail Ready2Run pour traiter vos données sans avoir à gérer les outils logiciels ou les scripts de flux de travail. Les flux de travail Ready2Run sont payants à l'exécution et les mêmes frais fixes vous sont facturés lorsque les exécutions sont terminées avec succès, quelle que soit la durée d'exécution. Si l’exécution est annulée ou ne peut pas être terminée avec succès dans la première heure, les frais par exécution sont calculés au prorata en fonction de la première heure d'utilisation. Les exécutions qui s'exécutent pendant plus d'une heure sont facturées au prix total de l’exécution. Les flux de travail Sentieon Ready2Run nécessitent un abonnement distinct souscrit auprès de Sentieon. Un abonnement d'évaluation gratuit de deux semaines est automatiquement fourni par Sentieon sans frais supplémentaires aux nouveaux utilisateurs de Sentieon Ready2Run. Pour consulter des informations détaillées sur les flux de travail Ready2Run disponibles, y compris les paramètres d'entrée, les diagrammes de flux de travail et les durées d'exécution estimées, consultez la console HealthOmics.

Tarification des magasins de données

Les magasins de données HealthOmics sont des solutions de stockage gérées, accessibles, interopérables et réutilisables (FAIR) destinées à des échantillons de données à grande échelle, avec une compression automatique des données et une capacité d'interrogation des variantes/annotations optimisée.

Le magasin de séquences permet de réaliser des économies grâce à la hiérarchisation et à la compression axées sur l'utilisation. Les objets stockés sont regroupés dans des ensembles de lecture pour des raisons d'organisation et de facilité de recherche. Lorsque vous stockez des données dans le magasin de séquences, vous payez par gigabase par mois. Un gigabase (Gb) représente un milliard de bases de vos fichiers de séquence importés (p. ex. FASTQ, BAM et CRAM). Comme la facturation se fait par gigabase, vous n'avez pas à vous soucier des formats de fichiers optimaux ou des techniques de compression. AWS HealthOmics optimise cela pour vous. Les données du magasin de séquences sont accessibles de deux manières : 1/ via les API HealthOmics de lecture, d'écriture et de mise à jour et en lisant via les API S3. Pour l’accès via les API HealthOmics, vous payez pour les requêtes GET effectuées sur vos objets en lecture. Tous les autres types de requêtes HealthOmics adressées aux jeux de lectures sont gratuits. 2/ Via list S3 et les API get. Pour l'accès via les API S3, les requêtes COPY et LIST sont facturées séparément de tous les autres types de requêtes. Pour comparer les coûts du magasin de séquences HealthOmics à ceux des autres options de stockage, consultez notre blog : https://aws.amazon.com/blogs/industries/store-omics-data-cost-effectively-at-any-scale-with-aws-healthomics/

Les magasins de variantes et d'annotations utilisent Zero-ETL pour préparer les données de variantes et d'annotations à des fins d'interrogation, de regroupement et d'analyse avec des services AWS tels qu'Amazon Athena et Amazon SageMaker. Les fichiers ingérés sont traités par HealthOmics et convertis en formats optimisés pour les requêtes. Vous pouvez stocker n'importe quelle quantité de données de variantes et d'annotations et vous ne payez que pour ce qui est stocké. La taille des données facturées est définie comme la taille des données après ingestion et transformation. Les données du magasin de variantes et d'annotations sont généralement accessibles via d'autres services AWS. Lorsque vous interrogez et analysez les données dans d'autres services, vous payez pour l'utilisation de ces services.

Les données stockées dans les magasins de données AWS HealthOmics sont facturées pour une durée de stockage minimale de 30 jours, et les données supprimées avant 30 jours sont facturées au prorata des frais de stockage pour les jours restants. 

Exemples de tarification

  • Une chercheuse en bioinformatique veut exécuter un flux de travail Nextflow dans les flux de travail AWS HealthOmics dans la région USA Est (Virginie du Nord). Son flux de travail contient trois tâches. La première réserve 16 vCPU et 30 Go de mémoire pour 3 heures d'exécution. La deuxième requiert 32 vCPU et 160 Go de mémoire pour 2 heures d'exécution. La troisième réserve 4 vCPU et 10 Go de mémoire pour 10 minutes d'exécution. Le client enregistre le flux de travail et appelle l'API StartRun avec le fichier système par défaut de 1 200 Go. Voici le calcul du coût total :
    Tâche 1 (omics.c.4xlarge) : 0,9180 USD/h * 3 h = 2,754 USD
    Tâche 2 (omics.r.8xlarge) : 2,7216 USD/h * 2 h = 5,4432 USD
    Tâche 3 (omics.m.xlarge) : 0,2592 USD/h * 1/6 h = 0,0432 USD
    Stockage statique : 0,0001918 USD/Go-heure * (1 200Go*(3 h+2 h+1/6 h)) = 1,18916 USD
    Total : 9,42956 USD

  • Une chercheuse en bioinformatique développe un nouveau flux de travail WDL dans AWS HealthOmics dans la région USA Est (Virginie du Nord). Son flux de travail contient deux tâches. La première réserve 16 vCPU et 30 Go de mémoire pour 3,5 heures d'exécution. La deuxième requiert 32 vCPU et 160 Go de mémoire pour 2,25 heures d'exécution. Le client enregistre le flux de travail et appelle l'API StartRun avec le fichier système dynamique. Au cours des 5,75 heures d'exécution du flux de travail, le système de fichiers augmente de façon linéaire de 0 Go à 1 043 Go, soit un total de 3 000 Go/h de stockage de fichiers. Voici le calcul du coût total :
    Tâche 1 (omics.c.4xlarge) : 0,9180 USD/h * 3,5 h = 3,213 USD
    Tâche 2 (omics.r.8xlarge) : 2,7216 USD/h * 2,25 h = 6,1236 USD
    stockage dynamique des exécutions : 0,0004110 USD/Go-heure * 3 000 Go-heure = 1,233 USD
    Total : 10,5696 USD

  • Un informaticien souhaite exécuter le flux de travail Ready2Run GATK-BP Germline fq2vcf for 30x génomes dans la région USA Est (Virginie du Nord) pour 3 échantillons. Le client saisit ses données et appelle l'API StartRun pour chaque échantillon. Le coût des 3 exécutions est de :
    GATK-BP Germline fq2vcf pour le flux de travail Ready2Run à 30x génome : 10,00 USD/exécution * 3 = 30,00 USD
    Total : 30,00 USD

  • Une initiative de séquençage de la population est lancée pour séquencer des individus d'une biobanque préalablement collectée. Le programme concerne la région UE Ouest (Irlande). Ils séquencent 100 000 individus, chacun à 130 gigabases, 50 gigaoctets, et stockent les données de séquençage brutes dans le stockage AWS HealthOmics. Au cours des cinq années suivantes, les données seront conservées dans la classe de stockage d'archives après les 30 jours suivant leur importation et seront lues deux fois, en moyenne, lorsqu'elles passeront dans la classe de stockage active pour 30 jours. Ils utilisent les API S3 pour accéder aux fichiers. Chaque génome est téléchargé en 500 fragments, et génère 500 appels d'API GET. Voici le calcul du coût total d'un seul génome pour cinq ans :
    Classe de stockage active : 0,005769 USD gigabase/mois * 130 gigabases * 90 jours = 2,22 USD
    Classe de stockage d'archives : 0,001154 USD gigabase/mois * 130 gigabases * (1825 – 90) jours = 8,56 USD.
    API S3 GET : 0,0004 USD/1 000 appels d'API * (2 * 500 appels d'API) = 0,0004 USD
    Coût total pour 5 ans : 2,22 USD + 8,56 USD + 0,0004 USD = 10,78 USD (soit 2,15 USD/an)

  • Un scientifique des données souhaite analyser 3 202 fichiers au format Variant Call Format (VCF) dans Amazon Athena dans la région USA Est (Virginie du Nord). Il crée un magasin de variantes et ingère ces fichiers au moyen des API AWS HealthOmics. Les données ingérées ont un volume de 1,5 To. Au cours du mois suivant, il exécute 1 000 requêtes dans Athena, et calcule les fréquences alléliques pour différentes sous-populations, chacune consommant en moyenne 50 Go. Le calcul du coût mensuel total est le suivant :
    Magasin de variantes : 0,035 USD Gb/mois * (1 024 Go/To * 1,5 To) = 53,76 USD
    Amazon Athena : 5 USD/To * 1 000 * 50 / 1 024 = 244,14 USD

Tarification du transfert de données

Vous payez pour toute la bande passante de HealthOmics. Les frais de transfert de données ne s'appliquent pas aux données transférées vers des services AWS situés dans la même région AWS que le magasin de données. La tarification ci-dessous est calculée en fonction des données transférées vers et depuis AWS HealthOmics (sur l'Internet public)†††. En savoir plus sur la tarification AWS Direct Connect En cas de transferts de données supérieurs à 500 To/mois, veuillez nous contacter.

Les niveaux de tarification prennent en compte votre utilisation globale pour le transfert de données vers internet à travers tous les services AWS.

††† Si vous résiliez prématurément la connexion, il est possible que les transferts de données sortantes diffèrent des données reçues par votre application, par exemple, si vous envoyez une requête pour un objet de 10 Go et mettez fin à la connexion après avoir reçu seulement 2 Go de données. AWS HealthOmics tente d'interrompre le flux de données, mais cela n'est pas instantané. Dans cet exemple, le transfert de données sortantes peut être de 3 Go (soit 1 Go de plus que les 2 Go reçus). Dans ce cas, 3 Go de transfert de données sortantes vous seront facturés.