Amazon EMR es la plataforma de big data en la nube líder del sector destinada al procesamiento de datos, análisis interactivo y machine learning (ML) mediante el uso de marcos de código abierto, como Apache Spark, Apache Hive y Presto. Los precios de Amazon EMR son simples y predecibles: paga una tarifa por segundo por cada segundo utilizado, con un cobro mínimo de un minuto. Un clúster con 10 nodos que se ejecuta durante 10 horas cuesta lo mismo que un clúster de 100 nodos que se ejecuta durante una hora. Los precios de Amazon EMR dependen de la manera en que despliegue las aplicaciones de EMR. Puede ejecutarlas en clústeres de EMR con instancias de Amazon Elastic Cloud Compute (Amazon EC2), en AWS Outposts, en Amazon Elastic Kubernetes Service (Amazon EKS), o con EMR Serverless. Puede ejecutar Amazon EKS en AWS mediante EC2 o AWS Fargate.
Amazon EMR en Amazon EC2
Estos precios corresponden a las aplicaciones de Amazon EMR que se ejecutan en los clústeres de Amazon EMR con instancias de Amazon EC2.
El precio de Amazon EMR se agrega al precio de Amazon EC2 (el precio de los servidores subyacentes) y al precio de Amazon Elastic Block Store (Amazon EBS) (si se adjuntan volúmenes de Amazon EBS). Estos servicios también se facturan por segundo, con un mínimo de un minuto. Puede elegir alguna de las diversas opciones de precios para EC2 disponibles. Las opciones incluyen: bajo demanda (según se muestra a continuación), instancias reservadas durante uno y tres años, Savings Plans de capacidad e instancias de spot. Las instancias de spot están disponibles según la capacidad sobrante de EC2 con un descuento de hasta el 90 % en comparación con los precios de las instancias bajo demanda. Para consultar lo que puede ahorrar con los precios de las instancias de spot en comparación con las instancias bajo demanda, filtre por “Tipos de instancias admitidas por EMR” en la página Asistente de instancias de spot.
Amazon EMR en Amazon EKS
Estos precios corresponden a Amazon EMR en clústeres de Amazon EKS.
El precio de Amazon EMR se agrega a los precios de Amazon EKS o cualquier otro servicio utilizado con EKS. Puede ejecutar EKS en AWS mediante EC2 o AWS Fargate. Si está utilizando EC2 (incluidos los grupos de nodos administrados de EKS), solo tiene que pagar los recursos de AWS (por ejemplo, instancias EC2 o volúmenes de EBS) que cree para ejecutar los nodos de trabajo de Kubernetes. Consulte la información de precios detallada en la página de precios de EC2. Si utiliza AWS Fargate, los precios de AWS Amazon Fargate se calculan a partir de la vCPU y los recursos de memoria utilizados desde el momento en que comienza a descargar su imagen de contenedor hasta que el pod de EKS termina, redondeado al segundo más cercano. Se aplica un cargo mínimo de un minuto. Consulte la información de precios detallada en la página de precios de AWS Fargate.
Los precios de Amazon EMR en Amazon EKS se calculan en función de los recursos de memoria y vCPU utilizados desde el momento en que comienza a descargar la imagen de la aplicación de EMR hasta que el pod de EKS termina, redondeado al segundo más cercano. Los precios se basan en los recursos de memoria y vCPU solicitados para la tarea o pod.
Amazon EMR en AWS Outposts
El precio de Amazon EMR en AWS Outposts es el mismo que el de las instancias basadas en la nube de EMR. Consulte la página de precios de AWS Outposts para obtener más detalles sobre los precios de este servicio.
Amazon EMR Serverless
Con EMR Serverless, no hay costos iniciales y solo paga los recursos que usa. Paga la cantidad de recursos de vCPU, memoria y almacenamiento que consumen sus aplicaciones.
Con EMR Serverless, crea una aplicación con una versión de marco de código abierto y enseguida envía trabajos a la aplicación. Como parte de la especificación del trabajo, puede proporcionar el número máximo y mínimo de empleados simultáneos, así como también, la vCPU, la memoria y el almacenamiento para cada empleado. EMR agrega y quita automáticamente empleados de acuerdo con los requerimientos del trabajo dentro de los límites especificados. Las tres dimensiones de computación, memoria y almacenamiento para empleados se pueden configurar de manera independiente. Puede elegir entre 1, 2, 4, 8 o hasta 16 CPU virtuales por trabajador, entre memoria desde 2 hasta 120 GB por empleado en incrementos de 1 a 8 GB. Para las opciones de almacenamiento, puede elegir un almacenamiento estándar de entre 20 GB y 200 GB por trabajador, o elegir un almacenamiento optimizado para la distribución aleatoria de entre 20 GB y 2 TB por trabajador.
Se le cobra por recursos agrupados de CPU virtual, memoria y almacenamiento utilizados desde el momento en que los empleados están listos para ejecutar su carga de trabajo hasta que terminan y se redondea hasta el segundo más cercano con un mínimo de 1 minuto. Si configura su aplicación para que los empleados comiencen al iniciar la aplicación, los empleados solicitados comenzarán cuando inicie su aplicación y terminarán cuando detenga su aplicación o cuando la aplicación esté inactiva.
Nota: Al utilizar imágenes personalizadas, se le cobra por recursos agrupados de vCPU, memoria y almacenamiento desde el momento en que EMR sin servidor comienza a descargar la imagen hasta que se detiene a los empleados y se redondea hasta el segundo más cercano con un mínimo de 1 minuto.
Detalles de precios (computación y memoria)
El precio está determinado por los recursos de vCPU, memoria y almacenamiento utilizados por los empleados, que abarcan todos los empleados.
-
Linux/x86
-
Linux/ARM
-
Linux/x86
-
-
Linux/ARM
-
Detalles de los precios (almacenamiento efímero)
Almacenamiento estándar: de forma predeterminada, hay disponible 20 GB de almacenamiento efímero para todos los empleados. Solo paga el almacenamiento adicional que configure por empleado.
Almacenamiento aleatorio optimizado: paga por todo el almacenamiento configurado por trabajador, incluidos los primeros 20 GB.
Configuraciones de empleado admitidas
CPU | Valores de memoria | Almacenamiento efímero |
1 vCPU | Mínimo 2 GB y máximo 8 GB en incrementos de 1 GB | 20 GB - 200 GB |
2 vCPU | Mínimo 4 GB y máximo 16 GB en incrementos de 1 GB | 20 GB - 200 GB |
4 vCPU | Mínimo 8 GB y máximo 30 GB en incrementos de 1 GB | 20 GB - 200 GB |
8 vCPU | Mínimo 16 GB y máximo 60 GB en incrementos de 4 GB | 20 GB - 200 GB |
16 vCPU | Mínimo 32 GB y máximo 120 GB en incrementos de 8 GB | 20 GB - 200 GB |
Duración
La duración se calcula desde el momento en que un empleado está listo para ejecutar su carga de trabajo hasta el momento en que se detiene, redondeado al segundo más cercano con un mínimo de 1 minuto.
Cargos adicionales
Además, puede contraer costos adicionales si sus aplicaciones usan otros servicios de AWS. Por ejemplo, si su aplicación utiliza Amazon Simple Storage Service (S3) para almacenar y procesar datos, se le cobrará la tarifa estándar de Amazon S3. Si mueve datos de fuentes como Amazon S3, Amazon Relational Database Service (RDS) o Amazon Redshift, se le cobran tarifas estándar de solicitud y transferencia de datos. Si usa Amazon CloudWatch, se cobran tarifas estándar para los registros y los eventos de CloudWatch.
Amazon EMR WAL
Este precio es para Amazon EMR en clústeres de EC2 con aplicaciones Apache HBase que utilizan Amazon EMR WAL. El registro de escritura anticipada de Apache HBase permite registrar todos los cambios en los datos en un almacenamiento basado en archivos. Con Amazon EMR en EC2, puede escribir sus registros de escritura anticipada de Apache HBase en el registro de escritura anticipada (WAL, Write Ahead Log) de Amazon EMR, una capa de almacenamiento administrado duradera que se prolonga más que su clúster. En el caso de que su clúster, o en los casos raros en que la zona de disponibilidad no esté en buen estado o no esté disponible, puede crear un nuevo clúster, dirigirlo al mismo directorio raíz de Amazon S3 y al mismo espacio de trabajo del WAL de Amazon EMR y recuperar automáticamente los datos en el WAL en unos minutos. Para obtener más información, consulte la documentación de Amazon EMR WAL.
Pagará por lo que utilice para EMR WAL. Si tiene un clúster activo que está configurado para usar WAL, se le cobrará por el almacenamiento EMR WAL en función del uso facturado como EMR-WAL-WALHours, escrito como WriteRequestGiB y leído como ReadRequestGiB.
EMR-WAL-WALHours: EMR WAL creará un WAL por cada región de Apache HBase. Una vez finalizado el clúster, si aún hay datos en EMR WAL que no se descargaron en Amazon S3, puede recuperar los datos lanzando un clúster de recuperación o elegir limpiar el WAL al crear un clúster temporal y usar la EMR WAL CLI para eliminar los recursos de EMR WAL. Si no elimina los datos de EMR WAL de forma explícita, EMR WAL conservará los datos y le cobrará por los datos no descargados durante 30 días. A continuación, puede ver un ejemplo.
ReadRequestGiB and WriteRequestGiB: estas dos dimensiones son para las solicitudes de lectura y escritura. Las llamadas a la API de Apache HBase para escribir datos en la tabla de un clúster con EMR WAL se facturan como WriteRequestGiB. Las escrituras EMR WAL se realizarán para todas las escrituras de Apache HBase, como las operaciones `Put`. Las llamadas a la API de Apache HBase para leer datos de su EMR WAL durante las operaciones de recuperación de Apache HBase se facturan como ReadRequestGiB. Las lecturas y escrituras se cobran según el tamaño de los artículos y las facturas de EMR con un mínimo de 1 byte.
Ejemplos de precios
Ejemplo 1: EMR en EC2
Los precios se basan en los precios de US-East-1.
Suponga que ejecuta una aplicación de Amazon EMR implementada en Amazon EC2 y que utiliza una instancia EC2 c4.2xlarge como nodo maestro y dos instancias EC2 c4.2xlarge como nodos principales. Se aplicarán cargos por EMR y por los nodos de EC2. Si ejecuta durante un meso, con el 100 % de utilización durante ese mes y utiliza los precios en diferido para EC2, los cargos serán:
Nodo maestro:
Cargos de EMR = 1 instancia x 0,105 USD por hora x (100/100 utilizados/mes) x 730 horas en un mes = 76,65 USD (costo del nodo maestro de EMR) Cargos de EC2 = 1 instancia x 0,398 USD por hora x 730 horas en un mes = 290,54 USD (costo del nodo maestro de EC2)
Nodos principales:
Cargos de EMR = 2 instancias x 0,105 USD por hora x (100/100 utilizados/mes) x 730 horas en un mes = 153,30 USD (costo del nodo principal de EMR)
Cargos de EC2 = 2 instancias x 0,398 USD por hora x 730 horas en un mes = 581,08 USD (costo del nodo principal de EC2)
Cargos totales = 76,65 USD + 290,54 USD + 153,30 USD + 581,08 USD = 1101,57 USD
Ejemplo 2: EMR en EKS
Los precios se basan en los precios de US-East-1.
Suponga que ejecuta una aplicación de Amazon EMR-Spark implementada en Amazon EKS. En este caso, EKS obtiene su capacidad informática mediante instancias EC2 r5.2xlarge (8 vCPU, 64 GB de RAM). Supongamos que el clúster de EKS tiene 100 nodos, para un total de 800 vCPU y 6400 GB de memoria total. Supongamos que la aplicación utiliza 100 vCPU y 300 GB de memoria durante 30 minutos.
Total de incremento en cargos de Amazon EMR para el trabajo:
Total de incremento en cargos correspondientes a vCPU = (100 * 0,01012 USD * 0,5) = (número de vCPU * tarifa por hora de la vCPU * tiempo de ejecución del trabajo en horas) = 0,506 USD
Total de incremento en cargos correspondientes a memoria = (300 * 0,00111125 USD *0,5) = (cantidad de memoria utilizada * tarifa por hora de GB * tiempo de ejecución del trabajo en horas) = 0,1667 USD
Total de incremento en cargos de EMR para el trabajo de EMR = 0,6727 USD
Costos adicionales
Paga 0,10 USD por hora por cada clúster de Amazon EKS que cree. Puede usar un único clúster de Amazon EKS para ejecutar varias aplicaciones mediante el uso de los espacios de nombres de Kubernetes y las políticas de seguridad de IAM. Puede ejecutar EKS en AWS mediante Amazon EC2 o AWS Fargate.
Si utiliza Amazon EC2 (incluso con los grupos de nodos administrados de Amazon EKS), paga por los recursos de AWS (por ejemplo, instancias EC2 o volúmenes de Amazon EBS) que crea para ejecutar sus nodos de trabajo de Kubernetes. Solo paga por lo que se usa, a medida que se use. No se requieren pagos mínimos ni compromisos iniciales. Consulte la información de precios detallada en la página de precios de EC2.
Si utiliza AWS Fargate, los precios se calculan en función de los recursos de memoria y vCPU utilizados desde el momento en que comienza a descargar la imagen de contenedor hasta que se termina el pod de Amazon EKS, redondeado al segundo más cercano. Se aplica un cargo mínimo de un minuto. Consulte la información de precios detallada en la página de precios de AWS Fargate.
Ejemplo 3: EMR Serverless
Imagine que envía una trabajo Spark a EMR Serverless. Supongamos que el trabajo está configurado para que utilice un mínimo de 25 empleados y un máximo de 75 empleados, cada uno configurado con 4 VCPU y 30 GB de memoria. Tenga en cuenta que no se configuró ningún almacenamiento efímero adicional. Si su trabajo se ejecuta durante 30 minutos con 25 empleados (o 100 vCPU) y se lo escaló automáticamente para que agregue 50 empleados más (200 vCPU más) durante 15 minutos:
Costo total de horas de vCPU = (100 * 0,052624 USD * 0,5) + (200 * 0,052624 USD * 0,25) = (número de vCPU * por tarifa por horas de vCPU * tiempo de ejecución del trabajo en horas) = 5,2624 USD
Total de horas de GB = (750 * 0,0057785 USD * 0,5) + (1500 * 0,0057785 USD * 0,25) = (Total de GB de memoria configurada * por tarifa por horas de GB * tiempo de ejecución del trabajo en horas) = 4,333875 USD
Cargos totales de EMR Serverless = 9,596275 USD
Cargos adicionales: si su aplicación utiliza otros servicios de AWS, como Amazon S3, se le cobran las tarifas estándar de S3.
Ejemplo 4: EMR WAL
Supongamos que ha creado un nuevo clúster de Amazon EMR con Apache HBase y ha decidido realizar una copia de seguridad completa del clúster en la región este de EE. UU. (Virginia del Norte). Debido a que es para una nueva aplicación, no sabe cuáles serán los patrones de tráfico. Para simplificar, suponga que el usuario creó 10 tablas de HBase, incluidas las tablas del sistema, 2 regiones de HBase por tabla, y que cada vez que un usuario interactúa con la aplicación, escribe 1 KiB de datos.
Durante un período de 10 días, recibirá poco tráfico en su aplicación, lo que se traduce en 10 000 escrituras por día. Sin embargo, el día 11, el tráfico de su aplicación aumenta a 2 500 000 escrituras ese día. También decide actualizar simultáneamente su código personalizado en su clúster y programar un tiempo de inactividad nocturno para sus usuarios finales el día 11. Supongamos que esto da como resultado 1 000 000 de lecturas del EMR WAL para las operaciones de recuperación de HBase. Su aplicación escala para ofrecer una experiencia sin inconvenientes a sus usuarios. Su aplicación luego se establece en un patrón de tráfico más regular, con un promedio de 50 000 escrituras por día hasta el final del mes.
La siguiente tabla resume el uso total durante el mes.
Período: (día del mes) | Total de escrituras | Total de lecturas | Uso de EMR WAL |
1 a 10 | 100 000 escrituras (10 000 escrituras x 10 días) | ||
11 | 2 500 000 escrituras | 1 000 000 lecturas | |
12 a 30 | 950 000 escrituras (50 000 escrituras x 19 días) | ||
Total mensual | 3 550 000 escrituras | 1 000 000 lecturas | |
Factura mensual | 0,30 USD (0,0883 USD por GiB de solicitudes de escritura EMR WAL x 3,55 millones de KiB de escrituras / 1 048 576 KiB/GiB) | 0,08 USD (0,0883 USD por GiB de solicitudes de lectura de EMR WAL x 1 millón de KiB de lecturas / 1 048 576 KiB/GiB) | 25,92 USD (0,0018 USD por WAL por hora de uso de WAL de EMR x uso de 10 tablas de HBase x 2 regiones de HBase por tabla de HBase x 1 WAL por región de HBase x 30 días x 24 horas o uso de 14 400 horas de EMR-WAL-WALHours) |
Para el mes, su factura será de 26,52 USD, un total que incluye 0,38 USD para ReadRequestGiB y WriteRequestGiB, y 25,92 USD para EMR-WAL-WALHours.
Recursos de precios adicionales
Calcule fácilmente los costos mensuales en AWS
Contacte con los especialistas de AWS para obtener un presupuesto personalizado
Obtenga acceso instantáneo a la capa gratuita de AWS.
Comience a crear con Amazon EMR en la consola de administración de AWS.