El Centro de biología cuantitativa lleva a cabo nuevas investigaciones de genómica de forma más rápida con AWS
Análisis de las diferencias de expresión génica
Todos los días, los investigadores del Centro de biología cuantitativa (QBiC) utilizan plataformas informáticas (HPC) de alto rendimiento para analizar datos genómicos y determinar, por ejemplo, diferencias de expresión génica entre tejidos normales y afectados. QBiC tiene su sede en la Universidad de Tubinga, en Alemania, y apoya la investigación genómica dentro de la universidad y en otras organizaciones de investigación de todo el mundo.
Las cargas de trabajo HPC de QBiC se alojan principalmente en un centro de datos local. Sin embargo, como el volumen de datos de investigación sigue creciendo rápidamente, QBiC prevé dificultades para escalar de forma rápida y rentable. “A medida que nuestro volumen de datos aumentaba, nos dimos cuenta de que necesitábamos mucha más capacidad de cálculo de la que podía ofrecer nuestra infraestructura local”, afirma Alex Peltzer, científico sénior de investigación bioinformática en QBiC. “Los investigadores que utilizan nuestra plataforma también necesitaban un mejor rendimiento, para poder analizar más datos y completar su investigación más rápidamente”. El mayor valor de QBiC es el tratamiento de los datos según los principios de los datos FAIR: localizables, accesibles, interoperables y reproducibles. “Cumplir los requisitos de procesamiento de FAIR implica la necesidad de escalar de forma eficiente, algo que no podíamos hacer fácilmente”, afirma Peltzer.
“La configuración evaluada puede reducir potencialmente nuestro tiempo de investigación genómica en un 50 % debido a la automatización y orquestación que obtenemos con AWS Batch”.
Alex Peltzer, científico sénior de Investigación bioinformática, Centro de biología cuantitativa, Universidad de Tubinga
-
Sobre el Centro de Biología Cuantitativa
-
Beneficios
-
Servicios de AWS utilizados
-
Sobre el Centro de Biología Cuantitativa
-
El Centro de biología cuantitativa (QBiC) es una unidad de investigación que forma parte de la Universidad de Tubinga en Alemania. QBiC aloja una plataforma de investigación HPC para que los investigadores internos y externos analicen y procesen los datos genómicos.
-
Beneficios
-
- Puede procesar hasta 100 000 muestras genéticas en un solo proyecto de investigación
- Reduce el tiempo de investigación genómica en un 50 %
- Acelera la investigación de las diferencias de expresión genética
- Reduce el costo del análisis
-
Servicios de AWS utilizados
Aprovechamiento de una plataforma de investigación HPC y de la computación en la nube basada en AWS
La necesidad de escalabilidad y rendimiento de QBiC lo llevó a la nube de Amazon Web Services (AWS). “Sabíamos que la nube podía satisfacer nuestras necesidades, y AWS ofrece una tecnología más avanzada que los otros proveedores que examinamos”, dice Peltzer. AWS también se integra con los marcos Nextflow y nf-core, que admiten flujos de trabajo científicos escalables mediante contenedores de software. “AWS funciona muy bien con Nextflow, y ningún otro proveedor de la nube podría hacerlo”, dice Peltzer. “Sin esa integración, habríamos tenido que invertir mucho tiempo y dinero en reescribir las funciones de programación nosotros mismos”.
QBiC eligió aprovechar las instancias de Amazon Elastic Compute Cloud (Amazon EC2), equipadas con procesadores Intel Xeon Scalable, para su infraestructura local existente. QBiC ahora ejecuta Nextflow en AWS para la gestión del flujo de trabajo y utiliza AWS Batch para la automatización y orquestación de los trabajos por lotes de Nextflow.
La organización también está utilizando Amazon EC2 Spot Instances para reducir los costos de análisis. Las instancias de spot de EC2 son capacidad de cómputo de reserva en AWS disponible con descuentos de hasta el 90 % en comparación con el precio de las instancias bajo demanda. “Estamos reduciendo el costo de los análisis mediante el uso de Amazon EC2 Spot Instances”, afirma Peltzer. “Eso representa un ahorro de costos que podemos destinar a la investigación”.
Procesamiento de 100 000 muestras genéticas
Al ejecutar sus cargas de trabajo de análisis en Nextflow en AWS, QBiC puede aprovechar el procesamiento paralelo y puede escalar bajo demanda. “Con AWS, podemos escalar nuestra plataforma HPC hacia arriba o hacia abajo rápidamente, ya sea procesando 30 muestras genéticas o 100 000 muestras en un proyecto de investigación”, dice Peltzer. Además, QBiC y sus clientes de investigación están experimentando una mayor fiabilidad en los trabajos de secuenciación genómica. “Ya no tenemos que preocuparnos por las interrupciones del sistema y la ralentización del rendimiento porque haya demasiada gente haciendo cola para procesar los trabajos”, dice Peltzer. Aunque la configuración está funcionando actualmente en proyectos de investigación técnica, los resultados actuales apuntan a un posible uso en producción.
Reducción del tiempo de investigación genómica en un 50 %
En sus proyectos de evaluación comparativa, QBiC ha reducido su tiempo de investigación y procesamiento de todos los trabajos utilizando Amazon EC2 y AWS Batch, tanto para la universidad como para las organizaciones de investigación privadas que comparten recursos con el centro. “La configuración evaluada puede reducir potencialmente nuestro tiempo de investigación genómica en un 50 % debido a la automatización y orquestación que obtenemos con AWS Batch”, dice Peltzer. “Podemos hacer las cosas mucho más rápido en comparación con nuestro entorno local”.
Como resultado, QBiC y otras instituciones de investigación de toda Alemania ven un enorme potencial en el uso de las aplicaciones de la nube de AWS. La infraestructura distribuida puede ayudar a QBiC a completar más rápidamente la investigación que analiza la expresión de los genes para encontrar mutaciones que puedan estar implicadas en el cáncer. “Al realizar la secuenciación genómica en AWS, estamos observando los datos de plantas y animales para ver cómo los tratamientos experimentales cambian la expresión de ciertos genes”, dice Peltzer.
QBiC seguirá evaluando el uso de los servicios de AWS a medida que aumenten sus necesidades de investigación. “Esperamos formar parte de uno de los mayores centros públicos de secuenciación genómica de Alemania en los próximos años”, afirma Peltzer. “AWS nos ayudará a hacerlo posible”.
Más información
Para obtener más información, visite aws.amazon.com/hpc.