Illumina lleva la genómica de las muestras a las respuestas mediante AWS
2021
En la última década, la genómica ha pasado de ser un área de investigación especializada a una poderosa herramienta clínica que ha dado paso a una nueva era de atención de salud centrada en el paciente. La secuenciación y el análisis del genoma se han vuelto más sencillos, más baratos y más completos, lo que hace que los médicos puedan pedir pruebas genéticas para pacientes individuales y que los investigadores puedan examinar miles de muestras para establecer conexiones entre la variación genética y las enfermedades humanas. Mientras que el primer genoma humano tardó décadas en secuenciarse, los científicos pueden ahora secuenciar eficazmente un genoma humano completo en menos de 24 horas.
La misión de Illumina es liberar el poder del genoma para mejorar la salud humana. Un socio de AWS , la empresa ha sido una fuerza impulsora del avance tecnológico en genómica, y ha pasado de ser un proveedor de instrumentos de secuenciación a ser un proveedor de soluciones genómicas completas y a implementar soluciones de software en Amazon Web Services (AWS) desde 2013. Las soluciones de software respaldadas por AWS de Illumina están reduciendo las barreras de entrada y ayudando a los investigadores a generar nuevos descubrimientos cada día, al impulsar el descubrimiento de fármacos y más.
“El sector de la genómica se está expandiendo en todas las direcciones, desde las pruebas directas al consumidor hasta las vacunas personalizadas contra el cáncer”, dice Susan Tousi, directora comercial de Illumina. “El objetivo de Illumina es democratizar el acceso a las tecnologías genómicas en todo el mundo; nos hemos asociado con AWS desde el principio para dar a nuestros clientes las respuestas que necesitan. A lo largo de la última década, hemos ampliado nuestra cartera de software disponible en AWS para ofrecer un paquete de soluciones integral y sin fisuras que puede implementarse de forma inmediata o personalizarse para satisfacer necesidades específicas”.
Estamos ofreciendo un flujo de trabajo completo, desde la preparación de la muestra hasta el análisis terciario, en el entorno seguro de AWS que permite agregar y analizar toda la información generada antes y después de la secuenciación”.
Rami Mehio
Vicepresidente de bioinformática y software de instrumentos, Illumina
Navegar de la muestra a la respuesta
Un flujo de trabajo completo de genómica de nueva generación comienza con la recolección, preparación y secuenciación de las muestras, pero eso es solo el principio. Después viene el trabajo pesado de la bioinformática, que empieza con el control de calidad de las lecturas en bruto, el preprocesamiento de los datos y la alineación. A continuación, los científicos pueden pasar a los análisis secundarios, como la llamada de variantes, y, por último, realizar análisis terciarios avanzados en función de sus intereses. Estos análisis terciarios pueden incluir anotaciones filogenéticas, asociaciones genotipo-fenotipo y mucho más. Para los investigadores y médicos que no son expertos en bioinformática, realizar cada paso en una plataforma distinta puede resultar rápidamente abrumador.
Illumina agiliza todo este flujo de trabajo genómico para los clientes al ofrecer soluciones integradas para cada paso. Desde el principio, BaseSpaceTM Clarity LIMS (Sistemas de gestión de información de laboratorio) ayuda a los clientes de genómica a realizar un seguimiento de las muestras y a optimizar los flujos de trabajo de secuenciación. Los instrumentos de secuenciación pueden cargar datos directamente en la plataforma Illumina Connected Analytics (ICA) , donde los usuarios pueden administrar conjuntos de datos y aprovechar las herramientas analíticas dentro de la plataforma en AWS. La plataforma DRAGENTM Bio-IT proporciona resultados de análisis secundarios precisos y ultrarrápidos. Al mismo tiempo, BaseSpace Correlation Engine integra los conjuntos de datos y las consultas de los individuos en un repositorio de conjuntos de datos públicos de acceso abierto y controlado para permitir una amplia variedad de análisis terciarios.
Los datos de estas plataformas se almacenan en Amazon Simple Storage Service (Amazon S3), un servicio de almacenamiento de objetos escalable. Los clientes de Illumina potencian y aceleran drásticamente sus análisis con DRAGEN, que se ejecuta en Amazon Elastic Compute Cloud (Amazon EC2), un servicio web que proporciona capacidad informática segura y redimensionable en la nube.
“Estamos ofreciendo un flujo de trabajo completo, desde la preparación de la muestra hasta el análisis terciario, en el entorno seguro de AWS que permite agregar y analizar toda la información generada antes y después de la secuenciación”, afirma Rami Mehio, vicepresidente de software y bioinformática de Illumina. “Eso es muy potente para los clientes que quieren hacer un seguimiento de las muestras a lo largo del tiempo, cruzar sus datos con bases de datos disponibles públicamente y recopilar información para obtener resultados más rápidos”.
Mientras que los usuarios avanzados tienen la opción de personalizar herramientas como ICA y DRAGEN para realizar investigaciones de nicho, Illumina también ofrece soluciones integrales en la nube con funcionalidades listas para usar para usos específicos. Entre ellos se encuentran el paquete de software TruSightTM, una solución de software de análisis de variantes para descubrir información sobre enfermedades raras, y TruSight Oncology 500, un ensayo de secuenciación ajustado para analizar tumores e identificar biomarcadores inmunológicos-oncológicos.
“Confiamos en la fuerza de las herramientas de AWS como columna vertebral que nos permite centrarnos en el diseño de algoritmos específicos para la genómica”, dice Mehio. “A medida que cambian las necesidades de los investigadores y los médicos, podemos implementar fácilmente nuevas funciones y versiones de nuestros productos”.
Reducción de costos gracias al ahorro en AWS
Desde su creación, Illumina ha reducido el costo de la tecnología genómica a un ritmo que supera la Ley de Moore. La secuenciación de un solo genoma humano costaba más de 100 000 000 USD en 2001; 20 años después, puede costar tan solo USD 600.
“Queremos democratizar el acceso a las tecnologías genómicas; trasladar el ahorro de costes a nuestros clientes es una parte importante de este esfuerzo”, dice Tousi. “El costo no debería ser un factor decisivo para la investigación o las aplicaciones clínicas: la gente debería realizar la secuenciación y el análisis basándose exclusivamente en cómo prevén poder utilizar los datos”.
Amazon S3 Storage Classes puede personalizarse en función de las diferentes necesidades de datos, lo que facilita a Illumina la optimización para conseguir el máximo ahorro de costos. Al almacenar petabytes de datos a los que se accede con poca frecuencia en Amazon S3 Glacier Deep Archive, los clientes de Illumina ahorran más del 90 % en costos de almacenamiento. Del mismo modo, DRAGEN se ejecuta en instancias F1 de Amazon EC2, que ofrecen una computación asequible y acelerada que puede soportar los procesos paralelos que Illumina necesita. Las instancias F1 ofrecen aceleración de hardware personalizable con matrices de puertas programables en campo (FPGA) de DRAGEN. Para escalar DRAGEN en instancias F1, la compañía utilizó AWS Batch, un servicio de procesamiento por lotes totalmente administrado que planifica, programa y ejecuta cargas de trabajo de informática por lotes.
“AWS nos ofrece opciones para optimizar la velocidad, la flexibilidad y el costo, y atender a los casos de uso y las necesidades del cliente final”, dice Mehio. “Algunos usuarios pueden querer realizar análisis genéticos lo más rápido posible, mientras que algunos usuarios académicos pueden optar por sacrificar algo de velocidad para reducir los costos y ahorrar dinero en la investigación. Al aprovechar diferentes tipos de instancias de F1 y opciones de almacenamiento, nuestros usuarios mantienen la flexibilidad y la capacidad de escalar verticalmente y reducir verticalmente según sea necesario”.
Illumina también reduce los costos para los clientes ejecutando muchos de los trabajos informáticos de sus plataformas en instancias de spot de Amazon EC2, que están disponibles con un descuento de hasta el 90 % en comparación con los precios bajo demanda. “Nuestros clientes han utilizado cientos de miles de horas de instancias de spot solo en el último año, lo que les ha supuesto un importante ahorro de costos”, dice Tousi.
El ahorro de costos y las ventajas técnicas pueden ir de la mano. Illumina ha migrado recientemente el motor de correlación de análisis terciario a AWS, ahorrando costos y multiplicando por seis las canalizaciones de ingesta de datos para que la base de conocimientos crezca más rápido y sea más potente.
Soluciones seguras para escalar la genómica mundial
Los datos genómicos humanos pueden estar asociados a información de salud muy personal, y las violaciones de datos son un riesgo cada vez mayor para las organizaciones de cuidado de la salud de todo el mundo. Por ello, la seguridad es una consideración primordial para Illumina y sus clientes, muchos de los cuales deben cumplir normas de administración de datos cada vez más estrictas.
“La seguridad es el trabajo cero: está en el centro de todo lo que hacemos”, dice Tousi. “En la base, podemos contar con el Modelo de responsabilidad compartida de AWS para asegurar que nuestra infraestructura de nube subyacente mantiene la seguridad y la conformidad de nivel empresarial. Al aprovechar las Regiones de Amazon EC2 a nivel global, estamos llevando la computación a los datos y apoyamos a los clientes en todas las regiones al tiempo que les permite mantener la soberanía de los datos”.
AWS respalda miles de estándares de seguridad y certificaciones de conformidad, como HIPAA, GDPR, ISO 27001 e ISO 13485, lo que ayuda a los clientes a satisfacer los requisitos de conformidad en todos sus flujos de trabajo de genómica. Illumina ofrece a los clientes una tranquilidad adicional al ofrecer la administración de datos en Amazon Virtual Private Cloud (Amazon VPC), que lanza otros recursos de AWS en una red virtual personalizada y lógicamente aislada que separa los datos de un cliente de los de otro.
Esta escalabilidad e implementación globales facilitan una colaboración significativa tanto para proyectos a largo plazo como para una respuesta rápida a las crisis. Investigadores de todo el mundo procesaron más de 371 000 muestras relacionadas con el COVID-19 en las aplicaciones BaseSpace COVID-19 de Illumina en 2020 y la primera mitad de 2021. “Si los clientes solo pudieran hacerlo en las instalaciones, nos habríamos encontrado con serias limitaciones. Por lo tanto, la nube fue clave para impulsar la respuesta global a la pandemia a ese nivel”, dice Tousi.
Creación del futuro de la genómica y la biotecnología
Con el aumento de las iniciativas de genética de grandes poblaciones y la ampliación del acceso a potentes soluciones de software de análisis como ICA, Illumina está adoptando plenamente el poder de “big data” en la genómica para ayudar a los clientes a extraer una rica información a partir de volúmenes masivos de datos de secuenciación. Estos proyectos impulsarán una nueva era de genómica personalizada y permitirán a los investigadores establecer conexiones entre los genes y los resultados de salud que no eran evidentes en muestras más pequeñas.
Las plataformas de Illumina también están ayudando a la investigación a transitar sin problemas hacia un futuro multiómico. La línea de ARN unicelular de DRAGEN, basado en la nube, por ejemplo, permite a los científicos anotar la expresión génica en células individuales. Con la aceleración DRAGEN, la plataforma puede procesar tres muestras celulares simultáneamente en paralelo en aproximadamente 53 minutos.
“Con ICA, DRAGEN y otras herramientas implementadas en AWS, estamos proporcionando soluciones que permiten a los clientes agregar cualquier tipo de datos, incluyendo NGS y datos de salud, para extraer información novedosa de esas grandes cohortes y mejorar la salud humana a escala”, dice Mehio.
Más información
Conozca cómo AWS está apoyando a otras organizaciones líderes en ciencias de la vida en su intento de mejorar la salud humana.
Sobre Illumina
Illumina desarrolla, fabrica y comercializa sistemas integrados para analizar la variación genética y la función biológica.
Beneficios de AWS
- Acceso facilitado a flujos de trabajo racionalizados, unificados y personalizables para el análisis de muestras
- Reducción drástica de los costos de computación y almacenamiento con instancias de spot de Amazon EC2 y Amazon S3 Glacier
- Implementación de una sólida cartera de soluciones genómicas en todo el mundo en un entorno seguro y conforme a las normas
- Investigación acelerada y fomento de la colaboración de clientes de todo el mundo para procesar más de 371 000 muestras relacionadas con la COVID-19
Servicios de AWS utilizados
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) es un servicio web que proporciona capacidad informática en la nube segura y de tamaño modificable. Está diseñado para facilitar a los desarrolladores la informática en la nube a escala web.
Amazon S3
Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en el sector.
Nube virtual privada AWS
Amazon Virtual Private Cloud (Amazon VPC) es un servicio que permite lanzar recursos de AWS en una red virtual aislada de forma lógica que usted defina.
Instancias de spot de Amazon EC2
Las instancias de spot de Amazon EC2 permiten aprovechar la capacidad sin usar de EC2 en la nube de AWS. Las instancias de spot están disponibles con un descuento de hasta el 90 % en comparación con los precios bajo demanda.
Introducción
Cada día crece el número de empresas de todos los tamaños y sectores que consiguen transformar sus negocios gracias a AWS. Contacte con nuestros expertos e inicie hoy mismo su proceso de traspaso a la nube de AWS.