Genentech maximiza el valor de los datos de biomarcadores clínicos con AWS
2022
Cuando la mayoría de la gente piensa en la investigación traslacional, piensa en la traducción del laboratorio a la práctica; informaciones que comienzan en el laboratorio y, finalmente, llegan a la clínica como nuevas terapias o estrategias de tratamiento. Sin embargo, en la era de los macrodatos en las ciencias biológicas, los investigadores también pueden pensar en la «traducción inversa», en la que la información recopilada en la clínica conduce a nuevos descubrimientos en el laboratorio. Sin embargo, obtener estas informaciones requiere que los datos clínicos estén seguros, accesibles, estables y puedan buscarse, lo que a menudo es más fácil decirlo que hacerlo.
«Debe disponer de los datos correctos de alta calidad. Si usted incluye un montón de datos basura en un algoritmo analítico sofisticado, igual va a obtener basura», afirma Christina Lu, directora de gestión de datos e ingeniería en informática de las ciencias del desarrollo de Genentech.
Genentech, miembro del Grupo Roche, es una empresa biotecnológica y farmacéutica líder. Ha acumulado una gran cantidad de datos biológicos del mundo real a partir de años de ensayos clínicos e investigaciones. En 2017, el grupo de ciencias del desarrollo de Genentech implementó una estrategia para optimizar esos datos para la investigación y el desarrollo, con el objetivo de responder a preguntas clave como «¿Cuál es nuestro próximo objetivo farmacológico?» y «¿Cómo pueden los datos de los ensayos clínicos finalizados servir de base para el diseño de ensayos futuros?» Esta estrategia consistía en crear un ecosistema de datos en las plataformas de AWS para almacenar los datos de forma retrospectiva en repositorios con capacidad de búsqueda y poner en marcha herramientas y procesos para la gestión de datos prospectiva en el futuro.
«Los análisis de datos clínicos que solían demorarse semanas, ahora solo les toma unas pocas horas a los investigadores. De este modo, hacemos que cada punto de datos cuente a la hora de entregarle el medicamento adecuado al paciente correcto en el momento justo».
Christina Lu
Directora de Administración de datos e Ingeniería, Informática de Ciencias de Desarrollo, Genentech
La curación de datos permite obtener información clínica
«Estamos en un punto de inflexión en la investigación clínica; ahora, si no se cuenta con los datos, se están perdiendo importantes oportunidades de desarrollar nuevos tratamientos y mejorar la atención a los pacientes», afirma Lu. En el caso de Genentech, muchas de esas oportunidades se centran en analizar los biomarcadores (moléculas medibles del cuerpo humano asociadas a estados biológicos específicos) para comprender los procesos de las enfermedades y los mecanismos moleculares.
El objetivo de «disponer de datos» es cumplir con los estándares de ser FAIR (JUSTOS): encontrables, accesibles, interoperables y reutilizables. Un informe de 2018 estimó que solo la economía de la Unión Europea pierde EUR 10 200 millones al año si utiliza datos de investigación no relacionados con el programa FAIR. Pero tal como están las cosas, los científicos de datos dedican hasta el 80 % de su tiempo a recopilar, limpiar y organizar datos a mano, cuando su experiencia sería mejor utilizar la creación de modelos o la realización de otras tareas especializadas.
«La conservación de datos heredados es costosa, lleva mucho tiempo y no es escalable», afirma Lu. Para ahorrar costes y lograr escalabilidad y eficiencia, Genentech consolidó y transfirió los datos de biomarcadores existentes de su red de organizaciones de investigación por contrato (CRO) a un repositorio centralizado y bien administrado alojado en Amazon Simple Storage Service (Amazon S3), un servicio de almacenamiento de objetos. Esto permite a los científicos de Genentech y a los investigadores externos un acceso simplificado a una mayor cantidad de información, lo que a su vez añade poder estadístico a los estudios que podrían revelar nuevos objetivos para la terapia génica o los medicamentos contra el cáncer.
«Si podemos aplicar estas estrategias de conservación de datos de forma prospectiva, podemos lograr mucho más para impactar en la salud humana», dijo Lu.
Creación de un ecosistema de datos en AWS
«El repositorio de datos de biomarcadores que hemos creado en AWS contiene petabytes de datos de biomarcadores exploratorios y proporciona una interfaz en la que los científicos pueden encontrar fácilmente los datos que necesitan para un estudio específico», afirma Lu.
El repositorio de biomarcadores se almacena en Amazon S3, mientras que Amazon Relational Database Service (Amazon RDS), un servicio gestionado de base de datos relacional, gestiona los metadatos asociados, y Amazon Elasticsearch Service habilita la indexación y la búsqueda rápida. Genentech utiliza Amazon API Gateway para crear API que ofrezcan a los investigadores un acceso seguro y específico para cada estudio, según sea necesario.
«Gracias a esta arquitectura simplificada, los análisis de datos clínicos, que solían tardar semanas, ahora solo requieren unas pocas horas para los investigadores», afirma Lu. «De este modo, hacemos que cada punto de datos cuente a la hora de entregarle el medicamento adecuado al paciente correcto en el momento justo».
Más información
Descubra cómo AWS está transformando la gestión de datos para otras empresas de ciencias biológicas.
Acerca de Genentech
Genentech, miembro del grupo Roche, es una empresa biotecnológica dedicada a desarrollar nuevos tratamientos para enfermedades graves y potencialmente mortales.
Beneficios de AWS
- Petabytes de datos de biomarcadores exploratorios almacenados de forma segura
- Datos seleccionados para que sean localizables, accesibles, interoperables y reutilizables (FAIR), tanto retrospectiva como prospectivamente
Servicios de AWS utilizados
Amazon RDS
Con Amazon Relational Database Service (Amazon RDS), es sencillo configurar, utilizar y escalar una base de datos relacional en la nube.
Amazon S3
Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en el sector.
Amazon API Gateway
Amazon API Gateway es un servicio completamente administrado que facilita a los desarrolladores la creación, la publicación, el mantenimiento, el monitoreo y la protección de API a cualquier escala.
AWS Lambda
AWS Lambda es un servicio de computación que le permite crear aplicaciones que respondan rápidamente a la información y los eventos nuevos.
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) ofrece la plataforma de computación más amplia y profunda, con más de 500 instancias y la posibilidad de elegir el procesador, el almacenamiento, la red, el sistema operativo y el modelo de compra de vanguardia, en función de lo que mejor se ajuste a las necesidades que plantea la carga de trabajo.
Amazon Elasticsearch Service
Amazon Elasticsearch Service es un servicio completamente administrado que facilita el despliegue, la protección y la ejecución de Elasticsearch a escala de manera rentable.
Introducción
Cada día crece el número de empresas de todos los tamaños y sectores que consiguen transformar sus negocios gracias a AWS. Contáctese con nuestros expertos e inicie hoy mismo su proceso de traspaso a la nube de AWS.