Logotipo de la empresa Genentech

Genentech maximiza el valor de los datos de biomarcadores clínicos con AWS

2022

Cuando la mayoría de la gente piensa en la investigación traslacional, piensa en la traducción del laboratorio a la práctica; informaciones que comienzan en el laboratorio y, finalmente, llegan a la clínica como nuevas terapias o estrategias de tratamiento. Sin embargo, en la era de los macrodatos en las ciencias biológicas, los investigadores también pueden pensar en la «traducción inversa», en la que la información recopilada en la clínica conduce a nuevos descubrimientos en el laboratorio. Sin embargo, obtener estas informaciones requiere que los datos clínicos estén seguros, accesibles, estables y puedan buscarse, lo que a menudo es más fácil decirlo que hacerlo. 

«Debe disponer de los datos correctos de alta calidad. Si usted incluye un montón de datos basura en un algoritmo analítico sofisticado, igual va a obtener basura», afirma Christina Lu, directora de gestión de datos e ingeniería en informática de las ciencias del desarrollo de Genentech. 

Genentech, miembro del Grupo Roche, es una empresa biotecnológica y farmacéutica líder. Ha acumulado una gran cantidad de datos biológicos del mundo real a partir de años de ensayos clínicos e investigaciones. En 2017, el grupo de ciencias del desarrollo de Genentech implementó una estrategia para optimizar esos datos para la investigación y el desarrollo, con el objetivo de responder a preguntas clave como «¿Cuál es nuestro próximo objetivo farmacológico?» y «¿Cómo pueden los datos de los ensayos clínicos finalizados servir de base para el diseño de ensayos futuros?» Esta estrategia consistía en crear un ecosistema de datos en las plataformas de AWS para almacenar los datos de forma retrospectiva en repositorios con capacidad de búsqueda y poner en marcha herramientas y procesos para la gestión de datos prospectiva en el futuro.

Simposio HCLS 2021: Genentech, miembro del Grupo Roche (12:46)
kr_quotemark

«Los análisis de datos clínicos que solían demorarse semanas, ahora solo les toma unas pocas horas a los investigadores. De este modo, hacemos que cada punto de datos cuente a la hora de entregarle el medicamento adecuado al paciente correcto en el momento justo».

Christina Lu
Directora de Administración de datos e Ingeniería, Informática de Ciencias de Desarrollo, Genentech

La curación de datos permite obtener información clínica

«Estamos en un punto de inflexión en la investigación clínica; ahora, si no se cuenta con los datos, se están perdiendo importantes oportunidades de desarrollar nuevos tratamientos y mejorar la atención a los pacientes», afirma Lu. En el caso de Genentech, muchas de esas oportunidades se centran en analizar los biomarcadores (moléculas medibles del cuerpo humano asociadas a estados biológicos específicos) para comprender los procesos de las enfermedades y los mecanismos moleculares.

El objetivo de «disponer de datos» es cumplir con los estándares de ser FAIR (JUSTOS): encontrables, accesibles, interoperables y reutilizables. Un informe de 2018 estimó que solo la economía de la Unión Europea pierde EUR 10 200 millones al año si utiliza datos de investigación no relacionados con el programa FAIR. Pero tal como están las cosas, los científicos de datos dedican hasta el 80 % de su tiempo a recopilar, limpiar y organizar datos a mano, cuando su experiencia sería mejor utilizar la creación de modelos o la realización de otras tareas especializadas.

«La conservación de datos heredados es costosa, lleva mucho tiempo y no es escalable», afirma Lu. Para ahorrar costes y lograr escalabilidad y eficiencia, Genentech consolidó y transfirió los datos de biomarcadores existentes de su red de organizaciones de investigación por contrato (CRO) a un repositorio centralizado y bien administrado alojado en Amazon Simple Storage Service (Amazon S3), un servicio de almacenamiento de objetos. Esto permite a los científicos de Genentech y a los investigadores externos un acceso simplificado a una mayor cantidad de información, lo que a su vez añade poder estadístico a los estudios que podrían revelar nuevos objetivos para la terapia génica o los medicamentos contra el cáncer.

«Si podemos aplicar estas estrategias de conservación de datos de forma prospectiva, podemos lograr mucho más para impactar en la salud humana», dijo Lu.

Creación de un ecosistema de datos en AWS

«El repositorio de datos de biomarcadores que hemos creado en AWS contiene petabytes de datos de biomarcadores exploratorios y proporciona una interfaz en la que los científicos pueden encontrar fácilmente los datos que necesitan para un estudio específico», afirma Lu.

El repositorio de biomarcadores se almacena en Amazon S3, mientras que Amazon Relational Database Service (Amazon RDS), un servicio gestionado de base de datos relacional, gestiona los metadatos asociados, y Amazon Elasticsearch Service habilita la indexación y la búsqueda rápida. Genentech utiliza Amazon API Gateway para crear API que ofrezcan a los investigadores un acceso seguro y específico para cada estudio, según sea necesario.

«Gracias a esta arquitectura simplificada, los análisis de datos clínicos, que solían tardar semanas, ahora solo requieren unas pocas horas para los investigadores», afirma Lu. «De este modo, hacemos que cada punto de datos cuente a la hora de entregarle el medicamento adecuado al paciente correcto en el momento justo».

Más información


Acerca de Genentech

Genentech, miembro del grupo Roche, es una empresa biotecnológica dedicada a desarrollar nuevos tratamientos para enfermedades graves y potencialmente mortales.

Beneficios de AWS

  • Petabytes de datos de biomarcadores exploratorios almacenados de forma segura
  • Datos seleccionados para que sean localizables, accesibles, interoperables y reutilizables (FAIR), tanto retrospectiva como prospectivamente


Servicios de AWS utilizados

Amazon RDS

Con Amazon Relational Database Service (Amazon RDS), es sencillo configurar, utilizar y escalar una base de datos relacional en la nube.

Más información »

Amazon S3

Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en el sector.

Más información »

Amazon API Gateway

Amazon API Gateway es un servicio completamente administrado que facilita a los desarrolladores la creación, la publicación, el mantenimiento, el monitoreo y la protección de API a cualquier escala.

Más información »

AWS Lambda

AWS Lambda es un servicio de computación que le permite crear aplicaciones que respondan rápidamente a la información y los eventos nuevos.

Más información »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) ofrece la plataforma de computación más amplia y profunda, con más de 500 instancias y la posibilidad de elegir el procesador, el almacenamiento, la red, el sistema operativo y el modelo de compra de vanguardia, en función de lo que mejor se ajuste a las necesidades que plantea la carga de trabajo.

Más información »

Amazon Elasticsearch Service

Amazon Elasticsearch Service es un servicio completamente administrado que facilita el despliegue, la protección y la ejecución de Elasticsearch a escala de manera rentable.

Más información »


Introducción

Cada día crece el número de empresas de todos los tamaños y sectores que consiguen transformar sus negocios gracias a AWS. Contáctese con nuestros expertos e inicie hoy mismo su proceso de traspaso a la nube de AWS.