Janssen Pharmaceuticals mejora la precisión de la tecnología de machine learning en un 21 % con Amazon SageMaker

2022

Janssen Pharmaceuticals (Janssen), un grupo de compañías farmacéuticas que forman parte de Johnson & Johnson desde 1961, utiliza el machine learning (ML) para comprender mejor la experiencia de los pacientes que reciben los tratamientos de Janssen. Para automatizar el flujo de trabajo de implementación y crear una mejor interfaz entre los entornos de desarrollo y producción, los científicos de datos de Janssen utilizaron Amazon Web Services (AWS). Con los servicios de AWS, incluido Amazon SageMaker, un servicio de ML que se puede utilizar para crear, entrenar e implementar modelos de ML para prácticamente cualquier caso de uso, Janssen implementó un proceso automatizado de operaciones de ML (MLOps) que mejoró la precisión de las predicciones de los modelos un 21 por ciento e incrementó la velocidad de la ingeniería de características aproximadamente un 700 por ciento, lo que ayudó a Janssen a reducir los costos al tiempo que incrementaron la eficiencia.

Challenging research. Determined experienced scientist working with her microscope and wearing a uniform
kr_quotemark

En lugar de organizar cada paso del proceso de forma secuencial, podríamos paralelizar los trabajos de preparación de datos e ingeniería de características y la forma en que se orquestan mediante el uso combinado de AWS Glue y AWS Step Functions”.  

Jenna Eun
Principal Data Scientist, Janssen Pharmaceuticals

Búsqueda de la automatización en MLOps para acelerar la investigación

La cartera de productos de Janssen abarca una amplia gama de áreas terapéuticas, como la inmunología, las enfermedades infecciosas, la neurociencia y la oncología. “Es importante brindar a los pacientes la mejor atención a lo largo de sus complejos procesos de tratamiento, por lo que utilizamos la inteligencia artificial y el machine learning para entender cómo las personas experimentan la terapia y satisfacer mejor las necesidades de los pacientes a lo largo de su proceso patológico”, afirma Jenna Eun, principal data scientist de Janssen.

Para acelerar el impacto de las soluciones basadas en ML en la experiencia del paciente, el equipo Business Technology Commercial Data Sciences de Janssen decidió centrarse en MLOps, un conjunto de prácticas cuyo objetivo es implementar y mantener de manera fiable y eficiente los modelos de ML en producción, aumentar la automatización y cumplir con los requisitos empresariales y tecnológicos. “Nuestro objetivo en términos de MLOps es facilitar la experimentación y el seguimiento del rendimiento de los modelos a lo largo del tiempo”, afirma Eun. “La experimentación sencilla y la exploración exhaustiva del espacio de los hiperparámetros son importantes para que podamos establecer la confianza en los modelos de machine learning”.

Janssen decidió formar un equipo multifuncional para crear un proceso de MLOps automatizado debido a la importancia de alinear sus necesidades tecnológicas con los requisitos de seguridad internos. “Como los procesos que creamos utilizan datos de atención médica, tenemos medidas de seguridad y privacidad rigurosas que debemos seguir de cerca a medida que desarrollamos e implementamos nuestras soluciones tecnológicas”, afirma Eun. A partir de finales de 2020, el equipo Business Technology Commercial Data Sciences de Janssen y el equipo Technology CloudX de Johnson & Johnson trabajaron en colaboración con el equipo solutions architecture de Amazon SageMaker y AWS Professional Services, un equipo global de expertos que puede ayudar a las empresas a lograr los resultados empresariales deseados en AWS.

Aumento de la velocidad y la precisión del ML en AWS

En colaboración con el equipo solutions architecture de Amazon SageMaker y AWS Professional Services, el equipo Business Technology Commercial Data Sciences de Janssen y el equipo Technology CloudX de Johnson & Johnson automatizaron los módulos de preparación de datos e ingeniería de características en menos de 3 meses. La ingeniería de características es el proceso de crear variables de entrada a partir de los datos de los pacientes para el entrenamiento de modelos de ML supervisados. Al automatizar estos pasos, los equipos pudieron acelerar la velocidad de preparación de los datos en aproximadamente un 600 por ciento y la velocidad de la ingeniería de características en aproximadamente un 700 por ciento. Janssen lo logró con AWS Step Functions, un servicio de flujo de trabajo visual con poco código que simplifica la secuencia de los pasos necesarios para recopilar, procesar y normalizar los datos de origen. AWS Step Functions coordina los trabajos en AWS Glue, un servicio de integración de datos sin servidor que cuenta con la funcionalidad de sincronizar sin esfuerzo los entornos de desarrollo y producción para una implementación más rápida de soluciones de ML experimentadas y optimizadas. “En lugar de organizar cada paso del proceso de forma secuencial, pudimos paralelizar los trabajos de preparación de datos e ingeniería de características y la forma en que se orquestan mediante el uso combinado de AWS Glue y AWS Step Functions”, afirma Eun. “Eso nos facilitó conectar sin problemas los entornos de desarrollo y producción, de modo que cualquier cosa con la que estemos experimentando se pueda convertir rápidamente en trabajos de AWS Glue, lanzados por AWS Step Functions”.

Tras implementar la solución de MLOps en AWS, Janssen aumentó la precisión de su modelado predictivo en un 21 por ciento. “Como la canalización de datos es más automatizada y lleva menos tiempo, podemos dedicar más tiempo al rendimiento del modelo”, afirma Eun. La optimización de hiperparámetros es fundamental para mejorar la precisión del modelo de ML. Una vez que el equipo de Janssen tiene los modelos y los datos definidos, utiliza Amazon SageMaker para ajustar automáticamente un modelo mediante la adaptación de miles de combinaciones de parámetros de algoritmos para obtener las predicciones más precisas que el modelo puede producir. Esa automatización, combinada con su algoritmo de optimización bayesiana, reduce sustancialmente el tiempo de búsqueda de parámetros. “Confiamos más en el modelo de ML resultante porque hicimos una búsqueda exhaustiva de hiperparámetros”, afirma Eun.

El equipo de Janssen y el equipo Technology CloudX de Johnson & Johnson pudieron documentar este proyecto y compartirlo con otros equipos de Johnson & Johnson que participan en proyectos de ML similares. Compartir el aprendizaje ayuda a acelerar los proyectos que también deben cumplir con las políticas de seguridad de Johnson & Johnson y a fomentar una cultura de MLOps en toda la organización. “Al crear un patrón para que otros lo siguieran, demostramos cómo conectar diferentes servicios de AWS para crear una canalización completa de ML dentro del entorno de Johnson & Johnson”, afirma Eun. “Poder crear y aumentar la eficiencia en partes de nuestro anterior proceso de desarrollo e implementación de ML nos abrió los ojos a la flexibilidad y la escalabilidad que podemos tener”.

Mejora de los tratamientos para pacientes de todo el mundo

La solución de MLOps de Janssen permite ofrecer soluciones de ciencia de datos a escala. Eun explica: “A medida que implementamos nuestra solución en el mundo real y mostramos cómo puede marcar la diferencia, prevemos escalarla a regiones geográficas más grandes y aplicarla a otros casos de uso empresarial en Johnson & Johnson”.


Acerca de Janssen Pharmaceuticals

Janssen Pharmaceuticals, una compañía de Johnson & Johnson desde 1961, es una organización de investigación y desarrollo que se centra en mejorar los resultados de los pacientes con enfermedades graves en seis áreas terapéuticas, como la salud cardiovascular, la inmunología, la neurociencia y la oncología.

Beneficios de AWS

  • Aumento de la velocidad de preparación de datos en aproximadamente un 600 %
  • Aumento de la velocidad de ingeniería de características en aproximadamente un 700 %
  • Mejora de la precisión de los modelos de ML en un 21 %
  • Establecimiento de una arquitectura de referencia de MLOps estándar para otros equipos de Johnson & Johnson

Servicios de AWS utilizados

Amazon SageMaker

Amazon SageMaker ayuda a los científicos de datos y a los desarrolladores a preparar, crear, entrenar e implementar con rapidez modelos de machine learning (ML) de alta calidad al poner a disposición un amplio conjunto de capacidades especialmente creadas para ML.

Más información »

AWS Step Functions

AWS Step Functions es un servicio de flujos de trabajo visual y que requiere poco código que los desarrolladores usan para crear aplicaciones distribuidas, automatizar procesos de TI y empresariales y crear canalizaciones de datos y machine learning mediante servicios de AWS.

Más información »

AWS Glue

AWS Glue es un servicio de extracción, transformación y carga (ETL) completamente administrado que ayuda a los clientes a preparar y cargar los datos para su análisis.

Más información »

AWS Professional Services

La organización de AWS Professional Services es un equipo global de expertos que puede ayudarlo a conseguir los resultados empresariales deseados cuando utilice la nube de AWS.

Más información »


Introducción

Organizaciones de todos los tamaños y de todos los sectores transforman sus negocios y cumplen sus misiones todos los días con AWS. Contacte nuestros expertos y comience hoy mismo su propia jornada en AWS.