Logo de l'entreprise Genentech

Genentech maximise la valeur des données de biomarqueurs cliniques grâce à AWS

2022

Lorsque la plupart des gens pensent à la recherche translationnelle, ils pensent au transfert laboratoire-lit du patient, c.-à-d. à un transfert des connaissances acquises en laboratoire jusque dans les centres de soins sous la forme de nouvelles thérapies ou stratégies de traitement. Cependant, à l'ère des big data dans les sciences de la vie, les chercheurs peuvent également penser au « transfert inversé », selon lequel les informations recueillies en clinique mènent à de nouvelles découvertes en laboratoire. Néanmoins, pour récolter ces informations, il faut que les données cliniques soient sécurisées, accessibles, stables et consultables, ce qui est souvent plus facile à dire qu'à faire. 

« Vous devez disposer des bonnes données de haute qualité. Si vous introduisez un tas de données inutiles dans un algorithme analytique sophistiqué, vous obtiendrez toujours des données inutiles », explique Christina Lu, responsable de la gestion et de l'ingénierie des données dans le domaine du développement des sciences informatiques chez Genentech. 

Genentech, membre du groupe Roche, est une société biotechnologique et pharmaceutique de premier plan. Elle a accumulé une mine de données biologiques concrètes issues d'années d'essais cliniques et de recherches. En 2017, le groupe des sciences du développement de Genentech a mis en œuvre une stratégie visant à optimiser ces données pour la recherche et le développement, dans le but de répondre à des questions clés comme « Quelle est notre prochaine cible médicamenteuse ? » et « Comment les données des essais cliniques achevés peuvent-elles éclairer la conception des prochains essais ? » Cette stratégie impliquait la création d'un écosystème de données sur les plateformes AWS pour organiser rétrospectivement les données dans des référentiels interrogeables et mettre en place des outils et des processus pour la gestion future des données.

Symposium HCLS 2021 : Genentech, membre du groupe Roche (12:46)
kr_quotemark

Les analyses de données cliniques, qui habituellement prenaient des semaines, ne nécessitent désormais que quelques heures pour les chercheurs. C'est ainsi que nous mettons à profit chaque point de données afin de fournir le bon médicament au bon patient au bon moment. »

Christina Lu
Responsable de la gestion et de l'ingénierie des données, domaine du développement des sciences informatiques, Genentech

La curation des données permet d'obtenir des informations cliniques

« Nous sommes à un point d'inflexion en matière de recherche clinique. Aujourd'hui, si vos données ne sont pas organisées, vous perdez des opportunités importantes de mettre au point de nouveaux traitements et d'améliorer la prise en charge des patients », déclare Christina Lu. Dans le cas de Genentech, bon nombre de ces opportunités sont centrées sur l'analyse de biomarqueurs, c'est-à-dire de molécules mesurables dans le corps humain associées à des états biologiques spécifiques, afin de comprendre les processus pathologiques et les mécanismes moléculaires.

L'objectif d'« organiser ses données » est de respecter les principes FAIR : Findable (Facile à trouver), Accessible, Interoperable (Interopérable) et Reusable (Réutilisable). Un rapport de 2018 a estimé que l'économie de l'Union européenne perd à elle seule 10,2 milliards d'euros par an en utilisant des données de recherche qui ne respectent pas les principes FAIR. Mais en l'état actuel des choses, les scientifiques des données passent jusqu'à 80 % de leur temps à collecter, à nettoyer et à organiser les données manuellement, alors que leur expertise serait mieux utilisée pour créer des modèles ou effectuer d'autres tâches spécialisées.

« La curation des données existantes est coûteuse, prend du temps et ne peut pas être mise à l'échelle », explique Christina Lu. Pour réduire les coûts et atteindre la capacité de mise à l'échelle et l'efficacité, Genentech a consolidé et transféré les données existantes de biomarqueurs de son réseau d'organismes de recherche sous contrat (CRO) vers un référentiel centralisé et bien géré hébergé sur Amazon Simple Storage Service (Amazon S3), service de stockage d'objets. Les scientifiques de Genentech et les chercheurs externes ont ainsi un accès rationalisé à une plus grande quantité d'informations, ce qui ajoute de la puissance statistique aux études susceptibles de révéler de nouvelles cibles en matière de thérapie génique ou de médicaments anticancéreux.

« Si nous pouvons appliquer ces stratégies de curation des données de manière prospective, nous pouvons accomplir bien plus en termes d'impact sur la santé humaine », a déclaré Christina Lu.

Création d'un écosystème de données sur AWS

« Le référentiel de données sur les biomarqueurs que nous avons créé sur AWS héberge des pétaoctets de données exploratoires sur les biomarqueurs et fournit une interface permettant aux scientifiques de trouver facilement les données dont ils ont besoin pour une étude spécifique », explique Christina Lu.

Le référentiel de biomarqueurs est stocké sur Amazon S3, tandis qu'Amazon Relational Database Service (Amazon RDS), service géré de base de données relationnelle, administre les métadonnées associées, et qu'Amazon Elasticsearch Service permet l'indexation et la recherche rapide. Genentech utilise Amazon API Gateway pour créer des API qui fournissent aux chercheurs un accès sécurisé et spécifique à l'étude, selon leurs besoins.

« Grâce à cette architecture rationalisée, les analyses de données cliniques, qui habituellement prenaient des semaines, ne nécessitent désormais que quelques heures pour les chercheurs », explique Christina Lu. « C'est ainsi que nous mettons à profit chaque point de données afin de fournir le bon médicament au bon patient au bon moment. »

En savoir plus


À propos de Genentech

Genentech, membre du groupe Roche, est une entreprise de biotechnologie dédiée à l'élaboration de nouveaux traitements pour des maladies graves et potentiellement mortelles.

Avantages d'AWS

  • Des pétaoctets de données exploratoires sur les biomarqueurs stockés en toute sécurité
  • Des données organisées de façon à être faciles à trouver, accessibles, interopérables et réutilisables (FAIR), à la fois de manière rétrospective et prospective


Services AWS utilisés

Amazon RDS

Amazon Relational Database Service (Amazon RDS) vous permet d'installer, de gérer et de mettre à l'échelle facilement une base de données relationnelle dans le cloud.

En savoir plus »

Amazon S3

Amazon Simple Storage Service (Amazon S3) est un service de stockage d'objets offrant une évolutivité, une disponibilité des données, une sécurité et des performances de pointe.

En savoir plus »

Amazon API Gateway

Amazon API Gateway est un service entièrement opéré, qui permet aux développeurs de créer, publier, gérer, surveiller et sécuriser facilement des API à n'importe quelle échelle.

En savoir plus »

AWS Lambda

AWS Lambda est un service de calcul qui vous permet de créer des applications qui répondent rapidement aux nouvelles informations et aux nouveaux événements.

En savoir plus »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) offre la plateforme de calcul la plus variée et la plus complète, avec plus de 500 instances. Vous y avez accès au processeur, à la solution de stockage, aux réseaux, au système d'exploitation et au modèle d'achat les plus récents pour vous aider à répondre au mieux aux besoins de votre charge de travail.

En savoir plus »

Amazon Elasticsearch Service

Amazon Elasticsearch Service est un service entièrement géré qui facilite le déploiement, la sécurisation et l'exécution d'Elasticsearch à grande échelle et de façon rentable.

En savoir plus »


Démarrer

Les entreprises de toute taille et de tous les secteurs d'activités transforment chaque jour leurs activités à l'aide d'AWS. Contactez nos spécialistes et entamez votre transition vers le cloud AWS dès aujourd'hui.