Genentech maximise la valeur des données de biomarqueurs cliniques grâce à AWS
2022
Lorsque la plupart des gens pensent à la recherche translationnelle, ils pensent au transfert laboratoire-lit du patient, c.-à-d. à un transfert des connaissances acquises en laboratoire jusque dans les centres de soins sous la forme de nouvelles thérapies ou stratégies de traitement. Cependant, à l'ère des big data dans les sciences de la vie, les chercheurs peuvent également penser au « transfert inversé », selon lequel les informations recueillies en clinique mènent à de nouvelles découvertes en laboratoire. Néanmoins, pour récolter ces informations, il faut que les données cliniques soient sécurisées, accessibles, stables et consultables, ce qui est souvent plus facile à dire qu'à faire.
« Vous devez disposer des bonnes données de haute qualité. Si vous introduisez un tas de données inutiles dans un algorithme analytique sophistiqué, vous obtiendrez toujours des données inutiles », explique Christina Lu, responsable de la gestion et de l'ingénierie des données dans le domaine du développement des sciences informatiques chez Genentech.
Genentech, membre du groupe Roche, est une société biotechnologique et pharmaceutique de premier plan. Elle a accumulé une mine de données biologiques concrètes issues d'années d'essais cliniques et de recherches. En 2017, le groupe des sciences du développement de Genentech a mis en œuvre une stratégie visant à optimiser ces données pour la recherche et le développement, dans le but de répondre à des questions clés comme « Quelle est notre prochaine cible médicamenteuse ? » et « Comment les données des essais cliniques achevés peuvent-elles éclairer la conception des prochains essais ? » Cette stratégie impliquait la création d'un écosystème de données sur les plateformes AWS pour organiser rétrospectivement les données dans des référentiels interrogeables et mettre en place des outils et des processus pour la gestion future des données.
Les analyses de données cliniques, qui habituellement prenaient des semaines, ne nécessitent désormais que quelques heures pour les chercheurs. C'est ainsi que nous mettons à profit chaque point de données afin de fournir le bon médicament au bon patient au bon moment. »
Christina Lu
Responsable de la gestion et de l'ingénierie des données, domaine du développement des sciences informatiques, Genentech
La curation des données permet d'obtenir des informations cliniques
« Nous sommes à un point d'inflexion en matière de recherche clinique. Aujourd'hui, si vos données ne sont pas organisées, vous perdez des opportunités importantes de mettre au point de nouveaux traitements et d'améliorer la prise en charge des patients », déclare Christina Lu. Dans le cas de Genentech, bon nombre de ces opportunités sont centrées sur l'analyse de biomarqueurs, c'est-à-dire de molécules mesurables dans le corps humain associées à des états biologiques spécifiques, afin de comprendre les processus pathologiques et les mécanismes moléculaires.
L'objectif d'« organiser ses données » est de respecter les principes FAIR : Findable (Facile à trouver), Accessible, Interoperable (Interopérable) et Reusable (Réutilisable). Un rapport de 2018 a estimé que l'économie de l'Union européenne perd à elle seule 10,2 milliards d'euros par an en utilisant des données de recherche qui ne respectent pas les principes FAIR. Mais en l'état actuel des choses, les scientifiques des données passent jusqu'à 80 % de leur temps à collecter, à nettoyer et à organiser les données manuellement, alors que leur expertise serait mieux utilisée pour créer des modèles ou effectuer d'autres tâches spécialisées.
« La curation des données existantes est coûteuse, prend du temps et ne peut pas être mise à l'échelle », explique Christina Lu. Pour réduire les coûts et atteindre la capacité de mise à l'échelle et l'efficacité, Genentech a consolidé et transféré les données existantes de biomarqueurs de son réseau d'organismes de recherche sous contrat (CRO) vers un référentiel centralisé et bien géré hébergé sur Amazon Simple Storage Service (Amazon S3), service de stockage d'objets. Les scientifiques de Genentech et les chercheurs externes ont ainsi un accès rationalisé à une plus grande quantité d'informations, ce qui ajoute de la puissance statistique aux études susceptibles de révéler de nouvelles cibles en matière de thérapie génique ou de médicaments anticancéreux.
« Si nous pouvons appliquer ces stratégies de curation des données de manière prospective, nous pouvons accomplir bien plus en termes d'impact sur la santé humaine », a déclaré Christina Lu.
Création d'un écosystème de données sur AWS
« Le référentiel de données sur les biomarqueurs que nous avons créé sur AWS héberge des pétaoctets de données exploratoires sur les biomarqueurs et fournit une interface permettant aux scientifiques de trouver facilement les données dont ils ont besoin pour une étude spécifique », explique Christina Lu.
Le référentiel de biomarqueurs est stocké sur Amazon S3, tandis qu'Amazon Relational Database Service (Amazon RDS), service géré de base de données relationnelle, administre les métadonnées associées, et qu'Amazon Elasticsearch Service permet l'indexation et la recherche rapide. Genentech utilise Amazon API Gateway pour créer des API qui fournissent aux chercheurs un accès sécurisé et spécifique à l'étude, selon leurs besoins.
« Grâce à cette architecture rationalisée, les analyses de données cliniques, qui habituellement prenaient des semaines, ne nécessitent désormais que quelques heures pour les chercheurs », explique Christina Lu. « C'est ainsi que nous mettons à profit chaque point de données afin de fournir le bon médicament au bon patient au bon moment. »
En savoir plus
Découvrez comment AWS transforme la gestion des données pour d'autres entreprises du secteur des sciences de la vie.
À propos de Genentech
Genentech, membre du groupe Roche, est une entreprise de biotechnologie dédiée à l'élaboration de nouveaux traitements pour des maladies graves et potentiellement mortelles.
Avantages d'AWS
- Des pétaoctets de données exploratoires sur les biomarqueurs stockés en toute sécurité
- Des données organisées de façon à être faciles à trouver, accessibles, interopérables et réutilisables (FAIR), à la fois de manière rétrospective et prospective
Services AWS utilisés
Amazon RDS
Amazon Relational Database Service (Amazon RDS) vous permet d'installer, de gérer et de mettre à l'échelle facilement une base de données relationnelle dans le cloud.
Amazon S3
Amazon Simple Storage Service (Amazon S3) est un service de stockage d'objets offrant une évolutivité, une disponibilité des données, une sécurité et des performances de pointe.
Amazon API Gateway
Amazon API Gateway est un service entièrement opéré, qui permet aux développeurs de créer, publier, gérer, surveiller et sécuriser facilement des API à n'importe quelle échelle.
AWS Lambda
AWS Lambda est un service de calcul qui vous permet de créer des applications qui répondent rapidement aux nouvelles informations et aux nouveaux événements.
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) offre la plateforme de calcul la plus variée et la plus complète, avec plus de 500 instances. Vous y avez accès au processeur, à la solution de stockage, aux réseaux, au système d'exploitation et au modèle d'achat les plus récents pour vous aider à répondre au mieux aux besoins de votre charge de travail.
Amazon Elasticsearch Service
Amazon Elasticsearch Service est un service entièrement géré qui facilite le déploiement, la sécurisation et l'exécution d'Elasticsearch à grande échelle et de façon rentable.
Démarrer
Les entreprises de toute taille et de tous les secteurs d'activités transforment chaque jour leurs activités à l'aide d'AWS. Contactez nos spécialistes et entamez votre transition vers le cloud AWS dès aujourd'hui.