AWS를 사용하여 신약 개발에 대규모 유전체학 솔루션을 도입한 Regeneron
2022년
2020년 한 해에만 12개 대형 바이오 제약 회사가 의약품 R&D에 960억 USD 이상을 지출하는 등, 의약품 개발 비용이 꾸준히 증가하고 있습니다. 대다수의 실험약이 출시로 이어지지 못하는 상황에서, 매년 승인을 받고 상용화에 성공하는 신약은 극소수에 불과합니다. 생물약제학 관련 조직들은 신약 개발의 성공률을 높이기 위해 유전자 데이터를 활용하여 약물 반응을 효과적으로 분석할 수 있는 유전체학 기술을 제약 R&D 프로세스에 도입하고 있습니다. 약리 유전체학이라고 하는 이 기술은 아직 도입 초기 단계지만, 이미 신약 개발 성공률을 두 배로 높였습니다. 질병과 관련한 유전자는 훨씬 더 많지만, 현재 인간 게놈의 유전자 중 승인된 약의 표적이 되는 비율은 5%에 불과합니다.
국제적인 생명 공학 및 제약 회사인 Regeneron은 Amazon Web Services(AWS)를 활용하여 유전체 인사이트를 통합함으로써 신약 개발을 가속화하고 개선하는 방향으로 업계가 발전할 수 있도록 돕고 있습니다. Regeneron Genetics Center(RGC)는 인간 게놈의 유전자 암호화 영역인 진유전체를 시퀀싱하고 게놈 및 건강 데이터의 대규모 분석을 지원함으로써, Regeneron의 자체 신약 개발 프로그램은 물론, 연구 커뮤니티 전반에도 적용할 수 있는 유용한 과학적 결과를 도출하는 데 중점을 둔 연구 이니셔티브입니다.
“타의 추종을 불허하는 AWS 클라우드 인프라의 확장성 없이는 통찰력 있는 대규모 애그노스틱 분석을 수행할 수 없었습니다.”
Jeffrey Reid 박사
Regeneron Genetics Center 최고 데이터 책임자(CDO)
AWS 기반 플랫폼에서의 대규모 유전체학 연구
한 번에 수천 또는 수백만 개의 게놈을 분석하면 연구원들이 소수의 집단에서는 명확하게 나타나지 않는, 특정 유전적 변이와 질병 사이의 연관성을 밝혀낼 수 있습니다. 데이터 세트가 크고 다양할수록 과학적 연구 결과가 광범위한 환자에게 적용될 가능성이 커집니다. 이러한 포괄적인 데이터 세트를 세계적인 차원에서 구축하기 위해 Regeneron은 UK Biobank, AWS 파트너 DNAnexus 등의 조직과 긴밀히 협력하여 수백만 명의 지원자로부터 유전자 샘플과 건강 정보를 확보했습니다.
Regeneron과 협력 조직들은 클라우드에서 안전하고 크기 조정이 가능한 컴퓨팅 용량을 제공하는 웹 서비스인 Amazon Elastic Compute Cloud(Amazon EC2)를 사용하여 이러한 유전자 샘플의 진유전체 시퀀싱 및 처리를 가속화할 수 있었습니다. 이렇게 생성된 페타바이트 규모의 익명화된 건강 및 유전체 데이터는 객체 스토리지 서비스인 Amazon Simple Storage Service(S3)를 사용하여 안전하게 저장됩니다. Regeneron은 Amazon S3에 이 정보를 저장함으로써 온프레미스 서버에 비해 비용을 90% 절감할 수 있게 되었습니다. RGC는 로컬 스토리지 및 컴퓨팅 리소스를 사용했을 때보다 10배 빠른 속도로 2021년까지 100만 개 이상의 게놈을 시퀀싱했습니다.
유전체 데이터가 확보되면, AWS는 데이터를 기반으로 과학적 연구를 수행하는 데 필요한 분석 성능을 Regeneron에 제공합니다. 특히 RGC는 데이터베이스에 존재하는 모든 표현형과 유전자형 간의 모든 연관성을 식별하여 궁극적으로 신약 발견 및 개발 프로젝트에 정보를 제공하기 위해 방대한 유전체 데이터 세트를 검색하는 심층 분석 프로세스인 올바이올(All-by-All) 분석을 수행하는 분야를 선도하고 있습니다.
RGC의 최고 데이터 책임자(CDO)인 Jeffrey Reid 박사는 “올바이올 분석의 연관성 결과 테이블은 셀 개수가 1조 개가 넘습니다. 타의 추종을 불허하는 AWS 클라우드 인프라의 확장성 없이는 이러한 통찰력 있는 대규모 애그노스틱 분석을 수행할 수 없었습니다”라고 말합니다.
RGC는 다양한 학계 및 제약 산업 그룹과의 연구 협력을 시작하여 맞춤형 프로젝트 기반 분석에 데이터를 사용할 수 있도록 했습니다. 연구원들은 Amazon S3에서 안전하게 데이터에 액세스하고, 개인이 스토리지를 프로비저닝하거나 관리하지 않고도 파일 데이터를 공유할 수 있는 간편한 서버리스 방식의 탄력적 파일 시스템인 Amazon Elastic File System(Amazon EFS)을 사용하여 프로젝트에 필요한 파일을 관리할 수 있습니다.
Reid는 “AWS를 사용하면 두 서비스의 이점을 모두 활용할 수 있습니다. 즉, 연구원들이 가동하는 컴퓨팅 인스턴스 등, 사용하는 인프라를 보다 세부적으로 제어할 수 있어 학술 환경에서 하듯이 연구를 진행할 수 있습니다. 데이터의 효과를 극대화하려면 데이터에 대한 액세스를 극대화해야 합니다. 이것이 바로 저희가 AWS를 사용하여 실현한 결과입니다. AWS 솔루션이 없었다면 전 세계의 수많은 파트너에게 이 정도 규모의 데이터를 절대 제공할 수 없었을 것입니다”라고 말합니다.
AWS를 사용하여 인간의 건강을 개선하기 위한 글로벌 협업 지원
국제 산업 협력은 새로운 유전체 발견을 가속화하는 열쇠입니다. Reid는 “저희는 여러 기관과 위치에서 작업을 수행할 방법이 필요했고, 이것이 바로 저희가 클라우드 컴퓨팅에 집중한 이유 중 하나입니다. AWS를 사용하면서 저희는 데이터를 생성하여 전 세계의 협력 조직과 공유하고 대규모 분석을 적용한 다음 결과를 전파할 수 있는 안전한 데이터 과학 플랫폼을 제공할 수 있었습니다”라고 말합니다.
유전체 데이터의 효과를 극대화한다는 것은 샘플과 수행 중인 다양한 연구 프로젝트에서 표현 능력을 극대화하는 것을 의미합니다. RGC는 전 세계 100명 이상의 협력 조직이 협력을 통해 다양한 유전체 데이터 세트를 수집하여 분석의 효과를 강화하고 결과를 더 광범위하게 적용할 수 있도록 합니다.
Reid는 “기존에 유럽의 선조에만 초점을 맞추었기 때문에 아직 발견되지 않았던 인사이트가 많이 남아 있다는 것을 잘 알고 있기 때문에, 저희는 데이터베이스에서 유전적 선조의 다양성을 개선하기 위해 적극적으로 노력하고 있습니다. AWS를 기반으로 솔루션을 구축함으로써, 저희는 향후 정밀 의학 및 다유전자 위험 지수를 사용하여 혈통을 불문하고 모든 사람의 의료 서비스를 공평하게 개선할 수 있도록 글로벌 접근성을 높일 수 있게 되었습니다”라고 말합니다.
Regeneron 소개
Regeneron은 전통적인 신약 개발 프로세스를 가속화하고 개선하는 데 주력하는 생명 공학 및 제약 회사입니다.
AWS의 이점
- 10배 빠른 속도로 100만 개가 넘는 진유전체 시퀀싱
- 유전체 데이터를 AWS에 저장하여 온프레미스 스토리지에 비해 90%의 비용 절감 실현
- 올바이올(all-by-all) 애그노스틱 데이터 분석을 지원하여 유전체 인사이트 확보
- 접근성을 높여 정밀 의학용 정보를 제공하는 유전체 데이터 세트의 다양성 개선
- 유전자 표적을 기반으로 신약 개발
사용된 AWS 서비스
Amazon Elastic File System
Amazon Elastic File System은 AWS 컴퓨팅 서비스를 위한 공유 파일 시스템을 쉽고 빠르게 구축하고 구성할 수 있는 단순하고 유연한 서버리스 파일 시스템을 제공합니다.
Amazon Elastic Compute Cloud
Amazon Elastic Compute Cloud(Amazon EC2)는 475개가 넘는 인스턴스, 그리고 최신 프로세서, 스토리지, 네트워킹, 운영 체제 및 구매 모델의 옵션과 함께 워크로드의 요구 사항에 가장 잘 부합할 수 있도록 가장 포괄적이고 심층적인 컴퓨팅 플랫폼을 제공합니다.
Amazon S3
Amazon Simple Storage Service(Amazon S3)는 업계 최고의 확장성과 데이터 가용성 및 보안과 성능을 제공하는 객체 스토리지 서비스입니다.
시작하기
모든 산업에서 다양한 규모의 조직이 AWS를 통해 매일 비즈니스를 혁신하고 임무를 수행하고 있습니다.
지금 전문가와 상담하고 AWS로의 여정을 시작하세요.