5분
1개월이 아니라 5분 만에 데이터 사이언티스트를 위한 ML 개발 환경 구축
2개월 반
이전의 6개월 이상에서 2개월 반으로 솔루션 구축 시간 단축
데이터 사이언티스트 100명
100명 이상의 데이터 사이언티스트 지원
수동 워크로드 감소
데이터 사이언티스트의 부담 완화
개요
의료 및 생명 과학 산업의 상당 부분에서 생성되는 상업 데이터가 끊임없이 증가하고 있으며, 조직들은 데이터를 효율적으로 분석하기 위해 고군분투하고 있습니다. 과학 중심의 바이오 제약 회사인 AstraZeneca도 예외가 아닙니다. 이 회사는 갈수록 증가하는 데이터를 관리하는 과정에서, 치료에 대한 중요한 비즈니스 인사이트를 확보할 기회를 놓치고 있다는 사실을 깨달았습니다. 기계 학습(ML) 모델을 개발해 프로덕션 환경에 배포하고, 데이터를 대규모로 신속하게 분석하고, 연구 개발을 개선하는 데 도움이 되는 비즈니스 인사이트를 창출하며, 새로운 치료법의 상용화를 가속화하여 궁극적으로 환자의 생명을 지킬 약을 신속하게 제공할 수 있는 효율적인 개발 프로세스가 필요했습니다.
AstraZeneca는 Amazon Web Services(AWS)와의 협력 하에 Amazon SageMaker를 사용하여 데이터 과학 및 개발 작업에서 ML 모델을 빠르게 준비, 구축, 훈련 및 배포하는 데 도움이 되는 솔루션을 만들었습니다. 이제 AstraZeneca는 상용 데이터를 대규모로 분석하여 인사이트를 확보할 뿐만 아니라 이전에 수동이었던 대부분의 프로세스를 자동화하여 데이터 과학 작업의 시간과 노력을 줄이고 있습니다.
기회 | 대규모 데이터 분석을 위해 AWS에서 ML 사용
세계적인 과학 중심 기업으로서, AstraZeneca는 획기적인 종양 및 희귀 질병 치료제와 바이오 의약품(심혈관계, 신장 및 대사 기능, 호흡기 건강 및 면역학 분야의 치료제)의 발견, 개발 및 상용화에 주력하면서 145개국과 70개의 시장에 걸쳐 수백만 명의 환자를 지원하고 있습니다. AstraZeneca는 익명 처리된 환자 데이터를 분석하여 인사이트를 확보합니다. 이를 통해 특정 치료법에 대한 환자의 감정을 학습하고 만성 신장 질환, 심부전 재입원 및 암 분류와 같은 치료 분야에서 진행 모델을 제공하는 등 의학 발전에 기여하고 있습니다. AstraZeneca는 이러한 인사이트를 비즈니스 분석가에게 전달하여 이를 통해 비즈니스 프로세스를 개선하고 의료 시스템에 대한 인식과 활용을 촉진할 수 있게 합니다. AstraZeneca의 글로벌 수석 엔터프라이즈 아키텍트인 Cherry Cabading은 "우리는 표적화된 조율과 마케팅에 집중하고 있으며, 비즈니스 팀이 환자의 니즈를 해결하는 데 적합한 정보를 의료 서비스 제공자에게 제공하는 데 도움을 주고 있습니다."라고 말합니다.
이러한 인사이트를 제공하기 위해서는 대규모 데이터 세트 분석이 필요합니다. 여타 대기업과 마찬가지로, AstraZeneca의 상업 팀은 대규모로 데이터를 처리할 수 있는 민첩한 ML 환경을 갖추고 있지 않았습니다. 이전 ML 솔루션에서는 데이터 사이언티스트가 필요한 데이터에 액세스할 수 있는 환경을 구축하는 데 한 달 이상 집중적으로 매달려야 했습니다. 이는 시간과 비용의 측면 모두에서 비효율적이었습니다. 이에 대해 Cabading은 "이전에는 데이터 사이언티스트 팀을 위한 자동화된 환경을 구축할 방법이 결여된 기술 스택을 사용했습니다. 시중에 나와 있는 다양한 ML 도구들이 통합 기능을 지원하지 않아 연동하는 것조차 어려웠습니다."라고 설명합니다.
2020년 당시, 이 회사의 상업 팀은 연장성, 유연성 및 확장성을 제공하는 솔루션을 찾고 있었습니다. Cabading은 "데이터 사이언티스트에게는 ML 모델을 구축, 훈련 및 배포한 후 해당 모델을 상용 시스템과 통합하여 산업화하기 위한 솔루션이 필요했습니다."라고 말합니다. 이에 AstraZeneca는 Amazon SageMaker를 사용하여 ML 개발을 위한 표준 통합 솔루션을 구현함으로써, 맞춤형 통합 코드를 작성하는 데 몇 개월씩 매달리는 일이 없도록 하고 비용을 절감할 수 있었습니다.
많은 수동 프로세스를 생성하는 대신, Amazon SageMaker Studio 내에서 간단하게 대부분의 기계 학습 개발 프로세스를 자동화할 수 있습니다.”
Cherry Cabading
AstraZeneca Global Senior Enterprise Architect
솔루션 | AWS에서 속도, 효율성 및 단순성 개선
2020년, Cabading과 상업 팀은 Amazon SageMaker를 사용하여 솔루션을 아키텍팅하고 설계하기 시작했습니다. 이 팀이 ML 운영 구현을 준비할 당시, 마침 AWS는 데이터를 준비하고 모델을 구축, 훈련 및 배포하는 데 필요한 모든 리소스를 하나의 통합 웹 기반 시각적 인터페이스로 제공하는 ML용 완전 통합형 개발 환경인 Amazon SageMaker Studio를 릴리스했습니다. AstraZeneca는 2021년 7월에 Amazon SageMaker Studio를 사용하기 시작했습니다. Cabading은 "이 서비스에는 배포, ML 운영, 모델 레지스트리, SageMaker 특성 저장소, 다양한 단계 또는 환경에 모델을 배포하는 기능이 포함되어 있습니다. 많은 수동 프로세스를 생성하는 대신, Amazon SageMaker Studio 내에서 간단하게 대부분의 기계 학습 개발 프로세스를 자동화할 수 있습니다."라고 말합니다.
Advanced Insights Generator(AIG)라는 AstraZeneca의 ML 솔루션은 분석가가 상업적 모델링을 수행할 수 있도록 지원합니다. 미국의 상업 부문에서 AIG는 100여명의 데이터 사이언티스트로 구성된 과학 팀에서 사용되고 있습니다. 데이터 사이언티스트는 바이오 의약품 또는 종양학 데이터 등 액세스하고자 하는 데이터와 환경을 요청합니다. 이러한 요청을 관리하기 위해 Cabading 팀은 조직이 정보 기술 서비스 카탈로그를 중앙에서 관리할 수 있는 단일 인터페이스를 제공하는 AWS Service Catalog를 사용합니다. Cabading은 "데이터 과학 팀의 이름을 입력하고 액세스하려는 데이터의 확인란을 선택합니다."라고 말합니다. 그러면 새 환경이 자동으로 실행됩니다. 한 달 이상 걸리던 전체 프로세스가 5분밖에 소요되지 않으므로, 데이터 사이언티스트는 보다 가치 있는 작업에 집중하고 신속하게 인사이트를 제공할 수 있습니다.
이 상업 팀은 AIG를 사용하여 이전에 6개월 이상 걸리던 것에 비해 훨씬 단축된 2.5개월 만에 인사이트를 도출할 수 있게 되었습니다. 즉, 인사이트를 확보하는 데 걸리는 시간이 약 150% 단축된 것입니다. Cabading은 "이 솔루션은 코드형 인프라를 기반으로 하므로 반복하기가 쉽습니다. 따라서 프로젝트를 진행하기 위해 무언가를 새로 만들어낼 필요가 없습니다. 그리고 이 솔루션을 가장 합리적인 방식으로 내부 및 외부 파트너 간에 공유할 수 있다"고 말합니다.
결과 | Amazon SageMaker 솔루션을 전 세계로 확장
현재 AIG는 미국 상업 시장과 Global Medical에서 사용되고 있습니다. AstraZeneca는 AIG 기능을 내부적으로 또는 외부 주요 파트너와 보다 광범위하게 공유하게 될 것으로 기대하고 있습니다.
Amazon SageMaker와 기타 AWS 서비스를 사용하여, AstraZeneca는 대량의 데이터를 분석하는 솔루션을 신속하게 배포할 수 있었고, 데이터 사이언티스트의 수동 워크로드를 줄이면서 인사이트를 향상시킬 수 있었습니다. 이는 전 세계 사람들의 삶을 변화시키는 의약품을 탐색하고 개발하는 AstraZeneca의 임무에 중요했습니다.
AstraZeneca 참조 아키텍처: 분석 애플리케이션을 위한 Advanced Insights Generator(AIG) 프레임워크
AstraZeneca 소개
AstraZeneca는 심혈관, 호흡기 및 면역 질환 분야를 비롯한 종양학 및 생물약제학에서 전문 의약품을 연구, 개발 및 판매합니다. 145개 국가와 70개 시장에 걸쳐 수백만 명의 환자를 돕습니다.
사용된 AWS 서비스
Amazon SageMaker
Amazon SageMaker를 통해 데이터 사이언티스트와 개발자는 기계 학습을 위해 특별히 구축된 다양한 기능 세트를 함께 활용하여 고품질 기계 학습 모형을 빠르게 준비, 구축, 훈련 및 배포할 수 있습니다.
Amazon SageMaker Studio
Amazon SageMaker Studio는 모든 ML 개발 단계를 수행할 수 있는 웹 기반의 단일 시각적 인터페이스를 제공하여, 데이터 과학 팀의 생산성을 10배까지 높입니다.
AWS Service Catalog
AWS Service Catalog를 사용하는 조직은 AWS에서 사용이 승인된 IT 서비스 카탈로그를 생성하고 관리할 수 있습니다. 이러한 IT 서비스에는 가상 머신 이미지, 서버, 소프트웨어 및 데이터베이스에서 완전한 멀티 티어 애플리케이션 아키텍처에 이르기까지 모든 것이 포함될 수 있습니다.
더 많은 생명 과학 고객 사례
시작하기
모든 산업에서 다양한 규모의 조직이 AWS를 통해 매일 비즈니스를 혁신하고 임무를 수행하고 있습니다. 지금 전문가와 상담하고 AWS로의 여정을 시작하세요.