A Illumina traz genômica de amostras a respostas utilizando a AWS
2021
Na última década, a genômica evoluiu de uma área de pesquisa especializada para uma ferramenta clínica poderosa que deu início a uma nova era de cuidados centrados no paciente. O sequenciamento e a análise de genomas tornaram-se mais simples, mais baratos e mais completos, propiciando aos médicos a realização de pedidos de testes genéticos para pacientes individuais e aos pesquisadores o exame de milhares de amostras para realizar conexões entre variações genéticas e doenças humanas. Enquanto o primeiro genoma humano levou décadas para ser sequenciado, hoje em dia os cientistas podem sequenciar, eficientemente, um genoma humano completo em menos de 24 horas.
A missão daIllumina é desbloquear o poder do genoma a fim de aperfeiçoar a saúde humana. Como parceira da AWS, a empresa tem sido uma força motriz por trás de avanços tecnológicos na genômica, progredindo de fornecedora de instrumentos de sequenciamento para provedora de soluções genômicas completas, utilizando as soluções de software da Amazon Web Services (AWS) desde 2013. As soluções de software respaldadas pela AWS da Illumina estão reduzindo as barreiras de entrada e ajudando os pesquisadores a gerar novas descobertas todos os dias, impulsionando a descoberta de medicamentos e muito mais.
“A indústria genômica está se expandindo em todas as direções, desde testes genéticos diretos ao consumidor a vacinas personalizadas contra o câncer”, afirma Susan Tousi, chefe do departamento comercial da Illumina. “O objetivo da Illumina é democratizar o acesso a tecnologias genômicas ao redor do planeta; temos uma parceria com a AWS desde o início para proporcionar aos nossos clientes as respostas de que precisam. Ao longo da última década, expandimos nosso portfólio de software disponível na AWS a fim de fornecer um conjunto holístico e integrado de soluções que possam ser utilizadas imediatamente ou que sejam customizadas para atender a necessidades específicas.”
“Estamos entregando um fluxo de trabalho completo, desde a preparação de amostras até a análise terciária, no ambiente seguro da AWS que permite que todas as informações geradas antes e depois do sequenciamento sejam agregadas e analisadas.”
Rami Mehio
Vice-presidente de bioinformática e software de instrumentos da Illumina
Como navegar da amostra até a resposta
Um fluxo de trabalho genômico completo da próxima geração se inicia pela coleta, preparação e sequenciamento de amostras, mas esse é apenas o começo. Em seguida, acontece o levantamento intenso de bioinformática, começando pelo controle de qualidade de leitura bruta, de pré-processamento de dados e de alinhamento. Os cientistas podem então seguir para as análises secundárias, como chamada de variante e, finalmente, conduzir análises terciárias avançadas baseadas em seus interesses. Tais análises terciárias podem incluir anotação filogenética, associações entre genótipo e fenótipo e muito mais. Para pesquisadores e médicos que não são especialistas em bioinformática, a realização de cada etapa em uma plataforma separada pode se tornar rapidamente exaustiva.
A Illumina simplifica todo esse fluxo de trabalho genômico para os clientes, oferecendo soluções integradas para cada etapa. Desde o início, o BaseSpaceTM Clarity LIMS (Sistemas de gerenciamento de informações de laboratório) auxilia os clientes de genômica a trilhar amostras e otimizar fluxos de trabalho de sequenciamento. Os instrumentos de sequenciamento podem fazer o upload de dados diretamente na plataforma Illumina Connected Analytics (ICA), onde os usuários podem gerenciar conjuntos de dados e aproveitar ferramentas analíticas dentro da plataforma na AWS. A plataformaDRAGENTM Bio-IT fornece resultados precisos e ultrarrápidos de análises secundárias. Ao mesmo tempo, o BaseSpace Correlation Engine integra conjuntos de dados e pesquisa de indivíduos em um repositório de acesso aberto e de conjuntos de dados de acesso público controlado para habilitar uma ampla variedade de análises terciárias.
Os dados para essas plataformas estão armazenados no Amazon Simple Storage Service (Amazon S3), um serviço de armazenamento de objetos escalável. Os clientes da Illumina potencializam e aceleram dramaticamente suas análises com DRAGEN operando no Amazon Elastic Compute Cloud (Amazon EC2), um serviço web que fornece capacidade computacional segura e redimensionável na nuvem.
“Estamos entregando um fluxo de trabalho completo, desde a preparação de amostras até a análise terciária, no ambiente seguro da AWS que permite que todas as informações geradas antes e após o sequenciamento sejam agregadas e analisadas”, afirma Rami Mehio, vice-presidente de software e bioinformática da Illumina. “Isso é importante aos clientes que desejam trilhar amostras ao longo do tempo, comparar seus dados com bancos de dados disponíveis publicamente e obter insights para resultados mais rápidos.”
Enquanto usuários avançados têm a opção de personalizar ferramentas como ICA e DRAGEN a fim de executar pesquisa de nichos, a Illumina também oferece soluções em nuvem de ponta-a-ponta com funcionalidade imediata para usuários específicos. Elas podem incluir o TruSightTM Software Suite, uma solução de software de análise de variantes para a detecção de insights de doenças raras e o TruSight Oncology 500, uma avaliação de sequenciamento detalhado para a análise de tumores e para a identificação de biomarcadores imuno-oncológicos.
“Contamos com a força das ferramentas da AWS como um pilar que nos permite focar na projeção de algoritmos genômicos específicos”, afirma Mehio. “Como as necessidades dos pesquisadores e dos médicos mudam, podemos facilmente utilizar novas funções e versões dos nossos produtos.”
Reduzindo custos ao economizar na AWS
Desde a sua criação, a Illumina tem reduzido o custo de tecnologias de genoma a uma taxa que ultrapassa a Lei de Moore. O sequenciamento do genoma de apenas uma pessoa custava acima de USD 100 milhões em 2001; 20 anos depois, pode custar apenas USD 600.
“Queremos democratizar o acesso a tecnologias genômicas, repassar as economias de custo para nossos clientes é uma grande parte deste esforço”, diz Tousi. “O custo não deveria ser um fator decisivo para a pesquisa ou para as aplicações clínicas, as pessoas deveriam realizar o sequenciamento e a análise puramente baseadas em como esperam poder utilizar os dados.”
O Amazon S3 Storage Classes pode ser personalizado de acordo com as diferentes necessidades de dados, facilitando para a Illumina a otimização do máximo de economia de custos. Ao armazenarem petabytes de dados acessados com pouca frequência no Amazon S3 Glacier Deep Archive, os clientes da Illumina economizam acima de 90% em custos de armazenamento. Do mesmo modo, a DRAGEN executa as instâncias F1 do Amazon EC2, que oferecem computação acessível e acelerada que podem dar suporte aos processos paralelos que a Illumina precisa. As instâncias F1 oferecem aceleração de hardware personalizável com arranjo de portas programável em campo (FPGAs) DRAGEN. Para dimensionar a DRAGEN através das instâncias F1, a empresa utilizou o AWS Batch, um serviço de processamento em lotes totalmente gerenciado que planeja, agenda e executa workloads de computação em lotes.
“A AWS nos fornece opções para otimizar a velocidade, a flexibilidade e o custo, e atender ao caso de uso e à necessidade do cliente final”, explica Mehio. “Alguns usuários podem querer realizar análises genéticas o mais rápido possível, enquanto alguns usuários do meio acadêmico podem optar por sacrificar um pouco a velocidade a fim de reduzir custos e economizar dólares voltados à pesquisa. Ao aproveitar diferentes tipos de instâncias F1 e opções de armazenamento, nossos usuários mantêm a flexibilidade e a habilidade de escalar para cima e para baixo, conforme necessário.”
A Illumina também diminui custos para clientes ao executar muitos trabalhos de computação em suas plataformas nasinstâncias spot do Amazon EC2, que estão disponíveis com até 90% de desconto em comparação com os preços sob demanda. “Nossos clientes têm utilizado centenas de milhares de horas de instâncias spot somente no último ano, o que proporcionou economias de custo significativas para eles”, afirma Tousi.
Economias de custos e vantagens técnicas andam de mãos dadas. Recentemente, a Illumina migrou o mecanismo de correlação de análise terciária para a AWS, economizando gastos enquanto escalona pipelines de ingestão de dados por seis vezes para fazer a base de conhecimento crescer mais rápido e se tornar mais poderosa.
Soluções seguras para escalabilidade da genômica global
Os dados genômicos humanos podem ser associados a informações de saúde altamente pessoais e as violações de dados são um risco cada vez maior para as organizações de saúde em todo o mundo. Como resultado, a segurança é uma consideração primordial para a Illumina e seus clientes, muitos dos quais devem aderir a regulamentos de gerenciamento de dados cada vez mais rigorosos.
“A segurança é nossa prioridade número um, está no centro de tudo que fazemos”, conta Tousi. “Na própria fundação, podemos contar com oModelo de Responsabilidade Compartilhada da AWS para garantir que nossa infraestrutura de nuvem subjacente mantenha a segurança e a conformidade a nível empresarial. Ao impulsionar as regiões da Amazon EC2 globalmente, trazemos computação para os dados, oferecendo suporte aos clientes em todas as regiões, permitindo-lhes manter a soberania dos dados.”
A AWS concede suporte a milhares de padrões de segurança e certificações de conformidade, incluindo HIPAA, GDPR, ISO 27001 e ISO 13485, auxiliando os clientes a satisfazer as exigências de conformidade durante todo o seu fluxo de trabalho genômico. A Illumina oferece tranquilidade extra aos clientes ao fornecer gerenciamento de dados na Amazon Virtual Private Cloud (Amazon VPC), que introduz outros recursos da AWS em uma rede virtual personalizada logicamente isolada que separa os dados de um cliente dos dados de outro.
Essa escalabilidade e implantação global facilitam a colaboração significativa tanto para os projetos de longo prazo e quanto para a resposta adequada a crises. Pesquisadores ao redor do mundo processaram mais de 371 mil amostras relacionadas à COVID-19 nas aplicações COVID-19 BaseSpace da Illumina em 2020 e na primeira metade de 2021. "Se os clientes só pudessem fazer isso em nossas dependências, teríamos enfrentado sérias restrições. Portanto, a nuvem foi a chave para fortalecer a resposta global à pandemia nesse nível”, afirma Tousi.
Como preparar o futuro para a genômica e para a biotecnologia
Com grandes iniciativas genéticas da população em ascensão e com a expansão do acesso a soluções potentes de software de análise, como ICA, a Illumina está adotando totalmente o poder de “big data” na genômica a fim de auxiliar os clientes a extrair insights ricos de grandes volumes de dados sequenciais. Esses projetos abastecerão uma nova era de genômica personalizada, permitindo que pesquisadores façam conexões entre genes e resultados de saúde que não estavam evidentes em amostras menores.
As plataformas da Illumina também estão ajudando na transição da pesquisa sem falhas para um futuro multi-econômico. O DRAGEN Single-Cell RNA Pipeline baseado em nuvem, por exemplo, permite aos cientistas registrar a expressão gênica em células individuais. Com a aceleração DRAGEN, a plataforma pode processar três amostras de células simultaneamente em paralelo em cerca de 53 minutos.
“Com ICA, DRAGEN e outras ferramentas implantadas na AWS, estamos fornecendo soluções que permitem que os clientes agreguem quaisquer tipos de dados, incluindo NGS e dados de saúde, para extrair informações novas dos grandes grupos e para aperfeiçoar a saúde humana em escala”, diz Mehio.
Saiba mais
Veja como aAWS está apoiando outras organizações líderes em ciências biológicas em sua busca para melhorar a saúde humana.
Sobre a Illumina
A Illumina desenvolve, produz e comercializa sistemas integrados para analisar variações genéticas e funções biológicas.
Benefícios da AWS
- Facilitou acesso a fluxos de trabalho simplificados, unificados e personalizáveis de amostras para análise
- Reduziu drasticamente custos de computação e armazenamento com as instâncias spot Amazon EC2 e com o Amazon S3 Glacier
- Implementou portfólio robusto de soluções genômicas globalmente em ambiente seguro e em conformidade
- Acelerou a pesquisa e promoveu a colaboração de clientes ao redor do mundo para processar mais de 371 mil amostras relacionadas à COVID-19
Serviços da AWS usados
Amazon EC2
O Amazon Elastic Compute Cloud (Amazon EC2) é um serviço da Web que disponibiliza capacidade computacional segura e redimensionável na nuvem. Ele foi projetado para facilitar a computação em nuvem na escala da web para os desenvolvedores.
Amazon S3
O Amazon Simple Storage Service (Amazon S3) é um serviço de armazenamento de objetos que oferece escalabilidade, disponibilidade de dados, segurança e performance líder do setor.
AWS Virtual Private Cloud
A Amazon Virtual Private Cloud (Amazon VPC) é um serviço que permite iniciar recursos da AWS em uma rede virtual logicamente isolada definida por você.
Instâncias spot do Amazon EC2
As instâncias spot do Amazon EC2 permitem aproveitar a capacidade não utilizada do EC2 na Nuvem AWS. Em comparação com os preços sob demanda, as instâncias spot oferecem descontos de até 90%.
Comece a usar
Empresas de todos os portes em todos os setores estão transformando seus negócios diariamente usando a AWS. Entre em contato com nossos especialistas e comece sua própria jornada para a Nuvem AWS hoje mesmo.