Estudo de caso da Fabric Genomics

2018

Fabric Genomics é uma empresa de genômica de software que fornece análise de dados genômicos de ponta, soluções para geração de relatórios, classificação, curadoria e anotação para laboratórios clínicos, laboratórios hospitalares, empresas de biologia, programas de sequenciamento de países e instituições de pesquisa. As tecnologias de Machine Learning da empresa e os avançados algoritmos proprietários VAAST e Phevor permitem que os cientistas processem e analisem genomas inteiros, exomas e painéis de genes com rapidez e precisão com relação a doenças hereditárias e oncológicas. Com sede em Oakland, Califórnia, a Fabric Genomics ajuda seus clientes a acelerar o acesso a insights relacionados à causa de doenças genéticas.

inicie um tutorial de python
kr_quotemark

Usando o software de interpretação da Fabric Genomics na AWS, junto com outras ferramentas de software, podemos interpretar a variante de um genoma inteiro em questão de minutos, enquanto outras plataformas podem levar horas. Isso significa que podemos iniciar nossa análise rapidamente e refinar milhões de pontos de dados em poucos marcadores distintos para doenças infantis.”

Shareef Nahas
Ph.D., Diretor sênior de Operações de laboratório clínico, Rady Children’s Institute for Genomic Medicine

O desafio

Todos os dias, os clientes que usam a plataforma da Fabric Genomics têm o potencial de ajudar a salvar vidas, identificando quais variantes são causadoras de doenças. Essas informações ajudam os médicos a determinar o melhor tratamento e medicamentos para seus pacientes com base na sua genética.

A performance resistente é fundamental para o sucesso da plataforma. “A velocidade é muito importante para nosso software porque nossos clientes estão trabalhando para identificar as causas genéticas da doença em pacientes graves”, diz Martin Reese, diretor executivo e cofundador da Fabric Genomics. Por exemplo, o Rady Children’s Institute for Genomic Medicine utiliza o software de interpretação e geração de relatórios clínicos da Fabric Genomics como parte de seu pipeline de bioinformática para identificar variantes causadoras de doenças no genoma de uma criança. “Realizamos um sequenciamento rápido do genoma para encontrar distúrbios genéticos que causam a internação de crianças muito doentes em unidades de terapia intensiva neonatal ou pediátrica”, diz Shareef Nahas, Diretor sênior de operações de laboratório clínico do instituto. “Quanto mais rápido pudermos sequenciar os genomas e fornecer dados à equipe médica, mais rápido essas crianças serão tratadas.”

Além da performance, o software da Fabric Genomics precisa ser altamente escalável. “A escalabilidade é muito importante para nós, especialmente porque os laboratórios clínicos precisam sequenciar com frequência o DNA de pais e irmãos de um paciente”, diz Reese. “Os arquivos de dados são enormes – milhões de arquivos de até 200 gigabytes cada – e precisam ser comparados muito rapidamente, por isso, precisamos de ferramentas que deem suporte a arquivos grandes e com capacidade de analisá-los de uma só vez.”

Por que a Amazon Web Services

A Fabric Genomics optou por executar seu software na nuvem da Amazon Web Services (AWS) para ter a performance e a escalabilidade necessárias. “Ao usar a AWS, temos a força computacional e a capacidade que precisamos para processar e analisar grandes conjuntos de dados genômicos”, diz Reese. “Em um laboratório normal atual, a interpretação de um genoma leva 12 semanas. Com nosso software, reduzimos esse tempo para duas horas.”

A empresa executa duas cargas de trabalho computacionais – descoberta de variantes e interpretação de variantes – na AWS, usando instâncias do Amazon Elastic Compute Cloud (Amazon EC2), executadas nos mais atuais processadores Intel® Xeon®. “Os processadores Intel são essenciais para a performance de nossas cargas de trabalho”, afirma Reese. “Em alguns de nossos processos de descoberta de variantes mais complexos, usamos até 200 gigabytes de RAM simultaneamente em todos os núcleos de processamento, e os Intel Xeons têm um desempenho excelente nesse tipo de carga extenuante”. A Fabric Genomics armazena resultados de sequenciamento genômico em buckets Amazon Simple Storage Service (Amazon S3) e utiliza volumes Amazon Elastic Block Store (Amazon EBS) de alto desempenho para obter um banco de dados de referência.

Após o sequenciamento dos dados genômicos, um arquivo FASTQ ou VCF é carregado na plataforma da Fabric Genomics para análise das variantes. As variantes são classificadas com uso da tecnologia de Machine Learning e algoritmos avançados. Os diretores de laboratório podem analisar os dados e gerar um relatório clínico personalizável.

A plataforma da Fabric Genomics fornece dados abrangentes, segurança de rede e suporte completo para atender à conformidade de regulamentações como HIPAA, ISO 27001 e FDA 21 CFR Parte 11. Além disso, a empresa depende muito dos recursos de segurança da AWS – além de tecnologias extras de criptografia – para proteger os dados do paciente. “Esses dados são alguns dos mais confidenciais do mundo – é literalmente o código de quem uma pessoa é”, diz Reese. “A AWS fornece alta segurança que nos ajuda a cumprir os rígidos requisitos de proteção de dados com as informações de saúde do paciente (PHI)”.

Os benefícios

As tecnologias da AWS e da Intel proporcionam à Fabric Genomics a capacidade de oferecer velocidades computacionais rápidas e segurança aos seus clientes. “Nosso software pode realizar sequenciamento e análise genética de forma muito rápida devido à performance que temos com a AWS e a Intel”, diz Reese. Como resultado, os clientes como Rady Children’s Institute of Genomic Medicine recebem os dados mais rapidamente. “Com o software de interpretação da Fabric Genomics na AWS, junto com outras ferramentas de software, podemos interpretar a variante de um genoma inteiro em questão de minutos, enquanto outras plataformas podem levar horas”, diz Nahas. “Isso significa que podemos iniciar nossa análise de forma mais rápida e refinar milhões de pontos de dados em poucos marcadores distintos para doenças infantis”, diz Nahas. “Por isso, podemos encontrar um diagnóstico em poucos minutos e obter imediatamente as informações para a equipe médica do Rady Children’s Hospital e possibilitar o tratamento de crianças com doenças graves.”

Em alguns casos, as equipes médicas do Rady Children’s Hospital, ao usar o pipeline de bioinformática do Rady Children’s Institute for Genomic Medicine para obter sequenciamento rápido e completo do genoma, descobriram que um paciente tem uma doença diferente da que se pensava inicialmente. “Podemos fazer diagnósticos mais precisos porque nossa análise mostrou qual é a doença e os médicos podem saber exatamente quais medicamentos ou tratamentos ajudam”, diz Nahas.

A Fabric Genomics está aproveitando a escalabilidade da AWS para atender aos clientes com necessidades de análise de dados muito extensas. “Com a AWS, podemos escalar nossa plataforma da forma mais ampla que desejamos”, diz Reese. “Se um cliente quer processar 10.000 genomas, podemos processar todos esses genomas simultaneamente. Temos uma competência ilimitada de expandir a capacidade computacional. Sem a escalabilidade da AWS, não conseguiríamos entregar 10.000 relatórios em dois dias.” Além disso, a empresa está usando várias Zonas de disponibilidade da AWS no mundo todo para atender às necessidades de seus clientes. “A AWS está presente em muitas regiões e podemos implantar nosso software globalmente sempre que quisermos”, diz Reese. “Isso nos ajuda, porque alguns clientes têm dados confidenciais que não podem sair de sua região devido a requisitos regulamentares locais. Com a AWS, podemos ajudá-los a armazenar esses dados em seus países ou regiões.”

A plataforma da Fabric Genomics está sendo utilizada por laboratórios clínicos para análise de genomas inteiros, exomas e painéis, e a empresa está entusiasmada em fazer parceria com vários laboratórios à medida que expandem seu volume de testes para testes de NGS. “A medicina de precisão ainda está no começo”, diz Reese. “Quanto mais pessoas usarem a AWS, mais fácil será compartilhar dados, assim, as pessoas poderão encontrar novos insights e nós poderemos tratar os pacientes mais cedo e identificar a causa da doença. Isso permitirá que sejamos mais eficazes com relação às opções de tratamento e, portanto, os pacientes serão mais saudáveis daqui para frente.”

As tecnologias da AWS e Intel proporcionam à Fabric Genomics a capacidade de oferecer velocidades computacionais rápidas

Estudo de caso da Fabric Genomics

Fabric Genomics é uma empresa de genômica de software que fornece análise de dados genômicos de ponta, soluções para geração de relatórios, classificação, curadoria e anotação para laboratórios clínicos, laboratórios hospitalares, empresas de biologia, programas de sequenciamento de países e instituições de pesquisa. 


Serviços da AWS usados

Amazon EC2

O Amazon Elastic Compute Cloud (Amazon EC2) é um web service que disponibiliza capacidade computacional segura e redimensionável na nuvem. Ele foi projetado para facilitar a computação em nuvem na escala da web para os desenvolvedores.

Saiba mais »

Amazon S3

O Amazon CloudFront é um serviço rápido de rede de entrega de conteúdo (CDN) que entrega dados, vídeos, aplicativos e APIs a clientes em todo o mundo com segurança, baixa latência e altas velocidades de transferência em um ambiente de uso facilitado para desenvolvedores.

Saiba mais »

Amazon EBS

O Amazon Elastic Block Store (EBS) é um serviço de armazenamento de blocos de alta performance fácil de usar projetado para o uso com o Amazon Elastic Compute Cloud (EC2), tanto para cargas de trabalho com alta taxa de transferência de dados quanto com intenso consumo de transações em qualquer escala.

Saiba mais »


Comece a usar

Empresas de todos os portes em todos os setores estão transformando seus negócios diariamente usando a AWS. Entre em contato com nossos especialistas e inicie sua própria jornada para a Nuvem AWS hoje mesmo.