- Produtos›
- Banco de dados›
- Amazon DocumentDB›
- Perguntas frequentes sobre o Amazon DocumentDB (compatível com MongoDB)
Perguntas frequentes sobre o Amazon DocumentDB (compatível com MongoDB)
Tópicos da página
GeralGeral
O que é o Amazon DocumentDB (compatível com MongoDB)?
O Amazon DocumentDB (compativel com MongoDB) é um serviço de banco de dados de documentos empresarial rápido, escalável, altamente disponível e totalmente gerenciado que oferece suporte a workloads JSON. Como banco de dados de documentos, o Amazon DocumentDB facilita o armazenamento, a consulta e a indexação de dados JSON. Os desenvolvedores podem usar o mesmo código, drivers e ferramentas de aplicações MongoDB que usam hoje para executar, gerenciar e dimensionar workloads no Amazon DocumentDB. Desfrute de melhor performance, escalabilidade e disponibilidade sem se preocupar com o gerenciamento da infraestrutura subjacente.
Os clientes podem usar o AWS Database Migration Service (DMS) para migrar facilmente bancos de dados não relacionais do MongoDB on-premises ou no Amazon Elastic Compute Cloud (EC2) para o Amazon DocumentDB sem praticamente nenhum tempo de inatividade. Não há investimentos adiantados para usar o Amazon DocumentDB. Os clientes pagam apenas pela capacidade utilizada.
Quais casos de uso são adequados para um banco de dados de documentos como o Amazon DocumentDB?
Os bancos de dados orientados a documentos são uma das categorias de bancos de dados noSQL que mais crescem, sendo que o principal motivo é que os bancos de dados de documentos oferecem esquemas flexíveis e amplos recursos de consulta. O modelo de documento é uma ótima opção para casos de uso com conjuntos de dados dinâmicos que exigem consulta, indexação e agregações ad-hoc. Com a escala que o Amazon DocumentDB oferece, ele é usado por uma ampla variedade de clientes para casos de uso como gerenciamento de conteúdo, personalização, catálogos, aplicações móveis e da Web, IoT e gerenciamento de perfis.
O que significa ser “compatível com MongoDB”?
“Compatível com MongoDB” significa que o Amazon DocumentDB interage com as APIs de código aberto do MongoDB 3.6, 4.0 e 5.0 do Apache 2.0. Como resultado, você pode usar os mesmos drivers, aplicações e ferramentas do MongoDB com o Amazon DocumentDB com poucas, ou nenhuma, mudanças. Enquanto o Amazon DocumentDB suporta a grande maioria das APIs do MongoDB que os clientes costumam usar, ele não suporta todas as APIs do MongoDB. Nosso foco tem sido entregar recursos que os clientes realmente usam e precisam.
Desde o lançamento, continuamos a trabalhar com base nas necessidades dos clientes e entregamos mais de 80 recursos adicionais, incluindo compatibilidade, transações e fragmentação com o MongoDB 4.0 e 5.0. Para saber mais sobre as APIs do MongoDB compatíveis, consulte a documentação de compatibilidade. Para saber mais sobre lançamentos recentes do Amazon DocumentDB, consulte “Anúncios do Amazon DocumentDB” na página de recursos do Amazon DocumentDB.
O Amazon DocumentDB é restringido pela licença SSPL do MongoDB?
Não. O Amazon DocumentDB não utiliza qualquer código SSPL do MongoDB, assim, ele não é restringido por essa licença. Em vez disso, o Amazon DocumentDB interage com as APIs de código aberto do MongoDB 3.6, 4.0 e 5.0 do Apache 2.0. Continuaremos a ouvir e trabalhar a partir das necessidades de nossos clientes para entregar os recursos que eles precisarem. Para saber mais sobre as APIs do MongoDB compatíveis, consulte a documentação de compatibilidade. Para saber mais sobre lançamentos recentes do Amazon DocumentDB, consulte “Anúncios do Amazon DocumentDB” na página de recursos do Amazon DocumentDB.
Como posso migrar dados de um banco de dados do MongoDB existente para o Amazon DocumentDB?
Os clientes podem usar o AWS Database Migration Service (DMS) para migrar facilmente bancos de dados do MongoDB on-premises ou no Amazon Elastic Compute Cloud (EC2) para o Amazon DocumentDB sem praticamente qualquer tempo de inatividade. Com o DMS, é possível migrar de um conjunto de réplicas do MongoDB ou de um cluster fragmentado para o Amazon DocumentDB. Além disso, você pode usar a maioria das ferramentas existentes para migrar dados de um banco de dados do MongoDB para o Amazon DocumentDB, como mongodump/mongorestore, mongoexport/mongoimport e ferramentas de terceiros que oferecem suporte à Change Data Capture (CDC – Captura de dados de alteração) por meio do oplog. Para obter mais informações, consulte Migrar para o Amazon DocumentDB.
É necessário alterar drivers do cliente para usar o Amazon DocumentDB?
Não, o Amazon DocumentDB funciona com a grande maioria dos drivers do MongoDB compatíveis com o MongoDB 3.4 ou superior.
O Amazon DocumentDB oferece suporte a transações ACID?
Sim. Com o lançamento do suporte para compatibilidade com MongoDB 4.0, o Amazon DocumentDB oferece suporte à capacidade de realizar transações de atomicidade, consistência,isolamento e durabilidade(ACID) em vários documentos, instruções, coleções e bancos de dados.
O Amazon DocumentDB está sujeito à programação de end of life (EOL – fim de vida útil) do MongoDB?
Não, o Amazon DocumentDB não segue os mesmos ciclos de vida de suporte do MongoDB, e a programação de EOL do MongoDB não se aplica ao Amazon DocumentDB.
Como faço para acessar um cluster do Amazon DocumentDB?
Os clusters do Amazon DocumentDB são implantados em uma Amazon VPC (VPC) do cliente e podem ser acessados diretamente por instâncias do Amazon Elastic Compute Cloud (EC2) ou outros serviços da AWS implantados na mesma VPC. Além disso, o Amazon DocumentDB pode ser acessado por instâncias do Amazon EC2 ou outros serviços da AWS em VPCs diferentes na mesma ou em outras regiões por meio do emparelhamento da VPC. O acesso aos clusters do Amazon DocumentDB deve ser feito por meio do mongo shell ou com os drivers do MongoDB. O Amazon DocumentDB exige autenticação para conexão a um cluster. Para opções adicionais, consulte Estabelecer conexão com um cluster do Amazon DocumentDB de fora de uma Amazon VPC.
Por que são exigidos recursos e permissões do Amazon RDS para o uso do Amazon DocumentDB?
Para determinados recursos de gerenciamento, como gerenciamento do ciclo de vida de instâncias, criptografia de dados ociosos com chaves do Amazon Key Management Service (KMS) e gerenciamento de grupos de segurança, o Amazon DocumentDB utiliza uma tecnologia operacional que é compartilhada com o Amazon Relational Database Service (RDS) e o Amazon Neptune. Ao usar as APIs describe-db-instances e describe-db-clusters da AWS CLI, recomendamos filtrar os recursos do Amazon DocumentDB usando o seguinte parâmetro: "--filter Name=engine,Values=docdb".
Quais os tipos de instância oferecidos pelo Amazon DocumentDB?
Consulte a página de preços do Amazon DocumentDB para obter informações atualizadas sobre os tipos de instância disponíveis por região.
Como faço para experimentar o Amazon DocumentDB?
Para experimentar o Amazon DocumentDB, visite o guia Conceitos básicos.
O Amazon DocumentDB tem um acordo de nível de serviço?
Sim. Para obter mais informações, consulte o Acordo de Nível de Serviço do Amazon DocumentDB (com compatibilidade com o MongoDB).
Performance
Que tipo de performance posso esperar do Amazon DocumentDB?
Ao gravar no armazenamento, o Amazon DocumentDB persiste apenas um log write-ahead e não precisa gravar sincronizações completas de páginas de buffer. Como resultado dessa otimização, que não compromete a resiliência, as gravações do Amazon DocumentDB são normalmente mais rápidas que as dos bancos de dados tradicionais. A escala dos clusters do Amazon DocumentDB pode ser aumentada horizontalmente até milhões de leituras por segundo com até 15 réplicas de leitura.
Preços
Quanto custa o Amazon DocumentDB e em quais regiões da AWS o Amazon DocumentDB está disponível?
Consulte a página de preços do Amazon DocumentDB para obter informações atualizadas sobre regiões e preços.
O Amazon DocumentDB tem um nível gratuito e você pode começar gratuitamente?
Sim, você pode experimentar o Amazon DocumentDB gratuitamente usando um teste gratuito por um mês. Caso ainda não tenha usado o Amazon DocumentDB, você está qualificado para um mês gratuito de teste. Sua organização recebe 750 horas por mês de uso da instância t3.medium, 30 milhões de ESs, 5 GB de armazenamento e 5 GB de armazenamento de backup gratuitamente por 30 dias. Assim que o teste gratuito de um mês expirar ou seu uso exceder a franquia gratuita, você poderá encerrar o cluster para evitar cobranças ou mantê-lo funcionando de acordo com nossas taxas padrão sob demanda. Para saber mais, consulte a página de teste gratuito do DocumentDB.
Por que eu deveria usar o Amazon DocumentDB I/O Optimized?
O Amazon DocumentDB I/O-Optimized é a escolha ideal quando você precisa de custos previsíveis ou tem aplicações com uso intensivo de E/S. Se você espera que seus custos de E/S excedam 25% dos custos totais do banco de dados Amazon DocumentDB, essa opção oferece melhor custo-benefício. Consulte a documentação do Amazon DocumentDB com E/S Otimizada para saber mais, incluindo como começar.
Posso alternar entre as configurações de armazenamento padrão e a I/O-Optimized?
Você pode mudar os clusters de banco de dados existentes uma vez a cada 30 dias para o Amazon DocumentDB I/O-Optimized. Você pode voltar às configurações de armazenamento padrão do Amazon DocumentDB a qualquer momento.
Com o Amazon DocumentDB I/O Optimized, eu continuo pagando pelas E/S necessárias para replicar dados entre regiões com clusters globais?
Sim, as cobranças pelas operações de E/S necessárias para replicar dados entre regiões continuam sendo aplicadas. O Amazon DocumentDB I/O-Optimized não cobra pelas operações de E/S de leitura e gravação, o que é diferente da replicação de dados. Consulte a documentação do Amazon DocumentDB com E/S Otimizada para saber mais.
Elastic Clusters
O que é o Amazon DocumentDB Elastic Clusters?
O Amazon DocumentDB Elastic Clusters permite que você escale elasticamente seu banco de dados de documentos para lidar com milhões de gravações e leituras, com petabytes de capacidade de armazenamento. O Elastic Clusters simplifica a maneira como os clientes interagem com o Amazon DocumentDB, gerenciando automaticamente a infraestrutura subjacente e eliminando a necessidade de criar, remover, atualizar ou escalar instâncias.
Como faço para começar a usar o Elastic Clusters?
Você pode criar um cluster do Elastic Clusters usando a CLI, o SDK, a API do Amazon DocumentDB, o CloudFormation (CFN) ou o console da AWS. Ao provisionar seu cluster, especifique quantos fragmentos e a computação por fragmento são necessários para sua workload. Depois de criar seu cluster, você estará pronto para começar a aproveitar a escalabilidade elástica do Elastic Clusters. Agora, é possível conectar-se ao cluster do Elastic Clusters e ler ou gravar dados da sua aplicação. O Elastic Clusters é elástico. Dependendo das necessidades da sua workload, você pode adicionar ou remover computação, modificando sua contagem de fragmentos e/ou computação por fragmento com o uso do console, da API, da CLI ou do SDK da AWS. O Elastic Clusters provisionará ou desprovisionará automaticamente a infraestrutura subjacente e rebalanceará seus dados.
Como o Elastic Clusters funciona?
O Elastic Clusters usa fragmentação para particionar dados no sistema de armazenamento distribuído do Amazon DocumentDB. O processo de fragmentação, também conhecido como particionamento, divide grandes conjuntos de dados em pequenos conjuntos de dados entre vários nós, permitindo que os clientes expandam seu banco de dados além dos limites de aumento de escala horizontal de um único banco de dados. O Elastic Clusters utiliza a separação entre computação e armazenamento no Amazon DocumentDB. Em vez de reparticionar coleções movendo pequenos blocos de dados entre nós de computação, o Elastic Clusters pode copiar dados de maneira eficiente dentro do sistema de armazenamento distribuído.
Que tipos de fragmentação são compatíveis com o Elastic Clusters?
O Elastic Clusters oferece suporte ao particionamento baseado em hash.
Como o Elastic Clusters é diferente da fragmentação do MongoDB?
Com o Elastic Clusters, você pode facilmente aumentar ou reduzir a escala da sua workload horizontalmente no Amazon DocumentDB, normalmente com pouco ou nenhum tempo de inatividade da aplicação ou impacto sobre a performance, independentemente do tamanho dos dados. Uma operação semelhante no MongoDB afetaria a performance da aplicação e demoraria horas e, em alguns casos, dias. O Elastic Clusters também oferece recursos de gerenciamento diferenciados, como backups sem impacto e restauração rápida pontual, permitindo que os clientes se concentrem mais em suas aplicações em vez de gerenciar seus bancos de dados.
Preciso fazer alguma alteração na minha aplicação para usar o Elastic Clusters?
Não. Você não precisa fazer alterações na sua aplicação para usar o Elastic Clusters.
Posso converter meu cluster existente do Amazon DocumentDB em um cluster do Elastic Clusters?
Não. Em curto prazo, você poderá aproveitar o serviço AWS Database Migration (DMS) para migrar dados de um cluster Amazon DocumentDB existente para um cluster do Elastic Clusters.
Como defino uma chave de fragmento?
Escolher uma chave de fragmento ideal para o Elastic Clusters não é diferente em comparação a outros bancos de dados. Uma chave de fragmento ideal tem duas características: alta frequência e alta cardinalidade. Por exemplo, se a sua aplicação armazena user_orders no DocumentDB, geralmente você precisa recuperar os dados por usuário. Portanto, você deseja que todos os pedidos relacionados a um determinado usuário estejam em um só fragmento. Nesse caso, user_id seria uma boa chave de fragmento. Leia mais informações.
Quais são os conceitos associados ao Elastic Clusters?
- Elastic Clusters: um cluster do Amazon DocumentDB que permite escalar a throughput da sua workload para milhões de leituras/gravações por segundo e o armazenamento para petabytes. Um cluster do Elastic Cluster é composto por um ou mais fragmentos para computação e um volume de armazenamento e, por padrão, está altamente disponível em várias zonas de disponibilidade.
- Fragmento: um fragmento fornece computação para o cluster do Elastic Clusters. Por padrão, um fragmento terá três nós: um nó de gravador e dois nós de leitor. É possível ter no máximo 32 fragmentos, e cada um pode ter no máximo 64 vCPUs.
- Chave de fragmento: a chave de fragmento é um campo opcional nos seus documentos JSON que o Elastic Clusters utiliza para distribuir o tráfego de leitura e gravação ao fragmento correspondente. É recomendável escolher uma chave que tenha muitos valores exclusivos. Uma boa chave de fragmentação particionará uniformemente seus dados nos fragmentos subjacentes, proporcionando à sua workload os melhores níveis de throughput e performance.
- Coleção fragmentada: uma coleção cujos dados são distribuídos em um cluster do Elastic Clusters.
Como o Elastic Clusters se relaciona a outros serviços da AWS?
O Elastic Clusters se integra a outros serviços da AWS da mesma forma que o DocumentDB faz atualmente. Primeiro, você pode usar o AWS Database Migration Service (DMS) para migrar do MongoDB e de outros bancos de dados relacionais para o Elastic Clusters. Segundo, você pode monitorar a integridade e a performance do seu cluster do Elastic Clusters usando o Amazon CloudWatch. Terceiro, você pode configurar a autenticação e a autorização por meio de usuários e perfis do AWS IAM e usar a AWS VPC para conexões seguras somente para VPC. Por último, você pode usar o AWS Glue para importar e exportar dados de/para outros serviços da AWS, como o S3, o Redshift e o OpenSearch.
Posso migrar minhas workloads fragmentadas existentes do MongoDB para o Elastic Clusters?
Sim. Você pode migrar suas workloads fragmentadas existentes do MongoDB para o Elastic Clusters. É possível usar o AWS Database Migration Service ou ferramentas nativas do MongoDB, como mongodump e mongorestore, para migrar sua workload do MongoDB para o Elastic Clusters. O Elastic Clusters também oferece suporte às APIs comumente usadas do MongoDB, como shardCollection(), oferecendo a você a flexibilidade de reutilizar ferramentas e scripts existentes com o Amazon DocumentDB.
Hardware, escalabilidade e armazenamento
Quais são os limites mínimo e máximo de armazenamento de um cluster do Amazon DocumentDB?
O armazenamento mínimo é de 10 GB. Com base na utilização do seu cluster, seu armazenamento do Amazon DocumentDB aumentará automaticamente até 128 TiB, em incrementos de 10 GB, sem afetar a performance. Com o Amazon DocumentDB Elastic Clusters, o armazenamento crescerá automaticamente até 4 PiB em incrementos de 10 GB. Em ambos os casos, não há necessidade de provisionar o armazenamento com antecedência.
Como o Amazon DocumentDB é escalado?
O Amazon DocumentDB é escalado em duas dimensões: armazenamento e computação. O armazenamento do Amazon DocumentDB é escalado automaticamente de 10 GB para 128 TiB em relação a clusters baseados em instâncias e até 4 PiB para clusters elásticos do Amazon DocumentDB. A capacidade computacional do Amazon DocumentDB pode ter um aumento na escala vertical, criando instâncias maiores, e na escala horizontal (para aumentar o throughput), adicionando mais instâncias de réplicas ao cluster.
Como posso escalar os recursos computacionais associados a um cluster do Amazon DocumentDB?
Você pode escalar os recursos computacionais alocados para uma instância no Console de Gerenciamento da AWS selecionando a instância desejada e clicando no botão Modify. Os recursos de memória e de CPU são modificados alterando a classe da instância.
Ao modificar a classe de instância, as alterações solicitadas serão aplicadas durante sua janela de manutenção especificada. Como alternativa, você pode usar o marcador “Aplicar imediatamente” para aplicar suas solicitações de escalabilidade imediatamente. As duas opções afetarão a disponibilidade por alguns minutos enquanto a operação de escalabilidade é realizada. Lembre-se de que qualquer outra alteração pendente do sistema também será aplicada.
Backup e restauração
Como faço para habilitar os backups de um cluster?
Os backups automáticos estão sempre habilitados nos clusters do Amazon DocumentDB. O recurso de backup de banco de dados simples do Amazon DocumentDB permite a recuperação em um ponto anterior no tempo de seus clusters. Você pode aumentar a janela de backup para restaurações em um ponto anterior no tempo para até 35 dias. Os backups não afetam a performance do banco de dados.
Posso criar snapshots de cluster e mantê-los disponíveis pelo tempo que quiser?
Sim. Os snapshots manuais podem ser mantidos além da janela de backup e a criação de snapshots não afeta a performance. Observe que restaurar dados a partir de snapshots do cluster exige a criação de um novo cluster.
Se minha instância falhar, qual será o caminho de recuperação?
O Amazon DocumentDB torna automaticamente seus dados duráveis em três zonas de disponibilidade (AZs) de uma região e tentará recuperar, de forma automática, a instância em uma AZ íntegra, sem perda de dados. No caso improvável dos dados estarem indisponíveis no armazenamento do Amazon DocumentDB, você pode restaurar com base em um snapshot do cluster ou realizar uma operação de restauração para um ponto no tempo para um novo cluster. Observe que o último momento restaurável para uma operação de restauração em um ponto anterior no tempo pode ser de até cinco minutos atrás.
O que acontecerá com os backups e snapshots de cluster automatizados se eu excluir um cluster?
Você pode optar por criar um snapshot final ao excluir a instância. Se fizer isso, você poderá usar esse snapshot para restaurar a instância excluída posteriormente. Após a exclusão da instância, o Amazon DocumentDB reterá esse snapshot criado pelo usuário, junto de todos os outros snapshots criados manualmente. Apenas os snapshots são mantidos depois da exclusão da instância (ou seja, os backups automáticos criados para restauração pontual não são mantidos).
O que acontecerá com os backups e snapshots de cluster automatizados se eu excluir minha conta?
A exclusão da sua conta da AWS excluirá todos os backups e snapshots automatizados contidos na conta.
Posso compartilhar os meus snapshots com outra conta da AWS?
Sim. O Amazon DocumentDB permite criar snapshots de cluster que podem ser usados posteriormente para restaurar um cluster. Você pode compartilhar um snapshot com uma conta diferente da AWS e o proprietário da conta de destino pode usar esse snapshot para restaurar um cluster com os seus dados. Você pode até mesmo optar por tornar seus snapshots públicos, ou seja, qualquer pessoa pode restaurar um cluster contendo seus dados (públicos). É possível usar este recurso para compartilhar dados entre seus vários ambientes (produção, desenvolvimento/teste, preparação, etc.) que tenham contas diferentes da AWS, como também manter backups de todos os seus dados seguros em uma conta separada, caso sua conta principal da AWS sofra uma ameaça em algum momento.
Eu receberei alguma cobrança por snapshots compartilhados?
Não há cobrança pelo compartilhamento de snapshots entre contas. No entanto, podem haver cobranças pelos snapshots em si, como também por qualquer cluster que você restaurar usando os snapshots compartilhados.
Posso compartilhar snapshots de maneira automática?
Não oferecemos suporte ao compartilhamento de snapshots de cluster automáticos. Para compartilhar um snapshot automático, você deve criar manualmente uma cópia do snapshot e, então, compartilhar a cópia.
Posso compartilhar snapshots do Amazon DocumentDB entre regiões diferentes?
Não. Os snapshots compartilhados do Amazon DocumentDB só poderão ser acessados por contas na mesma região da conta que os compartilha.
Posso compartilhar um snapshot criptografado do Amazon DocumentDB?
Sim. Você pode compartilhar snapshots criptografados do Amazon DocumentDB. O destinatário do snapshot compartilhado deve ter acesso à chave do KMS usada para criptografar o snapshot.
Posso usar os snapshots do Amazon DocumentDB fora do serviço?
Não. Os snapshots do Amazon DocumentDB só podem ser usados dentro do serviço.
O que acontece com os backups se eu excluir o cluster?
Você pode optar por criar um snapshot final ao excluir o cluster. Se fizer isso, você poderá usar esse snapshot para restaurar posteriormente o cluster excluído. Após a exclusão do cluster, o Amazon DocumentDB reterá esse snapshot criado pelo usuário, juntamente com todos os outros snapshots criados manualmente.
Alta disponibilidade e replicação
Como o Amazon DocumentDB melhora a tolerância do cluster a falhas de disco?
O Amazon DocumentDB divide automaticamente o volume do armazenamento em segmentos de 10 GB em vários discos. Cada bloco de 10 GB do volume de armazenamento é replicado seis vezes em três zonas de disponibilidade (AZs). O Amazon DocumentDB é projetado para tratar de maneira transparente a perda de até duas cópias de dados sem afetar a disponibilidade de gravação e até três cópias sem afetar a disponibilidade de leitura. Além disso, o volume de armazenamento do Amazon DocumentDB também oferece recuperação automática. Os blocos e discos de dados são varridos continuamente em busca de erros e corrigidos automaticamente.
Como o Amazon DocumentDB melhora o tempo de recuperação depois de uma falha do banco de dados?
Ao contrário de outros bancos de dados, depois de uma falha, o Amazon DocumentDB não precisa reproduzir o log de repetição do último ponto de verificação do banco de dados (normalmente cinco minutos) e confirmar que todas as alterações foram aplicadas antes de disponibilizar o banco de dados para operações. Isso reduz os tempos de reinicialização do banco de dados para menos de 60 segundos na maioria dos casos. O Amazon DocumentDB move o cache para fora do processo do banco de dados e o disponibiliza imediatamente no momento da reinicialização. Isso evita que você tenha que controlar o acesso até que o cache esteja preenchido novamente para evitar comprometimentos de performance.
Para que tipo de réplicas o Amazon DocumentDB oferece suporte?
O Amazon DocumentDB oferece suporte a réplicas de leitura, que compartilham o mesmo volume de armazenamento subjacente da instância principal. As atualizações feitas pela instância principal são visíveis para todas as réplicas do Amazon DocumentDB.
- Recurso: réplicas de leitura do Amazon DocumentDB
- Número de réplicas: até 15
- Tipo de replicação: assíncrona (normalmente, milissegundos)
- Impacto de performance na instância principal: baixo
- Atua como destino de failover: sim (sem perda de dados)
- Failover automatizado: sim
Posso ter réplicas entre regiões com o Amazon DocumentDB?
Sim, você pode replicar seus dados entre regiões usando o recurso Global Cluster. Os Global Clusters se estendem entre várias Regiões da AWS. Os Global Clusters replicam seus dados para clusters em até cinco regiões com pouco ou nenhum impacto na performance. Os Global Clusters oferecem recuperação de desastres mais rápida após interrupções por toda a região e permitem leituras globais de baixa latência. Para saber mais, consulte nossa publicação no blog.
Posso priorizar algumas réplicas como destinos de failover em relação a outras?
Sim. Você pode atribuir um nível de prioridade de promoção a cada instância no seu cluster. Se a instância principal falhar, o Amazon DocumentDB promoverá a réplica com a maior prioridade como principal. Se houver inconsistências entre duas ou mais réplicas na mesma camada de prioridade, o Amazon DocumentDB promoverá a réplica que tiver o mesmo tamanho da instância principal.
Posso modificar as camadas de prioridade para instâncias depois que elas forem criadas?
É possível modificar a camada de prioridade para uma instância a qualquer momento. Um failover não é acionado apenas com a modificação de camadas de prioridade.
Posso evitar que determinadas réplicas sejam promovidas como a instância primária?
Você pode atribuir níveis de prioridade mais baixos para réplicas que não quer promover para a instância principal. No entanto, se as réplicas de prioridade mais alta no cluster não estiverem íntegras ou disponíveis por alguma razão, o Amazon DocumentDB promoverá a réplica de prioridade mais baixa.
Como o Amazon DocumentDB garante a alta disponibilidade de um cluster?
O Amazon DocumentDB pode ser implantado em uma configuração de alta disponibilidade, usando instâncias de réplica em várias zonas de disponibilidade da AWS como destinos de failover. No caso de uma falha de instância principal, a instância replicada é promovida automaticamente como a nova principal, com o mínimo de interrupção do serviço.
Como posso melhorar a disponibilidade de uma única instância do Amazon DocumentDB?
Você pode acrescentar réplicas do Amazon DocumentDB. As réplicas do Amazon DocumentDB compartilham o mesmo armazenamento subjacente da instância principal. Qualquer réplica do Amazon DocumentDB pode ser promovida para tornar-se principal sem nenhuma perda de dados e, portanto, pode ser usada para melhorar a tolerância a falhas no caso de falha de uma instância principal. Para aumentar a disponibilidade do cluster, crie de 1 a 15 réplicas em várias AZs. O Amazon DocumentDB as incluirá automaticamente na escolha de principal pelo failover no caso de interrupção da instância.
O que acontece durante o failover e quanto tempo o processo demora?
O failover é controlado automaticamente pelo Amazon DocumentDB para que as aplicações possam retomar as operações de banco de dados com a maior rapidez possível sem intervenção administrativa manual.
- Se você tiver uma instância de réplica do Amazon DocumentDB na mesma zona de disponibilidade ou em outra, ao fazer o failover, o Amazon DocumentDB alterará o registro de nome canônico (CNAME) do da instância para apontar para a réplica íntegra, que, por sua vez, será promovida como a nova principal. Normalmente, o failover é concluído em até 30 segundos.
- Se você não tiver uma instância de réplica do Amazon DocumentDB (ou seja, um cluster de uma única instância), o Amazon DocumentDB tentará criar uma nova instância na mesma zona de disponibilidade da instância original. Faremos o possível para substituir a instância original, mas pode ser que isso não tenhamos sucesso se, por exemplo, ocorrer um problema que afete amplamente a zona de disponibilidade.
Seu aplicativo deve tentar novamente fazer as conexões do banco de dados em caso de perda de conexão.
Se eu tiver uma instância principal e uma instância de réplica do Amazon DocumentDB consumindo ativamente o tráfego de leitura e ocorrer um failover, o que acontecerá?
O Amazon DocumentDB detectará automaticamente um problema com a instância principal e começará a rotear o tráfego de leitura/gravação para uma instância de réplica do Amazon DocumentDB. Em média, o failover é concluído em até 30 segundos. Além disso, o tráfego de leitura atendido pelas instâncias de réplica do Amazon DocumentDB será brevemente interrompido.
Qual é a defasagem entre a instância primária e as réplicas?
Como as réplicas do Amazon DocumentDB compartilham o mesmo volume de dados da instância principal, praticamente não há atraso na replicação. Normalmente, observamos defasagens de dezenas de milissegundos.
Segurança e conformidade
Posso usar o Amazon DocumentDB na Amazon Virtual Private Cloud (Amazon VPC)?
Sim. Todos os clusters do Amazon DocumentDB devem ser criados em uma VPC. Com o Amazon VPC, é possível definir uma topologia de rede virtual que lembra muito uma rede tradicional que você poderá operar no seu próprio Datacenter. Isso oferece a você total controle sobre quem acessa seus clusters do Amazon DocumentDB.
O Amazon DocumentDB aceita o Role-based access control (RBAC – Controle de acesso baseado em função)?
O Amazon DocumentDB aceita o RBAC com funções integradas. O RBAC permite que você aplique o menor privilégio como uma prática recomendada ao restringir as ações que os usuários estão autorizados a executar. Para obter mais informações, consulte o controle de acesso com base na função do Amazon DocumentDB.
Como os modos de autenticação atuais do MongoDB funcionam com o Amazon DocumentDB?
O Amazon DocumentDB utiliza os perímetros rigorosos de rede e autorização da VPC. A autenticação e a autorização para as APIs de gerenciamento do Amazon DocumentDB são fornecidas por perfis, políticas e usuários do IAM. A autenticação em um banco de dados do Amazon DocumentDB é feita por meio de ferramentas e drivers padrão do MongoDB com o Salted Challenge Response Authentication Mechanism (SCRAM), o mecanismo de autenticação padrão do MongoDB.
O Amazon DocumentDB oferece suporte à criptografia de dados ociosos?
Sim. O Amazon DocumentDB permite criptografar clusters usando chaves gerenciadas por meio do AWS Key Management Service (KMS). Em um cluster em execução com a criptografia do Amazon DocumentDB, os dados ociosos mantidos no armazenamento subjacente são criptografados, bem como os backups automáticos, as réplicas de leitura e os snapshots desses dados no mesmo cluster. A criptografia e a descriptografia são processadas de forma transparente. Para obter mais informações sobre o uso do KMS com o Amazon DocumentDB, consulte Criptografar dados do Amazon DocumentDB em repouso.
Posso criptografar um cluster existente não criptografado?
No momento, não há suporte à criptografia de um cluster do Amazon DocumentDB existente não criptografado. Para usar a criptografia do Amazon DocumentDB para um cluster existente não criptografado, crie um novo cluster com criptografia habilitada e migre os dados para ele.
Quais certificações de conformidade foram obtidas pelo Amazon DocumentDB?
O Amazon DocumentDB foi projetado para atender aos mais altos padrões de segurança, facilitar a sua verificação de nossa segurança e cumprir suas próprias obrigações normativas e de conformidade. O Amazon DocumentDB foi avaliado como estando e conformidade com a PCI DSS, ISO 9001 , 27001 , 27017 e 27018, SOC 1, 2 e 3 e a certificação de Estrutura comum de segurança (CSF) da Health Information Trust Alliance (HITRUST), além de estar qualificado para a HIPAA. Os relatórios de conformidade da AWS estão disponíveis para download no AWS Artifact.
Importante atualização da versão
O que é a atualização da versão principal no local?
A major version upgrade (MVU – atualização de versão principal) no local permite que você atualize clusters do Amazon DocumentDB 3.6 ou 4.0 para o Amazon DocumentDB 5.0 usando o console da AWS, o kit de desenvolvimento de software (SDK) ou a interface de linha de comando (CLI). Com a MVU no local, não há necessidade de criar novos clusters ou alterar seus endpoints. A MVU no local está disponível em todas as regiões em que o Amazon DocumentDB 5.0 está disponível. Para começar a usar a MVU no local, consulte a documentação sobre a MVU no local.
Por que devo usar a MVU no local?
A MVU no local permite que você atualize facilmente seus clusters do Amazon DocumentDB 3.6 ou 4.0 para a versão 5.0 sem precisar fazer backup e restauração em outro cluster e sem usar outras ferramentas de migração de dados. Essa abordagem reduz o tempo e o esforço associados ao processo de atualização normal, que envolve a configuração dos endpoints de origem e destino, a migração de índices e dados, a alteração do código da aplicação e muito mais.
Você não precisará alterar seu endpoint nas aplicações após a atualização. Como os dados permanecem no mesmo cluster, não há custo adicional para atualizar usando este recurso.
Qual é o tempo de inatividade ao fazer o upgrade com a MVU no local?
O tempo de inatividade pode variar de cluster para cluster, dependendo do número de coleções, índices, bancos de dados e instâncias. Antes de executar a atualização de versão principal no local no cluster de produção, é altamente recomendável executá-la em um ambiente inferior para testar o tempo de inatividade, a performance e verificar se as aplicações funcionam conforme o esperado após a atualização.
Você também pode utilizar o recurso de clonagem rápida do Amazon DocumentDB para clonar seus dados de cluster para testes. Dependendo da complexidade da implementação do Amazon DocumentDB, você pode solicitar ajuda adicional do nosso arquiteto de soluções de banco de dados.
Quais versões de mecanismos são compatíveis com a MVU no local atualmente?
A MVU no local só é compatível com o Amazon DocumentDB 3.6 ou 4.0 como origem e com a versão 5.0 como destino. Não é compatível com Amazon DocumentDB Global Clusters ou Elastic Clusters ou com o DocumentDB 4.0 como destino.
Machine learning
Como posso usar meus dados no Amazon DocumentDB para criar modelos de machine learning?
O Amazon DocumentDB se integra ao Amazon SageMaker Canvas, facilitando a criação de modelos de machine learning (ML) e a personalização de modelos básicos usando dados armazenados no Amazon DocumentDB sem escrever uma única linha de código. Você não precisa mais desenvolver dados personalizados e pipelines de ML entre o Amazon DocumentDB e o SageMaker Canvas. Você pode iniciar o SageMaker Canvas no console do Amazon DocumentDB e adicionar bancos de dados Amazon DocumentDB existentes como fonte de dados para começar a criar seus modelos de machine learning. Você pode usar seus dados no DocumentDB no SageMaker Canvas e criar modelos para prever a rotatividade de clientes, detectar fraudes, prever falhas de manutenção, prever métricas financeiras e vendas, otimizar inventário, resumir conteúdo e gerar conteúdo.
IA generativa e machine learning
O que é pesquisa vetorial?
A pesquisa vetorial é um método usado no machine learning (ML) para encontrar pontos de dados semelhantes a um determinado ponto de dados, comparando suas representações vetoriais usando métricas de distância ou similaridade. Quanto mais próximos os dois vetores estiverem no espaço vetorial, mais semelhantes serão considerados os itens subjacentes. Essa técnica ajuda a capturar o significado ou a semântica dos dados. Essa abordagem é útil em vários aplicativos, como sistemas de recomendação, processamento de linguagem natural e reconhecimento de imagens.
Qual é o custo associado ao uso do Amazon DocumentDB como fonte de dados no Amazon SageMaker Canvas para criar modelos de machine learning?
O Amazon SageMaker Canvas oferece uma interface sem código para criar modelos de machine learning usando dados de várias fontes de dados, incluindo o Amazon DocumentDB. Você é cobrado pelo uso do SageMaker Canvas e pelas E/S resultantes quando o SageMaker Canvas ler os dados da instância do Amazon DocumentDB. Não há custo adicional para usar o DocumentDB como fonte de dados no Amazon SageMaker Canvas. Consulte a página de preços do Amazon DocumentDB e a página de preços do SageMaker Canvas para saber mais.
Por que eu deveria usar a pesquisa vetorial para o Amazon DocumentDB?
A pesquisa vetorial para o Amazon DocumentDB combina a flexibilidade e a rica capacidade de consulta de um banco de dados de documentos baseado em JSON com o poder da pesquisa vetorial. Você pode usar seus dados existentes do Amazon DocumentDB, ou uma estrutura de dados de documentos flexível, para criar casos de uso de machine learning e IA generativa, como experiências de pesquisa semântica, recomendações de produtos, personalização, chatbots, detecção de fraudes e detecção de anomalias. Consulte a documentação sobre pesquisa vetorial do Amazon DocumentDB para saber mais.
Quais versões do Amazon DocumentDB oferecem suporte à pesquisa vetorial?
A pesquisa vetorial para o Amazon DocumentDB está disponível nos clusters baseados em instâncias do Amazon DocumentDB 5.0.
Como a implementação da pesquisa semântica difere da pesquisa por palavra-chave com o Amazon DocumentDB?
A pesquisa vetorial para o Amazon DocumentDB permite o uso da pesquisa semântica para que você possa capturar o significado, o contexto e a intenção por trás de seus dados. A pesquisa por palavra-chave localiza o documento com base no texto real ou em mapeamentos de sinônimos predefinidos. Por exemplo, em um aplicativo de comércio eletrônico tradicional, um vestido vermelho pode devolver produtos que tenham as palavras “vermelho” e “vestido” em suas descrições. A pesquisa semântica recuperará resultados com vestidos em diferentes tons de vermelho, o que pode melhorar a experiência do usuário.
Qual é o custo associado ao uso da pesquisa vetorial para o Amazon DocumentDB?
Não há custo adicional para usar a pesquisa vetorial no Amazon DocumentDB. As taxas padrão de computação, E/S, armazenamento e backup serão aplicadas à medida que você armazenar, indexar e pesquisar vetores no Amazon DocumentDB. Consulte a página de preços do Amazon DocumentDB para saber mais.
Por que eu deveria usar o machine learning sem código com o Amazon DocumentDB e o Amazon SageMaker Canvas?
O Amazon DocumentDB se integra ao Amazon SageMaker Canvas, facilitando a criação de aplicações de inteligência artificial (IA) generativa e machine learning (ML) usando dados armazenados no Amazon DocumentDB. Você não precisa mais desenvolver dados personalizados e pipelines de ML entre o Amazon DocumentDB e o SageMaker Canvas. A integração no console elimina o trabalho pesado indiferenciado de conectar e acessar dados para acelerar o desenvolvimento de ML com uma experiência de baixo código sem código (LCNC). Você pode iniciar o SageMaker Canvas no console do Amazon DocumentDB e adicionar bancos de dados Amazon DocumentDB existentes como fonte de dados.
Integração ETL zero
Por que devo usar a Integração ETL zero do Amazon DocumentDB com o Amazon OpenSearch Service?
Essa Integração ETL zero com o Amazon OpenSearch Service abstrai a complexidade operacional no processo de extração, transformação e carregamento de dados de uma coleção do Amazon DocumentDB para um cluster gerenciado ou uma coleção sem servidor do Amazon OpenSearch. Com essa integração, você não precisa mais criar ou gerenciar pipelines de dados nem transformar dados.
Quando eu quiser realizar a pesquisa vetorial para meu caso de uso de IA generativa, quando devo usar os recursos nativos de pesquisa vetorial do Amazon DocumentDB versus a Integração ETL zero com o Amazon Opensearch Service?
Se quiser usar as APIs do MongoDB, você deve usar os recursos nativos do banco de dados no Amazon DocumentDB para realizar pesquisas vetoriais nos seus documentos. A integração do Amazon DocumentDB ETL zero com o Amazon OpenSearch Service é adequada para pesquisar em coleções e armazenar e indexar vetores com mais de 2.000 dimensões.
Como essa Integração ETL zero replica dados do Amazon DocumentDB para o Amazon OpenSearch Service?
A Integração ETL zero do Amazon DocumentDB com o Amazon OpenSearch Service usa o Amazon OpenSearch Ingestion para mover facilmente dados operacionais do Amazon DocumentDB para o Amazon OpenSearch Service. Para começar, você habilita a funcionalidade de fluxo de alterações na coleção do Amazon DocumentDB que precisa ser replicada. O recurso de Integração ETL zero configura um pipeline de ingestão do Amazon OpenSearch na sua conta que replica automaticamente os dados em um cluster gerenciado do Amazon OpenSearch Service ou em uma coleção sem servidor.
O Amazon OpenSearch Ingestion compreende automaticamente o formato dos dados nas coleções do Amazon DocumentDB e mapeia os dados para o Amazon OpenSearch Service com a finalidade de gerar os melhores resultados de pesquisa. Você pode sincronizar dados de várias coleções do Amazon DocumentDB por meio de vários pipelines em um cluster gerenciado pelo Amazon OpenSearch ou em uma coleção sem servidor para oferecer insights holísticos em várias aplicações. Opcionalmente, você pode especificar processadores de dados personalizados ao definir a configuração de ingestão no Amazon OpenSearch Service. As atualizações subsequentes das coleções do DocumentDB também são replicadas para o Amazon OpenSearch Service sem qualquer intervenção manual.
Como a transformação de dados funciona ao mover dados do Amazon DocumentDB para o Amazon OpenSearch Service?
A Integração ETL zero usa os recursos nativos de transformação de dados dos pipelines do Amazon OpenSearch Ingestion para agregar e filtrar os dados enquanto eles estão em movimento.
Quais são as minhas opções se eu não quiser usar a lógica de transformação fornecida pelo Amazon OpenSearch Ingestion?
Você também pode escrever uma lógica de transformação personalizada se quiser capacidade de transformação personalizada, e o Amazon OpenSearch Ingestion gerenciará o processo de transformação. Como alternativa, se você quiser mover dados inteiros da origem para o coletor sem personalização, o Amazon OpenSearch Ingestion fornece esquemas prontos para que você possa realizar as integrações com apenas alguns cliques.
Quais permissões de segurança são necessárias para usar a Integração ETL zero para o Amazon OpenSearch?
Para garantir que o Amazon OpenSearch Ingestion tenha as permissões necessárias para replicar dados do Amazon DocumentDB, o recurso de Integração ETL zero cria um perfil do IAM com as permissões necessárias para ler dados das tabelas do Amazon DocumentDB e gravar em um domínio ou coleção do Amazon OpenSearch. Esse perfil é então assumido por pipelines do Amazon OpenSearch Ingestion para garantir que a postura de segurança correta seja sempre mantida ao mover os dados da origem para o destino.
Como posso monitorar o estado da minha integração entre o Amazon DocumentDB e o Amazon OpenSearch Service?
Você pode visualizar todas as métricas relacionadas à sua Integração ETL zero com o Amazon DocumentDB nos painéis do console fornecidos pelo Amazon DocumentDB e pelo pipeline do OpenSearch Ingestion. Também pode consultar logs em tempo real no Amazon CloudWatch e configurar alertas personalizados usando o Amazon CloudWatch, que são acionados quando limites definidos pelo usuário são violados.
Acesse a página de definição de preço do Amazon DocumentDB (com compatibilidade com o MongoDB).
Obtenha acesso instantâneo ao nível gratuito da AWS.
Comece a criar usando o Amazon DocumentDB (com compatibilidade com o MongoDB) no Console AWS.