Preguntas frecuentes sobre Amazon DocumentDB (con compatibilidad con MongoDB)

Aspectos generales

Amazon DocumentDB (con compatibilidad con MongoDB) es un servicio empresarial de bases de datos de documentos ágil, escalable, de alta disponibilidad y completamente administrado que admite cargas de trabajo JSON nativas. Como base de datos de documentos, Amazon DocumentDB hace que almacenar, consultar e indexar datos JSON sea realmente fácil. Los desarrolladores pueden utilizar el mismo código de aplicación, controladores y herramientas de MongoDB que utilizan actualmente para ejecutar, administrar y escalar cargas de trabajo en Amazon DocumentDB. Disfrute de un rendimiento, una escalabilidad y una disponibilidad con mejoras sin preocuparse por la administración de la infraestructura subyacente.

Los clientes pueden usar AWS Database Migration Service (DMS) para migrar con facilidad las bases de datos locales no relacionales de MongoDB o de Amazon Elastic Compute Cloud (EC2) a Amazon DocumentDB prácticamente sin generar tiempo de inactividad. No es necesario hacer inversiones iniciales para poder usar Amazon DocumentDB y los clientes pagan únicamente la capacidad que consumen.

Las bases de datos orientadas a documentos son una de las categorías de bases de datos de tipo noSQL con un crecimiento más rápido, ya que las bases de datos de documentos ofrecen tanto esquemas flexibles como amplias funcionalidades de consulta. El modelo de documentos es una elección excelente para los casos de uso con conjuntos de datos dinámicos que requieren consultas, indexación y agregaciones ad-hoc. Gracias a la escala que proporciona Amazon DocumentDB, una amplia variedad de clientes lo usan para casos de uso como la administración de contenido, personalización, catálogos, aplicaciones móviles y web, IoT y administración de perfiles.

“Compatible con MongoDB” implica que Amazon DocumentDB interactúa con las API 3.6, 4.0 y 5.0 de MongoDB de código abierto de Apache 2.0. Por lo tanto, puede utilizar los mismos controladores, aplicaciones y herramientas de MongoDB con Amazon DocumentDB con pocos o ningún cambio. Mientras que Amazon DocumentDB es compatible con la gran mayoría de las API de MongoDB que los clientes realmente utilizan, no es compatible con todas las API de MongoDB. Nos hemos centrado en ofrecer capacidades que los clientes realmente utilicen y necesiten.

Desde el lanzamiento, hemos continuado nuestro trabajo con el cliente como punto de partida y hemos proporcionado más de 80 capacidades adicionales, incluidas las transacciones, la compatibilidad y la partición con MongoDB 4.0 y 5.0. Para obtener más información acerca de las API de MongoDB admitidas, consulte la documentación sobre compatibilidad. Para obtener más información sobre los lanzamientos recientes de Amazon DocumentDB, consulte los “anuncios de Amazon DocumentDB” en la página de recursos de Amazon DocumentDB.

No. Amazon DocumentDB no utiliza ningún código SSPL de MongoDB y, por lo tanto, no está restringido por esta licencia. En su lugar, Amazon DocumentDB interactúa con las API 3.6, 4.0 y 5.0 de MongoDB de código abierto de Apache 2.0. Siempre vamos a escuchar y a trabajar con nuestros clientes como punto de partida para ofrecer las capacidades que ellos necesitan. Para obtener más información acerca de las API de MongoDB admitidas, consulte la documentación sobre compatibilidad. Para obtener más información sobre los lanzamientos recientes de Amazon DocumentDB, consulte los “anuncios de Amazon DocumentDB” en la página de recursos de Amazon DocumentDB.

Los clientes pueden usar AWS Database Migration Service (DMS) para migrar con facilidad sus bases de datos locales de MongoDB o de Amazon Elastic Compute Cloud (EC2) a Amazon DocumentDB prácticamente sin generar tiempo de inactividad. Con DMS, puede migrar desde un clúster particionado o un conjunto de réplicas de MongoDB a Amazon DocumentDB. Además, puede usar la mayoría de las herramientas existentes para migrar datos desde una base de datos de MongoDB a Amazon DocumentDB, incluidas mongodump/mongorestore, mongoexport/mongoimport, y herramientas de terceros compatibles con la captura de datos modificados (CDC) a través de oplog. Para más información, consulte Migración a Amazon DocumentDB.

No, Amazon DocumentDB funciona con una amplia mayoría de controladores de MongoDB compatibles con la versión MongoDB 3.4 y posteriores.

Sí. Con el lanzamiento del soporte para la compatibilidad con MongoDB 4.0, Amazon DocumentDB admite la capacidad de efectuar transacciones de atomicidad, consistencia, aislamiento y durabilidad (ACID) en varios documentos, instrucciones, colecciones y bases de datos.

No, Amazon DocumentDB no sigue los mismos ciclos de vida de soporte que MongoDB y el programa de EOL de MongoDB no aplica en Amazon DocumentDB.

Es posible obtener acceso directo a los clústeres de Amazon DocumentDB implementados en una Amazon VPC (VPC) del cliente mediante instancias de Amazon Elastic Compute Cloud (EC2) u otros servicios de AWS que estén implementados en la misma VPC. Además, es posible obtener acceso a Amazon DocumentDB mediante instancias de Amazon EC2 u otros servicios de AWS en diferentes VPC de la misma región u otras regiones a través de la conexión de emparejamiento de VPC. El acceso a los clústeres de Amazon DocumentDB debe obtenerse a través del shell de Mongo o de los controladores de MongoDB. Amazon DocumentDB pide que se autentique al momento de conectarse a un clúster. Para más opciones, consulte Conexión a un clúster de Amazon DocumentDB desde fuera de Amazon VPC.

Para determinadas características de administración, como la del ciclo de vida de instancias, el cifrado en reposo con claves de Amazon Key Management Service (KMS) y la administración de grupos de seguridad, Amazon DocumentDB utiliza tecnología operativa que se comparte con Amazon Relational Database Service (RDS) y Amazon Neptune. Cuando utilice las API de AWS CLI describe-db-instances y describe-db-clusters, recomendamos que filtre los recursos de Amazon DocumentDB mediante el siguiente parámetro: “--filter Name=engine,Values=docdb”.

Consulte nuestra página de precios de Amazon DocumentDB para obtener información actualizada sobre los tipos de instancias disponibles por región.

Para probar Amazon DocumentDB, consulte la guía de Introducción.

Sí. Si desea obtener más información, consulte el Acuerdo de nivel de servicios de Amazon DocumentDB (con compatibilidad con MongoDB).

Rendimiento

Al escribir en el almacenamiento, Amazon DocumentDB solo conserva un registro de escritura previa y no escribe sincronizaciones de páginas de búfer completas. Como resultado de esta optimización, que no afecta la durabilidad, las escrituras de Amazon DocumentDB normalmente son más rápidas que las bases de datos tradicionales. Amazon DocumentDB puede escalar horizontalmente a millones de lecturas por segundo con hasta 15 réplicas de lectura.

Precios

Consulte la página de precios de Amazon DocumentDB para obtener información actualizada sobre regiones y precios.

Sí, puede probar Amazon DocumentDB sin costo con la prueba gratuita de un mes. Si no ha utilizado Amazon DocumentDB antes, puede optar por la prueba gratuita de un mes. La organización obtiene 750 horas al mes de uso de la instancia t3.medium, 30 millones de operaciones de entrada y salida, 5 GB de almacenamiento y 5 GB de almacenamiento de copias de seguridad de forma gratuita durante 30 días. Una vez que expire el mes de prueba gratuito o el uso exceda la asignación gratuita, puede apagar el clúster para evitar cualquier cargo o mantenerlo en ejecución bajo nuestras tarifas estándar bajo demanda. Para más información, consulte la página de prueba gratuita de DocumentDB.

Amazon DocumentDB optimizado para E/S es la opción ideal cuando necesita costos predecibles o tiene aplicaciones intensivas de E/S. Si espera que sus costos de E/S superen el 25 % de los costos totales de su base de datos Amazon DocumentDB, esta opción ofrece una mejor relación precio-rendimiento. Consulte nuestra documentación de Amazon DocumentDB optimizado para E/S para obtener más información, incluido cómo empezar.

Puede cambiar los clústeres de bases de datos existentes una vez cada 30 días a Amazon DocumentDB optimizado para E/S. Puede volver a las configuraciones de almacenamiento estándar de Amazon DocumentDB en cualquier momento.

Sí, se siguen cobrando los cargos por las operaciones de E/S necesarias para replicar datos en todas las regiones. Amazon DocumentDB optimizado para E/S no cobra por las operaciones de E/S de lectura y escritura, lo cual es diferente de la replicación de datos. Consulte nuestra documentación de Amazon DocumentDB optimizado para E/S para obtener más información.

Clústeres elásticos

Clústeres elásticos de Amazon DocumentDB le permite escalar de manera elástica su base de datos de documentos para administrar millones de escrituras y lecturas, con petabytes de capacidad de almacenamiento. Los clústeres elásticos simplifican la manera en la que los clientes interactúan con Amazon DocumentDB, al administrar de manera automática la infraestructura subyacente y eliminar la necesidad de crear, eliminar, actualizar o escalar instancias.

Puede crear un clúster de Clústeres Elásticos a través de la API de Amazon DocumentDB, el SDK, la CLI, CloudFormation (CFN) o la consola de AWS. Cuando aprovisiona su clúster, especifica cuántas particiones y cuántos recursos de computación por partición necesita su carga de trabajo. Una vez que ha creado el clúster, está preparado para empezar a beneficiarse de la escalabilidad elástica de Clústeres elásticos. Ahora, puede conectarse al clúster de Clústeres elásticos y leer o escribir datos desde su aplicación. Clústeres elásticos es elástico. Según las necesidades de su carga de trabajo, puede agregar o eliminar recursos de computación si modifica el recuento de particiones o el de recursos de computación por partición a través de la consola de AWS, la API, la CLI o el SDK. Los clústeres elásticos aprovisionarán o desaprovisionarán la infraestructura subyacente y reequilibrarán sus datos de manera automática.

Clústeres elásticos utiliza la partición para particionar datos en el sistema de almacenamiento distribuido de Amazon DocumentDB. La partición, también denominada particionado, divide conjuntos de datos de gran tamaño en conjuntos pequeños en varios nodos, lo cual permite a los clientes escalar horizontalmente su base de datos más allá de los límites de escalado vertical de una única base de datos. Clústeres elásticos utiliza la división de computación y almacenamiento de Amazon DocumentDB. En lugar de volver a particionar colecciones al transferir pequeños fragmentos de datos entre nodos de computación, Clústeres elásticos puede copiar datos de manera eficiente dentro del sistema de almacenamiento distribuido.

Clústeres elásticos es compatible con el particionado basado en hash.

Con Clústeres elásticos, puede escalar o desescalar horizontalmente su carga de trabajo en Amazon DocumentDB y, por norma general, con poco o ningún tipo de periodo de inactividad ni impacto sobre el rendimiento, sin importar el tamaño de los datos. Una operación similar en MongoDB afectaría al rendimiento de la aplicación y tardaría horas o, en algunos casos, días. Clústeres elásticos también brinda capacidades de administración diferenciada como copias de seguridad sin impacto y recuperación rápida a un momento dado, lo que le permite a los clientes dedicar más tiempo a sus aplicaciones en lugar de emplearlo en administrar su base de datos.

No, no necesita hacer ningún cambio en la aplicación para utilizar Clústeres elásticos.

Sí. A corto plazo puede utilizar AWS Database Migration Service (DMS) para migrar datos desde un clúster de Amazon DocumentDB existente a un clúster de Clústeres elásticos.

La elección de una clave de partición óptima para Clústeres elásticos no difiere de la de otras bases de datos. Una buena clave de partición tiene dos características: alta frecuencia y alta cardinalidad. Por ejemplo, si su aplicación almacena user_orders (pedidos de usuarios) en DocumentDB, por lo general tendrá que recuperar los datos por usuario. De este modo, querrá que todos los pedidos relacionados con un usuario específico estén en una partición. En ese caso, user_id (ID de usuario) sería una buena clave de partición. Obtenga más información

  • Clústeres elásticos: un clúster de Amazon DocumentDB que le permite escalar el rendimiento de su carga de trabajo a millones de lecturas y escrituras por segundo y disponer de petabytes de almacenamiento. Un clúster de Clústeres elásticos se compone de una o más particiones por recurso de computación y un volumen de almacenamiento, y tiene una alta disponibilidad en varias zonas de disponibilidad de manera predeterminada.
  • Partición: una partición ofrece computación para un clúster de Clústeres elásticos. De manera predeterminada, una partición tendrá tres nodos, un nodo de escritura y dos nodos de lectura. Puede tener un máximo de 32 particiones, y cada partición puede tener un máximo de 64 vCPU.
  • Clave de partición: la clave de partición es un campo opcional en sus documentos JSON que Clústeres elásticos utiliza para distribuir tráfico de lectura y escritura hacia la partición coincidente. Se recomienda que elija una clave que tenga muchos valores únicos. Una buena clave de partición particionará de manera uniforme sus datos en las particiones subyacentes, lo que brindará a su carga de trabajo el mejor rendimiento. 
  • Colección particionada: una colección cuyos datos se han distribuido en un clúster de Clústeres elásticos.

Clústeres elásticos se integra con otros servicios de AWS en la misma forma que DocumentDB lo hace en la actualidad. Primero, puede utilizar AWS Database Migration Service (DMS) para migrar desde MongoDB y otras bases de datos relacionales a Clústeres elásticos. Segundo, puede supervisar el estado y el rendimiento de los clústeres de Clústeres elásticos mediante Amazon CloudWatch. Tercero, puede configuración la autenticación y la autorización mediante usuarios y roles de AWS IAM y utilizar AWS VPC para conexiones de solo VPC seguras. Por último, puede utilizar AWS Glue para importar y exportar datos desde o hacia otros servicios de AWS como S3, Redshift y OpenSearch.

Sí. Puede migrar sus cargas de trabajo particionadas de MongoDB existentes a Clústeres elásticos. Puede utilizar AWS Database Migration Service o herramientas de MongoDB nativas, como mongodump y mongorestore, para migrar su carga de trabajo de MongoDB a Clústeres elásticos. Clústeres elásticos también es compatible con las API de MongoDB utilizadas de manera común, como shardCollection(), lo que le brinda flexibilidad para reutilizar herramientas y scripts existentes con Amazon DocumentDB.

Hardware, ajuste de escala y almacenamiento

El límite mínimo de almacenamiento es de 10 GB. El almacenamiento de Amazon DocumentDB aumentará automáticamente en función del uso del clúster hasta 128 TiB en incrementos de 10 GB sin que incida en el rendimiento. Con los clústeres elásticos de Amazon DocumentDB, el almacenamiento aumentará de manera automática hasta 4 PiB en incrementos de 10 GB. En cualquier caso, no es necesario aprovisionar el almacenamiento por adelantado.

Amazon DocumentDB desescala horizontalmente en dos dimensiones: almacenamiento e informática. El almacenamiento de Amazon DocumentDB escala de forma automática desde 10 GB a 128 TiB en clústeres basados en instancias y hasta 4 PiB para clústeres elásticos de Amazon DocumentDB. La capacidad de computación de Amazon DocumentDB se puede escalar verticalmente, mediante la creación de instancias de mayor tamaño, y horizontalmente (a fin de lograr un mayor nivel de rendimiento de lectura), mediante la incorporación de instancias de réplica adicionales al clúster.

Para ajustar la escala de los recursos informáticos asignados a la instancia en la consola de administración de AWS, seleccione la instancia deseada y haga clic en el botón "Modificar". La memoria y los recursos de CPU se modifican al cambiar la clase de instancia.

Si modifica la clase de instancia, los cambios solicitados se aplicarán durante el período de mantenimiento especificado. Si lo desea, puede utilizar el marcador "Apply Immediately" para aplicar sus solicitudes de escalado de forma inmediata. Ambas opciones afectarán la disponibilidad durante algunos minutos mientras se ejecuta la operación de escalado. Tenga en cuenta que también se aplicarán los demás cambios pendientes en el sistema.

Copia de seguridad y restauración

Las copias de seguridad automáticas siempre están habilitadas en los clústeres de Amazon DocumentDB. La capacidad para hacer copias de seguridad simples de bases de datos de Amazon DocumentDB permite recuperar clústeres a un momento dado. Es posible aumentar el periodo de copia de seguridad para las restauraciones a un momento dado hasta 35 días. Los backups no afectan el desempeño de la base de datos.

Sí. Las instantáneas manuales se pueden retener durante más tiempo que las copias de seguridad y el rendimiento no se ve afectado cuando se crean. Tenga en cuenta que para restablecer datos a partir de instantáneas de clústeres es necesario crear un clúster nuevo.

Amazon DocumentDB hace que sus datos duren automáticamente en tres zonas de disponibilidad (AZ) dentro de una región e intentará recuperar de forma automática su instancia en una AZ en buen estado sin pérdida de datos. En el improbable caso de que los datos no se encuentren disponibles en el almacenamiento de Amazon DocumentDB, puede restablecerlos a partir de una instantánea de clúster o llevar a cabo una operación de restablecimiento en un momento dado en un clúster nuevo. Tenga en cuenta que el último momento que se puede recuperar para una operación de restauración a un momento dado puede ser dentro de los 5 últimos minutos.

Puede optar por crear una instantánea final al momento de eliminar su instancia. De ser así, puede usar esta instantánea para restablecer la instancia eliminada en un momento posterior. Amazon DocumentDB retiene la instantánea final creada por el usuario junto con todas las demás instantáneas creadas manualmente después de la eliminación de la instancia. Después de eliminar la instancia, solo se retienen las instantáneas (es decir, no se conservan las copias de seguridad automáticas creadas para un restablecimiento en un momento dado).

Si elimina su cuenta de AWS se eliminarán todas las copias de seguridad automatizadas y de instantáneas incluidas en la cuenta.

Sí. Amazon DocumentDB le permite crear instantáneas de su clúster, que puede usar más adelante para restaurar un clúster. Puede compartir una instantánea con una cuenta distinta de AWS. El propietario de la cuenta de destino podrá usar esta instantánea para restaurar un clúster que contenga sus datos. Incluso puede elegir que sus instantáneas sean públicas. Es decir, cualquiera podría restaurar un clúster que contenga sus datos (públicos). Puede usar esta característica para compartir datos entre diferentes entornos (producción, desarrollo/pruebas, ensayos, etc.) que tengan cuentas distintas, así como también conservar copias de seguridad de todos los datos protegidas en una cuenta independiente en caso de que alguna vez su cuenta principal de AWS esté en riesgo.

Compartir instantáneas entre cuentas no conlleva ningún cargo. Sin embargo, es posible que se le cobre por las instantáneas, así como por cualquier clúster que restaure a partir de instantáneas compartidas.

No es posible compartir instantáneas de clústeres automáticas. Para compartir un snapshot automático, debe crear una copia del snapshot de forma manual y compartirla.

No. Solo podrán obtener acceso a las instantáneas de Amazon DocumentDB compartidas cuentas ubicadas en la misma región que la cuenta que las comparte.

Sí. Puede compartir instantáneas de Amazon DocumentDB cifradas. El destinatario de la instantánea compartida debe tener acceso a la clave de KMS que se utilizó para cifrar la instantánea.

No. Las instantáneas de Amazon DocumentDB solo pueden usarse dentro del servicio.

Puede optar por crear una instantánea final al momento de eliminar su clúster. De ser así, puede usar esta instantánea para restablecer el clúster eliminado en un momento posterior. Amazon DocumentDB conserva la instantánea final creada por el usuario junto con todas las demás instantáneas creadas manualmente después de la eliminación del clúster.

Alta disponibilidad y replicación

Amazon DocumentDB divide automáticamente el volumen de almacenamiento en segmentos de 10 GB distribuidos en varios discos. Cada segmento de 10 GB del volumen de almacenamiento se replica de seis formas en tres zonas de disponibilidad (AZ). Amazon DocumentDB es un servicio diseñado para administrar la pérdida de hasta dos copias de datos de manera transparente sin que ello afecte a la disponibilidad de escritura, y de hasta tres copias, sin que incida en la disponibilidad de lectura. El volumen de almacenamiento de Amazon DocumentDB también cuenta con recuperación automática. Los bloques de datos y los discos están sujetos a un análisis constante en busca de errores y se reparan automáticamente.

A diferencia de lo que ocurre con otras bases de datos, después de un bloqueo, Amazon DocumentDB no necesita reproducir el registro que debe rehacer a partir del último punto de comprobación de la base de datos (que suele ser cinco minutos) ni confirmar que todos los cambios se hayan aplicado antes de habilitar la base de datos para las operaciones. Esto reduce el tiempo de reinicio de la base de datos a menos de 60 segundos en la mayoría de los casos. Amazon DocumentDB extrae la caché del proceso de la base de datos y la habilita inmediatamente en el momento de realizar el reinicio. Esto evita la necesidad de limitar el acceso hasta que la caché se vuelve a llenar a fin de evitar interrupciones.

Amazon DocumentDB admite réplicas de lectura que comparten el mismo volumen de almacenamiento adyacente que la instancia principal. Las actualizaciones implementadas por la instancia principal son visibles en todas las réplicas de Amazon DocumentDB.

  • Característica: réplicas de lectura de Amazon DocumentDB
  • Número de réplicas: hasta 15
  • Tipo de replicación: asíncrona (normalmente, milisegundos)
  • Impacto en el rendimiento de la principal: bajo
  • Funciona como destino de conmutación por error: sí (sin pérdida de datos)
  • Conmutación por error automatizada:

Sí, puede replicar sus datos entre regiones si usa la característica Clúster global. Los clústeres globales abarcan varias regiones de AWS. Los clústeres globales replican sus datos en clústeres en hasta cinco regiones con poco o ningún impacto en el rendimiento. Los clústeres globales brindan una recuperación más rápida de las interrupciones en toda la región y permiten lecturas globales de baja latencia. Para más información, consulte nuestra publicación de blog.

Sí. Puede asignar un nivel de prioridad de conversión a cada instancia del clúster. Si la instancia principal falla, Amazon DocumentDB convertirá en instancia principal la réplica que tenga mayor prioridad. Si hay incoherencias entre dos o más réplicas con el mismo nivel de prioridad, Amazon DocumentDB convertirá la réplica que tenga el mismo tamaño que la instancia principal.

Puede modificar el nivel de prioridad de una instancia en cualquier momento. Modificar los niveles de prioridad no activará una conmutación por error.

Puede asignar niveles de prioridad inferiores a las réplicas que no quiera transformar en instancia principal. No obstante, si las réplicas de prioridad superior del clúster funcionan incorrectamente o no están disponibles por el motivo que sea, Amazon DocumentDB convertirá la réplica de menor prioridad.

Es posible implementar Amazon DocumentDB en una configuración de alta disponibilidad mediante el uso de instancias de réplicas en varias zonas de disponibilidad de AWS como destinos de conmutación por error. En caso de que ocurra un error en la instancia principal, una instancia de réplica se transformará automáticamente en la nueva instancia principal con una interrupción mínima del servicio.

Puede agregar réplicas de Amazon DocumentDB adicionales. Las réplicas de Amazon DocumentDB comparten el mismo almacenamiento subyacente que la instancia principal. Puede convertir cualquier réplica de Amazon DocumentDB en instancia principal sin que se produzcan pérdidas de datos, por lo que puede utilizarla para mejorar la tolerancia a errores en caso de que se produzca algún error en la instancia principal. Para aumentar la disponibilidad del clúster, solo tiene que crear de una a quince réplicas, en varias zonas de disponibilidad, y Amazon DocumentDB las incluirá automáticamente en la selección de instancias principales para la conmutación por error en el caso de que se produzca una interrupción de la instancia.

Amazon DocumentDB administra automáticamente la conmutación por error para que las aplicaciones puedan reanudar las operaciones de la base de datos a la mayor brevedad posible sin intervención administrativa manual.

  • Si dispone de una instancia de réplica de Amazon DocumentDB en la misma zona de disponibilidad o en otra distinta, al realizar la conmutación por error, Amazon DocumentDB cambia el registro de nombre canónico (CNAME) por su instancia para que apunte a la réplica que funciona correctamente, que, a su vez, se transforma en la nueva instancia principal. La conmutación por error completa normalmente finaliza en 30 segundos o menos. 
  • Si no dispone de una instancia de réplica de Amazon DocumentDB (es decir, un clúster de instancia única), Amazon DocumentDB tratará de crear una nueva instancia en la misma zona de disponibilidad en la que se encuentra la instancia original. Este reemplazo de la instancia original se lleva a cabo con el mayor esfuerzo, pero puede fallar, por ejemplo, si existe un problema que esté afectando a la zona de disponibilidad de manera generalizada. 

La aplicación debe reintentar las conexiones de la base de datos en caso de que se pierda la conexión.

Amazon DocumentDB puede detectar automáticamente cualquier problema en la instancia principal y comenzar a direccionar el tráfico de lectura y escritura a una instancia de réplica de Amazon DocumentDB. En promedio, la conmutación por error finaliza en 30 segundos o menos. Además, el tráfico de lectura que abastecen las instancias de réplica de Amazon DocumentDB se interrumpirá brevemente.

Dado que las réplicas de Amazon DocumentDB comparten el mismo volumen de datos que la instancia principal, no se produce prácticamente ningún retraso de replicación. Normalmente, observamos retrasos en las decenas de milisegundos.

Seguridad y cumplimiento

Sí. Todos los clústeres de Amazon DocumentDB deben crearse en una VPC. Con Amazon VPC, podrá definir una topología de red virtual que refleje detalladamente una red tradicional que tenga instaurada en su propio centro de datos. Esto le permite ejercer un control pleno sobre quién puede obtener acceso a los clústeres de Amazon DocumentDB.

Amazon DocumentDB es compatible con el RBAC que incluye roles integrados. El RBAC le permite imponer privilegios mínimos como práctica recomendada mediante la restricción de las acciones que los usuarios están autorizados a realizar. Para más información, consulte la sección Control de acceso basado en roles en Amazon DocumentDB.

Amazon DocumentDB utiliza el límite de autorización y red estricto de la VPC. Las políticas, los roles y los usuarios de IAM proporcionan la autenticación y la autorización para las API de administración de Amazon DocumentDB. La autenticación de una base de datos de Amazon DocumentDB se hace a través de los complementos y las herramientas de MongoDB estándares con Salted Challenge Response Authentication Mechanism (SCRAM), el mecanismo de autenticación predeterminado de MongoDB.

Sí. Amazon DocumentDB le permite cifrar sus clústeres mediante las claves que administra a través de AWS Key Management Service (KMS). En un clúster que se ejecuta con el cifrado de Amazon DocumentDB, los datos almacenados en reposo en el almacenamiento subyacente están cifrados, al igual que las copias de seguridad, las instantáneas y las réplicas automatizadas que se encuentran en el mismo clúster. El cifrado y el descifrado se administran de forma ininterrumpida. Para obtener más información sobre el uso de KMS con Amazon DocumentDB, consulte el Cifrado de datos en reposo de Amazon DocumentDB.

Actualmente, no se puede cifrar un clúster de Amazon DocumentDB que no esté cifrado. Si desea utilizar el cifrado de Amazon DocumentDB para un clúster existente no cifrado, cree un nuevo clúster con cifrado habilitado y migre sus datos allí.

Amazon DocumentDB se diseñó para cumplir con los estándares de seguridad más exigentes y para facilitar la verificación de nuestra seguridad y el cumplimiento de sus propias obligaciones normativas y de conformidad. Amazon DocumentDB se ha evaluado para cumplir con PCI DSS, ISO 9001, 27001, 27017 y 27018, SOC 1, 2 y 3 y la certificación Common Security Framework (CSF) de Health Information Trust Alliance (HITRUST), además de ser apto para HIPAA. Es posible descargar los informes de conformidad de AWS en AWS Artifact.

Actualización de la versión principal

La actualización local de la versión principal (MVU) le permite actualizar los clústeres de Amazon DocumentDB 3.6 o 4.0 a Amazon DocumentDB 5.0 mediante la consola de AWS, el kit de desarrollo de software (SDK) o la interfaz de línea de comandos (CLI). Con la MVU local, no es necesario crear nuevos clústeres ni cambiar los puntos finales. La MVU local está disponible en todas las regiones en las que está disponible Amazon DocumentDB 5.0. Para empezar a utilizar la MVU local, consulte la documentación de la MVU local.

La MVU in situ le permite actualizar sin problemas sus clústeres de Amazon DocumentDB 3.6 o 4.0 a la versión 5.0 sin necesidad de realizar copias de seguridad y restauraciones en otro clúster y sin utilizar otras herramientas de migración de datos. Al hacerlo, reduce el tiempo y el esfuerzo asociados con el proceso de actualización habitual, que implica configurar los puntos finales de origen y destino, migrar índices y datos, cambiar el código de la aplicación y más.

No necesitará cambiar el punto de conexión de sus aplicaciones después de la actualización. Dado que los datos permanecen en el mismo clúster, la actualización mediante la característica no conlleva ningún coste adicional.

El tiempo de inactividad puede variar de un clúster a otro según la cantidad de colecciones, índices, bases de datos e instancias. Antes de ejecutar una actualización de la versión principal in situ en su clúster de producción, le recomendamos encarecidamente que la ejecute en un entorno inferior para probar el tiempo de inactividad y el rendimiento y también para comprobar que las aplicaciones funcionan según lo esperado después de la actualización.

También puede utilizar la característica de clonación rápida de Amazon DocumentDB para clonar los datos del clúster con fines de prueba. En función de la complejidad de la implementación de Amazon DocumentDB, puede contratar a nuestro arquitecto de soluciones de bases de datos para obtener ayuda adicional.

La MVU local solo es compatible con Amazon DocumentDB 3.6 o 4.0 como fuente y la versión 5.0 como destino. No es compatible con los clústeres globales o elásticos de Amazon DocumentDB ni con DocumentDB 4.0 como destino.

Machine learning

Amazon DocumentDB se integra a Amazon SageMaker Canvas, lo que facilita la creación de modelos de machine learning (ML) y la personalización de los modelos básicos con los datos almacenados en Amazon DocumentDB sin escribir una sola línea de código. Ya no necesita desarrollar canalizaciones de datos y ML personalizadas entre Amazon DocumentDB y SageMaker Canvas. Puede iniciar SageMaker Canvas desde la consola de Amazon DocumentDB y añadir las bases de datos de Amazon DocumentDB existentes como fuente de datos para empezar a crear sus modelos de machine learning. Puede utilizar los datos de DocumentDB en SageMaker Canvas para crear modelos que permitan predecir la pérdida de clientes, detectar fraudes, predecir fallos de mantenimiento, pronosticar las métricas financieras y las ventas, optimizar el inventario, resumir contenido y generar contenido.

Amazon SageMaker Canvas ofrece una interfaz sin código para crear modelos de machine learning utilizando datos de varias fuentes de datos, incluida Amazon DocumentDB. Se le cobrará por el uso de SageMaker Canvas y por las E/S resultantes cuando SageMaker Canvas lea datos de su instancia de Amazon DocumentDB. El uso de DocumentDB como fuente de datos en Amazon SageMaker Canvas no conlleva ningún cargo adicional. Visite la página de precios de Amazon DocumentDB y la página de precios de SageMaker Canvas para obtener más información.

IA generativa y machine learning

La búsqueda vectorial para Amazon DocumentDB combina la flexibilidad y la amplia capacidad de consulta de una base de datos de documentos basada en JSON con la potencia de la búsqueda vectorial. Puede utilizar sus datos de Amazon DocumentDB existentes, o una estructura de datos de documentos flexible, para crear casos de uso de machine learning e IA generativa, como experiencias de búsqueda semántica, recomendaciones de productos, personalización, chatbots, detección de fraudes y detección de anomalías. Visite el apartado de búsqueda vectorial de la documentación de Amazon DocumentDB para obtener más información.

La búsqueda vectorial para Amazon DocumentDB permite el uso de la búsqueda semántica para que pueda capturar el significado, el contexto y la intención de los datos. La búsqueda por palabra clave busca el documento basándose en el texto real o en las asignaciones de sinónimos predefinidas. Por ejemplo, en una aplicación de comercio electrónico tradicional, la búsqueda “vestido rojo” puede devolver productos que tengan las palabras “rojo” y “vestido” en sus descripciones. La búsqueda semántica arrojará resultados con vestidos en diferentes tonos de rojo que pueden mejorar la experiencia del usuario.  

El uso de la búsqueda vectorial para Amazon DocumentDB no conlleva ningún costo adicional. Se aplicarán los cargos estándar de procesamiento, E/S, almacenamiento y copia de seguridad al almacenar, indexar y buscar vectores en Amazon DocumentDB. Visite la página de precios de Amazon DocumentDB para obtener más información.

Amazon DocumentDB se integra a Amazon SageMaker Canvas, lo que facilita la creación de aplicaciones de inteligencia artificial (IA) generativa y machine learning (ML) mediante datos almacenados en Amazon DocumentDB. Ya no necesita desarrollar canalizaciones de datos y ML personalizadas entre Amazon DocumentDB y SageMaker Canvas. La integración en la consola elimina el trabajo pesado e indiferenciado de conectarse y acceder a datos para acelerar el desarrollo de su ML con una experiencia de bajo código o sin código (LCNC, low code no code). Puede iniciar SageMaker Canvas desde la consola de Amazon DocumentDB y agregar bases de datos de Amazon DocumentDB existentes como origen de datos.

Integración sin ETL

Esta integración sin ETL con Amazon OpenSearch Service elimina la complejidad operativa de la extracción, transformación y carga de datos de una colección de Amazon DocumentDB a una colección de clúster administrado o sin servidor de Amazon OpenSearch. Con esta integración, ya no tendrá que crear ni administrar canalizaciones de datos ni transformar datos.

Si desea utilizar las API de MongoDB, debe utilizar las capacidades de bases de datos nativas de Amazon DocumentDB para realizar búsquedas de vectores en sus documentos. La integración sin ETL de Amazon DocumentDB con Amazon OpenSearch Service es ideal para buscar en colecciones y para almacenar e indexar vectores con más de 2000 dimensiones.

La integración sin ETL de Amazon DocumentDB con Amazon OpenSearch Service utiliza Ingesta de Amazon OpenSearch para transferir sin problemas los datos operativos de Amazon DocumentDB a Amazon OpenSearch Service. Para empezar, habilite la funcionalidad de transmisión de cambios en la colección de Amazon DocumentDB que debe replicarse. La característica de integración sin ETL configura una canalización de ingesta de Amazon OpenSearch en la cuenta que se encarga de replicar los datos en un clúster administrado o una colección sin servidor de Amazon OpenSearch Service.

Ingesta de Amazon OpenSearch reconoce de manera automática el formato de los datos de las colecciones de Amazon DocumentDB y los asigna a Amazon OpenSearch Service para obtener los resultados de búsqueda más eficaces. Puedes sincronizar los datos de varias colecciones de Amazon DocumentDB a través de varias canalizaciones en un único clúster administrado de Amazon OpenSearch o en una colección sin servidor para ofrecer información integral sobre varias aplicaciones. Si lo desea, puede especificar procesadores de datos personalizados al definir la configuración de ingesta en Amazon OpenSearch Service. Las actualizaciones posteriores de las colecciones de DynamoDB también se replicarán en Amazon OpenSearch Service sin que se requiera intervención manual.

Esta integración sin ETL se beneficia de las capacidades nativas de transformación de datos de las canalizaciones de Ingesta de Amazon OpenSearch para agregar y filtrar los datos mientras estén en movimiento.

También puede escribir una lógica de transformación personalizada si desea una capacidad de transformación personalizada, e Ingesta de Amazon OpenSearch gestionará el proceso de transformación. De manera alternativa, si desea trasladar todos los datos del origen al receptor sin personalizar, Ingesta de Amazon OpenSearch proporciona esquemas listos para usar para que pueda realizar las integraciones con tan solo unos pocos clics.

Para garantizar que Ingesta de Amazon OpenSearch cuente con los permisos necesarios para replicar los datos de Amazon DocumentDB, la característica de integración sin ETL crea un rol de IAM con los permisos necesarios para leer datos de la colección de Amazon DocumentDB y escribir en un dominio o colección de Amazon OpenSearch. Luego, las canalizaciones de la ingesta de Amazon OpenSearch asumen este rol para garantizar que siempre se mantenga la postura de seguridad correcta al mover los datos del origen al destino.

Puede ver todas las métricas relacionadas con su integración sin ETL con Amazon DocumentDB en los paneles de consola proporcionados por Amazon DocumentDB y la canalización de Ingesta de OpenSearch. También puede consultar los registros en tiempo real en Amazon CloudWatch y configurar alertas personalizadas con Amazon CloudWatch que se activan cuando se superan los umbrales definidos por el usuario.

Más información acerca de los precios

Vaya a la página de precios de Amazon DocumentDB (compatible con MongoDB).

Más información 
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Registrarse 
Comience a crear en la consola

Comience a crear con Amazon DocumentDB (compatible con MongoDB) en la consola de AWS.

Iniciar sesión