Répliquer les objets existants dans vos compartiments Amazon S3 avec la réplication par lots Amazon S3
DIDACTICIEL
Présentation
Ce didacticiel vous montre comment répliquer des objets déjà existants dans vos compartiments au sein de la même Région AWS ou dans différentes Régions AWS avec la réplication par lots Amazon Simple Storage Service (Amazon S3).
La réplication Amazon S3 est une fonctionnalité élastique, entièrement gérée et peu coûteuse qui réplique les objets entre les compartiments Amazon S3. Vous pouvez répliquer des données nouvelles et existantes d'un compartiment source vers plusieurs compartiments de destination dans la même Région AWS ou dans différentes Régions AWS. Que vous souhaitiez conserver une deuxième copie de vos données à des fins de protection ou que vos données soient réparties sur plusieurs sites géographiques afin d'offrir aux utilisateurs la latence la plus faible possible, la réplication S3 vous offre les contrôles dont vous avez besoin pour répondre aux besoins de votre entreprise.
Vous pouvez utiliser la réplication par lots Amazon S3 pour remplir un compartiment nouvellement créé avec des objets existants, répliquer des objets qui ont déjà été répliqués ou qui n'ont pas pu l'être auparavant, migrer des données entre comptes ou ajouter de nouveaux compartiments à votre lac de données. Les tâches de réplication par lots S3 sont créées à partir d'une configuration de réplication existante et sont exécutées pour toutes les règles de réplication activées pour le compartiment. Pour plus d'informations sur la réplication S3, consultez la section Réplication d'objets du Guide de l'utilisateur Amazon S3, et pour un didacticiel détaillé sur la configuration de la réplication S3, consultez la section Répliquer les données au sein et entre les Régions AWS à l'aide de la réplication Amazon S3. À la fin de ce tutoriel, vous serez en mesure de répliquer des données existantes au sein et entre des Régions AWS à l'aide de la réplication Amazon S3.
Votre projet
Dans ce didacticiel, vous allez :
- Configurer la réplication S3 sur votre compartiment Amazon S3
- Créer deux compartiments S3
- Créer une règle de réplication S3 sur votre compartiment S3
- Choisir un compartiment S3 de destination
- Choisir ou créer des rôles IAM pour la réplication
- Spécifier le type de chiffrement (facultatif)
- Choisir la classe de stockage S3 de destination
- Activer des options de réplication supplémentaires (facultatif)
- Configurez la réplication par lots S3 pour les objets existants dans votre compartiment Amazon S3 de la manière suivante :
- Créez une tâche de réplication par lots S3 lorsque vous créez une nouvelle configuration de réplication dans votre compartiment ou lorsque vous ajoutez une nouvelle destination à votre configuration de réplication existante
- Créez une tâche de réplication par lots S3 depuis la page d'accueil des opérations par lots S3 (recommandé)
- Création d'une tâche de réplication par lots S3 à partir de la page de configuration de réplication existante
Conditions préalables
Pour pouvoir démarrer ce didacticiel, vous avez besoin de ce qui suit :
- Un compte AWS : si vous n'en avez pas encore, suivez le didacticiel Configuration de votre environnement AWS pour une présentation rapide.
Expérience en matière d'utilisation des services AWS
Débutant
Durée
20 minutes
Coût de réalisation
Moins de 1 USD
Pour en savoir plus, consultez la page relative à la tarification d'Amazon S3
Éléments requis
Compte AWS
Services utilisés
Date de la dernière mise à jour
30 juin 2023
Implémentation
Étape 1 : créer deux compartiments Amazon S3
1.1 Connectez-vous à la console de gestion AWS en utilisant les informations de votre compte. Dans la barre de recherche, saisissez S3, puis sélectionnez S3 dans les résultats.
1.2 Dans le volet de navigation de gauche de la console S3, choisissez Compartiments, puis choisissez Créer un compartiment.
1.3 Saisissez un nom descriptif unique au niveau mondial pour votre compartiment source. Sélectionnez la Région AWS dans laquelle vous souhaitez que votre compartiment soit créé. Pour cet exemple, la région UE (Francfort) eu-central-1 est sélectionnée.
1.4 Activez la gestion des versions des compartiments. La gestion des versions des compartiments est requise pour les compartiments S3 source et de destination pour la réplication S3. Pour plus d'informations sur la gestion des versions, veuillez consulter la rubrique Utilisation de la gestion des versions des compartiments S3.
1.5 Vous pouvez laisser les autres options par défaut. Accédez au
bas de la page et choisissez Créer un compartiment.
1.6 Répétez les étapes précédentes pour créer un autre compartiment S3 qui servira de compartiment de destination. Ce nouveau compartiment peut exister dans la même Région AWS que le compartiment source pour la réplication S3 sur une même région (S3 SRR) ou dans une autre Région AWS pour la réplication interrégionale S3 (S3 CRR). Veillez à activer également la gestion des versions du compartiment pour le compartiment S3 de destination et donnez un nom unique à votre nouveau compartiment.
Étape 2 : créez une configuration de réplication S3 sur votre compartiment S3
2.1 Dans votre liste de compartiments S3, choisissez votre compartiment S3 source. La console vous amène à la page d'accueil du compartiment S3.
2.2 Sur la page d'accueil du compartiment S3, vous pouvez consulter les objets, les propriétés, les autorisations, les mesures, la gestion et les points d'accès du compartiment S3 sélectionné.
Dans l'onglet Gestion, sous Règles de réplication, sélectionnez Créer une règle de réplication.
2.3 Saisissez un Nom de règle de réplication et assurez-vous que l'option Activé est sélectionnée dans la section Statut. Si la règle de réplication est désactivée, elle ne sera pas exécutée.
REMARQUE : Amazon S3 tente de répliquer les objets conformément à toutes les règles de réplication. Toutefois, s'il existe deux règles ou plus avec le même compartiment de destination, les objets sont répliqués en fonction de la règle ayant la priorité la plus élevée. Plus le nombre est bas, plus la priorité est élevée. Vous pouvez modifier la priorité de chaque règle de réplication sur la page de configuration de la réplication.
2.4 Limitez l'étendue de la réplication en définissant un Type de filtre (préfixe ou balises), ou choisissez de répliquer l'ensemble du compartiment. Par exemple, si vous souhaitez répliquer uniquement les objets comprenant le préfixe Finance, indiquez cette étendue. Pour plus d'informations sur le filtrage des objets pour la réplication, reportez-vous à la documentation sur la spécification d'un filtre dans le Guide de l'utilisateur S3.
2.5 Choisissez le compartiment de destination que vous avez créé en sélectionnant le bouton Parcourir S3 et en saisissant le nom complet du compartiment.
Vous ne pouvez pas créer de nouveau compartiment S3 pendant le processus de configuration de la réplication.
2.6 Lorsque vous créez de nouvelles règles de réplication à partir du même compartiment source, assurez-vous que le rôle AWS Identity and Access Management (IAM) associé à cette configuration dispose d'autorisations suffisantes pour écrire de nouveaux objets dans le nouveau compartiment de destination. Vous pouvez choisir de créer un nouveau rôle IAM ou de sélectionner un rôle IAM existant avec le bon ensemble de permissions. Pour plus d'informations, voir la documentation sur la configuration des autorisations pour la réplication S3.
2.7 (Facultatif) Si vos objets sont chiffrés avec des clés de chiffrement gérées par Amazon S3 (SSE-S3) ou AWS Key Management Service (AWS KMS),spécifiez les options de chiffrement. La réplication S3 prend en charge le chiffrement SSE-S3 (chiffrement par défaut), le chiffrement côté serveur AWS KMS (SSE-KMS) et le chiffrement côté serveur avec des clés fournies par le client (SSE-C). Si vous choisissez le chiffrement AWS KMS, fournissez les clés AWS KMS pour déchiffrer dans le compartiment source et chiffrer de nouveau dans le compartiment de destination. Pour économiser sur les coûts liés à AWS KMS, vous pouvez activer les clés de compartiment Amazon S3.
2.8 (Facultatif) Choisissez une classe de stockage S3 pour vos objets répliqués dans le compartiment de destination. Envisagez de choisir des classes de stockage moins coûteuses en fonction de vos charges de travail. Par exemple, vous pouvez choisi Intelligent-Tiering pour optimiser les coûts de stockage des données dont les schémas d'accès sont imprévisibles ou changeants, Glacier Instant Retrieval si vos objets répliqués sont rarement consultés mais doivent être récupérés en quelques millisecondes, ou Glacier Deep Archive pour archiver les données auxquelles il est rarement nécessaire d'accéder. Pour plus d'informations, reportez-vous à la section Utilisation des classes de stockage Amazon S3.
2.9 Choisissez les options de réplication supplémentaires dont vous avez besoin :
- Contrôle du temps de réplication (RTC) : S3 RTC vous aide à respecter les exigences en matière de conformité et d'activité, car il offre un accord de niveau de service de 15 minutes pour répliquer 99,99 % de vos objets. Vous pouvez activer S3 RTC ainsi que S3 CRR et S3 SRR. Les métriques de notifications et de réplication sont activées par défaut.
- Métriques de notifications et de réplications : pour les règles non RTC, vous avez la possibilité de sélectionner les métriques et notifications de réplication, qui fournissent des mesures détaillées permettant de suivre minute par minute la progression des octets en attente, des opérations en attente, des opérations échouées et de la latence de réplication pour la règle de réplication.
- Réplication du marqueur de suppression : la sélection de la réplication du marqueur de suppression signifie que les suppressions effectuées dans le compartiment source seront répliquées dans le compartiment de destination. Cette option doit être activée si vous souhaitez que les compartiments source et destination soient synchronisés, mais pas si votre objectif est de vous protéger contre les suppressions accidentelles ou malveillantes.
- Synchronisation des modifications du réplica : pour établir une réplication bidirectionnelle entre deux compartiments S3, créez des règles de réplication bidirectionnelles (A vers B et B vers A) et activez la synchronisation des modifications du réplica pour les règles de réplication dans les compartiments S3 source et destination. Cela vous aidera à conserver les métadonnées des objets, telles que les balises, les ACL et les paramètres de verrouillage des objets, synchronisées entre les répliques et les objets sources.
S3 RTC, les métriques et notifications de réplication, et la synchronisation des modifications du réplica ne sont pas prises en charge lors de la réplication d'objets existants avec la réplication par lots S3.
Lorsque vous avez configuré la réplication, choisissez Enregistrer.
2.10 Lorsque vous créez la première règle d'une nouvelle configuration de réplication pour votre compartiment S3 ou que vous ajoutez une nouvelle Région AWS de destination à une configuration existante, vous avez la possibilité d'activer la réplication d'objets existants pour cette règle de réplication. Pour répliquer les objets existants, choisissez Oui, répliquer les objets existants, puis choisissez Soumettre.
La console vous amène à la page Créer une tâche d'opérations par lots.
Étape 3 : répliquer les objets existants tout en créant une nouvelle configuration de réplication
Sur la page Créer une tâche d'opérations par lots, vous pouvez consulter la tâche d'opérations par lots S3
paramètres tels que les options d'exécution des tâches, l'étendue des rapports d'achèvement S3 et les autorisations.
3.1 Définissez les options d'exécution des tâches. Si vous souhaitez que la tâche de réplication par lots S3 soit exécutée immédiatement, vous pouvez choisir Exécuter automatiquement la tâche lorsqu'elle est prête. Si vous souhaitez attendre d'exécuter la tâche lorsqu'elle sera prête, vous pouvez enregistrer le manifeste Opérations par lots pour consulter la liste des objets à répliquer.
3.2 Définir les options du manifeste Opérations par lots. Le fichier manifeste généré par Amazon S3 utilise le même compartiment source, le même préfixe et les mêmes balises que votre configuration de réplication afin de répertorier toutes les versions éligibles de vos objets pour la réplication. Nous vous recommandons de toujours choisir l'option Enregistrer le manifeste Opérations par lots afin de pouvoir consulter la liste d'objets avant le début de la réplication. Vous pouvez enregistrer le manifeste dans le même compte AWS ou dans un compte différent, mais le fichier manifeste doit être stocké dans la même Région AWS que le compartiment source.
Dans cet exemple, nous avons choisi le compartiment « aws-s3-tutorial-batch-replication-manifest-destination » pour enregistrer le fichier manifeste, qui se trouve dans le même compte AWS que le compartiment source.
3.3 Pour plus de sécurité, chiffrez le fichier manifeste à l'aide de clés gérées Amazon S3 (SSE-S3) ou d'une clé AWS Key Management Service (SS3-KMS).
3.4 Tant que les opérations par lots S3 traitent avec succès au moins un objet, Amazon S3 génère un rapport d'achèvement après la fin, l'échec ou l'annulation de la tâche de réplication par lots. Le rapport d'achèvement contient des informations supplémentaires pour chaque tâche, notamment le nom et la version de la clé de l'objet, le statut, les codes d'erreur et la description des erreurs. Nous vous recommandons de sélectionner Générer un rapport d'achèvement pour Toutes les tâches afin de pouvoir consulter le statut de tous les objets répliqués avec cette tâche. Pour des exemples de rapports d'achèvement, consultez Exemples : rapports d'achèvement des opérations par lots S3.
3.5 Assurez-vous que le rôle IAM associé à cette tâche de réplication par lots dispose des autorisations suffisantes pour effectuer des opérations par lots S3 en votre nom. Pour plus d'informations, consultez la documentation sur la configuration des politiques IAM pour la réplication par lots et l'octroi d'autorisations pour les opérations par lot Amazon S3.
Passez en revue la configuration et sélectionnez Enregistrer.
Vous êtes redirigé vers la page d'accueil Opérations par lots.
3.6 Sélectionnez l'identifiant de votre nouvelle tâche pour en revoir la configuration. Vous pouvez également suivre le statut de la tâche de réplication par lots.
Étape 4 : répliquer les objets existants avec la configuration de réplication existante
Outre la création d'une tâche de réplication pour une nouvelle règle de réplication, comme décrit à l'étape précédente, vous pouvez également créer des tâches de réplication par lots S3 pour les règles de réplication existantes dans les compartiments S3. Pour ce faire, retournez à la page d'accueil de la console Amazon S3.
4.1 Dans le volet de navigation gauche de la page d'accueil de la console, choisissez Opérations par lots, puis Créer une tâche.
4.2 Sur la page Créer une tâche, sélectionnez la Région AWS dans laquelle vous souhaitez créer votre tâche de réplication par lots. Vous devez créer la tâche dans la même Région AWS que celle dans laquelle se trouve le compartiment S3 source.
4.3 Fournissez la liste des objets à répliquer. Vous pouvez ajouter un manifeste généré par l'utilisateur sous la forme d'un rapport d'inventaire Amazon S3 ou d'un fichier CSV. Le manifeste doit contenir toutes les versions de l'objet qui doivent être répliquées. Amazon S3 peut également générer un manifeste pour vous en utilisant la configuration de réplication S3 existante dans le compartiment source.
REMARQUE : dans cet exemple, nous avons choisi Créer un manifeste à l'aide de la configuration de réplication S3 pour permettre à Amazon S3 de générer un manifeste en notre nom et avons choisi « aws-s3-replication-tutorial-source-bucket » comme compartiment source. Si vous choisissez de laisser Amazon S3 générer un manifeste pour vous, vous verrez également apparaître des filtres supplémentaires, tels que la date de création de l'objet et le statut de la réplication, afin de réduire l'étendue de la tâche.
4.4 (Facultatif) Si vous avez choisi d'enregistrer le manifeste Opérations par lots, chiffrez votre fichier manifeste à l'aide de clés gérées par Amazon S3 (SSE-S3) ou de la clé AWS Key Management Service (SSE-KMS) pour une sécurité et un contrôle d'accès supplémentaires.
- Si vous ne spécifiez pas de mode de chiffrement, Amazon S3 utilisera les paramètres de chiffrement par défaut du compartiment de destination du manifeste pour chiffrer le fichier manifeste.
- Si aucun chiffrement par défaut n'est activé sur le compartiment de destination, Amazon S3 utilisera SSE-S3 pour chiffrer le fichier manifeste.
4.5 Choisissez Suivant pour accéder à la page Choisir une opération.
4.6 Si vous avez choisi Créer un manifeste à l'aide de la configuration de réplication S3 à la page précédente, la seule option d'opération est Répliquer. En effet, la réplication est la seule opération autorisée lors de l'utilisation d'un manifeste généré par S3. Sélectionnez Répliquer, puis choisissez Suivant.
4.7 Configurer les options supplémentaires :
- Saisissez une description afin de définir au mieux l'objectif de la tâche.
- Sélectionnez une priorité pour indiquer la priorité relative de cette tâche par rapport aux autres tâches exécutées sur votre compte. Un chiffre plus élevé indique une priorité plus élevée. Par exemple, une tâche de priorité 2 sera privilégiée par rapport à une tâche de priorité 1. Les opérations par lots de S3 hiérarchisent les tâches en fonction des numéros de priorité, mais un ordre strict n'est pas garanti. Par conséquent, vous ne devez pas utiliser les priorités des tâches pour vous assurer qu'une tâche commence ou se termine avant une autre. Si vous devez respecter un ordre strict, attendez qu'une tâche soit terminée avant de commencer la suivante.
4.8 Choisissez si vous souhaitez générer un rapport d'achèvement.
4.9 Choisissez un rôle IAM d'opérations par lots valide pour autoriser Amazon S3 à effectuer des actions en votre nom.
Vous devez également associer une politique IAM de réplication par lots au rôle IAM d'opérations par lots. Pour créer un rôle et une politique IAM valides, consultez Configuration des politiques IAM pour la réplication par lots.
4.10 Ajoutez des balises de tâche à votre tâche de réplication par lots, puis choisissez Suivant pour vérifier la configuration de votre tâche.
4.11 Sur la page Révision, choisissez Modifier pour apporter des modifications, puis choisissez Suivant pour enregistrer vos modifications et revenir à la page Révision.
Lorsque votre tâche est prête, choisissez Créer une tâche.
4.12 Une fois la tâche de réplication par lots créée, les opérations par lots traitent le manifeste. En cas de réussite, le statut de la tâche devient En attente de votre confirmation pour être exécutée. Vous devez confirmer les détails de la tâche avant de pouvoir l'exécuter.
Lorsque la tâche est réussie, une bannière s'affiche en haut de la page Opérations par lots.
Étape 5 : créer une tâche de réplication par lots à partir de la page de configuration de réplication S3
5.1 Dans votre liste de compartiments S3, choisissez le compartiment S3 que vous souhaitez configurer comme source de réplication.
La console vous amène à la page d'accueil du compartiment S3.
5.2 Examinez les objets, les propriétés, les autorisations, les mesures, la gestion et les points d'accès du compartiment S3 sélectionné.
5.3 Dans l'onglet Gestion, sous Règles de réplication, sélectionnez Afficher la configuration de la réplication.
5.4 Sur la page d'accueil de la configuration de réplication de votre compartiment source, choisissez Créer une tâche de réplication pour accéder à la page Créer une tâche pour les opérations par lots S3. Répétez les étapes précédentes pour créer une tâche de réplication par lots à partir de la configuration de réplication existante.
Étape 6 : surveiller la progression d'une tâche de réplication par lots S3
Après la création et l'exécution d'une tâche de réplication par lots, celle-ci passe par une série de statuts. Vous pouvez suivre la progression d'une tâche de réplication par lots en consultant ces statuts sur la page d'accueil Opérations par lots.
Par exemple, une tâche se trouve dans le statut Nouveau lorsqu'elle est créée, passe au statut Préparation lorsqu'Amazon S3 traite le manifeste et les autres paramètres de la tâche, puis passe au statut Prêt lorsqu'elle est prête à être exécutée, au statut Actif lorsqu'elle est en cours et enfin au statut Terminé lorsque le traitement est achevé. Pour obtenir la liste complète des statuts des tâches, consultez la section Statuts des tâches des opérations par lots.
Vous pouvez choisir de générer un rapport d'achèvement lorsque vous créez votre tâche de réplication par lots afin de suivre l'état de la réplication des objets. Le rapport d'achèvement est un fichier CSV généré par Amazon S3 après la fin, l'échec ou l'annulation d'une tâche, à condition qu'au moins une tâche ait été invoquée avec succès à l'aide des opérations par lots S3.
En outre, si activé les Métriques de réplication ou le Contrôle du temps de réplication S3 (S3 RTC) pour votre règle de réplication, vous pouvez consulter le nombre d'opérations ayant échoué par minute sur la console Amazon S3 et la console Amazon CloudWatch à l'aide de la métrique Échec de réplication des opérations. Pour plus d'informations, reportez-vous aux rapports d'achèvement des opérations par lots S3 et au suivi de la progression à l'aide des mesures de réplication S3.
Étape 7 : nettoyer les ressources
Supprimer des objets de test
- Si vous vous êtes déconnecté de votre session de console de gestion AWS, reconnectez-vous.
- Accédez à la console S3 et sélectionnez l'option de menu Compartiments.
- Tout d'abord, vous devez supprimer l'objet de test dans votre compartiment de test. Sélectionnez compartiment que vous avez utilisé dans le cadre de ce didacticiel.
- Sélectionnez l'objet de test, puis choisissez Supprimer.
- Sur la page Supprimer des objets, vérifiez que vous avez sélectionné le bon objet à supprimer, saisissez supprimer dans le champ de confirmation, puis sélectionnez Supprimer l'objet.
Une bannière en haut de la page indique que la suppression a réussi.
Supprimer les compartiments de test
- Retournez à la liste des compartiments de votre compte.
- Sélectionnez le bouton radial à gauche du compartiment source que vous avez créé pour ce didacticiel, puis choisissez Supprimer.
- Saisissez le nom du compartiment dans le champ de confirmation, puis choisissez Supprimer le compartiment.
- Répétez ces étapes pour supprimer le compartiment de destination que vous avez créé dans le cadre de ce didacticiel.
Une bannière en haut de la page indique que la suppression a réussi.
Conclusion
Félicitations ! Vous avez appris à utiliser la réplication par lots S3 pour répliquer des objets existants de la source vers des compartiments S3 de destination afin de remplir les compartiments nouvellement créés avec des objets existants, de répliquer des objets qui ont déjà été répliqués et de répliquer des objets qui n'ont pas pu être répliqués par le passé. Lorsque vous utilisez la réplication par lots S3, nous vous recommandons d'utiliser un manifeste généré par S3 pour répertorier automatiquement les objets à répliquer. Vous devez également enregistrer votre manifeste de réplication pour un examen et une analyse ultérieurs. Enfin, nous vous recommandons de générer des rapports d'achèvement pour suivre le statut des objets répliqués avec la réplication par lots S3.
Étapes suivantes
Pour en savoir plus sur la réplication S3, consultez les ressources suivantes.
Documentation sur la réplication par lots S3
Questions fréquentes sur la réplication S3
Répliquer des objets existants avec le blog de réplication par lots Amazon S3
Répliquez les données d'une région et les données entre les Régions AWS en utilisant la réplication Amazon S3