Guide de l'administrateur NetBackup™ pour Apache Cassandra
- Présentation
- Gestion d'Apache Cassandra
- Protection
- Vérification de prérécupération
- Récupération
- Dépannage
- API pour Cassandra
Présentation de la prise en charge d'Apache Cassandra par NetBackup
Apache Cassandra est une base de données NoSQL évolutive couramment utilisée. Cassandra s'exécute sur du matériel standard utilisant une solution de stockage à connexion directe. Un cluster Cassandra type comporte des nœuds chargés de stocker les données. Cassandra réplique les données entre les différents nœuds pour assurer la résilience en cas d'arrêt d'un ou plusieurs nœuds. Il n'est pas question ici d'une copie principale des données ; chaque nœud peut avoir une version plus récente des données que ses répliques. Cassandra se distingue entre autres par le fait qu'elle privilégie la disponibilité à la cohérence. La base de données reste toujours disponible même si les répliques des données ne sont pas toujours à jour.
NetBackup offre une solution avancée de protection des clusters Cassandra. Cette solution présente les caractéristiques suivantes :
Sans agent Cassandra : il n'est pas nécessaire de placer des agents de sauvegarde sur les nœuds de cluster Cassandra. En pratique, aucun code ne vient ralentir le cluster Cassandra hautes performances.
Copie de données en une passe : au cours de la sauvegarde, un client léger réalise une passe unique sur les fichiers de données Cassandra (appelés sstables), afin de minimiser le volume des E/S.
Optimisation des données en dehors de l'hôte : les données Cassandra sont répliquées pour assurer la résilience. Les sauvegardes sont destinées à une conservation plus longue. La solution NetBackup de protection de Cassandra traite les données pour :
déterminer un instant cohérent avec le cluster.
supprimer les enregistrements de réplique.
supprimer les données obsolètes résultant de l'écrasement des enregistrements.
L'ensemble du traitement intervient en dehors de l'hôte sur des serveurs intermédiaires de données, afin d'assurer que les processus de sauvegarde n'affectent pas vos clusters Cassandra hautes performances.
Sauvegardes incrémentielles : NetBackup prend en charge les sauvegardes incrémentielles de Cassandra pour optimiser les temps de sauvegarde après une sauvegarde complète. La solution détecte automatiquement les nouveaux espaces de clés ou familles de colonnes créés pour réaliser une sauvegarde complète de ces nouvelles structures en complément des sauvegardes incrémentielles des structures existantes.
Sauvegarde évolutive : Cassandra permet de faire évoluer facilement votre cluster Cassandra en ajoutant des nœuds en fonction des besoins. Les données existantes sont redistribuées automatiquement sur de nouveaux nœuds tant que le cluster est en ligne. La protection de Cassandra par NetBackup est évolutive et permet d'ajouter des serveurs intermédiaires de données pour répondre à vos exigences de sauvegarde.
Identification du datacenter : la protection de Cassandra par NetBackup peut être configurée pour sauvegarder les données d'un datacenter spécifique. Elle interroge le cluster Cassandra et identifie automatiquement les nœuds présents dans divers datacenters. Seuls les nœuds du datacenter à sauvegarder sont sollicités.
Restauration en fonction du datacenter : lors de la restauration, NetBackup se connecte au cluster de restauration et détermine sa topologie actuelle. La solution rapproche cette topologie avec celle présente au moment de la sauvegarde pour s'adapter aux changements de topologie et procéder à la restauration en fonction de la topologie la plus récente. La solution dispose également d'options supplémentaires pour modifier les datacenters et le nombre de répliques dans chaque datacenter, pour changer l'espace de clés et les noms de familles de colonnes, etc. afin de simplifier votre processus de restauration.
Remarque :
Si le nom d'une famille de colonnes a été modifié, les index ne sont pas restaurés. Vous devez donc ajouter un index à la famille de colonnes renommée.
Restauration granulaire : la solution Cassandra de NetBackup vous permet de ne restaurer qu'une partie de l'ensemble de données de sauvegarde. Vous pouvez ainsi ne restaurer qu'une partie des espaces de clés ou des familles de colonnes.
Restauration sans réparation : les processus de restauration garantissent qu'une fois les données restaurées, il n'est pas nécessaire d'exécuter d'autres étapes de récupération. Les données sont disponibles immédiatement après la restauration dans votre cluster Cassandra hautes performances.