Guide de l'administrateur NetBackup™ pour Apache Cassandra

Last Published:
Product(s): NetBackup & Alta Data Protection (10.5)

Composants et terminologie de la sauvegarde et de la récupération Cassandra

Le tableau suivant décrit l'utilité des différents composants de la solution de sauvegarde et de récupération Cassandra et sa terminologie.

Tableau : 

Composants et terminologie

Utilité et définition

Cluster d'application

  • Le cluster d'application est le cluster de production Cassandra.

  • Le nom du cluster doit être un mot unique sans espaces et correspondre au nom réel du cluster utilisé dans le fichier Cassandra.yaml sur les nœuds de production.

Plan de protection

Un plan de protection définit le moment d'exécution des sauvegardes, la durée pendant laquelle elles sont conservées, ainsi que le type de stockage à utiliser.

Une fois qu'un plan de protection est configuré, vous pouvez y abonner des biens.

Hôte de sauvegarde

L'hôte de sauvegarde fait office de client proxy. Toutes les opérations de sauvegarde et de restauration sont exécutées par l'intermédiaire de l'hôte de sauvegarde.

La solution CBR (Cassandra Backup Recovery) utilise la politique BigData avec le type d'application cassandra.

Le plan de protection utilise cet hôte de sauvegarde.

Le serveur de médias utilisé pour configurer le serveur de stockage pour la solution CBR doit être utilisé comme hôte de sauvegarde.

Remarque :

Vous pouvez également utiliser le client NetBackup comme hôte de sauvegarde.

Cluster Cassandra

Représente le cluster de production Cassandra à protéger.

Composant de sauvegarde et de récupération Cassandra

Client léger NetBackup qui est déployé sur les serveurs intermédiaires de données et le cluster Cassandra pour faciliter les opérations de sauvegarde et de restauration

Serveurs intermédiaires de données

Parallèlement au serveur principal NetBackup et aux hôtes de sauvegarde, NetBackup requiert un ensemble de serveurs pour la sauvegarde du cluster Cassandra. Ces serveurs représentent en général 20 % du nombre total de serveurs du cluster Cassandra. Ils sont utilisés pour dédupliquer les données du cluster Cassandra pendant la sauvegarde et optimiser le processus de sauvegarde.

Lors d'une sauvegarde ou d'une restauration, des espaces de clés Cassandra sont transmis en parallèle entre le cluster Cassandra et les serveurs intermédiaires de données.

Les serveurs intermédiaires de données représentent un cluster intermédiaire. Vous devez déployer les nœuds, qui sont utilisés en fonction de la taille des données à sauvegarder ou à restaurer.

Réduction des données

La réduction des données implique les tâches suivantes :

  • Rapprochement efficace

    Des données de rapprochement efficace pour des clés identiques issues de nœuds différents sont transférées vers le même nœud dans les nœuds de sauvegarde.

    Des rapprochements sont effectués en parallèle dans chaque serveur intermédiaire de données sans aucune communication entre les nœuds.

  • Synthèse d'enregistrement

    Lors de l'itération sur les enregistrements, des colonnes de la même clé de différentes SStables sont fusionnées.

  • Déduplication sémantique

    Les enregistrements obsolètes et dupliqués (répliques) sont identifiés et supprimés.

Serveur principal NetBackup

Tous les travaux sont exécutés à partir du serveur principal NetBackup.

Flux parallèles

NetBackup Parallel Streaming Framework permet de sauvegarder les blocs de données de plusieurs nœuds en utilisant simultanément plusieurs hôtes de sauvegarde.