guides

Alerte de sauvegarde manquante pour Proxmox Backup Server

Cloud-PBS vous alerte quand un datastore Proxmox Backup Server cesse de recevoir des sauvegardes réussies, jusqu'à chaque VM, avec seuil par VM et désactivation à la carte.

Alerte de sauvegarde manquante pour Proxmox Backup Server

Une sauvegarde que vous croyez active, mais qui ne tourne plus, est pire que pas de sauvegarde du tout : elle donne une fausse confiance, et vous le découvrez le jour où vous avez besoin de la restauration. Cloud-PBS vous alerte désormais quand les sauvegardes s’arrêtent.

Alerter sur une sauvegarde manquante

Cloud-PBS surveille la date de la dernière sauvegarde réussie et lève une alerte lorsqu’elle devient plus ancienne que la fenêtre que vous choisissez. Vous êtes prévenu par e-mail, par webhook et dans le tableau de bord, où le datastore est signalé pour que l’état saute aux yeux.

C’est le complément de la vérification propre à Proxmox Backup Server. La vérification contrôle l’intégrité des sauvegardes déjà présentes ; cette alerte surveille l’absence de nouvelles sauvegardes. Planification cassée, hôte éteint, jeton expiré : quelle qu’en soit la cause, une sauvegarde qui ne tourne plus ne passe plus inaperçue.

À quoi ressemble un trou silencieux

Prenons srv-db01. Son jeton API expire un vendredi soir. La sauvegarde suivante échoue, la suivante aussi, mais personne ne lit le journal des tâches pendant le week-end. Le datastore contient toujours les snapshots de la semaine passée, donc au premier coup d’œil tout paraît normal. Avec un seuil de 24 heures sur ce groupe, Cloud-PBS envoie un e-mail le samedi matin nommant srv-db01 et l’âge de sa dernière sauvegarde valide. Vous régénérez le jeton, la sauvegarde suivante réussit, et l’alerte se résorbe d’elle-même. Trois jours de données non protégées deviennent une correction du samedi matin plutôt qu’une découverte le lundi, après l’incident.

C’est tout l’enjeu : le mode de défaillance, c’est le silence, et un seuil transforme ce silence en signal.

Activation en quelques secondes

L’alerte se configure par datastore. Ouvrez-le dans le tableau de bord, allez dans l’onglet Notifications, activez Sauvegarde manquante, et définissez le seuil (un nombre d’heures ou de jours). Elle est active dès l’enregistrement.

Jusqu’à chaque VM

Un datastore contient en général plusieurs groupes de sauvegarde, un par VM ou hôte, par exemple srv-web01 et srv-db01. Cloud-PBS évalue chacun individuellement, et l’alerte nomme la VM en retard : vous savez exactement où regarder.

Vous pouvez aussi régler chaque VM depuis l’onglet Sauvegardes :

Supervision par VM dans l'onglet Sauvegardes

  • Donnez à une VM critique son propre seuil. srv-db01, sauvegardée toutes les quelques heures, peut alerter au bout de 6 heures, tandis que le reste du datastore reste sur une fenêtre de 7 jours.
  • Mettez en pause la supervision d’une VM que vous ne sauvegardez plus volontairement, par exemple une machine décommissionnée dont les anciens snapshots sont encore conservés.

Une VM dont la dernière sauvegarde dépasse son seuil effectif est marquée En retard directement dans la liste.

Choisir un seuil adapté au rythme

Le bon seuil suit la cadence de sauvegarde, pas un chiffre unique pour tout le site. Une VM sauvegardée chaque nuit est tranquille avec une fenêtre de 36 à 48 heures : assez longue pour absorber une exécution ratée et un nouvel essai, assez courte pour attraper un job réellement à l’arrêt. Une base de données snapshotée toutes les quelques heures demande une fenêtre serrée de 6 à 12 heures. Un hôte sauvegardé chaque semaine a besoin de 8 ou 9 jours, sinon il alerte chaque semaine par construction.

C’est là que la surcharge par VM prend tout son sens. Un même datastore peut mêler un serveur de fichiers nocturne, une base horaire et un hôte d’archive hebdomadaire, et chacun reçoit un seuil calé sur son propre rythme. Le défaut du datastore s’applique toujours à tout ce que vous ne touchez pas : vous ne surchargez que les exceptions.

Un point à connaître

Le contrôle s’appuie sur l’historique des snapshots : il mesure donc les groupes qui ont sauvegardé au moins une fois. Une VM que vous comptiez protéger mais dont la toute première sauvegarde n’a jamais réussi n’a aucun snapshot à vieillir, et n’apparaîtra pas comme en retard. La règle reste celle qu’elle a toujours été : confirmez que la première sauvegarde arrive vraiment avant de considérer une VM comme protégée. Dès son premier snapshot réussi, l’alerte sauvegarde manquante la suit.

Un court guide pour démarrer

Quand vous activez l’alerte, un court guide intégré vous mène aux réglages dans l’onglet Sauvegardes. Vous pouvez le rejouer à tout moment avec le bouton (i) à côté du toggle d’alerte.

Disponible dès maintenant

L’alerte de sauvegarde manquante est active sur tous les datastores Cloud-PBS, sans coût supplémentaire. Ouvrez un datastore, activez l’alerte dans l’onglet Notifications, et réglez chaque VM depuis l’onglet Sauvegardes.

Tous les détails sont dans la documentation de l’alerte sauvegarde manquante.

monitoring alerting proxmox-backup-server product-update

Prêt à essayer Cloud-PBS ?

Démarrez votre essai gratuit de 7 jours dès aujourd'hui.

Démarrer l'essai gratuit