TL;DR
Cette série construit progressivement une infrastructure cloud complète sur Infomaniak Public Cloud. Dans cet épisode, le sujet précis est: Monitoring : ansible déploiement (ex : backups consul). Concentrer l épisode sur PostgreSQL: installation, réplication, failover, sauvegarde ou restauration selon "Monitoring : ansible déploiement (ex : backups consul)".
La vidéo de référence
Vidéo: https://www.youtube.com/watch?v=RKf4qbGBSJw
Playlist complète: https://www.youtube.com/playlist?list=PLn6POgpklwWpehxly1wOT6eB2NvZX9A-X
Le dépôt support est disponible ici: https://gitlab.com/xavki/infrastructure-cloud-infomaniak. Le chapitre correspondant est 41-monitoring-ansible-custom-metrics-installation.
Objectif précis de l épisode
Concentrer l épisode sur PostgreSQL: installation, réplication, failover, sauvegarde ou restauration selon "Monitoring : ansible déploiement (ex : backups consul)".
Concrètement, cet épisode sert à passer d une intention formulée dans le titre à une modification vérifiable dans l infrastructure. Le dépôt donne les fichiers, la vidéo donne l ordre de manipulation, et la vérification doit confirmer que la brique fonctionne vraiment.
Monitoring : ansible déploiement (ex : backups consul): c est quoi exactement ?
Dans une infrastructure cloud réelle, chaque épisode ajoute une brique: réseau, compute, sécurité, automatisation, découverte de services, observabilité, sauvegardes ou orchestration. Ici, les outils détectés sont: openstack, ansible, consul, monitoring, postgresql.
Dans cet épisode, il faut surtout regarder les éléments qui correspondent au titre: les ressources créées ou modifiées, les fichiers du chapitre, les services touchés et la preuve de fonctionnement. Les outils détectés donnent le contexte, mais le fil rouge reste Monitoring : ansible déploiement (ex : backups consul).
Ce que la vidéo cherche à modifier
- organiser inventaire, variables et playbooks du chapitre
- appliquer la configuration de manière reproductible
- vérifier les rôles réellement exécutés sur les hôtes ciblés
- déclarer ou utiliser les services Consul nécessaires
- relier DNS interne, checks et catalogue
- préparer l intégration avec proxy ou monitoring
Indices extraits des slides
- Monitoring – Custom Metrics – Backups consul
- storage consul datas /data/var/lib/consul
- in a container
- Ansible automation
- dashboard & alerting
Notions et définitions des outils
- openstack: OpenStack est la couche cloud IaaS: instances, réseaux, routeurs, IP flottantes, groupes de sécurité, volumes et images. Chez Infomaniak Public Cloud, il sert de socle programmable via GUI, CLI, Terraform et API.
- ansible: Ansible automatise la configuration des machines après leur création. Les playbooks, rôles, inventaires et variables transforment une VM brute en service exploitable.
- consul: Consul apporte service discovery, DNS interne, health checks et catalogue de services. Il relie machines, proxy, monitoring et automatisation.
- monitoring: Le monitoring collecte métriques, alertes et dashboards. Node exporter, vmagent, VictoriaMetrics, VMAlert, Alertmanager, Karma et Grafana couvrent collecte, stockage, règles, notification et visualisation.
- postgresql: PostgreSQL est le SGBD relationnel de la plateforme. La série aborde installation, réplication, failover, utilisateurs, sauvegardes, PITR et monitoring.
Ces définitions sont volontairement pratiques: elles expliquent à quoi sert l outil dans la chaîne, pas seulement ce qu il est sur le papier.
Points clés à retenir pour cet épisode
- Comprendre le rôle de Monitoring : ansible déploiement (ex : backups consul) dans la progression globale de l infrastructure.
- Identifier la couche concernée: cloud, automatisation, réseau, service, observabilité ou orchestration.
- Relier les fichiers du dépôt au résultat attendu sur les machines ou dans le cloud.
- Vérifier les inventaires, variables et rôles avant de lancer un playbook.
- Conserver une preuve de fonctionnement via métriques, dashboards ou alertes.
Approfondissement spécifique
Dans Monitoring : ansible déploiement (ex : backups consul), Ansible doit être lu comme la couche de convergence système. Le sujet n est pas uniquement le playbook lancé, mais la combinaison inventaire, variables, rôles et tâches qui transforme une machine provisionnée en service configuré.
Le diagnostic part de la cible: quel groupe d hôtes est visé, quelles variables sont chargées, quel rôle applique le changement et quel fichier ou service prouve le résultat sur la machine.
Avec Monitoring : ansible déploiement (ex : backups consul), Consul sert de tissu de découverte entre les machines. Le point spécifique est de comprendre quelle information entre dans le catalogue: nom du service, adresse, port, tags et health check.
Un service déclaré mais unhealthy ne doit pas être considéré comme disponible. Il faut suivre la chaîne DNS Consul -> catalogue -> check -> consommateur du service, par exemple Traefik, monitoring ou un autre composant applicatif.
Pour Monitoring : ansible déploiement (ex : backups consul), le sujet précis est le trajet de la métrique: exposition par un exporter ou un composant, découverte par le collecteur, stockage, requête PromQL puis visualisation ou alerte.
Un dashboard ne valide pas à lui seul l observabilité. Il faut remonter à la target, vérifier la fraîcheur des séries, tester une requête représentative et s assurer que l alerte repose sur un signal actionnable.
Exemple de code ou configuration du dépôt
Les exemples complets sont dans les répertoires du chapitre listés plus bas.
Chemin de diagnostic recommandé
- valider l inventaire Ansible
- relancer le playbook sans changement inattendu
- contrôler les services et fichiers modifiés sur la machine
- vérifier les membres Consul
- contrôler les entrées DNS et services
- regarder l état des health checks
- Comparer l état attendu dans le dépôt et l état réel dans le cloud, la machine ou le cluster.
- Documenter la commande, l écran ou la métrique qui prouve que l étape est fonctionnelle.
Répertoires et commandes utiles
- Répertoire support: 41-monitoring-ansible-custom-metrics-installation
- Répertoire support: 41-monitoring-ansible-custom-metrics-installation/code/ansible
- Répertoire support: 41-monitoring-ansible-custom-metrics-installation/code/terraform
Pièges fréquents
- lancer un playbook sur le mauvais groupe
- mélanger variables de lab et variables sensibles
- ne pas vérifier l idempotence
- oublier les ports Consul
- déclarer un service sans health check utile
- dépendre du DNS sans tester la résolution
Liens utiles externes
- Dépôt Xavki infrastructure-cloud-infomaniak
- Playlist YouTube Infra de A à Z
- docs.infomaniak.cloud
- docs.infomaniak.cloud/getting_started/first_project
- docs.infomaniak.cloud/compute/instances
- docs.infomaniak.cloud/orchestration/terraform
- docs.infomaniak.cloud/network/networks
- docs.infomaniak.cloud/network/security_groups
Liens internes conseillés
- Parcours Kubernetes pour relier la partie cluster et orchestration.
- Prometheus, Grafana et observabilité pour approfondir métriques et dashboards.
- RabbitMQ et workloads stateful pour comparer stockage, redémarrage et état applicatif.
Pour continuer, lire Infra A à Z 043 – Monitoring: custom metrics, checks, Grafana dashboard & alerts.
FAQ
Pourquoi utiliser Terraform et Ansible ensemble ?
Terraform est adapté à la création et au cycle de vie des ressources cloud. Ansible est adapté à la configuration des machines et services. Les mélanger sans frontière claire rend les changements difficiles à relire.
Pourquoi Infomaniak/OpenStack dans cette série ?
Infomaniak Public Cloud expose des concepts OpenStack standards: compute, réseau, volumes, security groups, object storage, identity et orchestration. Cela permet d apprendre des notions transférables tout en travaillant sur un fournisseur concret.
Que faut-il sécuriser en premier ?
Les accès: credentials cloud, state Terraform, SSH, VPN, dashboards, secrets Ansible, tokens GitLab, consoles d administration et ports exposés publiquement. Une infrastructure automatisée amplifie aussi les erreurs de sécurité.
Comment savoir si une étape est terminée ?
Chaque étape doit produire une preuve: une ressource visible, un service joignable, une métrique collectée, un backup restaurable, une requête qui répond ou un déploiement qui converge.
Conclusion
L épisode 42 s inscrit dans une progression complète: construire, automatiser, sécuriser, observer et exploiter une infrastructure cloud. Le dépôt Xavki donne les exemples concrets, la documentation Infomaniak/OpenStack donne le cadre fournisseur, et le deep dive permet de comprendre le rôle des outils au lieu de seulement rejouer des commandes.