Infra de A à Z 040 - Monitoring : dashboard grafana

TL;DR

Cette série construit progressivement une infrastructure cloud complète sur Infomaniak Public Cloud. Dans cet épisode, le sujet précis est: Monitoring : dashboard grafana. Rendre l exposition HTTP/HTTPS cohérente avec "Monitoring : dashboard grafana": routage Traefik, dashboard, TLS, DNS ou fournisseur dynamique.

La vidéo de référence

Vidéo: https://www.youtube.com/watch?v=VOCeV3jP0xs

Playlist complète: https://www.youtube.com/playlist?list=PLn6POgpklwWpehxly1wOT6eB2NvZX9A-X

Le dépôt support est disponible ici: https://gitlab.com/xavki/infrastructure-cloud-infomaniak. Le chapitre correspondant est 39-monitoring-ansible-grafana-dashboards.

Objectif précis de l épisode

Rendre l exposition HTTP/HTTPS cohérente avec "Monitoring : dashboard grafana": routage Traefik, dashboard, TLS, DNS ou fournisseur dynamique.

Concrètement, cet épisode sert à passer d une intention formulée dans le titre à une modification vérifiable dans l infrastructure. Le dépôt donne les fichiers, la vidéo donne l ordre de manipulation, et la vérification doit confirmer que la brique fonctionne vraiment.

Monitoring : dashboard grafana: c est quoi exactement ?

Dans une infrastructure cloud réelle, chaque épisode ajoute une brique: réseau, compute, sécurité, automatisation, découverte de services, observabilité, sauvegardes ou orchestration. Ici, les outils détectés sont: terraform, openstack, consul, monitoring, logs, tempo.

Dans cet épisode, il faut surtout regarder les éléments qui correspondent au titre: les ressources créées ou modifiées, les fichiers du chapitre, les services touchés et la preuve de fonctionnement. Les outils détectés donnent le contexte, mais le fil rouge reste Monitoring : dashboard grafana.

Ce que la vidéo cherche à modifier

brancher les métriques utiles
adapter la configuration de collecte ou de stockage
rendre le résultat visible dans Grafana ou dans les règles d alerte
définir les routes et services exposés
séparer dashboard, backends et endpoints publics
relier Traefik à Consul ou Kubernetes si nécessaire

Découvrez Infra de A à Z 020 - Terraform - Cloud Init & IPs

Indices extraits des slides

Monitoring – Grafana Dashboards
visualization
many datasources
Ajouter les variables nécessaires
Add datasource

Notions et définitions des outils

terraform: Terraform décrit l infrastructure comme du code. Le provider OpenStack transforme des ressources HCL en objets cloud: réseaux, routeurs, instances, volumes, groupes de sécurité.
openstack: OpenStack est la couche cloud IaaS: instances, réseaux, routeurs, IP flottantes, groupes de sécurité, volumes et images. Chez Infomaniak Public Cloud, il sert de socle programmable via GUI, CLI, Terraform et API.
consul: Consul apporte service discovery, DNS interne, health checks et catalogue de services. Il relie machines, proxy, monitoring et automatisation.
monitoring: Le monitoring collecte métriques, alertes et dashboards. Node exporter, vmagent, VictoriaMetrics, VMAlert, Alertmanager, Karma et Grafana couvrent collecte, stockage, règles, notification et visualisation.
logs: La chaîne logs regroupe collecte, transformation, stockage et requêtes. Logrotate gère les fichiers locaux, Vector collecte/transforme, Loki indexe les labels et LogQL interroge.
tempo: Tempo stocke les traces distribuées. Il complète métriques et logs pour comprendre le chemin d une requête dans une architecture distribuée.

Ces définitions sont volontairement pratiques: elles expliquent à quoi sert l outil dans la chaîne, pas seulement ce qu il est sur le papier.

Points clés à retenir pour cet épisode

Comprendre le rôle de Monitoring : dashboard grafana dans la progression globale de l infrastructure.
Identifier la couche concernée: cloud, automatisation, réseau, service, observabilité ou orchestration.
Relier les fichiers du dépôt au résultat attendu sur les machines ou dans le cloud.
Séparer clairement la création des ressources cloud du paramétrage applicatif.
Conserver une preuve de fonctionnement via métriques, dashboards ou alertes.

Approfondissement spécifique

Pour Monitoring : dashboard grafana, le sujet précis est le trajet de la métrique: exposition par un exporter ou un composant, découverte par le collecteur, stockage, requête PromQL puis visualisation ou alerte.

Un dashboard ne valide pas à lui seul l observabilité. Il faut remonter à la target, vérifier la fraîcheur des séries, tester une requête représentative et s assurer que l alerte repose sur un signal actionnable.

Avec Monitoring : dashboard grafana, Traefik est le point d entrée HTTP/HTTPS. Le détail important est l association entre hostname, route, service backend, certificat et fournisseur de configuration.

Découvrez Infra de A à Z 110 - Logging : installation de VictoriaLogs & configuration de Vector

Un 404, un 502 ou un certificat absent ne se diagnostiquent pas au même endroit. Il faut distinguer DNS, routage Traefik, service découvert, port backend et TLS.

Exemple de code ou configuration du dépôt

Les exemples complets sont dans les répertoires du chapitre listés plus bas.

Chemin de diagnostic recommandé

vérifier que les targets sont up
contrôler une requête PromQL représentative
ouvrir le dashboard ou l alerte concernée
tester le hostname
vérifier certificat et route
contrôler les logs Traefik en cas de 404 ou 502
Comparer l état attendu dans le dépôt et l état réel dans le cloud, la machine ou le cluster.
Documenter la commande, l écran ou la métrique qui prouve que l étape est fonctionnelle.

Répertoires et commandes utiles

Répertoire support: 39-monitoring-ansible-grafana-dashboards
Répertoire support: 39-monitoring-ansible-grafana-dashboards/code/ansible
Répertoire support: 39-monitoring-ansible-grafana-dashboards/code/terraform

Pièges fréquents

déployer un exporter sans scrape
créer un dashboard sans métrique stable
alerter sur un signal trop bruité
exposer le dashboard sans protection
confondre service interne et endpoint public
oublier DNS ou TLS

Liens utiles externes

Liens internes conseillés

Parcours Kubernetes pour relier la partie cluster et orchestration.
Prometheus, Grafana et observabilité pour approfondir métriques et dashboards.
Wazuh et logs sécurité pour comparer observabilité et détection sécurité.

Pour continuer, lire Infra A à Z 041 – Monitoring: e.g., backups, etc..

FAQ

Pourquoi utiliser Terraform et Ansible ensemble ?

Terraform est adapté à la création et au cycle de vie des ressources cloud. Ansible est adapté à la configuration des machines et services. Les mélanger sans frontière claire rend les changements difficiles à relire.

Pourquoi Infomaniak/OpenStack dans cette série ?

Infomaniak Public Cloud expose des concepts OpenStack standards: compute, réseau, volumes, security groups, object storage, identity et orchestration. Cela permet d apprendre des notions transférables tout en travaillant sur un fournisseur concret.

Que faut-il sécuriser en premier ?

Les accès: credentials cloud, state Terraform, SSH, VPN, dashboards, secrets Ansible, tokens GitLab, consoles d administration et ports exposés publiquement. Une infrastructure automatisée amplifie aussi les erreurs de sécurité.

Comment savoir si une étape est terminée ?

Chaque étape doit produire une preuve: une ressource visible, un service joignable, une métrique collectée, un backup restaurable, une requête qui répond ou un déploiement qui converge.

Conclusion

L épisode 40 s inscrit dans une progression complète: construire, automatiser, sécuriser, observer et exploiter une infrastructure cloud. Le dépôt Xavki donne les exemples concrets, la documentation Infomaniak/OpenStack donne le cadre fournisseur, et le deep dive permet de comprendre le rôle des outils au lieu de seulement rejouer des commandes.