Nagios est un outil de monitoring assurant la détection de pannes ou dysfonctionnements au sein d'une infrastructure réseau. Si l'on se réfère aux aires fonctionnelles FCAS, on le classe donc dans la catégorie de la gestion des fautes même si certains modules permettent de l'adapter afin de répondre aux problématiques de performances (cacti).
Le but de Nagios est de d'avertir les administrateurs d'un dysfonctionnement avant que les usagers de l'infrastructure ne soient impactés. Pour cela Nagios s'appuie sur un ensemble de tests exécutés régulièrement via son ordonnanceur.
Les test ou checks sont exécutés périodiquement par Nagios afin de déduire (d'inférer) l'état d'un service. Un test est implanté via un plugin contenant un binaire ou un script exécuté sur un équipement. Pour exécuter les tests à distance Nagios peut se reposer sur:
Les tests peuvent permettre de détecter de nombreuses anomalies comme par exemple:
Nagios peut également servir à contrôler l'état de services externes à l'infrastructure tels que des services web, du cloud etc.
Nagios intègre un système de notification sophistiqué permettant d'alerter les administrateurs lorsque un problème est détecté. Sophistiqué car il se permet le filtrage et escalade:
Interface Web listant les machines et les services testés sur celles-ci. Chaque service a un état( son status) indiquant si le service fonctionne correctement ou non. D'auters informations sont affichées telles que l'horodatage du dernier test, nombre de test effectués et des informations plus détaillées sur le résultat du test.
Le status d'un service est caractérisé par une couleur sur l'IHM
Couleur | Etat (status) |
---|---|
Green | OK, le service fonctionne normalement. |
Yellow | WARNING, état alerte. |
Red | CRITICAL, service HS, intervention nécessaire. |
Le sens donné par les états OK, WARNING, CRITICAL est définit par l'administrateur selon les besoins et les scénari d'usage de son SI.
Notes et affirmations issues du Quizz:
Retour menu général MOOC