Table des matières

, , ,

Nagios: Concepts et architecture

Usages

Nagios est un outil de monitoring assurant la détection de pannes ou dysfonctionnements au sein d'une infrastructure réseau. Si l'on se réfère aux aires fonctionnelles FCAS, on le classe donc dans la catégorie de la gestion des fautes même si certains modules permettent de l'adapter afin de répondre aux problématiques de performances (cacti).

Le but de Nagios est de d'avertir les administrateurs d'un dysfonctionnement avant que les usagers de l'infrastructure ne soient impactés. Pour cela Nagios s'appuie sur un ensemble de tests exécutés régulièrement via son ordonnanceur.

Architecture fonctionnelle

  1. Data Reaping: Collecte les informations via les tests et calcule l'état des ressources (hôtes et services).
  2. Notification System: filtrage communication et escalade des notifications. Transmissions par l'IHM, mails, sms.
  3. IHM: serveur web et scripts CGI.

Les test ou checks sont exécutés périodiquement par Nagios afin de déduire (d'inférer) l'état d'un service. Un test est implanté via un plugin contenant un binaire ou un script exécuté sur un équipement. Pour exécuter les tests à distance Nagios peut se reposer sur:

Les tests peuvent permettre de détecter de nombreuses anomalies comme par exemple:

Nagios peut également servir à contrôler l'état de services externes à l'infrastructure tels que des services web, du cloud etc.

Nagios intègre un système de notification sophistiqué permettant d'alerter les administrateurs lorsque un problème est détecté. Sophistiqué car il se permet le filtrage et escalade:

Interface

Interface Web listant les machines et les services testés sur celles-ci. Chaque service a un état( son status) indiquant si le service fonctionne correctement ou non. D'auters informations sont affichées telles que l'horodatage du dernier test, nombre de test effectués et des informations plus détaillées sur le résultat du test.

Le status d'un service est caractérisé par une couleur sur l'IHM

Couleur Etat (status)
Green OK, le service fonctionne normalement.
Yellow WARNING, état alerte.
Red CRITICAL, service HS, intervention nécessaire.

Le sens donné par les états OK, WARNING, CRITICAL est définit par l'administrateur selon les besoins et les scénari d'usage de son SI.

Notes issues du Quizz

Notes et affirmations issues du Quizz:

Références

Retour menu général MOOC

1)
Nagios Remote Process Executor