Quelques propositions pour factoriser la configuration et faciliter sa maintenance.
Lorsque le même service est surveillé sur différentes machines, on ne définit qu'un seul objet de type service et on remplace l'attribut host_name par hostgroup_name. L'attribut hostgroup_name est une référence sur un groupe de machines. Toutes les machines de ce groupe se verront affectées ce même service.
define hostgroup{ hostgroup_name dns_hosts alias devices hosting DNS service members dev01.lan, dev02.lan, devxx.lan } define service{ hostgroup_name dns_hosts service_description dnsservice .... }
Cela permet de réduire le nombre de définitions dans la configuration Nagios et donc les erreurs potentielles.
Nagios intègre un mécanisme proche de l'héritage et permet de factoriser au maximum les attributs via les templates.
Objectif: Mettre en place un support multi niveaux pour la résolution de problème en s'appuyant sur une hiérarchie des contacts établie selon les besoins par technicité, responsabilité, localisation géographique etc. Pour cela les attributs hostescalation et serviceescalation devront être définis.
Nagios doit pouvoir détecter les pannes le plus tôt possible. Pour améliorer le processus d'analyse, il peut être nécessaire de déclarer des dépendances via l'attribut parents.
Nagios inclus des dépendances implicites entre hôtes et services. L’hôte n'est pas testé si ses services sont opérationnels. On peut ajouter des dépendances explicites.
Les dépendances explicitement déclarées via l'attribut parents permettent notamment de différencier un hôte hors service d'un hote non atteignable.
Si les tests échouent pour un hôte, les parents sont testés: