Le NM System1) désigne l'ensemble des éléments et outils permettant la supervision et le contrôle du réseau. Il est constitué par:
Le NM system perçoit l'ensemble du réseau comme un tout. Il offre une vue globale du système.
Une NM Entity est mise en œuvre par l’exécution d'un Agent sur le nœud. C'est un processus local chargé des opérations de gestion. Les agents gèrent différentes informations/ressources/attributs du nœud appelées Managed Objects
L'administrateur gestionnaire dispose de l'application de gestion appelée Manager communiquant avec les Agents.
Les deux stratégies sont utiles et peuvent coexister en fonction des besoins. Le Polling est réputé plus fiable et plus léger coté Agent mais il est moins réactif lors de l'apparition d'événements et génère plus de trafic.
Des données de supervision (métriques) peuvent être brutes ou déduites/calculées à partir des données collectées.
La disponibilité exprime la proportion du temps où le service est disponible pour les utilisateurs.
On le calcule en comparant le temps moyen entre 2 pannes MTBF3) et le temps moyen entre deux pannes auquel est ajouté le temps moyen de remise en service MTTR4)
A = MTBF/(MTBF+MTTR)
Selon l'infrastructure le calcul de la disponibilité diffère:
Temps s'écoulant entre la sollicitation et la réponse effectivement retournée par le système. Il résume plusieurs délais (selon la complexité et les dépendances du système) en une seule métrique.
Le temps de réponse est souvent caractérisé à l'aide d'intervalles. Il doit rester faible pour que les services soient perçus comme réactifs par les utilisateurs.
La précision ou accuracy indique la quantité de données transmises sans erreur.
Le débit ou throughput nombre d'événements par unité de temps.
Le taux d'utilisation d'une ressources indique le pourcentage d'utilisation d'une ressource par rapport à ses capacités.
Il existe de nombreuses métriques et façon de les présenter: Matrices, courbes etc. Il faut trouver le bon compromis entre des mesures exhaustives et coûteuse pouvant devenir contre productives en surchargeant le système et provoquant des pertes et un échantillonnage trop grossier laissant échapper trop d'information.