Session de janvier 2020.
La supervision désigne l' ensemble des normes et techniques automatisées assurant le bon fonctionnement du réseau au cours du temps. Deux principales activités pour répondre à cet objectif:
On cherche au maximum à automatiser ces activités. Cela soulève plusieurs problématiques:
Pourquoi est-ce nécessaire?
Pour chaque domaine de l'informatique des outils de gestion adaptés deviennent nécessaires: conception de circuits, développement logiciel OS, application etc
Pour chaque domaine il existe des organismes définissant standards et bonnes pratiques;
L' automatisation est but visé par la gestion de réseau.
Pour exemple, on peut évoquer l'exemple des adresses IP. A l'origine assignées manuellement au périphérique. Ce mode de fonctionnement est devenu incompatible avec la forte croissance des réseaux. En 96 apparition des serveurs DHCP. Puis avec IPv6 ICMPv6 permet d'auto-configurer les nœuds sans service externe.
L'automatisation permet d’accroître les possibilités de gestion.
L'OSI a définit les principaux objectifs de la gestion de réseau désignés aires fonctionnelles:
En anglais ces objectifs sont désignés par F CAPS 1)
L'objectif de la gestion de faute est de réduire le temps d'indisponibilité du système du à un problème.
On distingue les notions de faute et d'erreur. L'erreur est un événement isolé, une occurrence qui n'est pas forcement un péril pour le fonctionnement du système. Une faute est un condition anormale nécessitant une intervention et qui engendre des erreurs dans le système.
La gestion de faute consiste à détecter au plus vite les fautes afin de rétablir au plus tôt le fonctionnement nominal du système.
Pour faciliter la gestion de fautes on prévoit en général de la redondance sur les éléments critiques (équipements ou services). Lorsqu'un faute est localisée, le réseau est temporairement reconfiguré pour pallier la défaillance puis le dispositif est remplacé.
Le défit lié à cette aire fonctionnelle: résolution rapide et fiable des fautes. Problématique: remonter les infos de supervision du réseau alors que l'état du réseau lui même est dégradé. C'est pour cela qu' en général un réseau distinct est dédié à la gestion du réseau.
La gestion de la configuration et des noms des équipements consiste à identifier précisément un équipement du réseau afin de pouvoir agir dessus:
Défis liés au domaine:
La gestion de la volumétrie a pour but de comptabiliser avec assez de précision les usages du réseau afi de pouvoir par exemple:
Enjeux/défis: obtenir granularité des mesures suffisante pour les besoins opérationnels en limitant les surcoût liés à l'activité de supervision: temps de calcul, bande passante sur le réseau.
La Gestion des performances doit garantir que le réseau offre en permanence le niveau de performances adéquat. Pour cela il faut être en mesure de lire de nombreux indicateurs de performance sur les dispositifs et d'agir en cas de dégradation. Quelques exemples d'indicateurs usuels:
Défis: définir les indicateurs et les seuils afin d'identifier au plus vite les goulots d'étranglement du réseau pour pouvoir y remédier. Ex: modifier les routages pour améliorer la répartition de la charge.
La gestion de la sécurité vise à protéger les ressources du réseau et les informations des utilisateurs contre les attaques principalement en:
Défis/enjeux: Sécuriser la gestion du réseau elle même car elle permet d'agir en profondeur sur les nœuds et l'infrastructure.
Présentation d'un REX 2) avec le fonctionnement de la supervision des réseau ADSL et fibre Orange.
Environ 47000 DSLAM pour le réseau ADSL et 1500 équivalents sur le réseau fibre. La supervision se répartie en 3 secteurs:
A propos de la remontée des alarmes, au premier niveau basée sur des gestionnaires d' équipement propriétaires.
Introduction du big data pour l'aide au diagnostic. Centralisation des alarmes et corrélation plus large de différents types d'équipements et de réseaux avec un niveau d'analyse plus global offert par le big data.
L'activité de supervision exploite en général une galaxie de logiciels le cas Orange 35 applications environs. L' aspect sécurité est important: contrôle physique des accès sur sites et évolution des processus liés à la sécurité. Le métier de la supervision est en cours de mutation, forte évolution lié aux réseaux hétérogènes: arrivée de la 5G et fibre requiert capacité fortes d'adaptation.
La supervision de services chez Orange comprend entre autres:
La supervision se décline en:
Identification de plusieurs niveaux de criticité des services en fonction du besoin client. Cela détermine la qualité de la surveillance: H24, heures ouvrables.
Robots et sondes génèrent les alarmes. Peut importe la source d'incident, la première étape consiste à reproduire le problème, tester afin écarter les faux positifs pouvant être remontés par robots/sondes. Ensuite pilotage du rétablissement, vérification du retour de service.
L'activité de supervision fait coopérer différents métiers et équipes en temps réel pour le suivi et la résolution d'incidents et en temps différé pour l'analyse des process et la mise en place de procédures automatisées.
Airbus propose un service de supervision de sécurité. Le service est centralisé sur un site désigné SOC 3). Son but est d' identifier, pour le compte de différents clients, les intrusions et comportements malveillants contre leur SI.
Pour réaliser la supervision de sécurité:
Une fois les étapes précédentes passées, l'évènement est qualifié, l'opérateur a écarté les faux positifs.
Il faut ensuite mesurer l'impact sensibilité/criticité de l'incident.
A propos des outils et des méthodes:
Pour qualifier/analyser correctement les incidents, on s'appuie également sur des méthodes:
Profil idéal de l'opérateur technique: Curieux, méthodique, organisé, touche à tout. Attentif à l'actualité et la veille technologique.