Contexte
La banque B a son siège à Genève. Elle est présente aux quatre coins de la Suisse comme du monde. Elle emploie plus de 1500 personnes.
De par son envergure mondiale, les technologies de l’information (IT) y jouent un rôle prépondérant, et le fonctionnement optimal de celles-ci est vital, ce qui rend le poste "d'incident manager" particulièrement important. Un rôle occupé depuis début 2016 par un collaborateur CeRFI, dont la mission est l'objet de cette actualité.
Dans le cadre ITIL, l'objectif principal de la gestion des incidents est, rappelons-le, de rétablir aussi vite que possible le fonctionnement normal des services informatiques en minimisant la durée d’interruption.
Mission
Dans la banque B, les incidents sont classés en 4 catégories: LOW, MEDIUM, HIGH et CRITICAL.
L'incident manager est amené à y gérer les incidents de priorités HIGH et CRITICAL, c’est-à-dire ceux qui ont l'impact le plus fort sur le bon déroulement du business. N'en font pas partie les incidents impactant des personnes isolées (sauf VIP) qui sont gérés par le Help-Desk.
Exemples d'incidents qu'il y traite:
- panne du réseau d’une succursale de la banque
- lenteurs généralisées de réception de courriels
- perte d’accès au "Online Banking" pour les clients
L'incident manager est autonome et évolue en tant qu'électron libre entre l'IT et le business. Il est donc à la fois au service de l'IT et du business. En cas d'absence (vacances par exemple), c'est son responsable qui le remplace, et vice-versa, celui-ci ayant la casquette de problem manager. L'un est le "backup" de l'autre, en quelque sorte.
L'incident manager a 4 sources d'informations:
- le Help-Desk ou le Service Desk
- l'équipe de monitoring
- le management de la banque
- l'IT
Le Help-Desk vient vers lui et tire la sonnette d'alarme en cas d'appels répétés pour le même incident, qui du coup devient une priorité HIGH, voire CRITICAL.
Le monitoring et l'IT peuvent, quant à eux, voir venir les incidents de par les outils de monitoring et/ou selon les interventions techniques en cours (exemple: crash d'un disque dans la baie de stockage).
Le management peut, de son côté, demander à l'Incident Manager de se focaliser sur une problématique spécifique.
La mission de l'incident manager peut se subdiviser en 3 composantes:
- la coordination
- le reporting
- l'amélioration
La coordination est la base de son métier: elle consiste à prendre en charge la gestion et le suivi des incidents, c'est-à-dire de mettre les bonnes personnes à la bonne place pour y parvenir, que ces personnes soient du côté IT (équipe réseau ou Windows par exemple) ou du côté business (métiers bancaires et management de la banque). Il s'agit souvent de mettre tous les intervenants autour de la même table (IT + business + management) pour remettre au plus vite le train sur les rails.
Le reporting prend trois formes principales: au fil de l'eau, hebdomadaire ou majeur. Au fil de l'eau, il s'agit de communiquer en direct à propos de l'incident (via e-mail mais aussi via SMS afin d'atteindre les gens non-connectés), et ce, dès sa détection jusqu'à sa résolution. Le reporting hebdomadaire vise à expliquer tous les incidents de la semaine (causes, impacts, plans d'action). Le reporting majeur concerne uniquement les incidents de catégorie 4 (CRITICAL) dont il dresse la chronologie de la gestion live et a posteriori.
La composante "amélioration" fait partie du PAC (processus d'amélioration continue) et est plus l'apanage du problem manager. L'incident manager se doit toutefois d'être force de proposition dans le contexte post-incident, mais pas en amont.
Difficulté majeure de la mission: le stress induit par la pression, une pression évidente au vu de l'importance du poste, de sa visibilité et de son exposition, l'incident manager communiquant en direct à presque tous les niveaux hiérarchiques de la banque, jusqu'au top management.
Autre composante indispensable du métier: l'hyper flexibilité au niveau des horaires, car les incidents peuvent survenir à toute heure dans le contexte d'une banque d'envergure mondiale. Il n'est pas rare de devoir se précipiter au bureau tôt le matin, d'écourter son lunch ou de devoir communiquer via VPN depuis chez soi le soir. Cela dit, les nuits blanches pour résoudre un incident majeur du genre "panne de réseau" impactant les succursales lointaines (Amérique, Asie) sont l'exception plutôt que la règle, les incidents se résolvant normalement tambour battant au maximum en deux heures de temps. Et pour les incidents de l'autre côté du globe, il y a un autre incident manager en poste en Asie.
Néanmoins, quand cela arrive, il faut faire preuve de la flexibilité et de l'agilité nécessaire. Comme en cette fin d'après-midi d'août 2016 quand le réseau des succursales asiatiques tomba aux environs de 16h00 (heure suisse). S'en sont suivies 13 heures non-stop d'actions dont plus de la moitié en mode conférence call avec en ligne le top management de l'Asie, celui de Genève, l'incident manager asiatique et celui de Genève, donc. De longues heures passées à amener les bonnes personnes autour de la table: équipes réseau respectives, notamment, mais aussi les responsables des applications bancaires clés, le "business continuity management" et les principaux représentants des lignes business. Avec, au final, un réseau pas complètement rétabli à 5 heures du matin, mais un peu plus tard dans la journée.
Focus sur...
Etre à l'aise pour parler en public (animation de réunions avec des gens plus haut placés que soi) est aussi un atout indispensable, même si les interlocuteurs jouent très bien le jeu et respectent le rôle et l'autorité de l'incident manager dans son domaine.
La communication apparaît ainsi comme la composante la plus importante de ce mandat, plus importante même que la coordination (qui pourrait se faire entre équipes IT et business sans forcément toujours faire appel à l'incident manager).
Oui, la communication est la clé du succès de ce mandat, car il s'agit de distiller l'information de manière pertinente pour le top management de la banque B, une information vulgarisée mais pas trop, ni trop technique ni trop peu, courte mais pas trop brève, bref, un travail d'orfèvre du langage. Car le temps presse toujours pour les managers, qui doivent comprendre en un instant de quoi il s'agit afin de prendre les décisions managériales qui s'imposent dans l'instant suivant.
Bien communiquer pour relever au quotidien le côté challenging de ce mandat.
Être agile ou ne pas être
Agile, c'est aussi l'une des qualités principales requises pour occuper le poste d'incident manager dans la banque B. Agile au niveau des horaires, agile dans la coordination des équipes IT et business, agile dans la communication avec quasi tous les échelons hiérarchiques.
Autant la banque B apprécie l'agilité du collaborateur CeRFI qui y occupe le poste d'incident manager, autant le collaborateur CeRFI s'est bien adapté à cette indispensable agilité, une adaptation facilitée par ses quelques années passées au préalable au sein du Help-Desk de la banque B.