Suivi et gestion de production informatique
Ayant été ingénieur support et ingénieur système, puis ayant piloté des équipes d'ingénieurs et techniciens en charge de l'exploitation des systèmes et des réseaux comme Service Delivery Manager (pilote de service), Assist MOA dispose d'une solide expérience en exploitation des systèmes d'informations et peut vous aider à garantir une bonne maîtrise des processus et la meilleure des qualités de service opérationnelle.
Contacter Assist MOA ! Aussi, si vous souhaitez avoir un avis externe à votre société, une vue tierce de votre situation, avant de vous lancer : Assist MOA est là pour ça !
Mise en production Une fois qu'un projet informatique a été prévu, puis "pensé", testé, il faut bien l'intégrer au système et le mettre en production. Le processus amont est bien sûr vital, mais il faut tout aussi prévoir que la mise en production puisse échouer à plus ou moins court terme. La traçabilité des actions menées, des changements de configuration effectués (anomalies corrigées et évolutions présentes), tout doit être accessible afin de comprendre et contenir autant que possible des effets de bords à la mise en production. Il faut savoir faire l'analyse de l'avant et de l'après via une analyse des logs, le comportement en production (temps de réponse notamment), etc. Le suivi en RUN L'équipe d'exploitation de suivi du RUN est vitale, car aussi bien pensé que soit un projet, nul n'est à l'abri d'incidents. Aussi, il faut disposer d'une équipe dédiée au suivi d'exploitation, formée pour répondre aux problèmes. Certains infogérants placent typiquement du personnel sous-qualifié ou en cours de qualification (stages, alternance, technicien junior, ...) pour économiser sur leur main d'oeuvre qualifiée : il faut savoir être ferme sur la qualification du personnel dédié et son expérience professionnelle. Plusieurs écoles existent entre : dédier des éléments (binôme typqiement) à un service/produit avec une montée en expertise sur le produit ou répartir égalitairement l'exploitation au risque de ne pas disposer d'expert sur le service, le maître mot restant la formation des personnels, notoirement sur les produits propriétaires critiques. La gestion des incidents majeurs et des crises Dans le cadre de service à haute disponibilité, un incident au périmètre large ou touchant le coeur de métier peut être qualifié de majeur et nécessite un traitement spécial, aussi bien en temps réel en termes de réactions d'exploitation et de communication, qu'ultérieurement en termes d'anticipation d'un éventuel renouvellement du problème. Les procédures en place, les escalades, la disponibilité du support (notamment chef de projet ou tiers applicatifs comme les DBA), les outils mis en place, la communication de crise ... : tout concourt à gérer la situation et mérite une attention approfondie. Normalisation et qualité et ITIL La normalisation des processus et la gestion de la qualité permettent un meilleur contrôle des activités. Si ces approches peuvent apporter une certaine lourdeur lors de leur mise en place, elles apportent à terme quasi-systématiquement des gains en productivité et surtout en gestion (anticipation, communication, traçabilité). Dans la recherche de la mise en place de norme, l'entreprise évoluera selon son implication et sa maîtrise vis à vis d'un référentiel donné. Un référentiel de bonnes pratiques assez récent, l'ITIL, permet une approche plus pragmatique et est suffisamment ouvert pour autoriser une adaptation au cas par cas. Les principes fondamentaux sont le client, la traçabilité des échanges, un responsable par processus et la recherche de l'amélioration continue. La formation des exploitants sur les produits à exploiter La formation des personnes sur les produits et les procédures d'exploitation est primordiale, surtout si la plate-forme technique est complexe et présente de nombreuses intéractions entre les serveurs. Par ailleurs, cette formation doit être accompagné d'outils de support pour la gestion de la production (documentation, sites webs, procédures, scripts, etc.). Schéma des interactions inter-processes ( réseau, fichiers, mémoire partagée, ...), procédures et documentation Connaître ce qu'on exploite et disposer des outils : le schéma des fonctions et des intéractions des serveurs d'une plate-forme apporte une visibilité importante à l'exploitant et à tout nouvel opérateur. Les procédures et la documentation doivent être adaptées à l'opérateur (son rôle, ses droits, ses compétences) et accessibles via un serveur WEB interne notamment. Un serveur (machine) peut contenir moults serveurs (processus) en cascade par exemple (c'est courant en architecture N-tiers notamment) et il faut pouvoir définir le rôle de chaque processus dans la chaîne de traitement (principe de décomposition des modules). Réaction des programmes et OS aux problèmes + limitations logicielles / matérielles à anticiper Nombre de programmes présentent dans leurs spécifications des limitations : il est évident qu'elles doivent être connues de tous et accessibles, car elles peuvent être la clé de résolution d'un problème. Par exemple, des routeurs peuvent atteindre leur nombre de paquets par seconde en restant très loin de leurs spécifications en terme de traitement de bande passante ! Moniteur de suivi, indicateurs de charge, wait sur I/O, ... De nombreux outils et graphes permettent de donner des éléments de diagnostic, ces outils doivent être aisément accessibles et disposer d'un historique conséquent. Ils doivent être assez exhaustifs pour déterminer le point de contention ou le SPOF (single Point Of Failure) : cela peut notamment être un délai d'attente sur I/O (wait sur I/O) à cause de performances d'écriture trop basses. Analyse de logs (développements en shell/perl/script) Les logs sont la mémoire d'une application et doivent être assez riches pour fournir des éléments via leur traitement. Les exploitants doivent idéalement être capables de les interpréter ou disposer de la documentation nécessaire. Ils doivent pouvoir effectuer des opérations d'agrégation (awk) , extraction (grep), ... , afin de retrouver les seules lignes utiles. Analyse réseau Si un brin sature, si une carte réseau ou la ligne ne répond plus ou bagotte, etc., il faut pouvoir disposer de sondes réseau ou savoir pratiquer l'analyse réseau (sniff, snoop, ...) et en extraire les données vitale (paquets reset, etc.) L'organisation des services et la communication La circulation de l'information inter-services est bien sûr vitale. Il faut échanger en temps réel (pont téléphonique notamment) et se tenir informé des actions en cours (suivi des opérations) et les tracer dans un journal pour le débriefing. Il faut pouvoir disposer de l'accès aux interlocuteurs d'autres spécialités (passage via la supervision ou annuaire d'astreinte performant). Les outils de détection, de diagnostic et de qualité de service (l'analyse des remontées des clients) Bien sûr, il faut monitorer la qualité de service (robots - sondes, suivi de logs, tests unitaires,...), fournir des outils de diagnostic et aussi surveiller les remontées des clients, car il existe toujours des cas de figure (anomalie, ...) qu'aucun robot ne pourra détecter.
Accueil Les prestations Présentation générale Assistance à maîtrise d'ouvrage Suivi de production Conseils sur les infogérances Expertise en messagerie SMTP Visibilité WEB CV et exp. professionnelle Liens partenaires ContactsRechercher sur le site :
Thomas FRALIN Freelance Informatique à votre service + de 10 ans d'expérience : assistance à maîtrise d'ouvrage, direction et gestion de projets, suivi de production, exploitation, expertise...
Assist MOA - freelance info
Copyright 2009
ASSIST MOA - SARL au capital de 300 euros - Freelance informatique
Contacts