Considérez ce scénario (toute comparaison avec des situations réelles est purement accidentelle):
- 3h07 : appel de support entrant " Quelque chose en production est tombé en panne, j'ai besoin de votre aide! ".
- 3h12 : connecté au système (connexion acceptée) ... et pas de temps pour le café.
- 3 h 15 : vous avez de la chance, vous pouvez tout de suite repérer le problème via un message d'erreur quelque part.
- 3h17 : utilisez votre boîte à outils SCM pour récupérer le code, résoudre le problème, le tester, super ... ma solution fonctionne!
- 3 h 20 : contactez l'équipe
DevOps pour envoyer le correctif et relancer la production. - 3h21 : drapeau rouge ... " Pour respecter les quatre yeux , il nous faut 2 yeux de plus pour obtenir l'approbation de cette correction ".
- 03h22 : ggggrrrreat, maintenant ce qui peut - on appeler autrement (= réveiller un gestionnaire)?
Si vous avez mis en place une procédure d'approbation similaire à ma réponse à " Quelles sont les implémentations (ou exemples) possibles du principe des quatre yeux? ", Alors vous n'avez pas de chance ... voici vos choix:
- Votre correctif sera bloqué (lire: la production sera en baisse) jusqu'à ce que 2 autres yeux soient impliqués.
- Vous trouvez un moyen de contourner les yeux manquants.
Alors, comment mettre en œuvre le principe des quatre yeux pour les correctifs d'urgence? ... Pour que la production soit opérationnelle dès que possible, c'est-à-dire vers 3 h 25 ... Et pour que vous puissiez également fermer l'appel (et revenir d'où vous venez)?
configuration
four-eyes
Pierre.Vriens
la source
la source
Réponses:
Dans le monde SCM que je connais le plus, le scénario ci-dessus est généralement traité par ce que l'on appelle la " procédure de liste d'approbation abrégée " .
En voici un plan:
Avec une telle solution en place, l'appel peut être clôturé vers 3h23 du matin ... puisqu'il n'y aura plus de drapeau rouge à 3h21 du matin ... (au lieu de café) ... et les doigts croisés les approbations de poste en attente arriveront bientôt ...
la source
Dans le cas de correctifs d'urgence en dehors des heures d'ouverture, il est plus pratique d'exiger moins de signature pour les modifications que votre procédure normale. En règle générale, vous pouvez déployer un correctif, puis effectuer des post-approbations le jour ouvrable suivant. Si le correctif n'est pas approuvé, il peut être annulé et remplacé par une solution permanente.
Lors d'une panne, la priorité numéro un devrait être de rétablir le service. Si votre organisation ne reconnaît pas ce processus détendu pendant une panne, alors oui, votre seule option est de commencer à réveiller plus de personnes pour la signature.
la source