Le crash de Nerandel: le bazar

Ecrit le 16/08/2018

Ou comment une grosse mise à jour a tout fait planter.

Je pense que je peux écrire un petit article sur le magnifique crash qui a eu lieu le 13 août de cette année. Pas tellement un crash mais une sorte semblable. Pas de corruption de disque ou une bêtise du genre mais une mise à jour un peu trop grosse…

13 août 2018, le soir qui a tourné au drame

410 paquets, et hop ! Pom popopom popopom pom-
Ouuuuhhhhh ! *crac* Aïe aïe aïe aïe ! *léger crash* Oooooooo !

Est-ce qu’on appele ça une scène figurative ? Peut-être… La suite de cette grosse mise à jour m’a quand même surpris car beaucoup de choses étaient cassées. Entre SystemD qui refuse de démarrer quelque chose parce que Failed at step USER spawning /usr/bin/python: No such process et une mise à jour Python (3.6.6 => 3.7) qui casse mon bot sur Aranel et qui m’obligerait à passer sur la version Rewrite de Discord.py. L’image en dessous c’est moi quand j’étais en PLS1.

Moi en PLS avec la mise à jour

Bref, je me suis retrouvé avec un système bien cassé et un bot qui ne veut plus démarrer. J’avais deux choix:

Mon choix s’est arrêté sur le premier point.

Le jour suivant, tout est vraiment cassé

Un ami me signale que le sous-domaine de Lutim retourne des 502 Bad Gateway. Étrange tout ça… Je regarde les journaux parce que c’est bien de s’informer sur l’actualité pour voir ce qui se passe.

Failed at step USER spawning /usr/bin/perl: No such process

Encore ? Bon, reboot.

A few moments later; quelques moments plus tard

Failed at step USER spawning /usr/bin/perl: No such process

Bon, super… Faut réinstaller \o/

J’ai fait un dump de l’image du SSD au cas où j’en aurais besoin dans une partiton à part sur le disque-dur du serveur à coup de dd if=/dev/sdb of=ssd.img bs=8M.

Le jour suivant, 14 août

Heureusement que c’est jour de congé :p

J’en ai profité pour tout réinstaller et passer Gitea sur Postgresql parce que c’est bien. La journée était longue, en plus qu’on me coupait pour RP. Concernant la distribution du serveur, il est à présent sous Debian Stretch et pour le moment, il carbure bien sans bouffer deux tonnes de RAM qu’il n’a pas.

Les jours suivants

Bah je remets les choses en place, une chose après l’autre. Certes, les données de base de données de Gitea sont paumées car changé de moteur de base mais le reste devrait aller. Chaque chose en son temps et tout devrait rentrer dans l’ordre.

Pour ceux qui se demandent, nan, Arch c’est pas super stable pour du serveur de production et tout peut te casser dans les mains sans que tu t’y attendes x’)

PS: Parce que j’aime bien me troll de temps en temps et faire un peu d’humour alakon avec moi-même… Is this an OS stable pour la prod ?



  1. Position Latérale de Sécurité