Bonjour,

Depuis quelques mois le forum est indisponible régulièrement pendant plusieurs heures en affichant une page de maintenance, nous vous prions de bien vouloir nous excuser pour la gêne occasionnée.

Nous avons fini par trouver le problème. Le conteneur docker n'était pas correctement dimensionné au niveau de ses ressources lors de certains pics de charge, ce qui faisait que PHP-FPM se mettait en erreur. Nous avons mis en place un second conteneur pour palier à ce problème de charge. Un rééquilibrage des ressources sera effectué ce week-end après analyse de la charge.

L'équipe de mondedie.fr

20 jours plus tard

Désolé pour le down de cet après midi. Le nombre de processus PHP-FPM a encore atteint la limite sur nos 2 conteneurs. Je regarde les solutions possibles pour éviter que ça ne se reproduise de nouveau. En tout cas, c'est pas à cause d'un problème de charge, le nombre de visite est stable et le serveur n'était pas surchargé avant le down.

Bon j'ai passé php-fpm en mode ondemand pour éviter une accumulation des processus enfants et j'ai mis un healthcheck sur les 2 conteneurs, donc si un tombe en panne, nginx basculera automatiquement sur le second. Après 3 essais avec 30 secondes d'intervalle, docker-autoheal redémarrera le premier conteneur si php-fpm est toujours down dedans, pareil pour le second conteneur si il est dans le même état.

Normalement on devrait plus avoir de down prolongé avec ce système. Le mieux serait de trouver la cause réelle de ce soucis, je suspecte un problème avec la dernière version de flarum. Ou sinon de passer sur docker swarm pour gérer ça en cluster.

8 jours plus tard

Avec l'approche du 22 Mars 2018, et les mouvements sociaux qui lui seront attachés... Avez-vous envisagé l'éventualité d'une grève larvée des dockers ? 🤔

Répondre…