• Serveurs
  • Serveur OneProvider s'arrête seul "Powering Down"

Bonjour à tous, je finis par ouvrir un nouveau sujet, voilà un serveur OneProvider récemment installé finit par s'arrêter seul, si les sites ni SSH ne répondent, obligé de reboot via l'interface OneProvider.

J'ai essayé le tutoriel proposé ici, ainsi que la solution dans mon post, sans succès apparent : https://mondedie.fr/d/9932-Oneprovider-dedie-soucis-recurrent/57

Voilà une partie de mes logs sudo cat /var/log/auth.log :

Feb  1 23:24:18 sd-40370 sshd[5839]: Disconnected from 98.189.134.115 port 55918 [preauth]
Feb  1 23:24:36 sd-40370 sshd[5847]: Invalid user 123 from 50.239.143.6 port 39216
Feb  1 23:24:36 sd-40370 sshd[5847]: input_userauth_request: invalid user 123 [preauth]
Feb  1 23:24:36 sd-40370 sshd[5847]: error: Could not get shadow information for NOUSER
Feb  1 23:24:36 sd-40370 sshd[5847]: Failed password for invalid user 123 from 50.239.143.6 port 39216 ssh2
Feb  1 23:24:36 sd-40370 sshd[5847]: Received disconnect from 50.239.143.6 port 39216:11: Bye Bye [preauth]
Feb  1 23:24:36 sd-40370 sshd[5847]: Disconnected from 50.239.143.6 port 39216 [preauth]
Feb  1 23:25:01 sd-40370 CRON[5877]: pam_unix(cron:session): session opened for user root by (uid=0)
Feb  1 23:25:01 sd-40370 CRON[5879]: pam_unix(cron:session): session opened for user www-data by (uid=0)
Feb  1 23:25:01 sd-40370 CRON[5878]: pam_unix(cron:session): session opened for user munin by (uid=0)
Feb  1 23:25:01 sd-40370 CRON[5877]: pam_unix(cron:session): session closed for user root
Feb  1 23:25:01 sd-40370 CRON[5879]: pam_unix(cron:session): session closed for user www-data
Feb  1 23:25:09 sd-40370 sshd[6245]: Failed password for root from 222.186.180.17 port 7268 ssh2
Feb  1 23:25:09 sd-40370 CRON[5878]: pam_unix(cron:session): session closed for user munin
Feb  1 23:25:10 sd-40370 sshd[6245]: Failed password for root from 222.186.180.17 port 7268 ssh2
Feb  1 23:25:12 sd-40370 sshd[6245]: Failed password for root from 222.186.180.17 port 7268 ssh2
Feb  1 23:25:13 sd-40370 sshd[6245]: Failed password for root from 222.186.180.17 port 7268 ssh2
Feb  1 23:25:13 sd-40370 sshd[5863]: Connection closed by 207.148.68.148 port 58754 [preauth]
Feb  1 23:25:14 sd-40370 sshd[6245]: Failed password for root from 222.186.180.17 port 7268 ssh2
Feb  1 23:25:14 sd-40370 sshd[6245]: error: maximum authentication attempts exceeded for root from 222.186.180.17 port 7268 ssh2 [preauth]
Feb  1 23:25:14 sd-40370 sshd[6245]: Disconnecting: Too many authentication failures [preauth]
Feb  1 23:25:33 sd-40370 sshd[6359]: Invalid user baptiste from 163.44.154.55 port 38538
Feb  1 23:25:33 sd-40370 sshd[6359]: input_userauth_request: invalid user baptiste [preauth]
Feb  1 23:25:33 sd-40370 sshd[6359]: error: Could not get shadow information for NOUSER
Feb  1 23:25:33 sd-40370 sshd[6359]: Failed password for invalid user baptiste from 163.44.154.55 port 38538 ssh2
Feb  1 23:25:34 sd-40370 sshd[6359]: Received disconnect from 163.44.154.55 port 38538:11: Bye Bye [preauth]
Feb  1 23:25:34 sd-40370 sshd[6359]: Disconnected from 163.44.154.55 port 38538 [preauth]
Feb  1 23:26:20 sd-40370 sshd[6383]: Invalid user sinusbot from 106.13.93.199 port 53374
Feb  1 23:26:20 sd-40370 sshd[6383]: input_userauth_request: invalid user sinusbot [preauth]
Feb  1 23:26:20 sd-40370 sshd[6383]: error: Could not get shadow information for NOUSER
Feb  1 23:26:20 sd-40370 sshd[6383]: Failed password for invalid user sinusbot from 106.13.93.199 port 53374 ssh2
Feb  1 23:26:20 sd-40370 sshd[6383]: Received disconnect from 106.13.93.199 port 53374:11: Bye Bye [preauth]
Feb  1 23:26:20 sd-40370 sshd[6383]: Disconnected from 106.13.93.199 port 53374 [preauth]
Feb  1 23:27:36 sd-40370 sshd[6396]: Invalid user teste from 129.204.87.153 port 57447
Feb  1 23:27:36 sd-40370 sshd[6396]: input_userauth_request: invalid user teste [preauth]
Feb  1 23:27:36 sd-40370 sshd[6396]: error: Could not get shadow information for NOUSER
Feb  1 23:27:36 sd-40370 sshd[6396]: Failed password for invalid user teste from 129.204.87.153 port 57447 ssh2
Feb  1 23:27:36 sd-40370 sshd[6396]: Received disconnect from 129.204.87.153 port 57447:11: Bye Bye [preauth]
Feb  1 23:27:36 sd-40370 sshd[6396]: Disconnected from 129.204.87.153 port 57447 [preauth]
Feb  2 08:02:47 sd-40370 systemd-logind[436]: New seat seat0.
Feb  2 08:02:47 sd-40370 systemd-logind[436]: Watching system buttons on /dev/input/event0 (Power Button)
Feb  2 08:02:48 sd-40370 sshd[567]: Server listening on 0.0.0.0 port 22.
Feb  2 08:02:48 sd-40370 sshd[567]: Server listening on :: port 22.
Feb  2 08:02:49 sd-40370 su[570]: Successful su for manty by root
Feb  2 08:02:49 sd-40370 su[569]: Successful su for manty by root
Feb  2 08:02:49 sd-40370 su[569]: + ??? root:manty
Feb  2 08:02:49 sd-40370 su[570]: + ??? root:manty
Feb  2 08:02:49 sd-40370 su[570]: pam_unix(su:session): session opened for user manty by (uid=0)
Feb  2 08:02:49 sd-40370 su[569]: pam_unix(su:session): session opened for user manty by (uid=0)
Feb  2 08:02:49 sd-40370 systemd-logind[436]: New session c1 of user manty.
Feb  2 08:02:49 sd-40370 systemd-logind[436]: New session c2 of user manty.
Feb  2 08:02:49 sd-40370 systemd: pam_unix(systemd-user:session): session opened for user manty by (uid=0)
Feb  2 08:02:50 sd-40370 su[570]: pam_unix(su:session): session closed for user manty
Feb  2 08:02:50 sd-40370 su[569]: pam_unix(su:session): session closed for user manty
Feb  2 08:02:55 sd-40370 sshd[567]: Received SIGHUP; restarting.
Feb  2 08:02:55 sd-40370 sshd[567]: Server listening on 0.0.0.0 port 22.
Feb  2 08:02:55 sd-40370 sshd[567]: Server listening on :: port 22.
Feb  2 08:04:24 sd-40370 sshd[1991]: Connection closed by 117.50.67.214 port 37698 [preauth]
Feb  2 08:05:01 sd-40370 CRON[2007]: pam_unix(cron:session): session opened for user www-data by (uid=0)
Feb  2 08:05:01 sd-40370 CRON[2005]: pam_unix(cron:session): session opened for user root by (uid=0)
Feb  2 08:05:01 sd-40370 CRON[2006]: pam_unix(cron:session): session opened for user munin by (uid=0)
Feb  2 08:05:01 sd-40370 CRON[2005]: pam_unix(cron:session): session closed for user root
Feb  2 08:05:05 sd-40370 CRON[2007]: pam_unix(cron:session): session closed for user www-data
Feb  2 08:05:14 sd-40370 CRON[2006]: pam_unix(cron:session): session closed for user munin
Feb  2 08:06:32 sd-40370 sshd[2484]: Connection closed by 61.36.119.181 port 9224 [preauth]
Feb  2 08:06:45 sd-40370 sshd[2490]: Did not receive identification string from 88.198.46.51 port 54398
Feb  2 08:07:52 sd-40370 sshd[2512]: Accepted password for alex from 86.211.233.243 port 62126 ssh2
Feb  2 08:07:56 sd-40370 su[2530]: Successful su for root by alex
Feb  2 08:07:56 sd-40370 su[2530]: + /dev/pts/2 alex:root
Feb  2 08:07:56 sd-40370 su[2530]: pam_unix(su:session): session opened for user root by alex(uid=1000)
Feb  2 08:07:56 sd-40370 systemd-logind[436]: New session c3 of user root.
Feb  2 08:07:56 sd-40370 systemd: pam_unix(systemd-user:session): session opened for user root by (uid=0)
Feb  2 08:08:14 sd-40370 sudo:     root : TTY=pts/2 ; PWD=/root ; USER=root ; COMMAND=/bin/cat /var/log/auth.log
Feb  2 08:08:14 sd-40370 sudo: pam_unix(sudo:session): session opened for user root by alex(uid=0)

Comme vous le voyez un moment donné j'ai ces lignes :

Feb  1 23:28:34 sd-40370 systemd-logind[414]: Power key pressed.
Feb  1 23:28:34 sd-40370 systemd-logind[414]: Powering Off...
Feb  1 23:28:34 sd-40370 systemd-logind[414]: System is powering down.

Je pense que le problème vient de là, mais j'avoue être un peu perdu.

Toute aide est la bienvenue, encore merci à tous.

Ça correspond pas aux heures où tu demande un restart via ipmi ?
Sinon il y'a quelqu'un qui appuie sur le bouton physiquement...
Il a combien de temps ton serveur ? C'est le même que sur l'autre sujet ?
J'ai eu plusieurs vieilles machines comme ça dans mon "grenier lab" qui devenait instable... pour l'une c’était l'alimentation qui entrait en défaut (Dell R200), une autre c’était la carte mère (HP Proliant DL360G5) et le dernier en date : la ram (Dell R200).

    MattProd

    Ça correspond pas aux heures où tu demande un restart via ipmi ?

    Euh ... Peut être, effectivement, mais dans ce cas ça n'explique pas pourquoi mon serveur ne répond plus au bout de quelques heures ?

    Il est récent, pris il y a quelques jours.

      Mantinum
      C'est à voir parce que dans les logs des fois ça apparaît tel quel...
      Récent, pour l'OS et l'install mais ils peuvent recycler du vieux matos, et si c'est un défaut matériel ça peut survenir sur du neuf ou du vieux...

      Tu paries donc sur un problème matériel ? Puis je faire d'autres tests, pour en être sur ?

      Écarte déjà le problème du power down. Parce que si ça vient pas de l'ipmi, il y'a quelqu'un devant la machine.
      Et si l'action est power down y'a peut être pas de restart derrière donc elle se met a l’arrêt. Ce qui peut expliquer le trou entre 00h et 08h ?

      Merci, je me demande si il n' y a pas un petit malin qui essaie de se connecter à mon serveur :

      Feb  1 23:25:10 sd-40370 sshd[6245]: Failed password for root from 222.186.180.17 port 7268 ssh2
      Feb  1 23:25:12 sd-40370 sshd[6245]: Failed password for root from 222.186.180.17 port 7268 ssh2
      Feb  1 23:25:13 sd-40370 sshd[6245]: Failed password for root from 222.186.180.17 port 7268 ssh2
      Feb  1 23:25:13 sd-40370 sshd[5863]: Connection closed by 207.148.68.148 port 58754 [preauth]
      Feb  1 23:25:14 sd-40370 sshd[6245]: Failed password for root from 222.186.180.17 port 7268 ssh2
      Feb  1 23:25:14 sd-40370 sshd[6245]: error: maximum authentication attempts exceeded for root from 222.186.180.17 port 7268 ssh2 [preauth]
      Feb  1 23:25:14 sd-40370 sshd[6245]: Disconnecting: Too many authentication failures [preauth]
      Feb  1 23:25:33 sd-40370 sshd[6359]: Invalid user baptiste from 163.44.154.55 port 38538

      Tu penses quoi de mes logs ?

      L'IP 207.148.68.148 renvoie en Chine.

      Si tu tiens vraiment à QB tu peux tenter une approche différente, installe un proxmox et tu installe une VM ou CT avec ton quickbox dedans. Au moins déjà tu auras un meilleur contrôle sur le redémarrage en cas de shutdown le temps de trouver une solution.

      Pour les essais de connexion, je dirai que c'est un des millions de bot qui polluent le net en tentant de s'infiltrer

        Pipotron

        Pour les essais de connexion, je dirai que c'est un des millions de bot qui polluent le net en tentant de s'infiltrer

        Est ce que ça peut expliquer que mon serveur deviennent inopérant ?

        @Pipotron ça peut-être une solution.
        @Mantinum une règle iptables et tu ban la Chine entière 😉 c'est vrai que c'est lourd leur bots...

          MattProd `

          une règle iptables et tu ban la Chine entière 😉 c'est vrai que c'est lourd leur bots...

          Tu penses donc que l'arrêt du serveur vienne des tentatives de connexion venues de Chine ?
          `

          Non, impossible.
          Tu as encore de la place sur toutes les partitions ? Tu n'as pas un script ou une action auto chez OneProvider (je ne connais plus leur interface) qui restart auto le serveur ?

            Aerya Merci pour ton aide, non pas de script à ma connaissance surtout que ça ne reboot pas, ça éteint, mais je viens de me rendre compte que mon serveur était encore tombé :

            ssh: connect to host 195.154.177.133 port 22: Operation timed out

            Problème de port ? Problème de config SSH ? On dirait que quand je laisse la connexion SSH active et qu'elle se coupe "automatiquement" après je suis obligé de relancer via IPMI.

            Et tu as pas fail2ban/portsentry ? Un truc du genre ?

            Tu as essayer d'accéder au serveur quand il "tombe" depuis une autre ip ?

            Franchement à mon avis le serveur il est en bois

              MattProd

              MattProd Et tu as pas fail2ban/portsentry ?

              Dans l’interface OP ? Quand il tombe, il tombe partout lol.

              Possible que cela vienne du serveur, mais je voulais exclure toutes les autres éventualités, surtout que je viens de tout migrer dessus.

              Salut, je ne saurai pas te dire non plus d'où vient exactement le problème mais il est possible que ce soit un souci électrique sur le serveur, il va falloir ouvrir un ticket au support quoi qu'il en soit.

              Sinon temporairement tu peux tenter quelque chose, à voir si cela fonctionne.

              Tu édites le fichier /etc/systemd/logind.conf et tu mets HandlePowerKey=ignore puis tu redémarre logind en faisant sudo systemctl restart systemd-logind

              Pas sûr que ça fonctionne mais ça se tente, au pire de toute manière le serveur ne fonctionnant pas correctement çe ne l'endommagera pas +.

                qo_op Merci à toi, j'ai fait ce que tu m'as dit, juste une petite question, dois je décommenter la ligne du coup ?

                Sinon je voulais également poster mes crons, voir si vous trouvez ça cohérent :

                crontab -e :

                #33 2 9 * * /bin/bash /usr/share/scripts-perso/updateGeoIP.sh > /dev/null 2>&1
                0 */2 * * * /bin/bash /usr/share/scripts-perso/logserver.sh > /dev/null 2>&1
                0 5 * * * /bin/bash /usr/share/scripts-perso/backup-session.sh > /dev/null 2>&1

                www-data crontab :

                # daemon's notion of time and timezones.
                #
                # Output of the crontab jobs (including errors) is sent through
                # email to the user the crontab file belongs to (unless redirected).
                #
                # For example, you can run a backup of all your user accounts
                # at 5 a.m every week with:
                # 0 5 * * 1 tar -zcf /var/backups/home.tgz /home/
                #
                # For more information see the manual pages of crontab(5) and cron(8)
                #
                # m h  dom mon dow   command
                */5  *  *  *  * php -f /var/www/nextcloud/cron.php

                Et la partie de mon fichier sshd_config que j'ai modifié récemment :

                #LoginGraceTime 2m
                #PermitRootLogin without-password
                #StrictModes yes
                #MaxAuthTries 6
                #MaxSessions 10

                En tout cas merci à vous tous de votre aide.

                Edit : Je me suis rendu compte que lorsque je rebootais via l'interface OP, je n'avais pas ce message dans mes logs :

                Feb  1 23:28:34 sd-40370 systemd-logind[414]: Power key pressed.
                Feb  1 23:28:34 sd-40370 systemd-logind[414]: Powering Off...
                Feb  1 23:28:34 sd-40370 systemd-logind[414]: System is powering down.

                  Mantinum dois je décommenter la ligne du coup ?

                  Tout à fait, j'ai oublié de préciser ce petit détail qui a son importance 😃

                    qo_op C'est vrai que ça semblait logique 😉 je sens qu'il va m'emm***** ce serveur.

                      Mantinum le support fera une demande pour te le changer je pense, ou au moins le faire réparer. Ils peuvent pas te laisser comme ça alors que tu payes.