Russian

 View Only
Expand all | Collapse all

ESXI 6.7 в зависшем состоянии

  • 1.  ESXI 6.7 в зависшем состоянии

    Posted Jun 23, 2020 08:18 AM

    Привет!

    Столкнулся с такой ситуацией:

    один из серверов esxi 6.7 отвалился от кластера. ВМ на нем работают нормально. Сам сервер по web-интерфейсу не отзывается, он не грузится. По ssh захожу на сервер, но при запуске комманд выдает ошибки

    root@node3:~] vim-cmd vmsvc/getallvms
    Failed to login: Connection reset by peer: The connection is terminated by the remote end with a reset packet. Usually, this is a sign of a network problem,  timeout, or se
    rvice overload.

    /etc/init.d/hostd restart

    /etc/init.d/vpxa restart

    не помогает

    перезапуск всех служб /sbin/services.sh restart, так же не помогает

    Сетевые порты работают, telnet проходит.

    Логи посмотреть не могу, при открытии консоль зависает.

    Соответственно ВМ на другие сервера перенести не могу.

    Перезагружать еще не пробовал, т.к. есть ВМ которые нельзя выключать.

    Кто то сталкивался с таким? Куда смотреть?



  • 2.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jun 23, 2020 02:05 PM

    Добрый день!

    Вариантов несколько.

    1. Проблемы с доступом к СХД или еще какие-либо около того - смотреть vmkernel.log и vobd.log

    2. Проблемы с работой hostd - смотреть hostd.log

    3. Менее вероятные проблемы с vpxa - смотреть vpxa.log

    Из также возможных - утечка памяти в сторонние сервисы (например такое бывает на серверах HPE, на которых установлен кастомизированный образ). Это также должно быть видно в vmkernel.log и syslog.log

    Резюме - начните с vmkernel.log



  • 3.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jun 23, 2020 02:44 PM

    Логи, вообще ни какие, посмотреть не могу, открываешь файл с логом и консоль зависает.

    С СХД сервер работает (пишет, читает)

    hostd и vpxa перезапускал, сервисы работают.

    Сервера 4шт. Lenovo SR630 и только у одного такая проблема появилась.

    Сенсоры железа не ругаются

    Есть и другие сервера, supermicro, IBM, на них все нормально.



  • 4.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jun 23, 2020 04:21 PM

    А куда гипервизор установлен? и где логи хранятся? Куда сконфигурирован scratch?



  • 5.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jun 24, 2020 10:06 AM

    Куда сконфигурирован scratch? - не настраивал, видимо по умолчанию

    Гипервизор установлен на локальный SSD M2 в зеркале, логи туда же пишутся



  • 6.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jun 26, 2020 03:26 PM

    И у вас консоль зависает, когда вы идете

    cd /var/log/

    и делаете less vmkernel.log ?



  • 7.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jun 27, 2020 07:59 PM

    Да, именно так.



  • 8.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jun 23, 2020 03:16 PM

    Скопировать логи так же не дает



  • 9.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jul 02, 2020 06:45 PM

    Здравствуйте!

    Если вы все еще не решили свою проблему, я предлагаю следующее:
    1. Сделайте  Backup (резервную копию) виртуальных машин этого хоста традиционными методами.
    2. Отключите VMs  (виртуальные машины) обычным способом от операционной системы.
    3. с консоли перезагрузите хост
    4. проверьте веб-соединение с хостом и попробуйте подключить его к кластеру и, наконец, запустить виртуальные машины

    Если хост не включается или имеет проблемы с доступом, его необходимо переустановить с возможностью сохранения VMFS (где находятся виртуальные машины) и вручную включить виртуальные машины в инвентарь хоста.

    Вы должны иметь готовый CD ISO (VMware vSphere) чтобы иметь возможность переустановить VMware vSphere.
    У вас должна быть сетевая конфигурация виртуальных машин и хоста, чтобы иметь возможность настраивать снова.

    Эти задачи лучше всего выполнять сотрудники  с опытом в VMware vSphere

    Удача



  • 10.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jul 03, 2020 08:15 AM

    Добрый день!

    В итоге:

    1. ВМ выключил из ОС, перерегистрировал на других хостах, все нормально работает.

    2. После перезагрузки гипервизора, работает исправно, поставил последние обновления, запустил на нем ВМ, все работает нормально.

    3. > Сделайте  Backup (резервную копию) виртуальных машин этого хоста традиционными методами.

    Здесь можно чуть подробнее, что за "традиционные методы"?



  • 11.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jul 03, 2020 01:15 PM

    Здравствуйте!

    Я указал сделать резервную копию виртуальных машин в качестве меры защиты данных в случае, если сервер не ответил после перезагрузки.


    Если у вас нет доступа к хосту VMware, но виртуальные машины все еще могут работать, вы должны сделать резервную копию виртуальных машин,

    это можно сделать так, как если бы это был физический сервер. то есть традиционным способом.

    Рекомендуется обновить другие хосты в кластере, чтобы избежать неожиданностей.

    все хосты должны иметь одинаковый уровень обновления.

    Удача



  • 12.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jul 03, 2020 01:22 PM

    Понял, спасибо!

    В моем случае хосты подключены к одной СХД.

    На "не значительной" ВМ проверил что будет если ее выключить. Все прошло хорошо. После этого стал уже отключать/перерегистрировать/запускать ВМ на других нодах.

    Но из-за чего произошла такая ситуация так и не понятно.

    При чем, пробовал перезагружать ВМ на сбойной ноде, запускалась нормально, а сам сервер так и продолжал сбоить.



  • 13.  RE: ESXI 6.7 в зависшем состоянии

    Posted Jul 26, 2020 08:57 AM

    После перезагрузки гипервизор работает нормально.