В общем обновились мы до ESX6.5
Жили какое то время — долго и счастливо, все настроили. НО потом перенесли туда более нагруженные VM, подтянули свежие хосты и в опа … PSOD.
Раз в +/-12 часовPSOD, на хостах которое отработали все эти месяцы. По 4 сервера в кластере вылетали, в общем треш.
Да, HA отрабатывал безупречно, но перезагрузки VM всех бесили. Все сервера HP DL 560G8, памяти от 256 Gb, в остальном все идентично.
бились с пару дней, в итоге сделали следующие:
- нагруженные VM выделил в отдельный кластер;
- В GOOGLE было найдено, что проблема с драйвера которые HP вшивает в образ. Поэтому решили взять оригинальный образ VMWARE и переставить его на паре хостов.
Но после еще дня копания нашел замечательную статейку — https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2148123.
и как ее продолжение — http://h20565.www2.hpe.com/hpsc/doc/public/display?docId=c05378386
при этом в них есть упоминания о разных сервера HP, но только не про DL560G8.
но был взяли патч —
в командной строке
esxcli software vib install -d "/tmp/ams-esxi6.5-bundle-10.6.2-2.zip" Installation Result Message: The update completed successfully, but the system needs to be rebooted for the changes to be effective. Reboot Required: true VIBs Installed: HPE_bootbank_hpe-ilo_650.10.0.2-2.4240417, HPE_bootbank_hpe-smx-limited_650.03.11.00.13-4240417 VIBs Removed: HPE_bootbank_hpe-ilo_650.10.0.1-24.4240417, HPE_bootbank_hpe-smx-provider_650.03.11.00.17-4240417 VIBs Skipped: HPE_bootbank_amshelper_650.10.6.0-24.4240417, HPE_bootbank_hpe-cru_650.6.5.8.24-1.4240417, HPE_bootbank_hpe-esxi-fc-enablement_650.2.6.10-4240417
и все, работаем уже 4 дня. Пока полет нормальный.