Page allocation error out of resources failed to shutdown the boot service

Solution: Now the good news... I'm finally back up and running - A great relief, after a very tough couple of days.Thanks to you all for the ideas and feedback.

Author AlwaysSearching

Now the good news… 

I’m finally back up and running — A great relief, after a very tough couple of days.

Thanks to you all for the ideas and feedback. I really do appreciate the assistance.

I’m still not sure why things changed after the power outage, but I found a work around that works for me, so I’m happy with that.

I came across some suggestions that UEFI booting may may cause issue with the ESXi startup process. I originally did not think that this was my issue, as I believe that I was booting in UEFI mode prior to problems seen after the power outage. When I first tried disabling UEFI boot and using «Legacy» booting I could not get it to boot from the USB thumb drive, it showed a message on the display saying that it was trying to boot from USB, but it would not boot. 

I tried adding a MBR partition to the USB drive but still could not get it to boot when in Legacy boot mode. I also tried using the SHIFT-O «runweasel formatwithmbr» boot option to the ESXi installer, but I could not get this to resolve my issue.

As I couldn’t get the ESXi 7.0 or 6.7 installer to boot from USB when in Legacy Boot mode, my next thought was to try booting from a DVD rather than USB. So I burned the ESXi 7.0b iso to a DVD, updated the boot order in BIOS and was able to boot the ESXi installer. The ESXi Installer completed (not failing at the «Initializing InitVMKernel…VMKAcpi_LateInit» step as it did when running in UEFI boot mode from a USB thumb drive).

The next challenge was to install the ESXi 7.0b onto the target boot media. I was hoping that this could be a 16GB USB thumb drive (as I was using prior to the power outage), however it would start loading the required data on the USB thumb drive but got stuck and never completed (it did this on several times, on multiple USB drives). So I tried using a USB hard drive as the target (rather than a USB Flash/Thumb Drive). The data transfer to the USB hard drive worked, and I was able to boot from the USB hard drive in Legacy boot mode. I finally had a working ESXi 7.0b server.

I found that I could access the Datastore on the internal SSD Drive via the web interface to the running ESXi hypervisor, however none of my hypervisor configuration was available (e.g. VM and network configurations, etc.). Luckily I had a backup of the /bootbank/state.tgz file that I used to restore the ESXi hypervisor configuration (via ssh, rcp and tar). Two of the three VMs stored on the internal SSD worked without an issue. The third VM apparently had a corrupted VM disk (.vmdk file) which could not be loaded. Luckily I had a recent backup of the .vmdk file, so this was easily sorted by uploading backup .vmdk file via the ESXi web interface.

Main take away lessons? The importance of a UPS and a regular backup schedule. I did have a UPS but regrettably had not yet got around to connecting this server. Server now connected to UPS, now need to invest some time to setup a UPS signal distribution and auto shutdown system, probably using something like NUT (Network UPS Tools).

Hopefully this may be of assistance to others who experience similar issues. Thanks for the help of all.


Was this post helpful?
thumb_up
thumb_down

Эта ошибка может возникать в системах любой конфигурации. Решение можно быстро нагуглить но само по себе оно не столько интересно нежели, то дополнительное понимание о памяти в Linux которое можно получить разобравшись в проблеме.

Итак, мы знаем, что есть Cache и Buffers под которые ядро может отдавать всю свободную память. Как бэ, чего ей простаивать — путь работает. Мы знаем, что эта память занятая кешами высвобождается при необходимости. То есть ее может получить любой нуждающийся процесс. То есть на нее можно рассчитывать как на свободную, думал я всегда.

Еще мы знаем, что есть swap в который как известно переносятся наименее используемые странички вирт. памяти, что является по сути расширением виртуальной памяти.

Глядя на вывод команды freeя всегда учитывал вышесказанное и при высокой утилизации памяти(не swap) я думал, ну в худшем случае провалимся в swap а там отработает мониторинг и будем либо добавлять память либо серверы, а пока все норм. Кстати у нас настроено использование swap только после утилизации памяти на 99%(vm.swappiness=1)и даже при этом swap остается коварным злом о котором я напишу отдельно.

Так вот, все немного не так как думал я. Есть ситуации когда память нужна вот прям сейчас, например при обработке прерываний и в этих ситуациях ядро не может ждать высвобождения памяти занятой кешем или пока старые страницы будут сброшены на диск в swap. В такие моменты возникает подобная ошибка. При этом не приходит OOM, это важно, это значит, что памяти как бы хватает. Хотя OOM возможно не приходит т.к. результатов его работы тоже долго ждать)

Значение параметра ядра: vm.min_free_kbytesпо умолчанию равно 90112 kb на CentOS 6.x/7.x.
Это резерв который ядро будет держать для себя и не отдаст под кеш или пользовательским процессам, что бы иметь возможность обслуживать подобные моментальные запросы. Собственно увеличение значения этого параметра решает проблему.

Важное замечание от инженеров RedHat, учтите его при выборе значения:

Be cautious when setting this parameter, as both too-low and,
too-high(5-10% of total system memory) values can be damaging and break your system.

Помогла ли вам статья?

  • #1

В чем может быть проблема? При запуске пяти карт на плате GIGABYTE X299-WU8 ловлю ошибку D4, в официальной инфе по этой плате значит — pci resource allocation error. out of resources.
При запуске четырех карт, все нормально, а с пятой никак не получается, в чем может быть дело?

i7-7820x
5x zotac 2080 ti
x2 Corsair HX1200 1200W
плата GIGABYTE X299-WU8

Все карты подключены через райзера x1

  • #2

В чем может быть проблема? При запуске пяти карт на плате GIGABYTE X299-WU8 ловлю ошибку D4, в официальной инфе по этой плате значит — pci resource allocation error. out of resources.
При запуске четырех карт, все нормально, а с пятой никак не получается, в чем может быть дело?

i7-7820x
5x zotac 2080 ti
x2 Corsair HX1200 1200W
плата GIGABYTE X299-WU8

Все карты подключены через райзера x1

Да вы, батенька, мажорррр…
Копайте биос;)

  • #3

Да вы, батенька, мажорррр…
Копайте биос;)

В чем может быть проблема? Буду благодарен за любую информацию) Биос перепрошивал на новый.

  • #4

В чем может быть проблема? Буду благодарен за любую информацию) Биос перепрошивал на новый.

Вам пишет, что не хватает ресурсов. Значит отрубаете в биосе всё по-максимуму.

  • #5

Вам пишет, что не хватает ресурсов. Значит отрубаете в биосе всё по-максимуму.

А что конкретно можно выключить?

  • #6

А что конкретно можно выключить?

зачем тебе это, возьми у мамки на расходы

  • #7

зачем тебе это, возьми у мамки на расходы

?) если только у твоей

  • #8

Звуковуху, юсб, встройку (если есть)

  • #10

Отключай в биосе:
Звук
ЛИШНИЕ юсб
Вообщем, отключай всё чем не пользуешься

  • #11

Тут предположили, что инвестировала семья ;)

  • #12

богатая жизнь она другая….. по теме отрубай что есть в биосе это логично…. а еще можно было бы взять норм проверенные мамки

  • #13

Чувак пол ляма вбухал в конструктор «лего», теперь не знает, как детальки соеденить o_O
Одна мать за 500 баксов, причём в коментах пишут, что если использовать саташный винт и М2 SSD, то доступно всего 2 слота PCIe. Там ещё 3.1 юсб жрут дохрена помимо звука и встроенной сетки (там 2 сетевухи).

  • #14

Купить железа на 450к, которое копает по 12к грязными в месяц … ну пусть ещё проц, ну 15ку

  • #15

Купить железа на 450к, которое копает по 12к грязными в месяц … ну пусть ещё проц, ну 15ку

проц на накопает 3

что если использовать саташный винт и М2 SSD, то доступно всего 2 слота PCIe. Там ещё 3.1 юсб жрут дохрена помимо звука и встроенной сетки (там 2 сетевухи).

самая майнинговая мать))

  • #16

так а кто сказал что оборудование то для майнинга?) лол, только сумасшедший отдаст 10k$ за доход в 1 бакс с карты)

  • #17

так а кто сказал что оборудование то для майнинга?) лол, только сумасшедший отдаст 10k$ за доход в 1 бакс с карты)

Тогда зачем Вы принуждаете народ на форуме разговаривать с сумасшедшим? :)))
Или хотите сказать, что это оборудование к вам упало на халяву?

  • #18

Тогда зачем Вы принуждаете народ на форуме разговаривать с сумасшедшим? :)))
Или хотите сказать, что это оборудование к вам упало на халяву?

я тебе написал что на этом риге никто майнить не будет, сборка для совсем другого

  • #19

я тебе написал что на этом риге никто майнить не будет, сборка для совсем другого

Тогда чего ты в майнинговый форум полез. Ищи тот, который специализируется на сборке ренедеринговых станций.

  • #20

Купить железа на 450к, которое копает по 12к грязными в месяц … ну пусть ещё проц, ну 15ку

я тебя расстрою, железо почти на 650к вышло.

Понравилась статья? Поделить с друзьями:

Читайте также:

  • Page allocation error out of resources esxi
  • Paf error 4 line 8191 artcam 2012 что делать
  • Pad0 misconfigured device check guids как исправить
  • Pacparser error wrong pac file
  • Pacojet ошибка 2048

  • 0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии