Новичок
Зарегистрирован: 08.10.2019
Пользователь #: 172,307
Сообщения: 4
Источник
Smbios 0x16 error supermicro
Профиль | Отправить PM | Цитировать
Добрый день, появилась такая проблема.
Есть сервак, при перезагрузке из-под винды, сервак не хочет стартовать, пищит (5 коротких, 1 длинный), а на экране Intel Reference Code Execution с кодом 02. Судя по бипам — проблемы с памятью. Однако с кнопки ресета всё стартует норм., далее постоял 2 часа и завис. Конфигурация следующая:
— Supermicro X11SSL-F (2 PCI-E x8, 1 PCI-E x16, 4 DDR4 DIMM, Video, Dual Gigabit LAN);
— QuadCore Intel Xeon E3-1240 v5, 3700 MHz (37 x 100);
— 2хKingston 8GB DDR4 PC4-17000 [KVR21E15D8/8];
— Два зеркала на встроенном контроллере Intel.
Перезагружался, т.к. устанавливал последние обновления от MS за сентябрь. ОС — 2008R2. Здесь аналогичная проблема, только память другая. Также натыкался ещё на несколько подобных случаев. Снёс все установленные обновы (кроме обновки для ie11), а именно: KB3184471, KB3177186, KB3175024, KB3184122, KB3185911. И всё ребутнулось успешно. Кто-н имел дело с похожим?
Судя по бипам — проблемы с памятью. »
——-
ВНИМАНИЕ ознакомьтесь, прежде чем создать тему! Процессор — мозг компьютера, блок питания — сердце и печень.
Это сообщение посчитали полезным следующие участники:
Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.
Проблема с Supermicro X9DAi (SYS-7037a-i)
Проблема с Supermicro X9DAi (SYS-7037a-i)
Сообщение SciMan » 10 янв 2017, 22:57
В наличии есть рабочая станция на базе Supermicro X9DAi, в корпусе SYS-7037a-i, версия BIOS = 3.0а
Сама станция подключена к бесперебойнику, до недавнего времени все было хорошо (полгода с запуска), а сегодня внезапно начался следующий глюк: включаю питание с передней панели — стартуют кулеры, шумят секунд 5, и мигает красный индикатор «i» — «информация». Потом станция внезапно прерывает запуск и выключается, не показав ничего на экране. Через несколько секунд (примерно 3 сек.) внезапно включает питание и продолжает запуск с нуля. В мане об индикации LED «i» не сказано ничего, там вместо него обозначен индикатор температуры, означает проверить помещение на перегрев, или мешает ли что-то вентиляторам. Разобрал корпус, прочистил его, собрал обратно, проблема осталась.
Некоторое время погуглив, нашел еще вариант источника проблемы — возможно, ошибки в памяти: на борту 128 ГБ Reg-ECC, работал на Force speed 1600, сейчас в BIOS переставил на Auto (стало 1333). Проблема не исчезла. На ночь поставлю Memtest, в нем, кстати, ECC=off. В логах BIOS есть ошибка Smbios 0x01 SINGLE ECC-BIT ERROR. Но в логах она уже очень давно, а проблема началась сегодня.
Подскажите пожалуйста, в чем может быть проблема. Прошивку BIOS обновлял летом, по способу в readme с офсайта Supermicro, все встало без проблем.
Источник
ECC memory errors causing random server reboots
I’m running ubuntu server 14.04 on Supermicro X10SLM-F / Xeon E3-1271 v3
Memory: SuperTalent 32GB DDR3 1600 ECC
About every 4 days, the logs on Ubuntu will show this:
Immediately after this the server reboots itself in a «power-cycle» fashion.
When I look in the BIOS event log, I see this:
And the description of the error is:
ipmitool in Ubuntu show this:
A few questions:
If the ECC memory is self correcting, why does the machine reboot itself?
Am I, perhaps, missing some setting in the BIOS that will stop the box from rebooting itself?
Is this obviously a memory stick issue or can this be a slot issue or a CPU issue?
How to stop the server from rebooting?
Thank you for any advice.
3 Answers 3
The system should not reboot upon correctable memory error. Do you see additional information/pattern via ipmitool sel elist ? The BMC watchdog could reboot the system, check if it is enabled via ipmitool mc watchdog get . As you already have the information on the location of the bad memory module, replace it and if the problem manifests again, the memory slot could be at fault.
X10SLM-F the RAM that you use is not on the list of tested RAM modules — if you have the possibility, replace all the memory bars in a ‘problem’ system with equivalent Supermicro-tested ones. Also, check the list of supported OS for you Ubuntu version.
Related to the CMOS settings, you could use Supermicro SUM , provided you have the SUM keys installed, to dump the BIOS settings from all the systems then vimdiff them to see if there is any CMOS parameter being different for the systems that regularly reboot compared to the system(s) that do not.
Источник
Smbios 0x16 error supermicro
Профиль | Отправить PM | Цитировать
Добрый день, появилась такая проблема.
Есть сервак, при перезагрузке из-под винды, сервак не хочет стартовать, пищит (5 коротких, 1 длинный), а на экране Intel Reference Code Execution с кодом 02. Судя по бипам — проблемы с памятью. Однако с кнопки ресета всё стартует норм., далее постоял 2 часа и завис. Конфигурация следующая:
— Supermicro X11SSL-F (2 PCI-E x8, 1 PCI-E x16, 4 DDR4 DIMM, Video, Dual Gigabit LAN);
— QuadCore Intel Xeon E3-1240 v5, 3700 MHz (37 x 100);
— 2хKingston 8GB DDR4 PC4-17000 [KVR21E15D8/8];
— Два зеркала на встроенном контроллере Intel.
Перезагружался, т.к. устанавливал последние обновления от MS за сентябрь. ОС — 2008R2. Здесь аналогичная проблема, только память другая. Также натыкался ещё на несколько подобных случаев. Снёс все установленные обновы (кроме обновки для ie11), а именно: KB3184471, KB3177186, KB3175024, KB3184122, KB3185911. И всё ребутнулось успешно. Кто-н имел дело с похожим?
Добрый день, появилась такая проблема.
Есть сервак, при перезагрузке из-под винды, сервак не хочет стартовать, пищит (5 коротких, 1 длинный), а на экране Intel Reference Code Execution с кодом 02. Судя по бипам — проблемы с памятью. Однако с кнопки ресета всё стартует норм., далее постоял 2 часа и завис. Конфигурация следующая:
— Supermicro X11SSL-F (2 PCI-E x8, 1 PCI-E x16, 4 DDR4 DIMM, Video, Dual Gigabit LAN);
— QuadCore Intel Xeon E3-1240 v5, 3700 MHz (37 x 100);
— 2хKingston 8GB DDR4 PC4-17000 [KVR21E15D8/8];
— Два зеркала на встроенном контроллере Intel.
Перезагружался, т.к. устанавливал последние обновления от MS за сентябрь. ОС — 2008R2. Здесь аналогичная проблема, только память другая. Также натыкался ещё на несколько подобных случаев. Снёс все установленные обновы (кроме обновки для ie11), а именно: KB3184471, KB3177186, KB3175024, KB3184122, KB3185911. И всё ребутнулось успешно. Кто-н имел дело с похожим? »
Добрый день. Что-нибудь решилось с проблемой памяти?
Абсолютно таже проблема на Supermicro X11SSH-LN4F с 2хKingston 8GB DDR4 PC4-17000.
Тесты ничего не выявили.
Началось тоже после перезагрузке при обновлениях.
Прошло после посещения БИОС и потыканья вроде ничего не значащих пунктов с последующим сохранением.
В View SMBIOS Event Log также было одно старинное сообщение smbios 0x16.
Источник
Adblock
detector
Новичок
Зарегистрирован: 08.10.2019
Пользователь #: 172,307
Сообщения: 4
Источник
Smbios 0x16 error supermicro
Профиль | Отправить PM | Цитировать
Добрый день, появилась такая проблема.
Есть сервак, при перезагрузке из-под винды, сервак не хочет стартовать, пищит (5 коротких, 1 длинный), а на экране Intel Reference Code Execution с кодом 02. Судя по бипам — проблемы с памятью. Однако с кнопки ресета всё стартует норм., далее постоял 2 часа и завис. Конфигурация следующая:
— Supermicro X11SSL-F (2 PCI-E x8, 1 PCI-E x16, 4 DDR4 DIMM, Video, Dual Gigabit LAN);
— QuadCore Intel Xeon E3-1240 v5, 3700 MHz (37 x 100);
— 2хKingston 8GB DDR4 PC4-17000 [KVR21E15D8/8];
— Два зеркала на встроенном контроллере Intel.
Перезагружался, т.к. устанавливал последние обновления от MS за сентябрь. ОС — 2008R2. Здесь аналогичная проблема, только память другая. Также натыкался ещё на несколько подобных случаев. Снёс все установленные обновы (кроме обновки для ie11), а именно: KB3184471, KB3177186, KB3175024, KB3184122, KB3185911. И всё ребутнулось успешно. Кто-н имел дело с похожим?
Судя по бипам — проблемы с памятью. »
——-
ВНИМАНИЕ ознакомьтесь, прежде чем создать тему! Процессор — мозг компьютера, блок питания — сердце и печень.
Это сообщение посчитали полезным следующие участники:
Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.
Smbios 0x16 error supermicro
Профиль | Отправить PM | Цитировать
Добрый день, появилась такая проблема.
Есть сервак, при перезагрузке из-под винды, сервак не хочет стартовать, пищит (5 коротких, 1 длинный), а на экране Intel Reference Code Execution с кодом 02. Судя по бипам — проблемы с памятью. Однако с кнопки ресета всё стартует норм., далее постоял 2 часа и завис. Конфигурация следующая:
— Supermicro X11SSL-F (2 PCI-E x8, 1 PCI-E x16, 4 DDR4 DIMM, Video, Dual Gigabit LAN);
— QuadCore Intel Xeon E3-1240 v5, 3700 MHz (37 x 100);
— 2хKingston 8GB DDR4 PC4-17000 [KVR21E15D8/8];
— Два зеркала на встроенном контроллере Intel.
Перезагружался, т.к. устанавливал последние обновления от MS за сентябрь. ОС — 2008R2. Здесь аналогичная проблема, только память другая. Также натыкался ещё на несколько подобных случаев. Снёс все установленные обновы (кроме обновки для ie11), а именно: KB3184471, KB3177186, KB3175024, KB3184122, KB3185911. И всё ребутнулось успешно. Кто-н имел дело с похожим?
Судя по бипам — проблемы с памятью. »
——-
ВНИМАНИЕ ознакомьтесь, прежде чем создать тему! Процессор — мозг компьютера, блок питания — сердце и печень.
Это сообщение посчитали полезным следующие участники:
Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.
Источник
SuperMicro X10SL7-F
grep137
Dabbler
Ziferius, I’m getting some strange results from one of the modules I got from Superbiiz back in March (see below).
I ran Memtest86+ 5.01 for 17 hours on the default settings and it found no errors. However, when I looked at the Event Logs in the BIOS it showed (see below). I’ve only had the machine powered on fewer than 10 times (on for only 1 — 5 hours each time, except for the 17 hour memtest) since I put it together. Is this normal, or is DIMMA1 faulty?
DATE: | TIME: | ERROR CODE: | SEVERITY: | DESCRIPTION:
05/05/14 | 01:20:30 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
05/05/14 | 03:08:27 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
05/05/14 | 06:48:06 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
05/05/14 | 09:34:40 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
05/18/14 | 11:48:03 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
06/15/14 | 11:32:58 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
06/22/14 | 15:21:03 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
Samsung DDR3-1600 ECC CL11
Mfr Part Number: M391B1G73QH0-YK0
Sir.Robin
Where are you getting your memory, if you don’t mind me asking?
Sent from my iPad using Tapatalk
I have Kingston for my primary system. My secondary will run on Crucial ECC initially. Might exchange that later.
Have you checked CPU then? Bent pins?
Sir.Robin
Ziferius
Dabbler
Ziferius, I’m getting some strange results from one of the modules I got from Superbiiz back in March (see below).
I ran Memtest86+ 5.01 for 17 hours on the default settings and it found no errors. However, when I looked at the Event Logs in the BIOS it showed (see below). I’ve only had the machine powered on fewer than 10 times (on for only 1 — 5 hours each time, except for the 17 hour memtest) since I put it together. Is this normal, or is DIMMA1 faulty?
DATE: | TIME: | ERROR CODE: | SEVERITY: | DESCRIPTION:
05/05/14 | 01:20:30 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
05/05/14 | 03:08:27 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
05/05/14 | 06:48:06 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
05/05/14 | 09:34:40 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
05/18/14 | 11:48:03 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
06/15/14 | 11:32:58 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
06/22/14 | 15:21:03 | Smbios 0x01 | DIMMA1 | Single Bit ECC Memory Error
Samsung DDR3-1600 ECC CL11
Mfr Part Number: M391B1G73QH0-YK0
Interesting. That seems like an aweful lot, but that’s why we run ECC. it catches and fixes that.
Cyber jock is definitely proved right (yet again) why ECC is so important.
Источник
Supermicro BMC watchdog-caused reboots
I’ve recently acquired a SuperMicro X10SLL-F motherboard, which has a built-in BMC (Aspeed AST2400 chip). I want to use built-in watchdog controller when running linux on server (gentoo hardened).
I enabled watchdog function in bios then switched motherboard jumper from hard-reset to NMI (watchdog timeout action, for testing purposes to avoid rebooting). About soft — I installed and added to default runlevel watchdog program (sys-apps/watchdog) which is configured to ping watchdog device (/dev/watchdog, which is present) every 10 seconds. Watchdog timeout is set to 250 seconds.
Programs apparently see watchdog hardware (ipmitool with openipmi enabled):
However, after certain amount of time I get (with good «current countdown» values reported by programs above):
Which is NMI, apparently caused by watchdog timeout. Little less than a minute after that machine hard-reset happens.
Where is a problem and which direction should I dig to?
EDIT: kernel messages related to ipmi:
EDIT: I tried to use bmc-watchdog with configuration «-u 4 -p 2 -a 0 -F -P -L -O -i 300 -e 10». So only SMS/OS time is in use, pre-timeout interrupt is set to NMI, timeout action is set to NONE:
But this led to no change at all.
EDIT. Also when I trigger watchdog timer with echoing x00 to /dev/watchdog and then kept it untouched — system is correctly rebooted after default 10 second timeout. So watchdog works good but at exactly 350 seconds from startup system reboots.
EDIT. I checked BMC system event log (SEL) and found this after reboot:
What is interesting here — is that event marked as «status only». And even so, system is rebooted. When I trigger watchdog timeout intentionally, logs are different:
Источник
Adblock
detector
1 / 1 / 0 Регистрация: 10.10.2019 Сообщений: 11 |
|
1 |
|
18.03.2021, 16:20. Показов 11845. Ответов 11
Доброго времени суток. Есть сервер со следующей конфигурацией:
Проблема заключается в том,что при включении сервера на экране появляется логотип SuperMicro на белом фоне,внизу слева следуют надписи: Код PEI—IPMI Initialization... PEI—SB Initialization... (появляется на миллисекунду) PEI—Intel MRC Execution... (справа код 2F) После этого ничего не происходит. В чём может быть проблема?
__________________
0 |
4487 / 2165 / 441 Регистрация: 09.09.2017 Сообщений: 7,866 |
|
18.03.2021, 16:38 |
2 |
I_FarEvil_I, Не поддерживает мат. плата регистровую (буферизированную) память. Для проца и мат. платы заявлена только поддержка ECC-памяти (с коррекцией ошибок).
0 |
1 / 1 / 0 Регистрация: 10.10.2019 Сообщений: 11 |
|
18.03.2021, 16:39 [ТС] |
3 |
ibarg, то есть нужно идти покупать UDIMM?
0 |
4487 / 2165 / 441 Регистрация: 09.09.2017 Сообщений: 7,866 |
|
18.03.2021, 16:41 |
4 |
Сообщение было отмечено I_FarEvil_I как решение Решение
покупать UDIMM? По ходу да.
0 |
1 / 1 / 0 Регистрация: 10.10.2019 Сообщений: 11 |
|
18.03.2021, 16:47 [ТС] |
5 |
Хорошо, спасибо за информацию. В ближайшее время куплю UDIMM память, если будет подобное-напишу.
0 |
1376 / 508 / 99 Регистрация: 11.03.2015 Сообщений: 1,735 |
|
19.03.2021, 13:18 |
6 |
I_FarEvil_I,
1 |
0 / 0 / 0 Регистрация: 15.06.2021 Сообщений: 3 |
|
15.06.2021, 09:36 |
7 |
В итоге, с какой именно запустилось?
0 |
1 / 1 / 0 Регистрация: 10.10.2019 Сообщений: 11 |
|
15.06.2021, 12:08 [ТС] |
8 |
dompro, UDIMM ECC DDR4, у меня — Samsung M391A4G43MB1-CTDQY
1 |
0 / 0 / 0 Регистрация: 15.06.2021 Сообщений: 3 |
|
24.06.2021, 12:35 |
9 |
Попробовал Kingston KSM32ES8/8ME , та же ошибка. Это на 3200 частоты, но подстраивается под 2666. Но похоже плате нужно жестко конкретно 2666?
0 |
1 / 1 / 0 Регистрация: 10.10.2019 Сообщений: 11 |
|
24.06.2021, 13:23 [ТС] |
10 |
плате нужно жестко конкретно 2666? Да.
0 |
0 / 0 / 0 Регистрация: 15.06.2021 Сообщений: 3 |
|
06.07.2021, 13:17 |
11 |
Какая-то хрень, опять ждал пока доедет другая плашка, купил Samsung [M391A1K43BB2-CTD] 8 ГБ, поставил и то же самое. Может дело не в памяти? Уже двадцать раз пожалел что эту материнку выбрал.
0 |
1376 / 508 / 99 Регистрация: 11.03.2015 Сообщений: 1,735 |
|
12.07.2021, 13:01 |
12 |
dompro, Error code 2F means memory initialization. It is generated thru the BIOS. You may have memory issue. Please check your memory DIMMs and motherboard’s DIMM sockets. Скачайте мануал от материнки с этой страницы:
0 |
IT_Exp Эксперт 87844 / 49110 / 22898 Регистрация: 17.06.2006 Сообщений: 92,604 |
12.07.2021, 13:01 |
12 |
-
#1
Hi, this is my first post connected with new hardware.
I’m starting to build up a server.
I have such a devices:
MB: SuperMicro X11SSL-F
CPU: e3-1230v6
RAM: Samsung 4x16GB 2400 UDIMM ECC.
I had build up the PC, run it and I hear 5 short beeps and one long.
Then I entered to the IMPI and I see following Hardware list.
which is completely different, because Now I have v6 cpu and only one Ram on the board.
Here is stated bios 2.0c, but on the other site there is an 2.1a
On monitor I see something like that:
0x09 mrc data time centering 1d error
What should I do?
-
#2
- place one stick of ram in slot DIMMA1
- reset your ipmi back to factory default
- reboot the system
-
#3
did it,
now there is other issue
the system works only with 2 memory slots occupied — so only 32GB ram.
If I put 3.rd or 4th ram stick the system can not boot.
I get such error exactly:
Code:
0x09=mrcDataTimeCentering1DErr
I can only occupy the 2 first slots from the top (black and blue)
-
#5
Are all four of the ram modules part#M391A2K43BB1-CRC ???
Test each stick (one at a time) in the first ram slot (if one of the
sticks fails to boot) you may have a bad stick of ram.
-
#6
Disable the jumpers of SMB to PCI Slots (JI2C1/JI2C2) — from 1-2 to 2-3 and all will be fine
DrKK
FreeNAS Generalissimo
-
#7
Disable the jumpers of SMB to PCI Slots (JI2C1/JI2C2) — from 1-2 to 2-3 and all will be fine
really. What does that do?
-
#8
This is due to hardware limitation as the result of SMBus address conflict between DIMMA1 and the PCIe devices
-
#9
This is due to hardware limitation as the result of SMBus address conflict between DIMMA1 and the PCIe devices
How do you arrive at that conclusion?
-
#10
my system (X11-SSM) had same problems with 4pcs of 16GB modules (beeps at startup, 0x09=mrcDataTimeCentering1DErr, etc). I got information from Supermicro support about hardware limitations for SSM/SSL/SSH mainboards. And after setting jumpers to disable SMBus — system can start normally, w/o beeps and with all 64GB.
Very easy to check, but i don’t know where is TS — yacenty
Last edited: May 13, 2018
-
#11
Interesting. I assume those DIMMs are not on the QVL?
-
#12
yes ) HPE with SK Hynix chips
-
#13
my system (X11-SSM) had same problems with 4pcs of 16GB modules (beeps at startup, 0x09=mrcDataTimeCentering1DErr, etc). I got information from Supermicro support about hardware limitations for SSM/SSL/SSH mainboards. And after setting jumpers to disable SMBus — system can start normally, w/o beeps and with all 64GB.
Very easy to check, but i don’t know where is TS — yacenty
RSA- I was having this exact issue whenever I tried putting in 4DIMMS… your post saved me a ton of wasted time and heartache!!! Thank you!!!!
-
#14
RSA- I was having this exact issue whenever I tried putting in 4DIMMS… your post saved me a ton of wasted time and heartache!!! Thank you!!!!
i’m really happy to help you