Содержание
- Ошибки и проблемы серверов большой тройки: часть первая. Dell
- Обновление ПО
- Ошибка обновления iDRAC
- Ошибка Е1410
- Некорректная установка оперативной памяти
- Преимущества серверов Dell
- Server Dell Poweredge T710 gives Fatal error when i add 2nd Processor
- Dell R710, CPU2 Machine Check Error Detected
- Popular Topics in Dell Hardware
- 22 Replies
Ошибки и проблемы серверов большой тройки: часть первая. Dell
Занимаясь восстановленными (refurbished) серверами, мы накопили приличный опыт общения с проблемами разных брендов, которым хотим поделиться на примере машин большой тройки: Dell, HP и IBM. Чтобы никому не было обидно, мы пойдём в алфавитном порядке.
В этом посте мы собрали отзывы наших инженеров, которые имеют большой опыт в диагностировании, восстановлении и обслуживании серверов — каждая описанная ошибка решалась их потом и кровью. Эта информация не пригодится вам в случае, если вы обслуживаетесь по гарантии, но, тем не менее, может быть полезна.
Обновление ПО
Проблема при обновлении ПО актуальна для оборудования DELL старше 3-5 лет. Напомним, что все манипуляции с сервером Dell производятся при помощи Lifecycle, которая встроена в программное обеспечение сервера, а также iDRAC.
Интегрированный контроллер удаленного доступа Dell 7 (iDRAC7) — программное обеспечение для серверов Dell, которое удаленно подключается к серверу, даже если у сервера нет питания, но подключен интернет и блок питания. При подключении к серверу, ПО выводит на экран данные о состоянии системы, а также позволяет протестировать и обновить все компонентами: начиная от биоса и заканчивая драйверами на материнскую плату, блоки питания и т. д., а также прошивку.
Здесь, при стандартном сценарии, есть два варианта. Первый, обновление в ручном режиме, с флеш-карты — в случае, если нет подключенного к серверу интернета. Тогда заходим в Lifecycle и обновляемся с флеш-накопителя. Если что-то не пошло, подключаем сервер к интернету и обновляемся, либо заходим через iDRAC и восстанавливаем первоначальные настройки, устанавливаем необходимые обновления.
Однако, если сервер достаточно старый, проблемы ждут почти сразу: при попытке установить программное обеспечение через Интернет из системы обновления и диагностики Lifecycle. Причина такой проблемы в том, что производитель изначально, ещё на заре этой системы, не использовал протокол защиты на FTP — сервере обновления прошивок компонентов своих серверов. Сейчас, когда такие сертификаты защиты введены, старое оборудование трёх-пятилетней давности выпуска иногда с трудом может обновиться через Интернет.
Решается проблема достаточно просто и многие из вас уже наверняка догадались, как это можно сделать: обновить ПО, а именно Lifecycle, но сначала обновите систему IDRAC. Обновления доступны бесплатно на официальном сайте техподдержки Dell. (Проверка гарантии и скачивание обновлений на ваш сервер Dell).
После этой манипуляции вы сможете удобно загрузить все драйверы и остальные обновления через Интернет, вне зависимости от года выпуска вашего сервера — если, конечно, на сайте производителя есть для него набор обновлений.
Ошибка обновления iDRAC
Напомним, что iDRAC представлен в вариантах «стандартный», «экспресс» и «enterprise». Стандарт идёт в комплекте при покупке сервера. Если заказываем комплектацию «экспресс», то на материнскую плату сервера нам ставят соответствующую лицензионную микросхему. Таким образом, мы получаем новый порт, который позволяет нам получать более информативные данные через Web.
При стандартной лицензии, когда мы на рабочем компьютере подключаемся через браузер к системе iDRAC, мы можем увидеть обзор информации о системе на стандартной вкладке, сервис-тег сервера, модель и не более того.
Через экспресс, т. е. если у нас 7 версия iDRAC, мы уже можем обновлять BIOS, Lifecycle, и т.д. непосредственно через систему удалённого доступа iDRAC. В ранних версиях системы, к сожалению, эта возможность не предусмотрена: там можно обновляться только через флеш-накопитель.
Enterprise – самый полный комплект доступных функций по управлению сервером через порт iDRAC, который позволяет полноценно отслеживать и обновления, и полный список компонентов, и текущее состояние сервера. Это удобный и функциональный комплект, но мы сумели найти в нём один небольшой, но существенный недостаток.
После обновления версии iDRAC Enterprise 1.30.30 либо 1.45.45, система перестаёт инициализироваться и не стартует из-за неправильных настроек. Как результат, если мы входим в iDRAC в настройках через BIOS, мы не можем его ни отключить, ни что бы то ни было предпринять для того, чтобы восстановить его или перезагрузить.
Для большинства пользователей, единственный выход в такой ситуации, это обращение в техподдержку. Если ваш сервер на гарантии, то специалисты приедут и заменят материнскую плату. Мы, в свою очередь, сталкивались с этой проблемой и, как ни странно, помогло вполне стандартное решение, описанное на официальном форуме Dell: сервер пришлось обесточить на 5 минут, вытащить блоки питания и отключить все провода. Правда, если это не помогло, то вам, всё же, придётся заменить материнскую плату.
Ошибка Е1410
Ошибка Е1410 выдаётся после апгрейда: вы добавили ещё один процессор, но с ним сервер почему-то не стартует. Вернее, он включается, индикаторы попеременно загораются, он громко шумит, но при этом на экране ничего нет и пишет ошибку на дисплее диагностической панели.
Проблема в данном случае заключается в том, что на сокете CPU 1, загнуты ножки сокета, которые прилегают к процессору – либо одна, либо сразу несколько. На изображении вы видите исправные ножки сокета (слева) и место, где они загнуты (справа). Ножки можно вручную выправить, на этом проблема будет исчерпана.
Как вы уже догадались, при данной ошибке второй процессор не стартует потому, что часть функциональности первого процессора оказалась отключена. Какая именно? Вариантов может быть множество, одни из них: либо это ножки отвечающие за старт второго процессора, либо блок оперативной памяти не стартует от второго процессора. Это зависит от того, какая ножка загнута.
Некорректная установка оперативной памяти
Проблема часто встречается при апгрейде. В данном случае речь идёт целиком и полностью о человеческом факторе. Однако ошибка эта крайне распространена в силу того, что на каждую модель присутствует своя спецификация по установке. Во-первых, в зависимости от модели, почти в каждом сервере разное количество портов. Соответственно, определённое количество оперативки нужно добавлять в свои порты. Иногда задача усложняется многократно: например, у модели DELL R610 оперативная память трехканальная, поэтому необходимо добавлять по три планки на один канал. Легко можно ошибиться, выбирая из 12 слотов и 4 каналов.
Память типа DDR3 интерфейс состоит из трех каналов до двух модулей Rdimm или UDIMMs на канал
для одиночного или двойного ранга и до двух модулей Rdimm на канал для квадра ранга. Интерфейс использует 2 ГБ, 4 ГБ, 8 ГБ или 16 ГБ модулей Rdimm. Также поддерживается 1 ГБ или 2 ГБ UDIMMs.
Поэтому часто получается при неверном расчете памяти одна из планок или несколько установлены в неверные слоты, либо вовсе не хватает для оптимальной конфигурации.
Второй момент, часто приводящий к несовпадению по оперативной памяти заключается в том, что память для серверов подразделяется по питанию на 1,35 V и 1,5 V. Оперативка 1,35 вольт стартует только на начиная с 56-й версии процессора. На более ранних версиях серверов можно использовать только планки, рассчитанные на 1,5 вольт. Если в сервере будут стоять разные планки, то он не запустится и выдаст соответствующую ошибку.
Выглядит это таким же образом как в случае с загнутыми сокетами и ошибкой запуска второго процессора. Если ошибки на экране дисплея не отображается, сервер пишет “Server is booting. ” и на экране ничего не отображается, попробуйте проверить конфигурацию памяти. Замените память в соответствии со спеками и установите в правильные слоты, чтобы получить оптимальную конфигурацию.
Преимущества серверов Dell
Справедливости ради хотелось бы закончить статью, поговорив о плюсах серверов Dell. А они, по нашему мнению, полностью нивелируют те проблемы, которые мы описали выше. Ведь, в первую очередь, эти проблемы встречаются при реконфигурации серверов.
- Сервер «как-он-есть» от Dell, пожалуй, наиболее беспроблемный и удобный для всех действий с серверами. Это первое, что мы можем сказать на основе нашего опыта.
- Так же у Dell есть поддержка мощнейших процессоров на данный момент: как поколения Е3 так и Е5, до 12-ядерных процессоров (R720, R720XD).
- Холодный старт сервера у Dell намного быстрее других вендоров большой тройки.
- В серверах Dell большой выбор корзин для подключения HDD дисков – 2,5 дюйма и 3,5 дюйма, в которые можно подключить до 12 HDD (в случае с R720XD). С переходниками можно подключать SSD диски. На 3,5 дюйма существуют корзины на 4, 6, 8, 12 дисков, а на 2,5 дюйма — до 8.
- Почти во всех моделях Dell присутствует возможность подключения резервных блоков питания.
- Техподдержка на заявки реагирует очень быстро.
- Поэтому, несмотря на то, что серверы Dell чуточку дороже аналогов от других поставщиков, инвестиции вложенные в эти сервера оправдываются.
Надеемся, что наша статья поможет вам при апгрейде, диагностике и приобретении б/у-сервера. Остались вопросы? Пишите в комментариях.
Источник
Server Dell Poweredge T710 gives Fatal error when i add 2nd Processor
Dear All,
I have Dell PowerEdge T710 server. I bought it from Ebay, it only had 1 processor and i bought another processor exactly the same. When i turn it on it gives fatal error.
but no luck, anyone has any Idea ?
this what it states in the article
Configuration Before: 1 x Xeon 5540 CPU with 24GB RAM
Configuration Now: 2 x Xeon 5540 CPU with 48GB RAM
— After installing a CPU in Socket #2 and RAM to match CPU 1 and the RAM, upon boot I get the error on the front LCD E1410 Fatal System Error.
— I have moved the new CPU2 into the CPU1 socket then removed the CPU 2 RAM and it boots with no issues.
— I then took RAM from CPU1 banks out and left it with only 2 sticks in slots 1 and 2, it booted with no issues.
— I then took and put the old CPU in Socket #2 and placed 8GB RAM in identical configuration into CPU 2 banks and get the same error.
After this troubleshooting it shows that its NOT the CPU that is causing the issue, and it doesnt seem to be RAM either. There are no pins bent or missing on the socket. I did try to reset the NVRAM but it doesnt seem like it fixed it. Is there some BIOS update that I need in order to use both CPU’s? I have never seen any issue like this before. I just really hope its not the socket itself somehow.
this is teh answer it had
Everyone! Great News. I am going to declare this post as Solved! 🙂 After all of the troubleshooting and testing. I would like to say. Check your pins under processor 1 if your getting this error. You may see 1 or 2. or in my case 8 pins bent. I can only say this came from Dell this way as the only time processor 1 was removed was in troubleshooting putting the 2nd one in. It seems that I never checked to see if there was anything wrong because the processor was working was no issues in slot 1. However after checking there was 8 pins bent. I used sharp flat tweezers to pry them up and reposition them in place. put both processors in and BAM. It booted no errors.
Question. how the [ADMIN NOTE: Profanity removed] did it function with 8 pins not touching or crossed. How did I not get vm kernel crashes. lol
Thank You all for all your help. I am going to say its solved because I am the OP, however please continue troubleshooting your issues.
Источник
Dell R710, CPU2 Machine Check Error Detected
We have a Dell PowerEdge R710 running as a Hyper-V host which crashed last night. During some troubleshooting this morning, I could not get the server to stay up. Once, I got it to stay up long enough to look some logs through open-manage, and found two relevant entries:
CPU2 Machine Check Error
CPU2 Has an internal error (IERR)
After seeing these entries, I removed the second processor and the server has stayed up.
My questions are:
At this point I am assuming CPU 2 needs to be replaced, but I am seeing a lot online about this error being resolved by BIOS updates. Is it possible I could see this result too? I want to update the BIOS as it is very out of date, but I ran into some other problems while attempting to do that, so I’ll need some time to figure those out.
How likely is it that this could be a socket / motherboard issue vs the processor itself? In the meantime, I will be ordering a processor.
What are the implications of running on just the one processor? Not necessarily from a load perspective, but in general, is it alright to run the system like that?
Thanks for the help!!
Popular Topics in Dell Hardware
I have seen these before. If memory serves me correctly, we replaced the CPUs each time to resolve.
I have seen BIOS updates fix problems with Dell servers. Just backup your data first. Download the Dell system update utility and use it to get all the firmware and driver updates for the server. To do this log into Dell’s support site and enter the Service Tag. Find the SFU utility and download it. You can create the update set on your PC and then apply it on the server. This utility will update the firmware for the motherboard, iDRAC software, NICs, disk controllers, and even the Dell disks.
The first step is always a full firmware update. If you still have issues after that, log a call with Dell.
What are the implications of running on just the one processor? Not necessarily from a load perspective, but in general, is it alright to run the system like that?
Thanks for the help!!
On the Dell R710 each processor gets half the memory. The PCI bus is shared between the processors so you won’t lose any peripherals or NICs when running a single processor.
Thank you guys very much for the replies! I really appreciate the information.
I am going to perform the updates and post back here with the results.
In the meantime, I ordered a processor since they were very cheap.
Brand Representative for Dell
In the meantime, I ordered a processor since they were very cheap.
It is unlikely that the issue is with the processor. A CPU IERR is an error detected by the processor, not an error with the processor. It is usually caused by a driver or memory.
If the system is receiving the error as often as you suggest then it should be easy to narrow down the problem. I would start by booting to another operating system to rule out a software issue with your current operating system. Our support live image contains OpenManage Server Administrator for viewing logs:
Check the hardware log for memory errors that coincide with the CPU IERR. I would also boot into the system services menu and run memory diagnostics. If you do not encounter any issues in the SLI operating system and you cannot locate any memory errors then the issue is likely with your operating system. I would start by updating drivers in the OS.
Thank you for the help! I wasn’t able to get into System Services. Each time I attempted, I ended up at an error screen with red text, and at the top it says something like «The system has received a fatal error and has halted, a reboot is required». Any idea if that could be related, or is a separate issue?
The PCI bus is shared between the processors so you won’t lose any peripherals or NICs when running a single processor.
I have seen this on PowerEdge 2950 and other Dell servers. Most of the times is a capacitor or various of them bulging in the motherboard.
You can also reset any riser cards on the server. Do you have anything booting right away on the system? You can also check this:
Brand Representative for Dell
I wasn’t able to get into System Services. Each time I attempted, I ended up at an error screen with red text, and at the top it says something like «The system has received a fatal error and has halted, a reboot is required». Any idea if that could be related, or is a separate issue?
It is a separate issue. It may be related to the original issue, but it is unlikely.
I would skip running diagnostics for now and perform the other steps I mentioned. Diagnostics are only necessary if you cannot locate errors in the hardware log.
Have you got iDRAC on this machine? what does it say about the health of the machine?
what about maintenance? If you have call Dell and get their guys to sort this and swap parts, they are very good
If the system has been operating without issues prior to this event the socket is likely good, update the firmware, since you have a cpu on the way install the new chip. Run a mem test to be safe.
Time to upgrade to Supermicro. Just set it and forget it and you’ll never have to worry about any of these issues. This will give you more time to play solitaire.
I have seen these before. If memory serves me correctly, we replaced the CPUs each time to resolve.
This doesn’t seem like a memory issue so far. When we pulled the second processor out, everything ran fine. With the second processor out, we did loose half of the RAM in the system. So, I switch all the RAM from processor 2 over to processor 1 with processor 2 still out of the system, and everything ran fine. That was easiest step, So now i’ll move on to updates and post back.
Thanks again for all the replies, I really appreciate it.
Dude! Call Dell support, you have support on your mission critical servers right?
Seems like you will be fine soon, but be sure to have a fully up to date and verified backup before doing any more troubleshooting. It would really be a bummer if there was something else that then put you into a data loss situation.
Dude! Call Dell support, you have support on your mission critical servers right?
Like others have said. it is most likely not a processor issue. One way to ensure is to swap put CPU1 into socket 2 and CPU2 into socket 1. If the errors start popping up for CPU1 then it is indeed an issue with that CPU. If they continue for CPU2 then you know it is not the CPU but instead another component or firmware related.
Sorry for the delayed update on this. At the moment, it seems as though replacing the processor has fixed the issue. I replaced processor 2 and the server has been running for around an hour while it previously wouldn’t stay on more than 2 or 3 minutes. I’ll post back if the issue surfaces again.
My first step was to eliminate memory as an issue by swapping all memory modules over to processor 1, as stated above.
My next step was to update absolutely every piece of firmware I could find, which was easier said than done (probably because of how out of date everything was). In the end, I created a bootable USB with an image from Dell containing all the most recent updates for that server. I had to run the imagine 3 or 4 times until none of the packages failed to apply (due to dependencies).
After doing this, I reinstalled the old processor only to have the server crash exactly the same as before. So, I left it out until the new one came in.
After receiving and replacing the replacement processor, the issue seems to have been resolved.
Источник
Время прочтения
6 мин
Просмотры 46K
Занимаясь восстановленными (refurbished) серверами, мы накопили приличный опыт общения с проблемами разных брендов, которым хотим поделиться на примере машин большой тройки: Dell, HP и IBM. Чтобы никому не было обидно, мы пойдём в алфавитном порядке.
В этом посте мы собрали отзывы наших инженеров, которые имеют большой опыт в диагностировании, восстановлении и обслуживании серверов — каждая описанная ошибка решалась их потом и кровью. Эта информация не пригодится вам в случае, если вы обслуживаетесь по гарантии, но, тем не менее, может быть полезна.
Обновление ПО
Проблема при обновлении ПО актуальна для оборудования DELL старше 3-5 лет. Напомним, что все манипуляции с сервером Dell производятся при помощи Lifecycle, которая встроена в программное обеспечение сервера, а также iDRAC.
Интегрированный контроллер удаленного доступа Dell 7 (iDRAC7) — программное обеспечение для серверов Dell, которое удаленно подключается к серверу, даже если у сервера нет питания, но подключен интернет и блок питания. При подключении к серверу, ПО выводит на экран данные о состоянии системы, а также позволяет протестировать и обновить все компонентами: начиная от биоса и заканчивая драйверами на материнскую плату, блоки питания и т. д., а также прошивку.
Здесь, при стандартном сценарии, есть два варианта. Первый, обновление в ручном режиме, с флеш-карты — в случае, если нет подключенного к серверу интернета. Тогда заходим в Lifecycle и обновляемся с флеш-накопителя. Если что-то не пошло, подключаем сервер к интернету и обновляемся, либо заходим через iDRAC и восстанавливаем первоначальные настройки, устанавливаем необходимые обновления.
Однако, если сервер достаточно старый, проблемы ждут почти сразу: при попытке установить программное обеспечение через Интернет из системы обновления и диагностики Lifecycle. Причина такой проблемы в том, что производитель изначально, ещё на заре этой системы, не использовал протокол защиты на FTP — сервере обновления прошивок компонентов своих серверов. Сейчас, когда такие сертификаты защиты введены, старое оборудование трёх-пятилетней давности выпуска иногда с трудом может обновиться через Интернет.
Решается проблема достаточно просто и многие из вас уже наверняка догадались, как это можно сделать: обновить ПО, а именно Lifecycle, но сначала обновите систему IDRAC. Обновления доступны бесплатно на официальном сайте техподдержки Dell. (Проверка гарантии и скачивание обновлений на ваш сервер Dell).
После этой манипуляции вы сможете удобно загрузить все драйверы и остальные обновления через Интернет, вне зависимости от года выпуска вашего сервера — если, конечно, на сайте производителя есть для него набор обновлений.
Ошибка обновления iDRAC
Напомним, что iDRAC представлен в вариантах «стандартный», «экспресс» и «enterprise». Стандарт идёт в комплекте при покупке сервера. Если заказываем комплектацию «экспресс», то на материнскую плату сервера нам ставят соответствующую лицензионную микросхему. Таким образом, мы получаем новый порт, который позволяет нам получать более информативные данные через Web.
При стандартной лицензии, когда мы на рабочем компьютере подключаемся через браузер к системе iDRAC, мы можем увидеть обзор информации о системе на стандартной вкладке, сервис-тег сервера, модель и не более того.
Через экспресс, т. е. если у нас 7 версия iDRAC, мы уже можем обновлять BIOS, Lifecycle, и т.д. непосредственно через систему удалённого доступа iDRAC. В ранних версиях системы, к сожалению, эта возможность не предусмотрена: там можно обновляться только через флеш-накопитель.
Enterprise – самый полный комплект доступных функций по управлению сервером через порт iDRAC, который позволяет полноценно отслеживать и обновления, и полный список компонентов, и текущее состояние сервера. Это удобный и функциональный комплект, но мы сумели найти в нём один небольшой, но существенный недостаток.
После обновления версии iDRAC Enterprise 1.30.30 либо 1.45.45, система перестаёт инициализироваться и не стартует из-за неправильных настроек. Как результат, если мы входим в iDRAC в настройках через BIOS, мы не можем его ни отключить, ни что бы то ни было предпринять для того, чтобы восстановить его или перезагрузить.
Для большинства пользователей, единственный выход в такой ситуации, это обращение в техподдержку. Если ваш сервер на гарантии, то специалисты приедут и заменят материнскую плату. Мы, в свою очередь, сталкивались с этой проблемой и, как ни странно, помогло вполне стандартное решение, описанное на официальном форуме Dell: сервер пришлось обесточить на 5 минут, вытащить блоки питания и отключить все провода. Правда, если это не помогло, то вам, всё же, придётся заменить материнскую плату.
Ошибка Е1410
Ошибка Е1410 выдаётся после апгрейда: вы добавили ещё один процессор, но с ним сервер почему-то не стартует. Вернее, он включается, индикаторы попеременно загораются, он громко шумит, но при этом на экране ничего нет и пишет ошибку на дисплее диагностической панели.
Проблема в данном случае заключается в том, что на сокете CPU 1, загнуты ножки сокета, которые прилегают к процессору – либо одна, либо сразу несколько. На изображении вы видите исправные ножки сокета (слева) и место, где они загнуты (справа). Ножки можно вручную выправить, на этом проблема будет исчерпана.
Как вы уже догадались, при данной ошибке второй процессор не стартует потому, что часть функциональности первого процессора оказалась отключена. Какая именно? Вариантов может быть множество, одни из них: либо это ножки отвечающие за старт второго процессора, либо блок оперативной памяти не стартует от второго процессора. Это зависит от того, какая ножка загнута.
Некорректная установка оперативной памяти
Проблема часто встречается при апгрейде. В данном случае речь идёт целиком и полностью о человеческом факторе. Однако ошибка эта крайне распространена в силу того, что на каждую модель присутствует своя спецификация по установке. Во-первых, в зависимости от модели, почти в каждом сервере разное количество портов. Соответственно, определённое количество оперативки нужно добавлять в свои порты. Иногда задача усложняется многократно: например, у модели DELL R610 оперативная память трехканальная, поэтому необходимо добавлять по три планки на один канал. Легко можно ошибиться, выбирая из 12 слотов и 4 каналов.
Память типа DDR3 интерфейс состоит из трех каналов до двух модулей Rdimm или UDIMMs на канал
для одиночного или двойного ранга и до двух модулей Rdimm на канал для квадра ранга. Интерфейс использует 2 ГБ, 4 ГБ, 8 ГБ или 16 ГБ модулей Rdimm. Также поддерживается 1 ГБ или 2 ГБ UDIMMs.
Поэтому часто получается при неверном расчете памяти одна из планок или несколько установлены в неверные слоты, либо вовсе не хватает для оптимальной конфигурации.
Второй момент, часто приводящий к несовпадению по оперативной памяти заключается в том, что память для серверов подразделяется по питанию на 1,35 V и 1,5 V. Оперативка 1,35 вольт стартует только на начиная с 56-й версии процессора. На более ранних версиях серверов можно использовать только планки, рассчитанные на 1,5 вольт. Если в сервере будут стоять разные планки, то он не запустится и выдаст соответствующую ошибку.
Выглядит это таким же образом как в случае с загнутыми сокетами и ошибкой запуска второго процессора. Если ошибки на экране дисплея не отображается, сервер пишет “Server is booting…” и на экране ничего не отображается, попробуйте проверить конфигурацию памяти. Замените память в соответствии со спеками и установите в правильные слоты, чтобы получить оптимальную конфигурацию.
Преимущества серверов Dell
Справедливости ради хотелось бы закончить статью, поговорив о плюсах серверов Dell. А они, по нашему мнению, полностью нивелируют те проблемы, которые мы описали выше. Ведь, в первую очередь, эти проблемы встречаются при реконфигурации серверов.
- Сервер «как-он-есть» от Dell, пожалуй, наиболее беспроблемный и удобный для всех действий с серверами. Это первое, что мы можем сказать на основе нашего опыта.
- Так же у Dell есть поддержка мощнейших процессоров на данный момент: как поколения Е3 так и Е5, до 12-ядерных процессоров (R720, R720XD).
- Холодный старт сервера у Dell намного быстрее других вендоров большой тройки.
- В серверах Dell большой выбор корзин для подключения HDD дисков – 2,5 дюйма и 3,5 дюйма, в которые можно подключить до 12 HDD (в случае с R720XD). С переходниками можно подключать SSD диски. На 3,5 дюйма существуют корзины на 4, 6, 8, 12 дисков, а на 2,5 дюйма — до 8.
- Почти во всех моделях Dell присутствует возможность подключения резервных блоков питания.
- Техподдержка на заявки реагирует очень быстро.
- Поэтому, несмотря на то, что серверы Dell чуточку дороже аналогов от других поставщиков, инвестиции вложенные в эти сервера оправдываются.
Надеемся, что наша статья поможет вам при апгрейде, диагностике и приобретении б/у-сервера. Остались вопросы? Пишите в комментариях.
Модераторы: Trinity admin`s, Free-lance moderator`s
-
trash50
- Junior member
- Сообщения: 11
- Зарегистрирован: 26 фев 2010, 17:44
- Откуда: Казань
Незагружается сервер: error1410 (Dell PowerEdge2950);
Незагружается сервер:
не встроеном дисплее: error1410;
cветодиоды на дисках не светятся;
монитор не включается ;
посторонние звуки отсутствуют.
Пыль чистил, блоки питания ‘передергивал’, разъемы ‘передергивал’,
диски (зеркало) ‘передергивал’. Техподдержки нет. В google (мало информации переводил с английского) — не нашел. : -(
Прошу помочь.
—
Сервер: Dell PowerEdge2950.
-
Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
Stranger03 » 29 июн 2015, 14:42
trash50 писал(а):Незагружается сервер:
не встроеном дисплее: error1410;
Вы там меняли процессор? Попробуйте джампером на плате сбросить НВРАМ. Ну и вытащить, с лупой посмотреть на контакты процессоров.
-
trash50
- Junior member
- Сообщения: 11
- Зарегистрирован: 26 фев 2010, 17:44
- Откуда: Казань
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
trash50 » 29 июн 2015, 15:02
Процессор не меняли.
Внешне повреждений на видно (пойду смотреть еще раз; и заодно искать ‘ашбепам’)…
-
Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
Stranger03 » 29 июн 2015, 15:27
trash50 писал(а):Процессор не меняли.
Внешне повреждений на видно (пойду смотреть еще раз; и заодно искать ‘ашбепам’)…
Судя по описанию ошибка связана с процом. Думаю где-то там искать истину.
-
trash50
- Junior member
- Сообщения: 11
- Зарегистрирован: 26 фев 2010, 17:44
- Откуда: Казань
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
trash50 » 29 июн 2015, 16:00
(Джампер) НВРАМ не нашел.
Дополнительно: На плате RAID-контроллера мигает светодиод: «HEART_BEAT_ERR»
-
maverlife
- Advanced member
- Сообщения: 186
- Зарегистрирован: 28 янв 2014, 08:31
- Откуда: Иркутск
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
maverlife » 29 июн 2015, 16:08
в гугле кстати достаточно информации. если два процессора, то поменяйте их местами и наблюдайте за работой. если ошибка перекочует на другой сокет, то виноват процессор. если останется на этом же сокете, то системная плата. ну а если все станет в порядке, то решать — стоит ли работать на потенциально неисправном сервере или вывести его под некритичные задачи.
-
Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
Stranger03 » 29 июн 2015, 16:09
trash50 писал(а):(Джампер) НВРАМ не нашел.
Ну почему ж вы такие ленивые (гугл: Dell PowerEdge2950 where is jumper NVRAM): http://www.serwerydell.eu/2950/it/jumpers.htm
Дополнительно: На плате RAID-контроллера мигает светодиод: «HEART_BEAT_ERR»
Можно попробовать разобрать, контакты прочистить спиртом, процессор и гнездо продуть основательно воздухом.
-
trash50
- Junior member
- Сообщения: 11
- Зарегистрирован: 26 фев 2010, 17:44
- Откуда: Казань
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
trash50 » 29 июн 2015, 16:27
Пардон искал явно НВРАМ (‘ашбепам’);
NVRAM находил — переставил (туда), переставил обратно — эффека нет (ничего не изменилось).
-
trash50
- Junior member
- Сообщения: 11
- Зарегистрирован: 26 фев 2010, 17:44
- Откуда: Казань
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
trash50 » 29 июн 2015, 16:32
Все еще беспокоит:
trash50 писал(а):… cветодиоды на дисках не светятся…
?
-
Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
Stranger03 » 29 июн 2015, 16:44
trash50 писал(а):Пардон искал явно НВРАМ (‘ашбепам’);
NVRAM находил — переставил (туда), переставил обратно — эффека нет (ничего не изменилось).
Надо полностью обесточить, переставить джампер, включить на пару секунд, выключить, вернуть назад. Может поможет. По другому пересобирать сервер. Без сервиса ничего другого не сделать.
-
Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
Stranger03 » 29 июн 2015, 16:45
trash50 писал(а):Все еще беспокоит:
trash50 писал(а):… cветодиоды на дисках не светятся…
?
Сервер не стартует, даже до биоса не доходит, с чего ему лампочками то мигать.
-
trash50
- Junior member
- Сообщения: 11
- Зарегистрирован: 26 фев 2010, 17:44
- Откуда: Казань
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
trash50 » 02 июл 2015, 08:56
День добрый, уважаемые
Докладываю: процессоры местами менял (джампер переставлял)
=> при загрузке:
сначала: l1910
потом (тоже самое): e1410
Вопрос 1: можно ли попробовать включить с одним (физически установленным) процессором (и каким)?
Вопрос 2: что можно еще попробовать?
-
Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
Stranger03 » 02 июл 2015, 10:01
trash50 писал(а):Вопрос 1: можно ли попробовать включить с одним (физически установленным) процессором (и каким)?
Вопрос 2: что можно еще попробовать?
Можно попробовать с одним, скачать мануал, посмотреть, как правильно устанавливать память. Там должна быть табличка.
-
trash50
- Junior member
- Сообщения: 11
- Зарегистрирован: 26 фев 2010, 17:44
- Откуда: Казань
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
trash50 » 02 июл 2015, 14:08
1.Попробовал включить с одним процессором №1 (процессором №2 не вставлен)
Таже ошибка (перемычкой манипулировал)
2.Memory
«««
Memory module, slot 1 — DIMM 1 — УСТАНОВЛЕН
Memory module, slot 5 — DIMM 5 — ПУСТО
Memory module, slot 2 — DIMM 2 — УСТАНОВЛЕН
-
Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Незагружается сервер: error1410 (Dell PowerEdge2950);
Сообщение
Stranger03 » 02 июл 2015, 14:48
trash50 писал(а):1.Попробовал включить с одним процессором №1 (процессором №2 не вставлен)
Таже ошибка (перемычкой манипулировал)
Тогда скорей всего что-то с платой. Или сдавайте в платный ремонт, или уносите на склад и покупайте новый.
Вернуться в «Серверы — Решение проблем»
Перейти
- Серверы
- ↳ Серверы — Конфигурирование
- ↳ Конфигурации сервера для 1С
- ↳ Серверы — Решение проблем
- ↳ Серверы — ПО, Unix подобные системы
- ↳ Серверы — ПО, Windows система, приложения.
- ↳ Серверы — ПО, Базы Данных и их использование
- ↳ Серверы — FAQ
- Дисковые массивы, RAID, SCSI, SAS, SATA, FC
- ↳ Массивы — RAID технологии.
- ↳ Массивы — Технические вопросы, решение проблем.
- ↳ Массивы — FAQ
- Майнинг, плоттинг, фарминг (Добыча криптовалют)
- ↳ Proof Of Work
- ↳ Proof Of Space
- Кластеры — вычислительные и отказоустойчивые ( SMP, vSMP, NUMA, GRID , NAS, SAN)
- ↳ Кластеры, Аппаратная часть
- ↳ Deep Learning и AI
- ↳ Кластеры, Программное обеспечение
- ↳ Кластеры, параллельные файловые системы
- Медиа технологии, и цифровое ТВ, IPTV, DVB
- ↳ Станции видеомонтажа, графические системы, рендеринг.
- ↳ Видеонаблюдение
- ↳ Компоненты Digital TV решений
- ↳ Студийные системы, производство ТВ, Кино и рекламы
- Инфраструктурное ПО и его лицензирование
- ↳ Виртуализация
- ↳ Облачные технологии
- ↳ Резервное копирования / Защита / Сохранение данных
- Сетевые решения
- ↳ Сети — Вопросы конфигурирования сети
- ↳ Сети — Технические вопросы, решение проблем
- Общие вопросы
- ↳ Обсуждение общих вопросов
- ↳ Приколы нашего IT городка
- ↳ Регистрация на форуме
Hi,
I recently purchased two X5650 CPUs for my R710 (from two different eBay listings), got them in the mail today, and started to install them.
When I booted up I got: «E1410 System Fatal Error detected.»
Then:
-
I removed CPU2, booted up, it worked (except for the memory complaining).
-
At this point I was quite certain the CPU was to blame.
-
Just to rule it out I put the other CPU in, and to my surprise that also booted fine (except for the memory complaining).
So both CPUs work on their own in CPU slot #1, but not with both in.
As far as I can see all the pins looks fine. The server had a dual CPU setup from before (so it’s not something new).
Any advice? Is there something I’m missing here?
EDIT:
-
BIOS is up to date. Or at least it should be, I ran the R710 update ISO earlier.
-
Original CPUs: 2 x X5570 2,93Ghz
-
This is an Dell R710, rev I
EDIT 2:
Here is a photo of the two CPUs side by side: http://imgur.com/V7SYMDL
CPU 1 says:
Intel(m)(c)'09 X5650
Intel(R) XEON(R)
SLBV3 COSTA RICA
2.66GHZ/12M/6.40
3136B254 (04)
CPU 2 says:
Intel(m)(c)'09 X5650
Intel(R) XEON(R)
SLBV3 MALAY
2.66GHZ/12M/6.40
L049A879 (04)
-
The CPUs are produced different places, but other than that they seem identical on paper
-
The CPUs has physically a little bit different «housing».
Versions (From iPerc)
-
BIOS Version: 6.4.0
-
Firmware Version: 2.85 (Build 04)
-
Lifecycle Controller Firmware: 1.7.5.4
EDIT 3:
-
Looks like they should be identical, and work together, but they aren’t. So I guess the solution is to buy a matching pair.
EDIT 4:
-
I reached out to my ebay seller, and he had never seen anything like this before, and said he would ship me a replacement CPU. So when that arrives in a good weeks time I’ll test again.
-
#1
As the title implies, I have installed a new Xeon E5606 in my PowerEdge R410. Greased the heatsink and installed that as well.
I have a 500W redundant power supply and there is 16GB of ram on that processor’s slot.
The fans go on full blast as usual when I plug it in. About 30 seconds, I get an error on the front LCD screen saying «E1410 System Fatal Error detected.» When I remove the processor, I can boot normally into ESX. Leading me to believe that I did something wrong with the processor.
What did I do wrong? It should be the right socket, and the right RAM. I’ll double check that and let you all know.
Thanks!
-
- Aug 18, 2009
-
- 128,073
-
- 1,588
-
- 156,390
- 25,217
-
#3
-
- Feb 27, 2013
-
- 1
-
- 0
-
- 10,510
- 0
-
#4
I have an R710 and having the same issue. Did you ever get this resolved?
Thanks
-
- Oct 4, 2016
-
- 97
-
- 0
-
- 1,710
- 26
-
#5
Dell’s website says it is something to do with the cpu not being recognized properly. Someone on dell’s forum said they checked the cpu and straightened out some pins and it worked again, but I checked mine and the pins look fine.
Any ideas?
Thread starter | Similar threads | Forum | Replies | Date |
---|---|---|---|---|
C
|
Question POST issue after installing CPU ? | Prebuilt & Enterprise | 7 | Jan 17, 2023 |
A
|
Question Proliant GL360 G7 — Installing OS’, and other questions? | Prebuilt & Enterprise | 5 | Jan 14, 2023 |
|
Question Dell 8930 not working after installing upgrades ? | Prebuilt & Enterprise | 2 | Dec 31, 2022 |
D
|
Question Install SSD as main drive, advice and input. | Prebuilt & Enterprise | 17 | Dec 12, 2022 |
D
|
Question Swapping out SSD on W11 prebuilt and installing W10 | Prebuilt & Enterprise | 17 | Nov 30, 2022 |
R
|
Question No Display after installing old graphics card ? | Prebuilt & Enterprise | 0 | Nov 14, 2022 |
D
|
[SOLVED] Installing RAM and a second SSD to an HP prebuilt | Prebuilt & Enterprise | 12 | Nov 11, 2022 |
|
Question Problems with Fujitsu Primergy TX200 S6 ? | Prebuilt & Enterprise | 1 | Aug 20, 2022 |
1
|
Question Can’t install anything on HP Proliant DL360 Gen9 ? | Prebuilt & Enterprise | 1 | Jul 1, 2022 |
C
|
[SOLVED] Best slot for Installing PCIe Esata Adapter Card ? | Prebuilt & Enterprise | 3 | Jun 1, 2022 |
- Advertising
- Cookies Policies
- Privacy
- Term & Conditions
- Topics
I bought a pair of matched Xeon x5660 processors to upgrade my Dell T410 from current x5620’s and got the E1410 error in the iDRAC for both CPU’s. I have the latest BIOS and firmware updates available for the box. I have cleared the logs for the iDRAC, pulled the AC and held down the power button to drain. No luck. After pulling second CPU and dropping to one DIMM in
A1, I was able to run on a single CPU and the error cleared for it. I was able to put 32GB of RAM back in on that CPU. Putting in second CPU brings problem right back. I have tested both cpu’s independently in the cpu1 position and they both work. When I put the old x5620’s back in and the error persists for CPU2 on them. Has anyone ever successfully gotten the errors to clear after trying all there is to find on google? Was thinking about pulling battery and NVRAM clear on the motherboard as well as the power drain and that is sort of my last shot. If nothing else I would like to Get it running on the two original cpu’s again. I will scrape the thermal grease off the die and check the stencils that the pair of cpu’s are indeed matched. Is there a chance the dual power supplies are too small for the fast hex core Xeons?
Code
Text
E1410
System Fatal
Error
detected.
E1414
CPU # temp
exceeding
range.
Check CPU
heatsink.
E1418
CPU # not
detected.
Check CPU
is seated
properly.
E141C
Unsupported
CPU config.
Check CPU or
BIOS revision.
E141F
CPU # protocol
error. Power
cycle AC.
32
About Your System
Causes
Specified processor has an
internal error. The error
may or may not have
been caused by
the processor.
Specified processor is out
of acceptable
temperature range.
Specified processor is
missing or bad,
and the system is in an
unsupported
configuration.
Processors are in an
unsupported
configuration.
The system BIOS
has reported a processor
protocol error.
Corrective Actions
Remove AC power to the
system for 10 seconds and
restart the system.
If the problem persists,
see «Getting Help» on
page 199.
Ensure that the processor
heat sinks are properly
installed. See
«Troubleshooting
Processors» on page 186
and «Troubleshooting
System Cooling
Problems» on page 176.
Ensure that the specified
processor is properly
installed. See
«Troubleshooting
Processors» on page 186.
Ensure that your
processors match and
conform to the type
described in the processor
technical specifications
outlined in your system’s
Getting Started Guide.
Remove AC power to the
system for 10 seconds and
restart the system.
If the problem persists,
see «Getting Help» on
page 199.