Hp smart array error 271

Проблема с RAID на сервере HP ProLiant DL380p G8 с контроллером HP Smart Array P420i Серверы Решение и ответ на вопрос 2597552

Всем доброго времени суток! Сразу извиняюсь за стену текста.

В 2015 году был установлен сервер HP ProLiant DL380p Gen8 с контроллером HP Smart Array P420i, все под управлением Windows Server 2008 R2. На сервере крутились 1С Бухгалтерии, Отдела кадров и производства (своя конфигурация). 8 SAS дисков (2 по 146 Гб и 6 по 300 Гб), RAID 5, 1 логический раздел. 32 Гб ОЗУ. 2 БП (до описанных событий к сети был подключен только один).

https://peta-eg.store/wp-conte… 1448-p.jpg (1600×477, 106.0Kb)

Специалист, который все ставил, уволился в том же году. Тот, кому были переданы дела — в прошлом году уехал в Германию (но связь поддерживает, но с такой или подобной проблемой не сталкивался и помочь ничем не может).

Сервером никто не занимался — раз-два в месяц делали бэкапы БД 1С, в прошлом году делали полный бэкап сервера. Никаких обновления BIOS, драйверов и прочих утилит от HP не делалось.

Суть проблемы:

10.03.2020 утром выходит из строя SAS диск (1 слот из 8, на 146 Гб), пытаемся запуститься без него для бэкапа и выгрузки необходимой инфы — ничего не происходит, система не грузится, сообщений или предупреждений о ребилде нет.
10.03.2020 вечером запускаем виртуалку Windows PE, подключаем внешний жесткий диск (USB) и качаем через Total Commander всю необходимую инфу.
10.03.2020 вечером (но позже) на предприятии происходит 2 скачка напряжения с отключением света. UPS срабатывает, держится до подачи электроэнергии.
10.03.2020 еще сразу после отключения/включения света — Total Cmd перестает копировать файлы на внешний ЖД с сообщением о ошибке прав доступа к файлам, хотя папки и файлы на сервере открываются. Сервер нами перезагружается, но доступа к логическим дискам теперь отсутствует (через виртуалку диски не видно), в BIOSe контроллера статус RAID 5 — FAILED, отсутствует диск в корзине №1.
10.03.2020 вставляем пустой SAS диск (146 Гб) в слот №1, пробуем запуститься с ним — результата 0. Ребилд не происходит. Завершаем работы и переносим все на следующий день.

11.03.2020 выходит из строя еще один SAS диск (8 слот из 8, на 300 Гб), заменить нечем (только заказали), вытаскиваем из слота. Появляется ошибка в POST — 1615-Power Supply Input Dailure in Bay 2. Подключается 2 БП — ошибка исчезает.
11.03.2020 перечитываем всю доступную информацию как от производителя так и форумы в поиске решения нахлынувших проблем и ошибок. Находим несколько вариантов, которые ничем не увенчались.
11.03.2020 при применении найденных решений узнаем, что встроенные утилиты не вызываются (HP Intelligent Provisioning и пр.)

12.03.2020 обновляем HP IP — он заработал, выдает 3 критических ошибки (вложение №1, сорри за качество) — 274 (о том, что диск в слоте №8 поврежден или отсутствует), 298 (Логический раздел потерял физический диск) и 271 (Логический раздел поврежден и не может быть использован).

В итоге: отлетел 1 диск, заменили, сервер не запустился, массив развалился. Отлете еще 1 диск, пока не заменили. Судя по статьям в сети — восстановить инфу (при потере 2 дисков) шансы близки к нулю, но надежда умирает последней)

Вопрос: Возможно ли, каким либо способом восстановить RAID массив и, желательно, сохранить данные? Если мы реорганизуем RAID (удалим старый из 8 дисков и создадим новый из 7) — возможно ли восстановить данные через R-Studio либо другие подобные утилиты?

Логи с IP по дискам прилагаю.

Заранее благодарю за ответы! И извиняюсь за качество слога, если что-то не понятно или нужна доп.информация — спрашивайте.

__________________
Помощь в написании контрольных, курсовых и дипломных работ, диссертаций здесь

Модераторы: Trinity admin`s, Free-lance moderator`s

Аватара пользователя

igornov

Advanced member
Сообщения: 194
Зарегистрирован: 15 окт 2002, 14:02
Откуда: Кривой Рог, Украина
Контактная информация:

Развалился 5-ТБ массив на HP Smart Array P410i

Hi All!

Ранее один из дисков вылетел, но на Spare контроллер почему-то его не поменял… мои админы проворонили это и… теперь массив вообще не поднимается. Посоветуйте что можно сделать… на массиве есть ряд важных данных.

Массив Raid 5 из 13 дисков SATA (по 500 Гб)


maverlife

Advanced member
Сообщения: 186
Зарегистрирован: 28 янв 2014, 08:31
Откуда: Иркутск

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

maverlife » 24 авг 2015, 06:24

можете более конкретно описать, что сообщает контроллер, статусы дисков — физических и логических?
а так думаю вам к специалистам по восстановлению данных из рейда. если есть бэкап, то дешевле, быстрее и проще поднять данные из него.


Аватара пользователя

Stranger03

Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

Stranger03 » 24 авг 2015, 13:24

igornov писал(а):Ранее один из дисков вылетел, но на Spare контроллер почему-то его не поменял… мои админы проворонили это и… теперь массив вообще не поднимается. Посоветуйте что можно сделать… на массиве есть ряд важных данных.

Если я првильно понял, то два диска вылетели с массива. Пробуйте по очереди эти диски вернуть в онлайн. По очереди. Если не получится, то только к дата-рекаверам. Но шансы на восстановление невелики.


Аватара пользователя

igornov

Advanced member
Сообщения: 194
Зарегистрирован: 15 окт 2002, 14:02
Откуда: Кривой Рог, Украина
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

igornov » 25 авг 2015, 09:41

maverlife писал(а):Если я првильно понял, то два диска вылетели с массива. Пробуйте по очереди эти диски вернуть в онлайн. По очереди. Если не получится, то только к дата-рекаверам. Но шансы на восстановление невелики.

факта вылета 2-х дисков из массива не вижу. Один сгорел 3 месяца назад, на его место как оказалось всё-таки встал hotspare. Сейчас же этот hotspare стоит так как будто он и никогда не вставал вместо сбойного диска… Ну а все остальные диски в статусе OK. Хотя сам массив в статусе failed.

Вы пишете по одному вернуть в онлайн... но они все в статусе ОК + в утилитах к этому массиву нету никаких инструментов чтобы это сделать… можно только расширить массив, создать Spare или удалить массив…


Аватара пользователя

igornov

Advanced member
Сообщения: 194
Зарегистрирован: 15 окт 2002, 14:02
Откуда: Кривой Рог, Украина
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

igornov » 25 авг 2015, 10:12

maverlife писал(а):можете более конкретно описать, что сообщает контроллер, статусы дисков — физических и логических?
а так думаю вам к специалистам по восстановлению данных из рейда. если есть бэкап, то дешевле, быстрее и проще поднять данные из него.

вот сообщает контроллер:

298 SATA Array B with Spare — 1 Logical Drive(s) contains a failed physical drive. To correct this problem, check the data and power connections to the physical drives or replace the failed drive. For more information, generate a diagnostics report under the Diagnostics tab.

274 0 MB SATA Drive at Port 4C : Box 2 : Bay 1 is bad or missing.
To correct this problem, check the data and power connections to the physical drive.

For more information, generate a diagnostics report under the Diagnostics tab.
271 (Failed) Logical Drive 2 (5.5 TB, RAID 5) has failed and cannot be used. All data on this logical drive has been lost. Configuration changes to this logical drive are not allowed until this problem is corrected. Also, if your controller supports Expansion, Extension, or Migration, these operations will not be available for any logical drives in the array until the problem is corrected.

Replace any failed physical drives and re-enable the failed logical drive. For more information, generate a diagnostics report under the Diagnostics tab.

Статусы физических дисков — ОК

Логический диск в статусе Failed


Аватара пользователя

Stranger03

Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

Stranger03 » 25 авг 2015, 10:28

igornov писал(а):факта вылета 2-х дисков из массива не вижу. Один сгорел 3 месяца назад, на его место как оказалось всё-таки встал hotspare. Сейчас же этот hotspare стоит так как будто он и никогда не вставал вместо сбойного диска… Ну а все остальные диски в статусе OK. Хотя сам массив в статусе failed.

У вас был Р5 из скольки-то дисков + хотспаре, один диск вылетел, на его место «встал» диск с хотспаре.
1. с чего вы сделали такой вывод?
2. у вас есть рейдгруппа, в группе все диски в онлайн (не ОК, а онлайн)?


Аватара пользователя

Stranger03

Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

Stranger03 » 25 авг 2015, 10:31

igornov писал(а):298 SATA Array B with Spare — 1 Logical Drive(s) contains a failed physical drive. To correct this problem, check the data and power connections to the physical drives or replace the failed drive. For more information, generate a diagnostics report under the Diagnostics tab.

Если массив в состоянии файлед, значит пара дисков из него лежит. Если все диски в онлайне включая тот странный диск с хотспаре, но группа лежит, то значит где-то логическая ошибка. Попробуйте поодиночке переводил диски в группе в оффлайн и обратно. Может и взлетит. Но я бы уже пошел к дата-рекаверам.


Аватара пользователя

igornov

Advanced member
Сообщения: 194
Зарегистрирован: 15 окт 2002, 14:02
Откуда: Кривой Рог, Украина
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

igornov » 25 авг 2015, 12:00

Stranger03 писал(а):
Если массив в состоянии файлед, значит пара дисков из него лежит. Если все диски в онлайне включая тот странный диск с хотспаре, но группа лежит, то значит где-то логическая ошибка. Попробуйте поодиночке переводил диски в группе в оффлайн и обратно. Может и взлетит. Но я бы уже пошел к дата-рекаверам.

Все диски в онлайне… только вот функционала по выводу дисков в офлайн (и обратно в онлайн) в отличии от других моделей массивов (не HP) нету вообще. Я могу только удалить массив и создать по новой… но при этом скорее всего запустится инициализация массива, которая затрёт данные. В настройках контроллера тоже нету ничего как это можно отключить?

Подскажите плиз где в утилитах HP Smart Array P410i есть сиё? (перевод в офлайн и обратно + отключении инициализации)


Аватара пользователя

Stranger03

Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

Stranger03 » 25 авг 2015, 12:16

igornov писал(а):Подскажите плиз где в утилитах HP Smart Array P410i есть сиё? (перевод в офлайн и обратно + отключении инициализации)

Посмотрю, выложите логи и скриншоты с ACU.


Аватара пользователя

Stranger03

Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

Stranger03 » 25 авг 2015, 12:35

igornov
Мда, все документы, что я нашел по этому контроллеру, отправляют в саппорт ХП. По крайней мере траблшутинг у них один — коннект то саппорт ХП.


Аватара пользователя

igornov

Advanced member
Сообщения: 194
Зарегистрирован: 15 окт 2002, 14:02
Откуда: Кривой Рог, Украина
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

igornov » 25 авг 2015, 12:41

Stranger03 писал(а): igornov
Мда, все документы, что я нашел по этому контроллеру, отправляют в саппорт ХП. По крайней мере траблшутинг у них один — коннект то саппорт ХП.

то есть скриншоты и логи уже ни к чему?


Аватара пользователя

Stranger03

Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

Stranger03 » 25 авг 2015, 12:58

igornov писал(а):то есть скриншоты и логи уже ни к чему?

Ну это только подозрения, за действия ручаться не могу. Но суть примерно в следующем. У вас по вашим словам работал Р5, вылетел диск, на его место встал хотспаре. Вот этот момент надо бы по логам посмотреть, ибо все только с ваших слов. Если все так, то в каком-то промежутке времени массив был в норме. Тут что-то произошло, массиву пришел кирдык. Произойти это могло в двух случаях:
1. вылетели два диска
2. вылетел один диск, в момент вылета произошел программный сбой внутри контроллера.
Далее (чисто предположения), два сбойных диска после перезагрузки вдруг нарисовались в онлайне, но из-за рассинхронизации данных массиву пришел кирдык. Вот и надо выяснить, что это за диск. Для этого надо смотреть полный лог.
Что б я еще сделал, все диски протестил бы на другом компе утилитами на предмет физических ошибок, смарты, бедблоки и так далее. Возможно один из дисков совсем плохой. Вот без него можно было бы попробовать стартануть. Но для кучи я бы перед всеми процедурами с каждого диска снял слепки. Ибо велика вероятность вам пойти к дата рекаверам.


Аватара пользователя

igornov

Advanced member
Сообщения: 194
Зарегистрирован: 15 окт 2002, 14:02
Откуда: Кривой Рог, Украина
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

igornov » 25 авг 2015, 13:23

Stranger03 писал(а):

igornov писал(а):Подскажите плиз где в утилитах HP Smart Array P410i есть сиё? (перевод в офлайн и обратно + отключении инициализации)

Посмотрю, выложите логи и скриншоты с ACU.

Вложения
Физические
Физические
Логические диски
Логические диски
report-47be8f98-00000fc8-00000000.zip
Все логи
(243.33 КБ) 407 скачиваний


Аватара пользователя

Stranger03

Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

Stranger03 » 25 авг 2015, 13:57

«igornov»
Вот что я вижу:

26-го мая вылетел диск Box 2: Bay 1:

Код: Выделить всё

===== Start of Option ROM POST Message Log =====
1719-Slot 0 Drive Array - A controller failure event occurred prior to this
     power-up.  (Previous lock up code = 0xAB)
1792-Slot 0 Drive Array - Valid Data Found in Array Accelerator
     Data will automatically be written to drive array.
1784-Slot 0 Drive Array - Drive Failure
     The following disk drive(s) are failed and should be replaced:
         Port 4C: Box 2: Bay 1
     On-Line Spare Drive Active
===== End of Option ROM POST Message Log =====

Вам выло предложено заменить диск. Хотспаре не сработал. Далее по перезагрузкам видно, что этот диск все время был в состоянии сбоя до 22 августа, когда вылетел еще один диск Box 2: Bay 8:

Код: Выделить всё

===== Start of Option ROM POST Message Log =====
1792-Slot 0 Drive Array - Valid Data Found in Array Accelerator
     Data will automatically be written to drive array.
1784-Slot 0 Drive Array - Logical Drive Failure
     The following disk drive(s) are failed and should be replaced:
         Port 4C: Box 2: Bay 8
===== End of Option ROM POST Message Log =====

Ну а далее можно уже не смотреть. Хоспаре не встал, двум дискам кирдык, шансы на восстановление почти равны нулю.


Аватара пользователя

Stranger03

Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Развалился 5-ТБ массив на HP Smart Array P410i

Сообщение

Stranger03 » 25 авг 2015, 13:58

igornov
Вытаскивайте диски из 1-го и 8-го бокса, проверяйте утилитами. Если в 8-м боксе диск живой, попробуйте стартануть без 1-го диска. Может и получится. Хотспаре у вас не сработал.


Вернуться в «Массивы — Технические вопросы, решение проблем.»


Перейти

  • Серверы
  • ↳   Серверы — Конфигурирование
  • ↳   Конфигурации сервера для 1С
  • ↳   Серверы — Решение проблем
  • ↳   Серверы — ПО, Unix подобные системы
  • ↳   Серверы — ПО, Windows система, приложения.
  • ↳   Серверы — ПО, Базы Данных и их использование
  • ↳   Серверы — FAQ
  • Дисковые массивы, RAID, SCSI, SAS, SATA, FC
  • ↳   Массивы — RAID технологии.
  • ↳   Массивы — Технические вопросы, решение проблем.
  • ↳   Массивы — FAQ
  • Майнинг, плоттинг, фарминг (Добыча криптовалют)
  • ↳   Proof Of Work
  • ↳   Proof Of Space
  • Кластеры — вычислительные и отказоустойчивые ( SMP, vSMP, NUMA, GRID , NAS, SAN)
  • ↳   Кластеры, Аппаратная часть
  • ↳   Deep Learning и AI
  • ↳   Кластеры, Программное обеспечение
  • ↳   Кластеры, параллельные файловые системы
  • Медиа технологии, и цифровое ТВ, IPTV, DVB
  • ↳   Станции видеомонтажа, графические системы, рендеринг.
  • ↳   Видеонаблюдение
  • ↳   Компоненты Digital TV решений
  • ↳   Студийные системы, производство ТВ, Кино и рекламы
  • Инфраструктурное ПО и его лицензирование
  • ↳   Виртуализация
  • ↳   Облачные технологии
  • ↳   Резервное копирования / Защита / Сохранение данных
  • Сетевые решения
  • ↳   Сети — Вопросы конфигурирования сети
  • ↳   Сети — Технические вопросы, решение проблем
  • Общие вопросы
  • ↳   Обсуждение общих вопросов
  • ↳   Приколы нашего IT городка
  • ↳   Регистрация на форуме

This appendix lists the error codes that can be returned by HP Smart Array Controller Option ROM

during Power-On Self Test (POST), and provides details of corrective actions you can take.

POST error codes

The Smart Array Controller provides diagnostic error messages to the server BIOS at reboot. Many

of these POST messages are self-explanatory and suggest corrective actions for troubleshooting.

Detailed information and corrective actions are listed in

The Level column in

None

Informational

Critical

Table 20 Smart Array controller POST error codes

Error

code

1713

Slot z Drive Array Controller — Redundant ROM

Reprogramming Failure.

1714

Slot z Drive Array Controller — Redundant ROM

Checksum Error.

1715

Slot z Drive Array Controller – Memory Error(s)

Occurred Warning: Corrected Memory Error(s)

were detected during Controller memory self-test…

1720

Slot z Drive Array — S.M.A.R.T. Hard Drive Detects

Imminent Failure Port 1I: Box 1: Bay 2

1721

Slot z Drive Array — Drive Parameter Tracking

Predicts Imminent Failure.

The following drives should be replaced when

conditions permit: Port 1I: Box 1: Bays 2, 3.

1724

Slot z Drive Array — Physical Drive Position

Change(s) Detected — Logical drive configuration

has automatically been updated.

1726

Slot z Drive Array — Array Accelerator Memory

Size Change Detected.

Array Accelerator configuration has automatically

been updated.

1727

Slot z Drive Array — New Logical Drive(s)

Attachment Detected.

(if more than 32 logical drives are configured, this

will be followed by:)

Auto-configuration failed: Too many logical drives.

1728

Slot z Drive Array — Abnormal Shut-Down Detected

with Write-Cache Enabled.

No Array Accelerator battery backup on this

model array controller. Any data that may have

been in Array Accelerator memory has been lost.

Table 20

indicates the severity of the error:

No F1 prompt is triggered.

An F1 prompt is triggered, unless a POST prompt timeout is configured.

The controller always requests the System ROM to display the F1 prompt,

although this can still be disabled through system configuration.

Description

Table

20.

Level

Critical

Replace the controller if this error

persists after restarting the system.

Critical

Backup ROM has been activated.

Check firmware version.

Critical

Replace the controller if this error

persists.

Informational

Note the physical disk that has been

identified as failing.

Informational

Note the physical disks that have been

identified as failing.

Informational

None.

Informational

None.

Critical if lost

Reduce the number of logical drives

logical drives;

in the system. See

otherwise

«Configuration» (page

Informational

Critical

Data loss may have occurred. Contact

your HP support representative for

assistance.

Corrective action

Chapter 3:

40).

POST error codes

1 1 1

Like this post? Please share to your friends:
  • Hp setup error no devices found on bus usb
  • Hp scanjet enterprise flow 5000 s2 usb error
  • Hp recommends using hp batteries only как убрать ошибку
  • Hp psc 1513 ошибка е
  • Hp psc 1410 ошибка е мигает капля