0 / 0 / 0 Регистрация: 17.02.2013 Сообщений: 45 |
|
1 |
|
21.04.2016, 16:35. Показов 4960. Ответов 4
Друзья, помогите начинающему сисадмину. На сервере был зеркальный райд из двух дисков 500 Гб.
__________________
0 |
1187 / 917 / 367 Регистрация: 02.09.2012 Сообщений: 2,798 |
|
22.04.2016, 13:40 |
2 |
1. Прямо сейчас проверить бакапы! если нет, срочно сделать
0 |
1376 / 508 / 99 Регистрация: 11.03.2015 Сообщений: 1,735 |
|
22.04.2016, 15:02 |
3 |
tantin,
0 |
0 / 0 / 0 Регистрация: 17.02.2013 Сообщений: 45 |
|
07.05.2016, 06:04 [ТС] |
4 |
бекапы сделаны, райд софтовый есть и райд-контроллер, модель чего и чьи настройки вам сообщить?
0 |
Почетный модератор 28037 / 15768 / 981 Регистрация: 15.09.2009 Сообщений: 67,753 Записей в блоге: 78 |
|
07.05.2016, 09:38 |
5 |
модель и настройки всего.
0 |
Модераторы: Trinity admin`s, Free-lance moderator`s
-
[RAF]TAHKuCT
- Advanced member
- Сообщения: 138
- Зарегистрирован: 19 окт 2002, 15:49
- Откуда: г. Волжский, Волгоградская область
- Контактная информация:
Восстановление RAID5 с 2 дисками в offline
Cитуация такая — имеем контроллер Intel SRCU31 со старым интеловским софтом, 4 диска RAID5 (3 в массиве + 1 hot fix). Во время работы два винта из массива уходят в offline. Есть ли возможность восстановить массив?
Еще один вопрос по вышеописанной ситуации — раньше на том сервере периодически винты вылетали из райда, но по одному В чем может быть причина? Конфигурация сервера: SC5000, STL2, 2xPIII1000EB, SRCU31 (старый софт, интеловский)
Да, вот еще — в конторе проблемы с питанием постоянные. Но стоит UPS 1000VA. Я смотрел логи на сервере — чуть ли не каждую ночь аварийное выключение. По идее сервер нормально выключается (ups smart). Ведь из за этого не должны же винты из массива выпадать?
-
[RAF]TAHKuCT
- Advanced member
- Сообщения: 138
- Зарегистрирован: 19 окт 2002, 15:49
- Откуда: г. Волжский, Волгоградская область
- Контактная информация:
Сообщение
[RAF]TAHKuCT » 30 ноя 2002, 11:30
Так, почему винты отваливаются — я уже нашел. корзина SC5000 тому причина — support.intel.com помог мне . Остается вопрос по восстановлению массива.
-
Wizard
- Advanced member
- Сообщения: 185
- Зарегистрирован: 09 сен 2002, 11:34
- Откуда: SPb
-
Контактная информация:
Сообщение
Wizard » 02 дек 2002, 13:38
Если отвалились 2 диска из 5 рейда, то уже гарантировать полное востановление скорее всего невозможно, но есть вариант: поднять один из дисков в онлайн (тот который вылетел последним или тот который больше нравится ) и попробовать запустить операционку, потом ессесно бакап, и можно попробовать на другом диске после его форматирования пустить ребилд, ну и в окончание процедуры можно проверить check consistance — через такую последовательность теоретически/практически можно востановить массив.
P.S. Самое главное не переводить 2 диска в онлайн, это чаще всего ведёт к 100% убиванию массива.
-
gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Сообщение
gs » 02 дек 2002, 19:43
поднимать два винта можно, только информация может быть покорежена, если они сдохли не одновременно. эта операция обратима, так что не страшно. попробуйте поднять один винт на выбор. если информация прочитается, то бэкап и ПОТОМ ребилд. а лучше формат всех винтов или проверка типа IBM Drive Fitness Test.
нельзя без полной уверенности делать ребилд — это смерть 100%, если конфиг некорректный.
кстати, два винта обычно просто так не вылетают. это скорее всего сбой логический (так себя ведут IBM DDYS с прошивкой S80D) — в этом случае проблем нет. или электрический, тогда все плохо.
если оба винта сдохли физически, то ПЦ.
иногда бывает так, что один диск дохнет напрочь, а второй покрывается бэдами — тогда как повезет, попадет бэд на нужные файлы или нет. в этом случае если не грузится система, то можно поставить какой-нибудь идеешник с системой и попытаться скопировать информацию, если партиция видна.
в нашей практике не раз уже бывали ситуации, когда диски пачками вылетали. конкретно у моих клиентов дважды было виновато электричество.
дело в том, что юпс не спасает от помехи по земле (вернее по ее отсутствию — в России заземляться не принято
так что проверяйтесь.
и не делайте ребилд, пока данные не сольете.
-
[RAF]TAHKuCT
- Advanced member
- Сообщения: 138
- Зарегистрирован: 19 окт 2002, 15:49
- Откуда: г. Волжский, Волгоградская область
- Контактная информация:
Сообщение
[RAF]TAHKuCT » 06 дек 2002, 21:26
Переход винтов в состояние offline в данном случае — дело корзины. У Intel-а на саппорте этот трабл описывается. Там какие то проблемы возникают, когда хорошая нагрузка на винты. Исправляется перепрошивкой корзины.
Большое спасибо за советы!!! Нет, я бы даже сказал, ОГРОМНОЕ СПАСИБО!!!
-
Daniel
- Junior member
- Сообщения: 2
- Зарегистрирован: 19 янв 2003, 20:52
- Откуда: Екатеринбург
- Контактная информация:
Сообщение
Daniel » 19 янв 2003, 20:59
Тогда подскажите, почему в такой конфигурации SC5000, STL2,Mylex AcceleRAID 352 происходит то же самое. При повышении нагрузки на массив (обильная работа с базой данных) падает винда с синим экраном и потом при старте пишет -SCSI dead. Причем после того, как я этот рэйд вынул, и на родной контроллер подключился — все нормально. Никаких сбоев.
Правка:
Понял в чем дело. Корзина. Перепрошить. Вот ведь…
Вернуться в «Массивы — Технические вопросы, решение проблем.»
Перейти
- Серверы
- ↳ Серверы — Конфигурирование
- ↳ Конфигурации сервера для 1С
- ↳ Серверы — Решение проблем
- ↳ Серверы — ПО, Unix подобные системы
- ↳ Серверы — ПО, Windows система, приложения.
- ↳ Серверы — ПО, Базы Данных и их использование
- ↳ Серверы — FAQ
- Дисковые массивы, RAID, SCSI, SAS, SATA, FC
- ↳ Массивы — RAID технологии.
- ↳ Массивы — Технические вопросы, решение проблем.
- ↳ Массивы — FAQ
- Майнинг, плоттинг, фарминг (Добыча криптовалют)
- ↳ Proof Of Work
- ↳ Proof Of Space
- Кластеры — вычислительные и отказоустойчивые ( SMP, vSMP, NUMA, GRID , NAS, SAN)
- ↳ Кластеры, Аппаратная часть
- ↳ Deep Learning и AI
- ↳ Кластеры, Программное обеспечение
- ↳ Кластеры, параллельные файловые системы
- Медиа технологии, и цифровое ТВ, IPTV, DVB
- ↳ Станции видеомонтажа, графические системы, рендеринг.
- ↳ Видеонаблюдение
- ↳ Компоненты Digital TV решений
- ↳ Студийные системы, производство ТВ, Кино и рекламы
- Инфраструктурное ПО и его лицензирование
- ↳ Виртуализация
- ↳ Облачные технологии
- ↳ Резервное копирования / Защита / Сохранение данных
- Сетевые решения
- ↳ Сети — Вопросы конфигурирования сети
- ↳ Сети — Технические вопросы, решение проблем
- Общие вопросы
- ↳ Обсуждение общих вопросов
- ↳ Приколы нашего IT городка
- ↳ Регистрация на форуме
Привет, друзья. В прошлой статье мы с вами создали RAID 1 массив (Зеркало) — отказоустойчивый массив из двух жёстких дисков SSD. Смысл создания RAID 1 массива заключается в повышении надёжности хранения данных на компьютере. Когда два жёстких диска объединены в одно хранилище, информация на обоих дисках записывается параллельно (зеркалируется). Диски являются точными копиями друг друга, и если один из них выйдет из строя, мы получим доступ к операционной системе и нашим данным, ибо их целостность будет обеспечена работой другого диска. Также конфигурация RAID 1 повышает производительность при чтении данных, так как считывание происходит с двух дисков. В этой же статье мы рассмотрим, как восстановить массив RAID 1, если он развалится. Другими словами, мы рассмотрим, как сделать Rebuild RAID 1.
Развал RAID 1 массива может произойти по нескольким причинам: отказ одного из дисков, ошибки микропрограммы БИОСа, неправильные действия пользователя компьютера. При развале RAID 1 в БИОСе у него будет статус «Degraded».
В таких случаях нужно произвести восстановление (Rebuild) массива. Каким образом это можно сделать? К примеру, при отказе одного накопителя мы просто подсоединяем другой исправный, затем жмём в БИОСе кнопку «Rebuild», и происходит синхронизация данных на дисках. Таким вот образом RAID 1 массив восстанавливается, и мы можем работать дальше. Вроде, всё просто. Однако на практике при возникновении такой проблемы много нюансов. Давайте подробно рассмотрим все особенности восстановления RAID.
Если созданный с помощью БИОСа материнской платы RAID 1 массив развалился, неопытный пользователь может этого сразу и не понять. Мы не получим ни звукового оповещения, ни оповещения в иной форме, сигнализирующих о проблеме развала RAID 1. Возможностями аварийной сигнализации при развале массивов обладают только отдельные SAS/SATA/RAID-контроллеры, работающие через интерфейс PCI Express. За аварийную сигнализацию при проблемах с массивами отвечает специальное ПО таких контроллеров. Не имея таких контроллеров, можем использовать программы типа CrystalDiskInfo или Hard Disk Sentinel Pro, которые предупредят нас о выходе из строя одного из накопителей массива звуковым сигналом, либо электронным письмом на почту.
Если заглянем в управление дисками Windows, о развале RAID 1 можем догадаться, например, по исчезновению разметки одного из дисков.
Но лучше, конечно, чтобы на компьютере был установлен родной софт от производителя чипсета материнской платы, выполняющий задачи по обслуживанию RAID-массивов. И именно этот софт должен вывести сообщение о деградации массива из-за выхода из строя одного из накопителей. Ещё такой софт должен выполнять постоянное наблюдение за техническим состоянием массива. И при замене вышедшего из строя диска на исправный на таком софте лежит ответственность за быстрое перестроение рассыпавшегося массива.
Для примера возьмём мою материнскую плату на чипсете Z490 от Intel, для которого существует специальное программное обеспечение Intel Rapid Storage Technology (Intel RST). Технология Intel Rapid Storage поддерживает SSD SATA и SSD PCIe M.2 NVMe, повышает производительность компьютеров с SSD-накопителями за счёт собственных разработок. Всесторонне обслуживает массивы RAID в конфигурациях 0, 1, 5, 10. Предоставляет пользовательский интерфейс Intel Optane Memory and Storage Management для управления системой хранения данных, в том числе дисковых массивов.
После установки Intel RST в главном окне увидим созданный нами из двух SSD M.2 NVMe Samsung 970 EVO Plus (250 Гб) RAID 1 массив, исправно функционирующий.
Вот этот массив в управлении дисками Windows.
И в диспетчере устройств.
Технология Intel Rapid Storage имеет свою службу и постоянно мониторит состояние накопителей. На данный момент все находящиеся в рейде диски исправны.
Если какой-либо накопитель неисправен, драйвер Intel RST сразу предупредит всплывающим окном о проблеме «Требуется внимание. Производительность одного из ваших томов снижена».
И в главном окне программы будет значиться, что один из дисков массива неисправен.
В этом случае можно произвести диагностику неисправного накопителя специальным софтом, к примеру, программой Hard Disk Sentinel Pro. Если диск неисправен или отработал свой ресурс, выключаем компьютер и заменяем диск на новый. Затем делаем Rebuild (восстановление) RAID 1 массива.
После замены неисправного диска включаем ПК и входим в БИОС. Заходим в расширенные настройки «Advanced Mode», идём во вкладку «Advanced». Переходим в пункт «Intel Rapid Storage Technology».
Видим, что наш RAID 1 массив с названием Volume 1 неработоспособен — «Volume 1 RAID 1 (mirroring), Degraded».Выбираем «Rebuild» (Восстановить).
Обратим внимание на уведомление внизу: «Selecting a disk initiates a rebuild. Rebuild completes in the operating system», переводится как «Выбор диска инициирует перестройку массива. Восстановление завершается в операционной системе». Выбираем новый накопитель, который нужно добавить в массив для его восстановления, жмём Enter. Появится следующий экран, указывающий, что после входа в операционную систему будет выполнено автоматическое восстановление — «All disk data will be lost», переводится как «Все данные на диске будут потеряны».RAID 1 массив восстановлен.
Жмём F10, сохраняем настройки, произведённые нами в БИОСе, и перезагружаемся.
После перезагрузки открываем программу Intel Optane Memory and Storage Management и видим, что всё ещё происходит перестроение массива, но операционной системой уже можно пользоваться.
Восстановить дисковый массив можно непосредственно в программе Intel Optane Memory and Storage Management. К примеру, у нас неисправен один диск массива, и Windows 10 загружается с исправного накопителя. Выключаем компьютер, отсоединяем неисправный, а затем устанавливаем новый SSD PCIe M.2 NVMe, включаем ПК. Программа Intel Optane Memory and Storage Management определяет его как неизвестный жёсткий диск.
Диспетчер устройств, как и управление дисками, не видит целостный RAID, а видит два разных SSD.
В главном окне программы жмём «Создать том RAID».
У нас SSD нового поколения с интерфейсом PCIe M.2 NVMe, значит, выбираем контроллер PCIe. Тип дискового массива — «Защита данных в режиме реального времени (RAID 1)».
Выбираем два наших диска SSD PCIe M.2 NVMe.
Если на новом диске были данные, после перестроения массива данные на нём удалятся. Жмём «Создать том RAID». Можем наблюдать процесс восстановления массива.
RAID 1 массив восстановлен.
Если включить в настройках программы Intel RST «Автоматическое перестроение при оперативной замене», при замене неисправного накопителя не нужно будет ничего настраивать. Восстановление дискового массива начнётся автоматически.
Если у вас выйдут из строя сразу оба накопителя, то покупаем новые, устанавливаем в системный блок, затем создаём RAID 1 заново и разворачиваем на него резервную копию.