Get smart attributes error victoria - Исправление ошибок и поиск оптимальных решений проблем

EXCITER2001

Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Sergei_Kazanskij

Здравствуйте! Такой вопрос, имею HDD WD HUH721010ALN604 , диск практически новый, ему месяц. Три раза сбрасывал смарт, т.к. по непонятной причине несколько раз вырастал параметр 189. Ну и чтобы не мозолил глаза, я с помощью Вашей утилиты делал сброс смарта. Так вот, почему то сбрасываются далеко не все параметры. Сбросились ID: 1, 8, 189, 222. Остальные не сбросились, к примеру ID: 9, 192, 193 , и др. Вопрос — это так и должно быть,или я что-то не то делаю? Вообще в логе пишет вот так:

0:19:22 : Vendor mode ON. OK
0:19:23 : Clear SMART Attributes, process 1. error: ABRT
0:19:23 : Clear SMART Attributes, process 2. OK
0:19:23 : Init SMART Worsts, process 1. error: ABRT
0:19:23 : Init SMART Worsts, process 2. OK
0:19:24 : Vendor mode OFF. OK

То есть почему то process 1 — ошибка, а вот process 2 — ОК (я так понял, поэтому и что-то не стерлось,а что-то стерлось)

Вопрос — это так и должно быть?? Или нужно как-то по-другому использовать эту функцию?

Вообще заметил такой глюк: если запускаю программу из под рабочей Win10, то невозможно регулировать ползунком APM на этом HDD, у меня постоянно цокали головки, раз в 5 секунд примерно, и что я только не выставлял (и 128, и около того), цоканье не прекращалось,при этом даже при отключенном SATA шлейфе!! То есть видимо я когда игрался с этим ползунком, то что-то некорректно переключилось, и уже не захотело возвращаться назад.

Из ситуации вышел, загрузившись с Live USB , там с помощью программы HDD Scan (Ваша почему-то также не давала никакого эффекта), увидел, что APM почему-то выставлен не на 128,а на 126!. В этой же программе я его выставил на 128, и после этого головки снова стали парковаться примерно после минуты простоя.

Вопрос — может и смарт надо сбрасывать из Live USB ??

И еще такой вопрос, может немного не в тему — если выставить APM на 254 (то есть отключить автопарковку по неактивности), то почему головки начинают стучать каждые 5 секунд в простое. Я вот это не могу понять уже целый месяц. Ведь если головки распаркованы, и если нет активности на HDD, то что их заставляет стучать с ровным интервалом каждые 5 секунд?? И зачем.

Можно ли сделать так на этом HDD, чтобы и головки не парковались, и чтобы они не стучали каждые 5 секунд при неактивности, как это сделать?? У меня есть даташит на этот HDD (ссылка ниже), там какая-то куча 16ричных параметров для разных режимов, в т.ч. для Idle, есть даже возможность снижать обороты с 7200 до 6300 (по-моему), но я не понимаю как всем этим пользоваться,что нужно сделать,что программировать и как,и где?? Я так понял ползунок APM как раз эти регистры и меняет?? Как понять какие регистры какому положению ползунка соответствуют??

Прошу если можно поподробнее ответить на эти вопросы, потому что функционал и в HDD и в Вашей программе как я понимаю, присутствует, но как всем этим пользоваться — непонятно.

P.S. Немного разобрался с последним вопросом по поводу режимов APM, оказывается в этом мануале есть вот такое описание:

Сейчас выставил в CrystalDisk параметр 40h, диск стал снижать обороты, это и слышно, и вибрация существенно снизилась.

В связи с этим назрел еще вопрос — у меня HDD включен круглосуточно 24/7/365, насколько сильно будет влиять на его долговечность пользование такими вот режимами APM , где паркуются головки и снижаются обороты? Вопрос быстродействия меня не волНУЕТ, винт достаточно быстро выходит в рабочий режим, но вот насколько сильно он будет изнашиваться?? За месяц парковок набежало 1600 штук, при этом производитель гарантирует общее количество 600 000 парковок.

И остается открытым вопрос, можно ли сделать так,чтобы и головки не парковались, и при этом и не щелкали каждые пять секунд. и вообще, что является природой (причиной) этих циклических щелчков при отключенном APM??

Источник

266 / 71 / 11

Регистрация: 29.05.2011

Сообщений: 2,049

30.01.2016, 15:54. Показов 4954. Ответов 8

Время от времени загрузка ОС (Win7) начинается с «восстановления» — «поиск файлов» и т.д. Но система грузится и работает в общем-то нормально.
Запустил Викторию. Диск опознается, инициализируется нормально, сканирование тож запускается.
Но при попытке получить смарт — вот тое самое сообщение.

Диск Samsung HD200HJ. 200Гиг.

Добавлено через 14 минут
ЗЫ Вика 3.51

абырвалг:)

1579 / 657 / 67

Регистрация: 11.04.2013

Сообщений: 2,460

30.01.2016, 16:06

Лучше покажите СМАРТ из КристалДискИнфо.

266 / 71 / 11

Регистрация: 29.05.2011

Сообщений: 2,049

30.01.2016, 16:39

[ТС]

gidrontaur, я так понимаю, нижняя таблица в окне проги — и есть смарт?
Там у меня все пусто.
Диск определился только через «Расширенный поиск дисков».
Далее кое-какие данные о нем,
Техсостояние — неизвестно, температура не отображается.

ЗЫ CrystalDiskInfo 6.7.3

абырвалг:)

1579 / 657 / 67

Регистрация: 11.04.2013

Сообщений: 2,460

30.01.2016, 16:41

Сообщение от Bazaroff

я так понимаю, нижняя таблица в окне проги — и есть смарт?

Нет. Если в Вике, то надо нажимать SMART — GetSMART, а в КристалДискИнфо ничего не нужно нажимать, достаточно запустить программу.

266 / 71 / 11

Регистрация: 29.05.2011

Сообщений: 2,049

30.01.2016, 16:44

[ТС]

Сообщение от gidrontaur

в КристалДискИнфо

Да, я это уже в этой проге.

266 / 71 / 11

Регистрация: 29.05.2011

Сообщений: 2,049

30.01.2016, 16:56

[ТС]

Миниатюры

абырвалг:)

1579 / 657 / 67

Регистрация: 11.04.2013

Сообщений: 2,460

30.01.2016, 17:20

Второй раз такое вижу с этой прогой. Тогда СМАРТ показал HDDScan.

19 / 19 / 6

Регистрация: 22.12.2012

Сообщений: 2,261

02.11.2018, 02:49

У меня такая же ситуация. Диск пашет, но в Кристал Диск Инфо тоже «Неизвестно». Кто-нибудь в курсе, в чем проблема?
Спасибо.

Модератор

20529 / 12415 / 2189

Регистрация: 23.11.2016

Сообщений: 62,071

Записей в блоге: 23

02.11.2018, 09:30

morda77, Попробуйте загрузиться из-под Виктории, но из ДОСа. Либо де из-под HDAT2 оттуда же. И посмотреть смарт из дос-овских програм

Источник

Автор

Сообщение

Добавлено: 21.04.2020 11:13

[профиль]

Member

Статус: Не в сети
Регистрация: 02.11.2008
Откуда: Москва

Spenker писал(а):

В том то и дело, что не могу идетефицировать. Нашёл только кз на линии 5v. Не думал, что сейчас ssd делают без защиты.

На фотке чёрко видно пробой на 5-3.3V замени попробуй.

Реклама
Партнер

mol61

Member

Статус: Не в сети
Регистрация: 15.06.2010
Откуда: Калуга
Фото: 19

Cool’D писал(а):

На фотке чёрко видно пробой на 5-3.3V замени попробуй.

Ничего не вижу на этой мутной фотке. Ткни пальцем что именно надо менять.

_________________
Лужу, паяю, не шалю, никого не трогаю, починяю примус (ЭВМ). Я не фанат INTEL, я просто не люблю AMD.

Cool’D

Member

Статус: Не в сети
Регистрация: 02.11.2008
Откуда: Москва

Я могу ошибаться, но вот :

Вложение:

IMG_0312.JPG

У вас нет необходимых прав для просмотра вложений в этом сообщении.

mol61

Member

Статус: Не в сети
Регистрация: 15.06.2010
Откуда: Калуга
Фото: 19

Вполне возможно. Но по этому фото ничего не видно. слегка коричневое пятно на плате, которое может просто грязью оказаться. Обгорелых деталей не видно.

_________________
Лужу, паяю, не шалю, никого не трогаю, починяю примус (ЭВМ). Я не фанат INTEL, я просто не люблю AMD.

Spenker

Member

Статус: Не в сети
Регистрация: 18.04.2020

mol61 писал(а):

Ничего не вижу на этой мутной фотке. Ткни пальцем что именно надо менять.

Не уверен что лучше получилось, но всёже
Пятно под флюсом, но горелого ничего не вижу
Маркировка s2db2

У вас нет необходимых прав для просмотра вложений в этом сообщении.

Elkron

Junior

Статус: Не в сети
Регистрация: 17.06.2017

Здравствуйте, подскажите что можно сделать. Внешний диск навернулся с небольшой высоты, теперь при подключении к компьютеру начали раздаваться не характерные звуки и диск не определяется в системе( в управлении дисками тоже). Теперь только в СЦ? Или же есть возможность программно хотя б данные изъять?

Sania.

Member

Статус: Не в сети
Регистрация: 22.12.2012
Фото: 1

Изъять данные теперь только специальной фирмой можно чисто по этой проблеме.

psilocebin

Advanced member

Статус: Не в сети
Регистрация: 27.06.2007
Откуда: Vzm-Msk
Фото: 2

Elkron писал(а):

не характерные звуки

Если нужны данные, то лучше не подключать и нести в специализированную контору.

yui

Junior

Статус: Не в сети
Регистрация: 24.10.2012

Помогите, пожалуйста, чайнику…

Два WD Green — WD10EACS и WD20EADS. Несколько лет пролежали в тумбочке. До этого — работали в системнике и внешнем боксе (AgeStar, IDE+SATA, USB/1394/eSATA). Сейчас оба не определяются в BIOS.

Для тестов использую старую ASUS A8N-E (nForce4). Мать рабочая, грузится с OCZ ARC100 (Win10.x86). Все тесты провожу без SSD (винт цепляю на «загрузочный» шлейф)

Оба диска при включении — раскручиваются, но в BIOS записи о них нет. Гружусь HBCD 15.1, Victoria 3.52 -> P -> Ext PCI ATA/SATA -> 3 nForce4…
1Tb:
F2 -> Init Drive… Ok, Model: ; f/w; S/N: ; LBAs: 0; Pass size: 0Mb; CHS: 0/0/0/0Mb… Current power mode=Active; Security: Not supported.
F7 -> Init Drive…Ok….; Рекалибровка Ok; Starting Seek Test… Ok; Ошибка; Stop Drive… Ok (Вероятно, не прочитался один из секторов)
F9 -> Init Drive… Ok…; Get SMART attributes Error!
F6 -> RHPA -> Этот винчестер не поддерживает HPA.
2Tb — блины крутятся, но в Victoria на том же шлейфе, на канале 3 — <empty channel>, и, соответственно, диск не инициализируется — Ждем готовности HDD… Отсутствует DRSC+DRDY….

Блины на обоих дисках — раскручиваются, ощущается тихая меняющаяся вибрация, щелканей/стуков и прочих «посторонних» звуков — нет.

Посоветуйте, можно ли вернуть кого-то из инвалидов к жизни?

PS. Хотел кого-то из них подцепить в боксе к RT-AC68U для торрента и DLNA

редкий_гость

Member

Статус: Не в сети
Регистрация: 23.01.2016
Откуда: Москва
Фото: 1

yui
А если загрузиться с OCZ ARC100 (Win10.x86), а hdd подключить через внешний бокс?

_________________
«Вы, мой друг, не аноним, вы — кое что похуже»

yui

Junior

Статус: Не в сети
Регистрация: 24.10.2012

редкий_гость писал(а):

yui
А если загрузиться с OCZ ARC100 (Win10.x86), а hdd подключить через внешний бокс?

В боксе ни 1Tb, ни 2Tb не определяются (я, собственно, так и выяснил проблемы — сначала в бокс, потом — в системник). сам бокс — рабочий, SSD в нем, зацепленный к буку, видится и работает нормально.

редкий_гость

Member

Статус: Не в сети
Регистрация: 23.01.2016
Откуда: Москва
Фото: 1

yui

Цитата:

Ситуация — не норм.

Попробуйте, как вариант, почистить контакты на плате (

https://smelkov.com/content/%D0%BB%D0%B … 0%BC%D0%B8

).
Но это, скорее, как последнее средство перед

Цитата:

Можете выкидывать.

_________________
«Вы, мой друг, не аноним, вы — кое что похуже»

Sania.

Member

Статус: Не в сети
Регистрация: 22.12.2012
Фото: 1

Не ну контакты на гермоблоке и сата разъме тереть ластиком это слишком, лучше спиртом.

редкий_гость

Member

Статус: Не в сети
Регистрация: 23.01.2016
Откуда: Москва
Фото: 1

Sania.

Цитата:

Не ну контакты на гермоблоке и сата разъме тереть ластиком это слишком, лучше спиртом.

В плане наилучшего удаления окислов: ластик лучше чем спирт (окислы лучше удаляются механическим воздействием, а ластик — наиболее гуманное средство).

Если разговор о возможности механического повреждения контактов гермоблока/сата разъма: то тут, при должном старании и ватным тампоном со спиртом можно дел наделать
Это уже зависит от человека.

_________________
«Вы, мой друг, не аноним, вы — кое что похуже»

Sania.

Member

Статус: Не в сети
Регистрация: 22.12.2012
Фото: 1

редкий_гость писал(а):

Не, с позолоты или типа того гораздо лучше всё же спирт, там никогда не отлаживается окись как на серебре и другом металле, там скорее грязь от окружающей среды, золото не окисляется что бы её стирать из слоёв металла, если конечно не загадить их соплями или другой грязью пролив чего на контакты.

редкий_гость писал(а):

Если разговор о возможности механического повреждения контактов гермоблока/сата разъма: то тут, при должном старании и ватным тампоном со спиртом можно дел наделать

ну а стереть позолоту можно гораздо легче ластиком за 5-10 раз таких мероприятий, вы попробуйте стереть спиртом и ваткой окись с платы без позолоты, не получится как ластиком, ватка гораздо более щадящая обработка.

редкий_гость

Member

Статус: Не в сети
Регистрация: 23.01.2016
Откуда: Москва
Фото: 1

Sania.
В любом случаи (ластик или спирт) — тс’у, как последний вариант, стоит пробовать эту манипуляцию перед преданием hhd вечности.

_________________
«Вы, мой друг, не аноним, вы — кое что похуже»

Oxygen

Member

Статус: Не в сети
Регистрация: 23.04.2011
Откуда: Raspilland
Фото: 0

Пропал локальный диск D на ноутбуке. Жесткий диск wd 750 gb был разбит на 2 раздела, остался только системный диск С. Остальной части не видно нигде, даже в неразмеченной области нет. Если пробовать загрузится с него вылетает в синий экран. Подключали по юсб, тоже самое

BRAWA

Member

Статус: Не в сети
Регистрация: 12.12.2013

Spenker, если еще не выбросили, то можно керамику по входу проверить, вдруг повезло. А так цепляйте лабораторник и простой «методой» (найдете в нете) определите что вышло из строя. Кстати сказать под этот контроллер есть утилита.

_________________
«И смерти нет почетней той, что ты принять готов, за кости пращуров своих, за храм своих богов!»

MuRZik

Junior

Статус: Не в сети
Регистрация: 19.11.2020

Здраствуйте, компьютер начал тупить. В диспетчере задач диск частенько загружен на 100 %
Проверил диск через программу «Victoria»
Все очень плохо? Диск под замену?

У вас нет необходимых прав для просмотра вложений в этом сообщении.

—

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Лаборатория

Новости

Источник

Что такое S.M.A.R.T.? Почему возникают SMART ошибки и о чем это говорит? Ниже мы детально расскажем про причины и методы устранения подобных проблем.

Содержание

Что такое SMART и что он показывает?
Ошибки S.M.A.R.T.
Примеры ошибок SMART
Ошибка «SMART failure predicted»
Ошибка «S.M.A.R.T. status BAD»
Ошибка «the smart hard disk check has detected»
Как исправить SMART ошибку?
Как отключить проверку SMART?
Что делать если данные были утеряны?

Средство S.M.A.R.T., показывающее ошибки жесткого диска (HDD или SSD) является сигналом того, что с накопителем случились какие-то неполадки, влияющие на стабильность и работу компьютера.

Помимо этого, такая ошибка – серьезный повод задуматься о сохранности своих важных данных, поскольку из-за проблемного накопителя можно попросту лишиться всей информации, которую практически невозможно восстановить.

Что такое SMART и что он показывает?

«S.M.A.R.T.» расшифровывается как «self-monitoring, analysis and reporting technology», что в переводе означает «технология самодиагностики, анализа и отчетности».

Каждый жесткий диск, подключённый через интерфейс SATA или ATA, имеет встроенную систему S.M.A.R.T., которая позволяет выполнять следующие функции:

Проводить анализ накопителя.
Исправлять программные проблемы с HDD.
Сканировать поверхность жесткого диска.
Проводить программное исправление, очистку или замену поврежденных блоков.
Выставлять оценки жизненноважным характеристикам диска.
Вести отчётность о всех параметрах жесткого диска.

Система S.M.A.R.T. позволяет давать пользователю полную информацию о физическом состоянии жесткого диска методом выставления оценок, при помощи которых можно рассчитать примерное время выхода HDD из строя. С данной системой можно лично ознакомиться, воспользовавшись программой Victoria или другими аналогами.

С тем, как работать, проверять и исправлять ошибки жесткого диска в программе Victoria, Вы можете ознакомиться в статье «Как протестировать и исправить жесткий диск используя бесплатную программу Victoria».

Ошибки S.M.A.R.T.

Как правило, в нормально работающем накопителе система S.M.A.R.T. не выдает никаких ошибок даже при невысоких оценках. Это обусловлено тем, что появление ошибок является сигналом возможной скорой поломки диска.

Ошибки S.M.A.R.T. всегда свидетельствуют о какой-либо неисправности или о том, что некоторые элементы диска практически исчерпали свой ресурс. Если пользователю стали демонстрироваться подобные сообщения, следует задуматься о сохранности своих данных, поскольку теперь они могут исчезнуть в любой момент!

Примеры ошибок SMART

Ошибка «SMART failure predicted»

В данном случае S.M.A.R.T. оповещает пользователя о скором выходе диска из строя. Важно: если Вы увидели такое сообщение на своем компьютере, срочно скопируйте всю важную информацию и файлы на другой носитель, поскольку данный жесткий диск может прийти в негодность в любой момент!

Ошибка «S.M.A.R.T. status BAD»

Данная ошибка говорит о том, что некоторые параметры жесткого диска находятся в плохом состоянии (практически выработали свой ресурс). Как и в первом случае, следует сразу сделать бекап важных данных.

Ошибка «the smart hard disk check has detected»

Как и в двух предыдущих ошибках, система S.M.A.R.T. говорит о скорой поломке HDD.

Коды и названия ошибок могут различаться в разных жестких дисках, материнских платах или версиях BIOS, тем не менее, каждая из них является сигналом для того, чтобы сделать резервную копию своих файлов.

Как исправить SMART ошибку?

Ошибки S.M.A.R.T. свидетельствуют о скорой поломке жесткого диска, поэтому исправление ошибок, как правило, не приносит должного результата, и ошибка остается. Помимо критических ошибок, существуют еще и другие проблемы, которые могут вызывать сообщения такого рода. Одной из таких проблем является повышенная температура носителя.

Ее можно посмотреть в программе Victoria во вкладке SMART под пунктом 190 «Airflow temperature» для HDD. Или под пунктом 194 «Controller temperature» для SDD.

Если данный показатель будет завышен, следует принять меры по охлаждению системного блока:

Проверить работоспособность кулеров.
Очистить пыль.
Поставить дополнительный кулер для лучшей вентиляции.

Другим способом исправления ошибок SMART является проверка накопителя на наличие ошибок.

Это можно сделать, зайдя в папку «Мой компьютер», кликнув правой клавишей мыши по диску или его разделу, выбрав пункт «Сервис» и запустив проверку.

Если ошибка не была исправлена в ходе проверки, следует прибегнуть к дефрагментации диска.

Чтобы это сделать, находясь в свойствах диска, следует нажать на кнопку «Оптимизировать», выбрать необходимый диск и нажать «Оптимизировать».

Если ошибка не пропадет после этого, скорее всего, диск просто исчерпал свой ресурс, и в скором времени он станет нечитаемым, а пользователю останется только приобрести новый HDD или SSD.

Как отключить проверку SMART?

Диск с ошибкой S.M.A.R.T. может выйти из строя в любой момент, но это не означает, что им нельзя продолжать пользоваться.

Стоит понимать, что использование такого диска не должно подразумевать в себе хранение на нем сколько-либо стоящей информации. Зная это, можно провести сброс smart настроек, которые помогут замаскировать надоедливые ошибки.

Для этого:

Шаг 1. Заходим в BIOS или UEFI (кнопка F2 или Delete во время загрузки), переходим в пункт «Advanced», выбираем строку «IDE Configuration» и нажимаем Enter. Для навигации следует использовать стрелочки на клавиатуре.

Шаг 2. На открывшемся экране следует найти свой диск и нажать Enter (жесткие диски подписаны «Hard Disc»).

Шаг 3. Опускаемся вниз списка и выбираем параметр SMART, нажимаем Enter и выбираем пункт «Disabled».

Шаг 4. Выходим из BIOS, применяя и сохраняя настройки.

Стоит отметить, на некоторых системах данная процедура может выполняться немного по-другому, но сам принцип отключения остается прежним.

После отключения SMART ошибки перестанут появляться, и система будет загружаться в штатном порядке до тех пор, пока HDD окончательно не выйдет из строя. В некоторых ситуациях ошибки могут показываться в самой ОС, тогда достаточно несколько раз отклонить их, после чего появится кнопка «Больше не показывать».

Что делать если данные были утеряны?

При случайном форматировании, удалении вирусами или утере любых важных данных следует быстро вернуть утерянную информацию самым эффективным методом.

Шаг 1. Установите и запустите программу RS Partition Recovery.

Шаг 2. Выберите носитель или раздел диска, с которого необходимо восстановить данные.

Шаг 3. Выберите тип анализа.

Быстрый анализ стоит использовать, если файлы были удалены недавно. Программа проведет анализ и отобразит данные доступные для восстановления.

Полный анализ позволяет найти утерянные данные после форматирования, перераспределения диска или повреждения файловой структуры (RAW).

Шаг 4. Просмотр и выбор файлов для восстановления.

Шаг 5. Добавление файлов для сохранения в «Список Восстановления» или выбор всего раздела для восстановления.

Стоит отметить, что в качестве места для записи восстановленного файла лучше всего выбрать другой диск или раздел чтобы избежать перезаписи файла.

Часто задаваемые вопросы

S.M.A.R.T (Self-Monitoring, Analysis and Reporting Technology) – это специальная технология, разработанная для дисков, подключённых через SATA интерфейс, которая позволяет проводить анализ накопителя, исправлять программные проблемы HDD дисков, сканировать поверхность накопителя и автоматически исправлять поврежденные блоки информации, следить за состоянием накопителя и многое другое.

Эта ошибка предупреждает пользователя о скорой поломке накопителя. Если вы увидели эту ошибку – НЕМЕДЛЕННО скопируйте важные данные на другой накопитель, в противном случае важная информация может быть безвозвратно утеряна.

Воспользуйтесь программой RS Partition Recovery. Программа проста в использовании и позволяет восстановить утерянные данные после случайного удаления, форматирования диска, повреждений файловой структуры накопителя и во многих других случаях.

Исправлять SMART ошибки не имеет смысла, так как обычно они сигнализируют о ближайшем выходе накопителя из строя. Конечно вы можете отключить SMART технологию, но это только уберет сообщение об ошибке. Проблема же останется. Поэтому вместо отключения SMART – лучше заняться переносом данных в безопасное место.

Чтобы отключить SMART технологию войдите в настройки BIOS, затем откройте пункт «Advanced» —> «IDE Configuration». Выберите нужный диск из списка и нажмите «Enter». После этого, возле пункта «SMART» установите значение «Disabled».

Источник

В сегодняшней статье:

1. Как узнать в каком состоянии мой жёсткий диск или твердотельный накопитель SSD, сколько он ещё проживёт. Как узнать состояние здоровья жёсткого диска или SSD бывшего в употреблении. Что такое S.M.A.R.T и о чём говорят его показатели: Value, Worst, Raw, Threshold?

2. Что такое бэд-блоки? Как установить — сколько сбойных секторов (бэд-блоков) на моём жёстком диске, можно ли их исправить, а самое главное, как исправить?

3. Что делать, если операционная система не загружается или зависает даже после переустановки, а жёсткий диск при работе издаёт щелчки и посторонние звуки? Почему каждый раз при загрузке Windows запускается утилита проверки диска chkdsk?

4. Как создать загрузочную флешку с программой Victoria и проверить жёсткий диск компьютера, ноутбука на бэд-блоки даже если он не загружается и так далее…

Как пользоваться одной из легендарных программ по диагностике жёстких дисков под названием Victoria!

Приветствую Вас друзья на нашем сайте remontcompa.ru! Сегодняшняя статья о программе Victoria. Скажу уверенно, данная программа самая лучшая среди утилит по диагностике и лечению жёстких дисков. Разработал сиё творение чародей первой категории Сергей Казанский.

Я очень долго и ответственно готовился к данной статье чувствуя благодарность к этой программе. Бывало Victoria спасала казалось бы уже пропавшие данные на жёстких дисках моих клиентов, друзей и знакомых (часто перед мастером НЕ стоит задача вернуть к нормальной работе неисправный жёсткий диск, а только спасти данные находящиеся на нём), а иногда возвращала к жизни и сам винчестер!

Очень хотелось написать статью, которая помогла бы начинающим пользователям разобраться, а главное не боятся этой программы, а боятся есть чего, если пользоваться программой неосторожно, к примеру запустить бездумно сканирование в режиме Erase или ещё хуже Write , то можно удалить все данные на винте, если вы даже вовремя опомнитесь, то всё равно грохните загрузочную запись MBR и Вам не удастся в следующий раз загрузиться в операционную систему.

Друзья, невозможно всё, что я хочу рассказать и показать о программе Victoria поместить в одну статью. В результате моих стараний получилось несколько статей:

Сегодняшняя статья. Как скачать и запустить прямо из работающей Windows программу Victoria. Что такое S.M.A.R.T. или как за пару секунд определить состояние здоровья Вашего жёсткого диска или SSD. Ещё статьи…
Как произвести тест жёсткого диска или твердотельного накопителя SSD на наличие сбойных секторов (бэд-блоков) в программе Victoria для Windows. Как вылечить жёсткий диск.
Как создать загрузочную флешку с программой Victoria, загрузить с неё компьютер или ноутбук (если они не загружаются нормально из-за сбойных секторов) и протестировать поверхность жёсткого диска на бэд-блоки. Как избавиться от бэд-блоков в DOS (ДОС) режиме.
Как с помощью программы Victora произвести посекторное стирание информации с жёсткого диска и этим избавиться от сбойных секторов (бэд-блоков).
Как обрезать на жёстком диске участок со сбойными секторами.
Как установить точный адрес сбойного сектора в программе Victoria и исправить этот сектор.
Как сопоставить принадлежность сбойного сектора (бэд-блока) конкретному файлу в Windows?
Как избавить жёсткий диск ноутбука от бэд-блоков в программе Victoria
Загрузочная флешка Live CD AOMEI PE Builder с программами для диагностики жёсткого диска: Victoria, HDDScan, CrystalDiskInfo 6.7.4, DiskMark, HDTune, DMDE

Во первых, основных версий программы Victoria две:

Первая версия позволит нам произвести диагностику и небольшой ремонт жёстких дисков прямо в работающей Windows, но хочу сказать, что диагностику винчестера с помощью этой версии произвести можно, а вот исправление сбойных секторов (ремап) часто заканчивается неудачей, да и вероятность ошибок при работе с Викторией прямо «из винды» присутствует, поэтому многие опытные пользователи и профессионалы предпочитают вторую версию программы.

Вторая версия программы Victoria будет находиться на загрузочном диске или флешке, с данного диска (флешки) мы загрузим наш стационарный компьютер или ноутбук и также проведём диагностику и если нужно лечение жёсткого диска.

Примечание: Вторая версия очень пригодится многим, так как у большинства пользователей один жёсткий диск в компьютере или тем более в ноутбуке, в этом случае можно загрузиться с диска (флешки) Виктории и работать с одним единственным винчестером.

1. Victoria на загрузочном диске очень пригодится, если из-за бэд блоков Вы не можете запустить операционную систему.

2. Если у Вас один жёсткий диск и на нём установлена операционная система и в этой же работающей операционке Вы запустите Викторию, то наверняка она откажется исправлять сбойные сектора (бэд-блоки).

Многие пользователи заметят, что зачастую хороший бэд не исправит даже Виктория, на что ответить можно так — не все бэды имеют физическую природу (разрушившийся сектор на жёстком диске), многие бэды имеют логическую природу и легко исправляются этой программой.

Примечание: все подробности о существующих бэд-блоках винчестеров, какие они бывают, логические или физические, читайте в нашей статье- Как проверить состояние жесткого диска.

Коротко лишь скажу, что физические бэды (физически разрушившийся сектор) восстановить невозможно, а логические (программные, ошибки логики сектора) восстановить можно.

Друзья, можно много говорить, но есть хорошая жизненная пословица: «Лучше один раз увидеть, чем сто раз услышать», поэтому я приведу для Вас несколько примеров работы программы Victoria.

Victoria для работы с загрузочного диска

Идём на официальный сайт программы и выбираем Victoria 3.5 Russian ISO-образ загрузочного CD-ROM.

Victoria на загрузочном диске нам тоже нужна, но работу с этой версией мы рассмотрим во вторую очередь. Если у Вас нет дисковода, тогда мы сделаем загрузочную флешку с программой Victoria.

Victoria для работы непосредственно в операционной системе Windows XP, 7, 8, 10

Также скачиваем на моём облаке версию для Windows.

Щёлкаем на скачанном архиве программы правой мышью и выбираем Извлечь файлы.

Файлы извлекаются в создавшуюся папку vcr43. Заходим в эту папку и обязательно запускаем от имени администратора исполняемый файл программы victoria43.exe.

Главное окно программы Victoria

В главном окне программы пройдёмся по всем вкладкам поверхностно, а затем подробно.

Standard

Выбираем начальную вкладку Standard. Если у Вас несколько жёстких дисков, то в правой части окна выделите левой мышью нужный Вам жёсткий диск и сразу в левой части окна отобразятся паспортные данные нашего жёсткого диска: где родился и женился, модель, прошивка, серийный номер, объём кэша и так далее. В нижней части ведётся лог наших действий.

Что такое S.M.A.R.T.

Затем выбираем в правой части окна нужный нам жёсткий диск, если у Вас их несколько и выделяем его левой мышью. Выберем к примеру жёсткий диск WDC WD5000AAKS-00A7B2(объём 500 ГБ).

Переходим на вкладку SMART, жмем кнопку Get SMART, справа от кнопки засветится сообщение GOOD и откроется S.M.A.R.T. выбранного нами жёсткого диска.

S.M.A.R.T. (от англ. self-monitoring, analysis and reporting technology) — разработанная в 1995 году крупнейшими производители жёстких дисков усовершенствованная технология самоконтроля, анализа и отчётности винчестера.

Другими словами друзья, если посмотреть это окно, то можно узнать в каком состоянии Ваш жёсткий диск.

Обратите внимания программа Victoria подсветила красным (тревога!) цифру 8 на значении Raw, самого важного для здоровья жёсткого диска атрибута

5 Reallocated Sector Count — (remap), обозначающий число переназначенных секторов.

Примечание: значение атрибута Raw очень важно, читаем почему.

Простыми словами, если микропрограмма, встроенная в жёсткий диск, обнаружит сбойный сектор (бэд-блок), то она переназначит этот сектор сектором с резервной дорожки (процесс называется remapping). Но резервных секторов на жёстком диске не бесконечное число и программа нас предупреждает, что скоро бэд-блоки переназначать будет нечем, а это чревато потерей данных и нам надо готовиться менять жёсткий диск на новый. Забегая вперёд, скажу, что в следующей статье мы попробуем подлечить этот жёсткий диск.

9 Power-On time — общее количество отработанных жёстким диском часов 14810, не подсвечено красным, но хочу сказать, что приближение к цифре 20000 наработки в большинстве случаев связано с болезнями и нестабильной работой жёсткого диска.

Также подсвечены атрибуты:

196 Reallocation Event Count — 3. Количество операций переназначения бэд-блоков секторами с резервных дорожек (ремаппинг), учитываются как успешные, так и неуспешные операции.

197 Current Pending Sector — 13. Показатель количества нестабильных секторов реальных претендентов в бэд-блоки. Данные сектора микропрограмма жёсткого диска планирует в будущем заменить секторами из резервной области (remap), но всё же есть надежда, что в дальнейшем какой-то из этих секторов прочитается хорошо и будет исключён из списка претендентов.

198 Offline scan UNC sectors — 13. Количество реально существующих на жёстком диске не переназначенных бэдов (возможно исправимых имеющих логическую структуру — подробности далее в статье).

199 UltraDMA CRC Errors — 63771. Ошибки, возникающие при передаче информации по внешнему интерфейсу, причина — возможно перекрученный и некачественный SATA шлейф и его нужно заменить или расшатанный разъём SATA на материнской плате или на самом жёстком диске. А может сам винчестер интерфейса SATA 6 Гбит/с подключен в разъём на материнской плате SATA 3 Гбит/с, надо переподключить.

Атрибуты S.M.A.R.T и их значения. Очень важно знать!

Значения атрибутов

Val—текущее значение атрибута, оно должно быть высоким (до 255), если значение Val равно критическому Tresh или даже менее его, то это соответствует неудовлетворительной оценке параметра. К примеру в нашем случае на жёстком диске WDC WD5000AAKS-00A7B2 (500 ГБ, 7200 RPM, SATA-II) атрибут Reallocated Sector Count имеет значение Val—199, а атрибут Tresh (порог) имеет значение 140, это плохо, но значение Val—199 ещё не равно значению Tresh (порог) 140 и у нас есть время скопировать данные с этого диска и отправить его на пенсию.

Wrst—самый низкий показатель атрибута Val за всё время работы винчестера.

Tresh—пороговое значения атрибута, данное значение должно быть намного ниже значения Val (текущее значение).

Raw—«сырое значение», которое будет пересчитано в значение Value, чем меньше это значение, тем лучше. Важный показатель для оценки атрибута, представляет реальное число, исходя из которого формируется значение Value, но как именно происходит процесс формирования значения Value — это фирменный секрет каждого производителя жёсткого диска!

Расшифровка S.M.A.R.T.

Давайте разберёмся во всех атрибутах S.M.A.R.T, но хочу сказать, что чаще всего на «плохих» жёстких дисках неудовлетворительным будет именно этот атрибут Reallocated Sector Count (Переназначенные сектора). Это уже повод насторожиться и провести тест поверхности жёсткого диска или SSD (как это сделать узнаем далее в статье).

Друзья, для моментальной оценки здоровья жёсткого диска S.M.A.R.T я использую ещё одну простую программу на русском языке CrystalDiskInfo, обязательно скачайте и установите её себе. В ней все атрибуты указаны на русском языке!

http://crystalmark.info/download/index-e.html

Выберите Shizuku Edition (exe).

В данном окне язык программы можете выбрать русский.

Как видите, CrystalDiskInfo прямо указывает нам (подтверждая опасения «Виктории»), на жёстком диске WDC WD5000AAKS-00A7B2 (объём 500 ГБ) нехорошие значения атрибутов отвечающих за Переназначенные сектора, Нестабильные сектора, Неисправимые ошибки секторов, подсвечивая их жёлтым цветом и указывает на тех. состояние жёсткого диска одним словом «Тревога»

Как выглядит S.M.A.R.T неисправного жёсткого диска

А вот S.M.A.R.T неисправного жёсткого диска WDC WD500BPVT ноутбука, который мне принесли на ремонт.

Victoria из Windows. Обратите внимание на атрибут:

5 Reallocated Sector Count (переназначенные сектора), он имеет значение Val—133, а атрибут Tresh (порог) имеет значение 140, это неудовлетворительно, так как значение Val—133 не должно быть меньше предельного значения Tresh (порог) 140, то есть количество сбойных секторов будет расти, а переназначать их уже нечем, запасные сектора на резервных дорожках уже закончились.

197 Current Pending Sector — показатель количества нестабильных секторов реальных претендентов в бэд-блоки зашкалил все возможные пределы.

И самое главное, самооценка SMART status=BAD (непригоден).

Программа CrystalDiskInfo (ссылка на скачивание чуть выше). Видим тоже самое, атрибут Переназначенные сектора (Reallocated Sector Count) имеет значение Val (текущее)—133, а атрибут Tresh (порог) имеет значение 140, программа оценила оценку тех состояния жёсткого диска как Плохо.

этот ноутбук ужасно тормозит, данные c него невозможно скопировать, Windows невозможно переустановить, периодически винчестер пропадает из БИОС, то есть такой жёсткий диск подлежит замене без раздумий, даже наша Victoria не сможет полностью вылечить подобный винт, так как здоровые сектора на резервных дорожках закончились и сбойные сектора переназначать уже нечем, а копирование данных с него будет настоящим приключением на неделю (обязательно напишу про это статью).

Забегая вперёд скажу, что тест этого винта в программе Victoria показал наличие 500 неисправимых сбойных секторов (бэд-блоков).

ДОС — версия программы Виктория.

Примечание: Чтобы Вам упростить жизнь, некоторые программы диагностики жёстких дисков сопоставляют каждый атрибут, хороший он или плохой, цвету значка.

Зелёный—атрибут жёсткого диска соответствует нормальному.

Жёлтый—говорит о небольшом расхождении с эталоном и на этом винте важные данные лучше не хранить, если у Вас на таком жёстком диске находится Windows, перенесите её на SSD.

Красный—говорит о значительном расхождении с эталоном и жёсткий диск нужно было менять уже вчера.

S.M.A.R.T этого же жёсткого диска WDC WD500BPVT в программе HDDScan

Атрибуты

001 Raw Read Error Rate—частота ошибок при чтении информации с диска

002 Spinup Time—время раскрутки дисков до рабочего состояния

003 Start/Stop Count—общее количество стартов/остановок шпинделя.

005 Reallocated Sector Count — (remap) говорит о числе переназначенных секторов. Если микропрограмма встроенная в жёсткий диск обнаружит сбойный сектор (бэд-блок), то она переназначит этот сектор сектором с резервной дорожки (процесс называется remapping). Но резервных секторов на жёстком диске не бесконечное число и программа нас предупреждает, что скоро бэд-блоки переназначать будет нечем, а это чревато потерей данных и нам надо готовиться менять жёсткий диск на новый

007 Seek Error Rate—частота ошибок при позиционировании блока головок, постоянно растущее значение, говорит о перегреве винчестера и неустойчивом положении в корзине, к примеру плохо закреплён.

009 Power-on Hours Count—число часов, проведённых во включенном состоянии.

010 Spin Retry Count—число повторных раскруток диска до рабочей скорости при неудачной первой.

012 Device Power Cycle Count—Число полных циклов включения-выключения дисков

187 Reported Uncorrectable Error—Ошибки, которые не не смогла восстановить микропрограмма винчестера, используя свои методы устранения ошибки аппаратными средствами, последствия перегрева и вибрации.

189 High Fly Writes—записывающая головка находилась над поверхностью выше, чем нужно, а значит магнитное поле было недостаточным для надежной записи носителя. Причина– вибрация (удар).

Для ноутбуков данная цифра немного выше.

190 Важные параметры касающиеся температуры. Важно, что бы температура не поднималась выше 45 градусов.

194 HDA Temperature—температура механической части жёсткого диска

195 Hardware ECC Recovered—число ошибок, которые были исправлены самим винчестером.

196 Reallocation Event Count — Количество операций переназначения бэд-блоков секторами с резервных дорожек (ремаппинг), учитываются как успешные, так и неуспешные операции.

197 Current Pending Errors Count — неисправимые ошибки секторов, тоже важный параметр, число секторов, считывание которых затруднено и сильно отличается от считывания нормального сектора. То есть, эти секторы контроллер жёсткого диска не смог прочитать с первого раза, обычно к данным секторам принадлежат софт-бэды, ещё называют программные или логические бэд-блоки (ошибка логики сектора) — при записи в сектор пользовательской информации, так же записывается служебная информация, а именно контрольная сумма сектора ECC (Error Correction Code-код коррекции ошибок), она позволяет восстанавливать данные, если они были прочитаны с ошибкой, но иногда данный код не записывается, а значит сумма пользовательских данных в секторе не совпадает с контрольной суммой ECC. К примеру так происходит при внезапном отключении компьютера из-за сбоев с электричеством, из-за этого информация в сектор жёсткого диска была записана, а контрольная сумма нет.

Логические бэд-блоки нельзя исправить простым форматированием, так как при форматировании контроллер жёсткого диска попытается в первую очередь прочитать информацию из сбойного сектора, если ему это не удастся (в большинстве случаев), то значит не произойдёт никакой перезаписи и бэд-блок останется бэд-блоком. Исправить положение можно в программе Victoria, она принудительно впишет в сектор информацию (вылечит сектор), затем прочитает её, сравнит контрольную сумму ECC и бэд-блок станет нормальным сектором. Более подробно про все виды бэд-блоков в нашей статье Как проверить жёсткий диск.

198 Offline scan UNC sectors — Количество реально существующих на жёстком диске непереназначенных бэдов (возможно исправимых имеющих логическую структуру — подробности далее в статье).

198 Uncorrectable Errors Count—число нескорректированных ошибок при обращении к сектору, указывает на дефекты поверхности.

Reported Uncorrectable Errors — показывает число неисправленных сбойных секторов.

199 UltraDMA CRC Errors—число ошибок, возникающих при передаче информации по внешнему интерфейсу, причина- перекрученный и некачественный SATA шлейф, возможно его нужно поменять.

200 Write Error Rate—частота ошибок, происходящих при записи на винчестер, по данному показателю обычно судят о качестве поверхности накопителя и его механической части.

202 Data Address Mark Errors—расшифровки нигде не встречал, буквально Ошибка данных адресного маркера, означать может то, что знает один лишь производитель данного винчестера.

Как быстро проверить жёсткий диск или SSD на пригодность к работе?

Друзья, Вы меня часто спрашиваете: «Как быстро проверить жёсткий диск или SSD на пригодность к работе?»

Ответ: «Используйте программы: Victoria, CrystalDiskInfo, HDDScan, они сразу покажут Вам S.M.A.R.T любого жёсткого диска.

Как выглядит S.M.A.R.T абсолютно нового жёсткого диска

Во первых, смотрите как выглядит S.M.A.R.T абсолютно нового жёсткого диска WDC WD2500AAKX-00ERMA0

Как видим, все показатели накопителя в отличном состоянии и отработал он ноль часов (параметр 9 Power-On Time)

Теперь берём почти новый жёсткий диск WDC WD2500AAKX-001CA0 и смотрим S.M.A.R.T, как видим, винчестер практически в идеальном состоянии, хотя и отработал уже 8000 часов (параметр 9 Power-On Time)

Victoria

Тест поверхности жёсткого диска!

В правой части окна программы отметьте пункт Ignor и пункт read и нажмите Start. Этим Вы запустите простой тест поверхности жёсткого диска без исправления ошибок. Данный тест не принесёт никаких отрицательных и положительных воздействий на жёсткий диск, но зато по окончании теста Вы будете знать в каком состоянии находится Ваш винчестер..

Результаты теста отличные. Ни одного блока с задержкой более 30 мc!

CrystalDiskInfo

HDDScan

Жёсткий диск SAMSUNG HD403LJ (372 ГБ) из недавней статьи Как перенести Windows 7, 8, 8,1 на SSD с помощью программы Acronis True Image.

На нём были бэд-блоки и мне пришлось переносить с него Windows 8 на SSD, после успешного переноса, хозяин (мой одноклассник) подарил мне этот винт и Victoria вскоре вернула его к жизни после «записи по всей поляне» (алгоритм Write). Прежний хозяин забирать вылеченный винчестер отказался.

Результаты теста чуть хуже. 3 блока с задержкой более 200 мс и 1 блок с задержкой 600 мс (возможно кандидат в бэды).

Не вполне исправный жёсткий диск MAXTOR STM3250310AS (250 ГБ, 7200 RPM, SATA-II) ему 8 лет (ветеран) и он всё ещё работает, правда я его берегу, храню на нём только файлы неважных данных.

Хоть явных бэдов на нём и нет, видим, что атрибут 5 Reallocated Sector Count — (remap), обозначающий число переназначенных секторов критический и скоро бэды переназначать будет нечем.

9 Power-On time — общее количество отработанных жёстким диском часов 23668, это очень много, обычно проблемы у жёстких дисков начинаются после 20000 часов отработки.

Также неважнецкий атрибут 199 UltraDMA CRC Errors — 63771,ошибки, возникающие при передаче информации по внешнему интерфейсу, причина — некачественный шлейф SATA шлейф и его нужно заменить (не всегда дело в этом).

Результаты теста ещё хуже. 71 блок с задержкой более 200 мс и 1 блок с задержкой 600 мс (возможно кандидат в бэды).

Жёсткий диск ST3200826AS (200 ГБ, 7200 RPM, SATA). Винту около трёх лет и полёт пока нормальный.

Результаты теста. 6 блоков с задержкой более 200 мс.

Новый твердотельный накопитель SSD SPCC SSD162

Тест

Под конец статьи проверим мой самый старый твердотельный накопитель SSD — ADATA S510 60GB (60 ГБ, SATA-III)

Ему уже третий год, но работает он отменно, жалко что объём всего 60 ГБ, но когда я его покупал больше и не было, а стоил он около двухсот баксов.

Источник

Привет всем! В прошлой статье мы рассмотрели . А сегодня мы рассмотрим как посмотреть здоровье жесткого диска, например для того, чтобы знать что с ним в ближайшее время ничего не случится. Ну или случилось и вы ещё успеваете сохранить данные.

Для начала скачиваем бесплатную программу:

Запускаем и:

Выбираем диск, здоровье которого вы хотите проверить
Далее нажимаем на лупу
И жмем SMART

В ячейке Attribute Name название smart теста. Более подробную информацию вы можете узнать в файле, нажав на кнопку скачать. Это информация с википедии. Так же в файле будет указаны критические названия и несущественные. Если у вас критические наименования превысили норму, то задумайтесь о смене жесткого диска.

Она русская и менее функциональная.

Так же и обращаем внимание на температуру. Я вот делал эксперимент по этому поводу, ssd стоит у меня на боковой стенке (у корпуса zalman есть специальное крепление), а второй жесткий диск на своем месте, да ещё и впереди стоит кулер, который дополнительно его охлаждает. Так вот, с кулером и без, разница в 4 градуса. Так что я буду ssd переставлять ближе к кулеру. Ведь когда выходит жесткий диск из строя, первая причина это температура.

Критические значения

Особое внимание уделите следующим параметрам:

01 (01) Raw Read Error Rate (ошибки чтения)
— на сколько часто появляются ошибки при чтении с диска данных.
03 (03) Spin-Up Time (время раскрутки)
— на сколько быстро раскрутится пластина из состояния покоя, до рабочего состояния.
05 (05) Reallocated Sectors Count (переназначенные сектора)
— количество переназначенных секторов. Если количество переназначенных секторов закончится, то появятся .
07 (07) Seek Error Rate (ошибки позиционирования)
— если головка становится не точно на дорожку, это свидетельствует о повреждении механики. Причиной этого может быть перегрев. Чем чаще головка не попадает на дорожку, тем выше значение.
10 (0A) Spin-Up Retry Count (повторные попытки раскрутки)
— так же при неисправности механики. Ошибка появляется, когда диск не может раскрутится до рабочей скорости.
196 (C4) Reallocation Event Count (события переназначения)
— на сколько много производилось переназначение битых секторов на резервные.
197 (C5)
Current Pending Sector Count (нестабильные сектора)
— на сколько много секторов претендентов на переназначения. Эти сектора ещё не являются битыми, но у них слабый отклик.
198 (C6) Uncorrectable Sector Count (неисправные ошибки секторов)
— из-за поврежденной механики, показывает количество неудачных раз чтения секторов.
220 (DC) Disk Shift (сдвиг диска)
— из-за удара, пластины могут быть сбиты с оси.

На этом все. Не критические ошибки и описание вы найдете скачав в документе выше. Вот таким образом можно проверить здоровье жесткого диска с помощью этих 2х программ. А какой пользоваться, вам решать.

Маленький рассказ об S.M.A.R.T. атрибутах, их важности и понимании. В статье пойдет речь об расшифровке всех smart атрибутов ATA дисков. В предыдущих статьях речь шла об и . Теперь хочу немного описать атрибуты обычных АТА дисков на примере Seagate Barracuda ES.2 (ST31000340NS). Так же определим самые важные атрибуты, на которые нужно обращать внимание при мониторинге дисков используя smartctl. Для начала, можно убедиться, что наш диск поддерживает смарт

[email protected] s01:~# smartctl -i /dev/sda
smartctl 5.41 2011-06-09 r3365 (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda ES.2
Device Model: ST31000340NS
Serial Number: 9QJ2ADVC
…
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Fri Feb 21 16:18:35 2014 CET
…
SMART support is: Available — device has SMART capability.
SMART support is: Enabled

Две последние строки свидетельствуют о том, что диск поддерживает smart и можно посмотреть значение всех его атрибутов и их интерпретация будет корректной(интерпретация RAW_VALUE) . В данном случаи тип интерфейса (устройства) не указывался явно (не было указанно атрибут «-d»), по этому smartctl автоматически определил тип устройства и сказал, что «SMART support is: Enabled». Но если используются, к примеру массивы дисков (RAID контроллер), то smartctl может сказать, что смарт не поддерживается:

[email protected]:~# smartctl -i /dev/sda
smartctl 5.41 2011-06-09 r3365 (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
Vendor: SMC
Product: SMC2108
Revision: 2.90
User Capacity: 2,996,997,980,160 bytes
Logical block size: 512 bytes
Logical Unit id: 0xSerial number: Device type: disk
Local Time is: Fri Feb 21 17:32:27 2014 IST
Device does not support SMART

Но на самом деле, нужно просто знать (или подбирать) какие дисковые массивы используются, и тогда можно получить желаемый результат явно указав тип устройства:

[email protected]:~# smartctl -d megaraid,14 -i /dev/sda
smartctl 5.41 2011-06-09 r3365 (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
Vendor: SEAGATE
Product: ST1000NM0001
Revision: 0002
User Capacity: 1,000,204,886,016 bytes
Logical block size: 512 bytes
Logical Unit id: 0x5000c50041080343
Serial number: Z1N0TV980000C2157TYR
Device type: disk
Transport protocol: SAS
Local Time is: Fri Feb 21 17:34:45 2014 IST
Device supports SMART and is Enabled
Temperature Warning Enabled

Также может быть проблема в версии smartctl ибо не все жесткие диски добавляются в базу SMART сразу после выхода в мир нового HDD или RAID контроллера. Или же в BIOS отключено поддержку (нужно включить). Так же может быть проблема в прошивке (firmware) самого жесткого диска. Можете также стоит для начала попытаться включить SMART командой:

[email protected]:~# smartctl -s on /dev/sda
smartctl 5.41 2011-06-09 r3365 (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.

Следующая, интересующая нас часть вывода покажет суммарный результат проверки статуса здоровья диска (Если не Passed – нужно проводить замену диска). Так же выводится дополнительные характеристики диска и предполагаемое время выполнения коротких и длинных тестов.

[email protected]:~# smartctl -Hc /dev/sda
smartctl 5.41 2011-06-09 r3365 (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: (41) The self-test routine was interrupted
by the host with a hard or soft reset.
Total time to complete Offline
data collection: (634) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: (1) minutes.
Extended self-test routine
recommended polling time: (226) minutes.
Conveyance self-test routine
recommended polling time: (2) minutes.
SCT capabilities: (0x003d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

В нашем случаи тип устройства определился автоматически и теперь можно вывести самое интересное — список атрибутов.

[email protected]:~# smartctl -A /dev/sda
smartctl 5.41 2011-06-09 r3365 (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 068 059 044 Pre-fail Always — 130449727
3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always — 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always — 23
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always — 4
7 Seek_Error_Rate 0x000f 063 039 030 Pre-fail Always — 549998464474
9 Power_On_Hours 0x0032 052 052 000 Old_age Always — 42335
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always — 0
12 Power_Cycle_Count 0x0032 100 037 020 Old_age Always — 63
184 End-to-End_Error 0x0032 100 100 099 Old_age Always — 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always — 0
188 Command_Timeout 0x0032 100 093 000 Old_age Always — 4295032870
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always — 0
190 Airflow_Temperature_Cel 0x0022 076 049 045 Old_age Always — 24 (Min/Max 18/26)
194 Temperature_Celsius 0x0022 024 051 000 Old_age Always — 24 (0 17 0 0)
195 Hardware_ECC_Recovered 0x001a 041 021 000 Old_age Always — 130449727
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always — 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline — 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always — 0

Используя SMART можно предугадать с довольно большой вероятностью проблемы связанные с:

Магнитными головками диска
Физическими повреждениями диска
Логическими ошибками
Механическими проблемами (проблемы привода, системы позиционирования)
Подачей питания (платы)
Температурой

Расшифруем полученный вывод.

Каждый атрибут имеет группу значений:

ID#
— идентификационный номер атрибуты (детали ). Каждый атрибуты имеет свой уникальный ID, который должен быть одинаковым для всех фирм производителей дисков.
ATTRIBUTE_NAME
– название атрибута. Так как разные фирмы производители дисков могут называть атрибуты по своему (сокращать, синонимы), лучше всего ориентироваться по ID атрибута.
FLAG (Status flag)
– каждый атрибут имеет определенный флаг, назначенный фирмой разработчиком диска. В ОС с графическим интерфейсом значения этого флага предоставляется в виде набора буквенных обозначений – w,p,r,c,o,s (расшифровка ниже). И эти наборы предоставляются в виде шестнадцатеричного числа которые вы видели выше.

W
arranty: Указывает на жизненно важный атрибут диска и покрывается гарантией. Если этот флаг установлен и значение атрибута с этим флагом достигнет порогового (threshold) значения, в то время, когда диск еще на гарантии, то фирма должна будет заменить диск бесплатно.
P
erformance: Указывает на атрибут, который представляет показатель производительности диска – не критический.
Error R
ate: Атрибут с частотой ошибок.
C
ount of occurrences: Атрибут-счетчик происшествий.
O
nline test: Атрибут, который обновляет значения только через on-line тесты. Если не указан, то обновляется через off-line тесты.
S
elf preserving: Указывает на атрибут который может собирать и сохранять данные о диска, даже если S.M.A.R.T. отключен.

Value
– Текущее значение атрибута(оценка атрибута диска на основе Raw_value). Низкое значение говорит о быстрой деградации диска или о возможном скором сбое. т.е. чем выше значение Value атрибута, тем лучше. Это значение атрибута нужно сравнивать с пороговым (threshold) значением. Если это критический атрибут и значение ниже порогового — нужно проводить замену диска.
Worst
– Самое низкое значение атрибута за жизненный цикл диска. Значение может изменяться на протяжении жизни диска, и не должно быть ниже или равным пороговому значению (threshold).
Thresh (Threshold)
– Пороговое значения атрибута назначенное создателем диска. Значение не меняется за жизненный цикл диска. Если значение Value атрибута станет равным или меньше порогового – появиться уведомление в колонке WHEN_FAILED. И диск нужно заменить.
Type
– тип атрибута. Может быть критическим (pre-fail), который указывает на предстоящий отказ диска из-за ошибок или не критический, указывающий на достижение конца жизненного цикла диска.
Raw_value
– Объективное значения атрибута, которое показывается в десятичном формате (вычисляется firmware диска) и известных только производителю единицах (имеет связь с Value, Threshold и Worst значениями).
WHEN_FAILED
– Указывает на проблемы с атрибутом.

Атрибут диска примет значение failed, в случаи:

Value
= f(Raw_value
) <= Threshold

f(Raw_value)

– функция вычисления деградации (уменьшения) значения параметра Value в зависимости от значения Raw_value.

Недостатки такого подхода к вычислению деградации диска:

Для каждого производителя дисков и даже модели диска функция f(Raw_value)

вычисляется по-разному.
Оценка каждого атрибута подсчитывается независимо друг от друга – т.е. игнорируются связи между атрибутами.

Теперь хочу представить таблицу с перечисленными всех атрибутов. Те атрибуты, которые выделены розовым — относятся к атрибутам критическим. К тому же, указано тип параметра в зависимости от величины значения. Т.е. чем больше значение параметра, тем лучше состояние здоровья диска или наоборот.

Теперь приступим к атрибутам:

#ID	HEX	Имя атрибута	Лучше если…	Описание
01	01	Raw Read Error Rate		Частота ошибок при чтении данных с жёсткого диска. Происхождение их обусловлено аппаратной частью винчестера.
02	02	Throughput Performance		Общая производительность накопителя. Если значение атрибута уменьшается перманентно, то велика вероятность проблем с винчестером.
03	03	Spin-Up Time		Время раскрутки шпинделя из состояния покоя (0 rpm) до рабочей скорости. В поле Raw_value содержится время в миллисекундах/секундах в зависимости от производителя
04	04	Start/Stop Count	*	Полное число запусков, остановок шпинделя. Иногда в том числе количество включений режима энергосбережения. В поле raw value хранится общее количество запусков/остановок жёсткого диска.
05	05	Reallocated Sectors Count		Число операций переназначения секторов. При обнаружении повреждённого сектора на винчестере, информация из него помечается и переносится в специально отведённую зону, происходит утилизация bad блоков, с последующим консервированием этих мест на диске. Этот процесс называют remapping. Чем больше значение Reallocated Sectors Count, тем хуже состояние поверхности дисков — физический износ поверхности. Поле raw value содержит общее количество переназначенных секторов.
07	07	Seek Error Rate		Частота ошибок при позиционировании блока магнитных головок. Чем больше значение, тем хуже состояние механики, или поверхности жёсткого диска.
08	08	Seek Time Performance		Средняя производительность операции позиционирования. Если значение атрибута уменьшается, то велика вероятность проблем с механической частью.
09	09	Power-On Hours (POH)		Время, проведённое устройством, во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ.
10	0A	Spin-Up Retry Count		Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной.
11	0B	Recalibration Retries		Количество повторов рекалибровки в случае, если первая попытка была неудачной.
12	0C	Device Power Cycle Count		Число циклов включения-выключения винчестера.
13	0D	Soft Read Error Rate		Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению.
187	BB	Reported UNC Errors		Неустранимые аппаратные ошибки.
190	BE	Airflow Temperature		Температура воздуха внутри корпуса жёсткого диска. Целое значение, либо значение по формуле 100 — Airflow Temperature
191	BF	G-sense error rate		Количество ошибок, возникающих в результате ударов.
192	C0	Power-off retract count		Число циклов аварийных выключений.
193	C1	Load/Unload Cycle		Количество циклов перемещения блока головок в парковочную зону.
194	C2	HDA temperature		Показания встроенного термодатчика накопителя.
195	C3	Hardware ECC Recovered		Число коррекции ошибок аппаратной частью диска (ошибок чтения, ошибок позиционирования, ошибок передачи по внешнему интерфейсу).
196	C4	Reallocation Event Count		Число операций переназначения в резервную область, успешные и неудавшиеся попытки.
197	C5	Current Pending Sector Count		Число секторов- кандидатов на перенос в резервную зону. Помечены как не надёжные. При последующих корректных операциях атрибут может быть снят.
198	C6	Uncorrectable Sector Count		Число некорректируемых ошибок при обращении к сектору.
199	C7	UltraDMA CRC Error Count		Число ошибок при передаче данных по внешнему интерфейсу.
200	C8	Write Error Rate / Multi-Zone Error Rate		Общее количество ошибок при заполнения сектора информацией. Показатель качества накопителя.
201	C9	Soft read error rate		Частота появления «программных» ошибок при чтении данных с диска, а не аппаратной части HDD.
202	Ca	Data Address Mark errors		Число ошибок адресно помеченной информации (Data Address Mark (DAM)).Если автоматически не корректируется — заменить устройство.
203	CB	Run out cancel		Количество ошибок ECC данных, присоединяемые к передаваемому сигналу, позволяющие принимающей стороне определить факт сбоя или исправить несущественную ошибку.
204	CC	Soft ECC correction		Количество ошибок ECC, скорректированных программным способом.
205	CD	Thermal asperity rate (TAR)		Число ошибок в следствии температурных колебаний.
206	CE	Flying height	*	Высота между головкой и поверхностью диска компьютера.
209	D1	Offline seek performance	*	Drive’s seek performance during offline operations.
220	DC	Disk Shift		Дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения.
221	DD	G-Sense Error Rate		Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного crash датчика.
222	DE	Loaded Hours	*	Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область.
223	DF	Load/Unload Retry Count	*	Количество новых попыток выгрузок/загрузок блока магнитных головок винчестера в/из парковочной области после неудачной попытки.
224	E0	Load Friction		Величина силы трения блока магнитных головок при его выгрузке из парковочной области.
225	E1	Load Cycle Count		Число циклов вход-выход в парковочную зону.
226	E2	Load ‘In’-time	*	Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска.
227	E3	Torque Amplification Count		Количество попыток скомпенсировать вращающий момент.
228	E4	Power-Off Retract Cycle		Количество повторов автоматической парковки блока магнитных головок в результате выключения питания.
230	E6	GMR Head Amplitude	*	Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок).
231	E7	Temperature		Температура жёсткого диска.
240	F0	Head flying hours	*	Время позиционирования головки.
250	FA	Read error retry rate		Число ошибок во время чтения жёсткого диска.

Атрибуты дисков нужно смотреть в целом и самостоятельно прогнозировать замену, не только опираясь на smart атрибуты. Нужно дополнительно проводить тесты на бедблоки и запускать fscheck и smart тесты, о которых пойдет речь в следующих статьях.

Новейшие накопители представлены интеллектуальными устройствами, способными анализировать свое состояние и своевременно информировать пользователя о неполадках. Для этого аппаратная часть включает оригинальную опцию S.M.A.R.T.

Львиная доля дисковых накопителей последних лет, функционирует с использованием технологии S.M.A.R.T. Сочетание расшифровывается как self-monitoring, analysis and reporting technology

, что на русском звучит как механизм самоконтроля, анализа и отчетности. Ее первые разработки увидели свет в 1995 году и с тех пор технология постоянно совершенствуется.

С момента производства дисковый накопитель начинает считывать свое текущее состояние, определяя его с помощью специальных параметров или атрибутов. Они располагаются , доступ к которой имеет лишь встроенная программа. Просмотреть параметры позволяет отдельное ПО, чаще всего представленное утилитами от разработчиков конкретного жесткого диска. Через них в накопитель подаются вводные, после чего в журнале статистики появится информация о текущем состоянии диска.

В процессе эксплуатации накопителя, данные представленные в рамках параметров значения постоянно меняются. Параметры проходят путь с максимальных показателей, гарантирующих высокую производительность и эффективность до минимальных значений, связанных с высокой вероятностью выхода накопителя из строя.

Все представленные в рамках технологии S.M.A.R.T атрибуты имеет цифровой идентификатор. Как правило, он общий для накопителей различных версий, однако имеют место исключения. В данном отношении выделяется цифра 7, демонстрирующая ошибки в размещении головок на дисковую поверхность. Для цифровой идентификатор неактуален. В отличие от 7-ки, цифра 9, которая показывает общий период непосредственной работы накопителя за срок использования, ее поддерживают все типы дисков HDD и SSD.

Структура параметров, представлена несколькими полями, демонстрирующих состояние диска и его разделов в конкретный период. Предназначенные для считывания информации утилиты выводят на экран следующие параметры:

ID – идентификационный номер
name – название атрибута
VAL – его текущее состояние
Wrst – наихудший показатель за период эксплуатации
Thresh – минимальный порог работоспособности

Показатели S.M.A.R.T

Существует несколько самых распространенных параметров. Они, за редким исключением, объединяют накопители большинства производителей, итак:

Raw Read Error Rate – показатель числа ошибок считывания
Throughput Performance – рабочая эффективность. Ее снижение указывает на необходимость замены
Spin Up Time – период развертывания накопителя в рабочее состояние. Рост параметра демонстрирует изношенность или недостаток питания
Start/Stop Count – показатель количества моментов развертывания диска, которое изначально ограничено его механической структурой
Reallocated Sectors Count – атрибут отражает число запасных участков. Туда при неполадках перенаправляется информация. В идеале количество подобных действий должно составлять 0
Read Channel Margin – канальный резерв. В наше время накопители обходятся без него
Seek Error Rate – Отражение механического состояния накопителя, в числе прочего демонстрирует излишнюю вибрацию и перегрев
Seek Time Performance – уровень оперативных возможностей, актуален лишь для дисков HDD
Power-on Time – прогноз продолжительности функционирования накопителя исходя из периода эксплуатации. Максимальные показатели составляют 100 и с течением времени снижаются до 0
Spin-Up Retry Count – количество дублирующих операций запуска. Их увеличение говорит об ошибках в механической структуре

Эти и другие атрибуты, идущие красным фоном, говорят о его критическом состоянии накопителя, что предполагает скорую поломку. Конкретного стандарта, объединяющего показатели параметров от различных производителей, не существует. В каждом случае нормальные значения индивидуальны, отражаясь в виде фона или статуса, где

Good – хороший показатель
Bad – плохой показатель.

Наряду с уже упомянутыми атрибутами следует уделять внимание таким параметрам как:

Recalibration Retries – число дублей при рекаблировке. Их повышение свидетельствует о неполадках механики
End-to-End error – Недостатки обменных операций
Reported UNC Errors – неполадки, чье устранение ведется с помощью аппаратных средств
G-sense error rate – количество механических воздействий на диск. Фиксирует неаккуратную установку, столкновения
Reallocation Event Count – общий показатель операций перенаправления информации. Фиксирует удачные и неудачные операции
Current Pending Sector Count – количество потенциальных участков накопителя, подлежащих замене
Uncorrectable Sector Count – количество неисправных секторов, неподлежащих восстановлению
UltraDMA CRC Error Count – неполадки перенаправления данных между накопителем и ПК

Проверка S.M.A.R.T

Параметры S.M.A.R.T проверяются при помощи специальных утилит от производителей жестких дисков. Существуют и универсальные программы для тестирования и проверки дисков. Среди них выделяются udisks, smartctl, hddscan, CrystalDiskInfo, Victoria, используя которые пользователь сможет оценить состояние жесткого диска. В некоторых случаях, а именно при работе с контроллерами RAID, получить дисковые атрибуты практически невозможно.

Минимальный уровень диагностики поддерживается на уровне BIOS. Если включен режим диагностики S.M.A.R.T., то при наличии критических значений атрибутов BIOS не позволит загрузиться операционной системе.

Итак, тестируя состояние жесткого диска, прежде всего внимание, уделяется указанным параметрам S.M.A.R.T . Основное назначение технологии – прогнозирование выхода их строя жесткого диска. При опасном отклонении показателей от нормы, имеет смысл переносить важную информацию на другие носители.

И, самое главное, даже если в S.MA.R.T. никаких ошибок нет и все хорошо, это не является гарантией, что диск не сломается, так что .

Современные жесткие диски довольно “умные” устройства и, кроме основных присущих им как устройствам хранения и обработки данных свойств, поддерживают технологию самотестирования, анализа состояния, и накопления статистических данных об ухудшении собственных характеристик S.M.A.R.T.
(S
elf-M
onitoring A
nalysis a
nd R
eporting T
echnology). Основы S.M.A.R.T. были разработаны в 1995 г. совместными усилиями ведущих производителями жестких дисков (HDD). В последующие годы стандарты S.M.A.R.T дорабатывались в соответствии с изменениями технологий и оборудования (SMART II и SMART III) и продолжают совершенствоваться в настоящее время.

Жесткий диск, начиная с момента его изготовления, постоянно отслеживает определенные параметры своего состояния и отражает их в специальных характеристиках — атрибутах
(Attribute), сохраняющихся в постоянном запоминающем устройстве, как правило, в специально выделенной части дисковой поверхности, доступной только внутренней микропрограмме накопителя — служебной зоне
. Данные атрибутов могут быть считаны, в соответствии со спецификацией ATA (AT
A
ttachment) по командам поддержки SMART (SMART READ DATA и еще более десятка команд), которые передаются в накопитель специальным программным обеспечением, как например, утилитами от производителей оборудования или универсальными программами тестирования и мониторинга состояния HDD (udisks, smartctl, GSmartControl, gnome-disks и т.п.). Современные стандарты ATA включают в себя поддержку протокола SCT (SMART Command Transport), обеспечивающего считывание журналов статистики устройства. Журнал статистики устройства — это доступный только для чтения журнал SMART, передаваемый накопителем при получении команд READ LOG EXT, READ LOG DMA EXT или SMART READ LOG.

Атрибут представляет собой характеристику определенного состояния жесткого диска, которая изменяется в процессе эксплуатации, принимая числовое значение от максимального, установленного в момент изготовления данного устройства, до минимального, при достижении которого, работоспособность накопителя не гарантируется. Все атрибуты идентифицируются своим цифровым номером, большинство из которых одинаково интерпретируется жесткими дисками разных моделей. Некоторые из них могут использоваться только конкретным производителем оборудования, и поддерживаться отдельными моделями накопителей. Так, например, атрибут с идентификатором 7
, характеризующий количество ошибок установки головок на требуемую дорожку поверхности дискаSeek_Error_Rate
не имеет смысла для твердотельных дисков (SSD) и, соответственно, не поддерживается ими, а атрибут с идентификатором 9
,характеризующий суммарное время работы накопителя за весь срок эксплуатации и обозначаемый как Power_On_Hours
,поддерживается как SSD, так и традиционными HDD.

Атрибуты состоят из нескольких полей, (наиболее часто обозначаемых как Val, Worst, Tresh, RAW
), каждое из которых является определенным
показателем, характеризующим техническое состояние накопителя на данный момент времени. Программы считывания S.M.A.R.T.
выводят содержимое атрибутов, как правило, в виде нескольких колонок:

ID#
— числовой идентификатор атрибута

Attribute
— название атрибута

Flags
— флаги атрибутов, задаваемые производителем HDD. Характеризуют
тип атрибута (большинство программ интерпретируют флаги в виде символов k,c,r,s,o,p
или аббревиатур, например, EC – Event Count, счетчик событий).

Pre-Failure (PF, 01h)
— при достижении порогового значения данного типа атрибутов диск требует замены. Иногда данный бит флагов обозначают как Life Critical (CR)
или Pre-Failure warranty (PW)

O
nline test (OC, 02h)– атрибут обновляет значение при выполнении off-line/on-line встроенных
тестов SMART;
P
erfomance R
elated (PE или PR , 04h)– атрибут характеризует производительность;
E
rror R
ate (ER , 08h)– атрибут отражает счетчики ошибок оборудования;
E
vent C
ounts (EC, 10h) – атрибут представляет собой счетчик событий;
S
elf P
reserving (SP, 20h) – самосохраняющися атрибут;
Некоторые из программ могут интерпретировать флаги в виде текстовых описаний, близких по смыслу к рассмотренным выше. Один атрибут может иметь несколько установленных в единицу значений флагов,
например, атрибут с идентификатором 05
отражающий количество переназначенных из-за сбоев секторов из резервной области, имеет установленные флаги SP+EC+OC – самосохраняющийся,
счетчик событий, обновляется при автономном и интерактивном режиме накопителя.

Value
— текущее значение атрибута

Threshold
— минимальное пороговое значения атрибута

Worst
— самое худшее значение атрибута за все время работы накопителя

Raw
— абсолютное значение атрибута

Type
— некоторые из программ в данном необязательном поле отображают
информацию из флажков атрибутов или признаки их критичности (Critical
или Pre-Fail
, отражающих ухудшение характеристик оборудования, и Old-age
для атрибутов, отражающих выработку ресурса);

Для анализа состояния накопителя, пожалуй самым важным значением атрибута
является Value
— условное число (обычно от 0 до 100 или до 253), заданное
производителем. Значение Value
изначально установлено на максимум при производстве
накопителя и уменьшается в случае ухудшения его параметров. Для каждого атрибута существует пороговое значение, при достижения которого, производитель не гарантирует его работоспособность — поле Threshold
. Если значение Value
приближается или становится меньше значения Threshold
, — накопитель пора менять.

Перечень атрибутов и их значения жестко не стандартизированы и некоторые из них могут определяться
изготовителем накопителя, но основная часть интерпретируются одинаково.
Например, атрибут с идентификатором 05
(Reallocated sector count
) будет характеризовать число забракованных и переназначенных из
резервной области секторов диска, как для устройств производства компании Seagate Technology, так и для устройств производства Western Digital .
Набор поддерживаемых атрибутов зависит от модели накопителя и может значительно отличаться по составу для разных моделей.

Наиболее распространенным программным средством для получения данных S.M.A.R.T в среде Linux, является утилита smartctl
из комплекта smartmontools
, как правило, входящего в состав устанавливаемого по умолчанию программного обеспечения любого дистрибутива. При необходимости, обновить версию, а также скачать документацию на английском языке можно на сайте проекта smartmontools.org .

Для работы с утилитой smartctl
требуются права суперпользователя root
.

Формат командной строки smartctl
:

smartctl параметры устройство

Примеры использования smartctl

smartctl –help или smartctl —usage
— отобразить подсказку об использовании команды.

Параметры smartctl
:

-V, —version, —copyright, —license
— отобразить версию, информацию копирайта и лицензии.

-i, —info
— отобразить идентификационную информацию для устройства.

-g NAME, —get=NAME
— отобразить параметры настроек диска (all, aam, apm, lookahead, security, wcache, rcache, wcreorder)

-a, —all
— отобразить все данные SMART указанного диска.

-x, —xall
— отобразить все технические данные для указанного диска.

—scan
— выполнить поиск дисковых устройств.

-q TYPE, —quietmode=TYPE
установить режим детализации вывода для smartctl (errorsonly, silent, noserial)

-d TYPE, —device=TYPE
— установить тип устройства (ata, scsi, sat[,auto][,N][+TYPE], usbcypress[,X], usbjmicron[,p][,x][,N], usbsunplus, marvell, areca,N/E, 3ware,N, hpt,L/M/N, megaraid,N, cciss,N, auto, test) Обычно установка типа устройства требуется в тех случаях, когда утилита smartctl
не может определить его автоматически.

-b TYPE, —badsum=TYPE
— задать реакцию на обнаружение ошибок контрольных сумм (warn, exit, ignore)

-r TYPE, —report=TYPE
— опция предназначена для разработчиков smartmontools
и позволяет
получить детализированную информацию при выполнении транзакций функции управления устройствами ввода/вывода ioctl
(ioctl, ataioctl, scsiioctl и уровень отладки). Подробности — man smartctl

-n MODE, —nocheck=MODE
— режим запрета на выполнение тестов для режимов энергосбережения (never, sleep, standby, idle). Обычно используется для предотвращения запуска шпиндельного двигателя по команде smartctl.

-s VALUE, —smart=VALUE
— отключение или включение SMART (on/off)

-o VALUE, —offlineauto=VALUE
— запрет или разрешение автоматического выполнения тестов
в неинтерактивном режиме (в режиме простоя накопителя), принимаемые значения — on/off

-S VALUE, —saveauto=VALUE
автосохранение атрибутов (on/off)

-s NAME[,VALUE], —set=NAME[,VALUE]
— запрет/разрешение параметров оборудования накопителя (aam,, apm,,
lookahead,, security-freeze, standby,, wcache,, rcache,, wcreorder,)

-H, —health
— отобразить состояние накопителя (SMART health status)

-c, —capabilities
— отобразить информацию о поддерживаемых возможностях SMART указанного жесткого диска.

-A, —attributes
— отобразить атрибуты SMART

-f FORMAT, —format=FORMAT
— задать формат отображаемых атрибутов SMART (old, brief, hex[,id|val]). В основном, влияет на формат отображаемых значений идентификаторов атрибутов и формат отображения их флагов:
old
— идентификаторы атрибутов выводятся в десятичной системе счисления, значения флагов отображаются в шестнадцатеричной и интерпретируются в виде текста.
hex
— то же, что и в предыдущем случае, но идентификаторы атрибутов отображаются в шестнадцатеричной системе счисления.
brief
— компактный вывод, идентификаторы отображаются в десятичной системе счисления, флаги отображаются в виде символов с расшифровкой в нижней части таблицы:

ID# ATTRIBUTE_NAME FLAGS VALUE WORST THRESH FAIL RAW_VALUE
1 Raw_Read_Error_Rate POSR— 114 100 006 — 78309029
. . . . . .
254 Free_Fall_Sensor -O—CK 100 100 000 — 0
||||||_ K auto-keep
|||||__ C event count
||||___ R error rate
|||____ S speed/performance
||_____ O updated online
|______ P prefailure warning

-l TYPE, —log=TYPE
— отобразить указанный журнал устройства (selftest, selective, directory[,g|s],
xerror[,N][,error], xselftest[,N][,selftest],background, sasphy[,reset], sataphy[,reset], scttemp, scttempint,N[,p], scterc[,N,M], devstat[,N], ssd, gplog,N[,RANGE], smartlog,N[,RANGE]

-v N,OPTION , —vendorattribute=N,OPTION
— установить параметр для определенного производителем атрибута с идентификатором N

-F TYPE, —firmwarebug=TYPE
— адаптация программы для учета ошибок в аппаратной прошивке накопителя (none, nologdir, samsung, samsung2, samsung3, xerrorlba, swapid)

-P TYPE, —presets=TYPE
— предустановки параметров диска. По умолчанию, обнаружив информацию о накопителе в своей базе, утилита smartctl
, использует набор параметров, доступный для данной модели. Опция use
— использовать предустановки для данного накопителя, ignore
— не использовать, show
— отобразить предустановки для данного диска, showall
— отобразить предустановки для указанной модели. Примеры:

smartctl –P ignore /dev/hdb
— игнорировать предустановки для диска /dev/hdb;
smartctl –P show /dev/sdb
— отобразить предустановки для указанного диска;
smartctl –P showall ‘ST9250315AS’
— — отобразить предустановки для указанной модели
диска — ST9250315AS;
smartctl –P showall ‘ST3750515AS’ ‘SD15’
— отобразить предустановки для указанной
модели диска ST3750515AS с прошивкой SD15;

-B [+]FILE, —drivedb=[+]FILE
— прочитать и изменить базу данных моделей дисков из файла FILE. Знак “+” перед именем файла, означает добавление новых записей в базу, перед уже существующими.

По умолчанию, база данных хранится в файле /usr/share/smartmontools/drivedb.h

DEVICE SELF-TEST OPTIONS =====

-t TEST, —test=TEST
— запустить выполнение теста TEST
Run test. TEST: offline, short, long, conveyance, force, vendor,N,
select,M-N, pending,N, afterselect,

-C, —captive
— выполнение тестов в режиме захвата накопителя. Используется совместно с параметром -t
для тестов не
в режиме offline
.
Использование данного параметра может вызвать занятость устройства на все время выполнения теста и привести к нарушению работы системы и потере данных.
Не стоит использовать опцию -c
для выполнения тестов накопителей с монтированными разделами. Для SCSI устройств данная опция означает
выполнение встроенных тестов в режиме «Foreground mode» .

-X, —abort
— принудительно завершить тест, выполняющийся без ключа —captive
.

Примеры использования smartctrl.

smartctl —info /dev/sdb
— отобразить идентификационную информацию для устройства /dev/sdb. Пример вывода команды:

smartctl —all /dev/hdа
— отобразить все данные SMART для устройства /dev/hda

Пример отображаемых данных:

=== START OF INFORMATION SECTION ===
Device Model: ST9500620NS
Serial Number: 9XF0AW8T
Firmware Version: SN01
User Capacity: 500,107,862,016 bytes
Device is: Not in smartctl database
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Tue Oct 28 15:05:45 2014 MSK
SMART support is: Available — device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: (0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (634) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: (1) minutes.
Extended self-test routine
recommended polling time: (102) minutes.
Conveyance self-test routine
recommended polling time: (2) minutes.
SCT capabilities: (0x10bd) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 082 064 044 Pre-fail Always — 190274202
3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always — 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always — 72
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always — 0
7 Seek_Error_Rate 0x000f 070 060 030 Pre-fail Always — 11302732
9 Power_On_Hours 0x0032 073 073 000 Old_age Always — 24037
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always — 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always — 72
184 End-to-End_Error 0x0032 100 100 099 Old_age Always — 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always — 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always — 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always — 0
190 Airflow_Temperature_Cel 0x0022 081 048 045 Old_age Always — 19
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always — 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always — 38
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always — 73
194 Temperature_Celsius 0x0022 019 052 000 Old_age Always — 19 (0 14 0 0)
195 Hardware_ECC_Recovered 0x001a 118 100 000 Old_age Always — 190274202
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always — 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline — 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always — 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
No self-tests have been logged.
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

smartctl -A -v 9,minutes /dev/hda
— отобразить все данные атрибутов SMART для устройства /dev/hda
и атрибут с идентификатором 9
(время нахождения во включенном состоянии) интерпретировать как внутреннее значение, задаваемое в минутах, а не в часах.

smartctl —smart=on —offlineauto=on —saveauto=on /dev/hda
— включить SMART для диска /dev/hda, разрешить автоматическое выполнение оффлайн-тестов и самосохранение атрибутов. Команду можно выполнять на работающей системе. Фактически, это установка стандартных параметров эксплуатации для обычного дискового накопителя.

smartctl —test=long /dev/hda
— выполнить расширенные встроенные тесты для диска /dev/hda.Команду можно использовать на работающей системе. Для просмотра результатов выполнения тестов используется команда вывода внутреннего журнала после завершения теста
smartctl -l selftest /dev/hda

smartctl —attributes —log=selftest —quietmode=errorsonly /dev/had
— отобразить данные внутреннего журнала самотестирования и атрибуты ошибок.

smartctl -s on -t offline /dev/hdc
— включить SMART и выполнить оффлайн-тест для диска /dev/hdc. Если при тестировании будет обнаружена ошибка, то информация по ней будет записана во внутренний журнал, просмотреть который можно с использованием параметра -l error
.

smartctl -q silent -a /dev/had
— проверить данные SMART без вывода полученной информации.Обычно используется в скриптах. После выполнения команды проверяется код возврата (переменная $?
командной оболочки)для определения факта выхода значения какого – либо атрибута за предельную величину или наличия записи об ошибках в журналах устройства.

smartctl -q errorsonly -H -l selftest /dev/had
— выводить информацию только при наличии ошибочного состояния SMART или если какой-либо из внутренних тестов завершился с ошибкой.

smartctl -t select,10-100 -t select,30-300 -t afterselect,on -t pending,45 /dev/hda
— выполнить внутренний тест в заданной области блоков LBA и после его завершения сканировать оставшуюся часть диска. Если при сканировании будет выполнено выключение питания, то продолжить его через 45 минут после включения.

smartctl —all —device=3ware,0 /dev/sda
— получить данные SMART для первого ATA-диска, подключенного к RAID контроллеру 3ware.

smartctl -a -d 3ware,0 /dev/twe0
— получить данные SMART для первого ATA-диска, подключенного к RAID контроллеру 3ware RAID 6000/7000/8000.

smartctl -a -d 3ware,0 /dev/twa0
— получить данные SMART для первого ATA-диска, подключенного к RAID контроллеру 3ware RAID 9000

smartctl -t short -d 3ware,3 /dev/sdb
— запустить выполнение коротких внутренних тестов для 4-го диска, второго дискового SCSI устройства /dev/sdb

smartctl -a -d hpt,1/3 /dev/sda
— получить данные SMART диска, подключенного к 3-му каналу первого контроллера HighPoint RocketRAID

Расшифровка атрибутов S.M.A.R.T

Идентификаторы атрибутов указаны в десятичной системе счисления, а в скобках они же – в шестнадцатеричной.

001 (1h) Raw Read Error Rate
— абсолютное значение ошибок
считывания. Существует некоторые отличия в формировании значения данного
атрибута разными производителями. Из практики могу сказать, что накопители
Seagate могут иметь гигантское значение RAW этого атрибута, реально будучи в
хорошем состоянии, а накопители Western Digital могут иметь его нулевым, имея
критические показатели по другим характеристикам. Некоторые модели вообще не
поддерживают данный атрибут.

002 (02h) Throughput Performance
— усредненная производительность жесткого диска. Редко встречающийся атрибут.

003 (3h) Spin Up Time
— Среднее время раскрутки шпинделя диска от 0 RPM
до рабочей скорости. Для SSD дисков не поддерживается.

004 (4h) Start/Stop Count
— Количество циклов запуск/останов шпинделя.

005 (5h) Reallocated Sector Count
— Количество переназначенных (перераспределенных) секторов. Современные накопители имеют резервную область поверхности для использования ее объема в случае ухудшения характеристик блоков из основной зоны. Если микропрограмма накопителя обнаруживает ошибки с записи/чтения какого-либо блока рабочей поверхности, то запускается механизм, обеспечивающий переадресацию обращений к дефектному блоку (сектору), на блок из резервной части. Он автоматически перемещает его данные в резервную область, а данный блок помечается как «переназначенный». Часто этот процесс называют «remapping»,
или «automatic defect reassignment». Процедура переназначения сбойных секторов на резервные,
выполняется автоматически внутренней микропрограммой накопителя, и для пользователя (операционной системы) она невидима. Сам факт переназначения и количество переназначенных секторов доступны только из журналов SMART. Поле абсолютного значения атрибута Raw Value
содержит общее количество переназначенных секторов. Нормализованное значение Value
отражает процент допустимого количества дефектных блоков. При исчерпании резервной области, переназначение становится невозможным и диск подлежит замене. Даже некритическое, но большое значение этого поля, может привести к снижению скорости обмена данными, поскольку накопитель выполняет
дополнительные операции установки головок на дорожки резервной области, которая обычно
находится в конце рабочей поверхности диска.

007 (7h) Seek Error Rate
— Частота появления ошибок позиционирования блока магнитных головок (БМГ) . Дисковые накопители контролирует правильность установки головок на требуемую дорожку поверхности. В случае, когда установка выполнилась неверно, фиксируется ошибка и операция повторяется. На практике, большое количество ошибок позиционирования может быть вызвано не только проблемами оборудования, но и влиянием внешних факторов – не соответствующим температурным режимом или вибрацией.

008 (8h) Seek Time Performance

009 (09h) Power-On Hours (POH)
Количество рабочих часов — количество часов, когда диск
находился во включенном состоянии за весь срок с момента производства, в виде целочисленного значения в часах. Иногда встречаются модели накопителей, в которых внутреннее значение данного атрибута сохраняется в виде количества рабочих минут или секунд, а не часов. Достижение порогового значения данного атрибута означает выработку ресурса, заданного производителем (MTBF
—
Mean Time Between Failures

010 (0Ah) Spin Retry Count
— Количество повторных попыток старта
шпинделя. После включения питания, накопитель раскручивает диски и
контролирует достижение рабочей скорости вращения, заданной производителем для данной модели. Если за отведенное контрольное время рабочая скорость не достигнута, увеличивается значение данного атрибута и выполняется повторная раскрутка двигателя.

011 (0B) Recalibration Retries
— атрибут отражает количество повторных рекалибровок, в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то велика вероятность проблем с механической частью накопителя.
Кроме того, увеличение абсолютного значения данного атрибута может быть вызвано
тем, что процедура рекалибровки используется внутренней микропрограммой
накопителя для коррекции других типов ошибок.

012 (0Ch) Device Power Cycle Count
— абсолютное значение Raw Value указывает на количество циклов включения/выключения питания накопителя за весь период эксплуатации. Нормализованное значение Value обычно не изменяется и равно 100.

013 (0Dh) — Soft Read Error Rate
— Количество программных сбоев — совокупное количество программных сбоев. Нормализованное значение: начиная со 100, отображает процент оставшегося допустимого нарастающего количества программных сбоев.

100 (64h) Erase/Program Cycles
— количество циклов стирания –записи перепрограммируемой памяти (flash) для SSD-дисков. Количество таких циклов ограниченно и зависит от микросхем постоянной перезаписываемой памяти, используемых в данной модели SSD.

103 (67h) Translation Table Rebuild
— количество событий, связанных с разрушением внутренних таблиц транслятора и его перестроением.

170 (AAh)Reserved Block Count
— количество доступных резервных блоков для переназначения сбойных секторов (см. атрибут E8h).

171 (ABh) Program Fail Count
— ошибки записи в перепрограммируемую память SSD

172 (ACh) Erase Fail Count
– ошибки стирания flash-памяти SSD. Процесс записи в перезаписываемую постоянную память состоит из двух частей — стирания и записи. Процедура стирания всегда выполняется перед записью данных.

173 (ADh) Wear Leveller Worst Case Erase Count
— максимально допустимое количество операций стирания для единичного блока SSD-диска.

174 (AEh) Unexpected Power Loss
— непредвиденное отключение питания для SSD . Также этот показатель называется «Количество аварийных выключений» в терминологии жестких дисков с магнитными носителями. Абсолютное значение Raw Value: совокупное количество нештатных выключений
за весь срок использования устройства.

175 (AFh) Program Fail Count
– данный атрибут используется в SSD-накопителях производства Intel и отображает информацию о сбоях защиты от отключения питания SSD-дисков. Результаты последнего теста в виде количества микросекунд до разряда конденсатора, фиксируется на максимальном значении. Также записывается количество минут после последнего теста и
общее количество тестов за весь срок использования устройства.
Необработанное значение Raw Value:
Байты 0-1: Результаты последнего теста в виде количества микросекунд до разряда конденсатора,
фиксируется на максимальном значении. Результат теста должен быть в диапазоне
25 — 5 000 000, более низкое значение указывает на определенный код ошибки.
Байты 2-3: количество минут после последнего текста, фиксируется на максимальном значении.
Байты 4-5: количество тестов за весь срок использования устройства, не увеличивается при циклах включения и отключения,
фиксируется на максимальном значении.
Значение Value устанавливается равным 1
при сбое теста, или 11
при тестировании конденсатора в недопустимых температурных условиях; в противном случае устанавливается равным 100.

183 (B7h) SATA Downshifts
— Количество снижений скорости SATA Необработанное значение: количество случаев, когда из-за ошибок для интерфейса SATA была выбрана пониженная скорость передачи данных (с 6 Гб/с до 3Гб/с или 1,5Гб/с или с 3Гб/с. До 1.5Гб/с. Очень часто данный атрибут характеризует недостаточное качество электропитания, окисление контактов интерфейсного кабеля, или его неисправность.

184 (B8h) End-to-End error
Количество обнаруженных сквозных ошибок кэш-памяти (disk cache). Абсолютное значение: количество обнаруженных и исправленных оборудованием сквозных ошибок.

187 (BBh) Reported Uncorrectable Errors
Количество невосстановимых ошибок. Необработанное значение Raw Value: количество ошибок, которые не удалось исправить с помощью внутренних подпрограмм накопителя.

188 (BCh) Command Timeout
— количество команд, прерванных по таймауту.

189 (BDh) High Fly Writes
— количество событий, связанных с ошибками, зафиксированными монитором контроля высоты полета Fly Height Monitor, когда головки записи находятся в положении, не гарантирующем нормальное выполнение операции. Если высота полета головки над магнитной поверхностью, даже на короткое время превысит оптимальную, то записанные ею данные, в дальнейшем, могут не прочитаться. Современные накопители используют специально разработанную технологию контроля высоты полета головок, позволяющую не выполнять запись данных при неоптимальной высоте. В счетчик данного атрибута добавляется единица, а запись выполняется после установки нормальной высоты полета. Повышенное значение данного атрибута может быть вызвано внешними ударами или
вибрациями, ненормальной температурой, ухудшением характеристик магнитной
поверхности или головки.

190 (BEh) Airflow Temperature
температура воздушного потока (корпус). Значение Raw Value: статистические данные по температуре корпуса.
Байты 0-1: текущая температура корпуса в градусах по Цельсию;
байт 2: недавняя минимальная температура корпуса в градусах по Цельсию;
байт 3: недавняя максимальная температура корпуса в градусах по Цельсию;
байты 4-5: счетчик превышений температуры. Количество случаев, когда зафиксированная температура
превышала максимальную допустимую рабочую температуру накопителя.

191 (BFh) G-sense error rate
— количество ошибок, возникающих в
результате ударных нагрузок. Атрибут хранит показания встроенного
акселерометра, который фиксирует все удары, толчки, падения и даже
неаккуратную установку диска в корпус компьютера. Обычно довольно точно
характеризует условия эксплуатации ноутбуков — большое значение атрибута говорит о
резких толчках и падениях при работе устройства.

192 (C0h) Emergency Retract Cycle Count
Количество аварийных выключений (количество нештатных выключений) — совокупное количество событий аварийного (нештатного) отключения питания за весь срок использования устройства. Для SSD дисков под «нештатным выключением» понимается отключение питания устройства без предварительной выдачи команды STANDBY IMMEDIATE.

194 (C2h) HDA Temperature
— температура самого накопителя (HDA — Hard Disk Assembly).
В данном атрибуте хранятся показания встроенного температурного датчика, которым обычно
служит одна из магнитных головок (как правило — нижняя). У SSD дисков термодатчик размещается внутри корпуса на печатной плате. Данные, записанные в полях атрибута отображают текущую,
минимальную и максимальную температуру. Поле Worst показывает наихудшую,
достигнутую за время работы накопителя, температуру (можно установить факт
перегрева и его степень), Raw Value — текущую температуру. Некоторые модели
накопителей могут поддерживать атрибут 205 (CDh) Thermal asperity rate (TAR),
фиксирующий количество опасных перепадов температуры.

195 (C3h) Hardware ECC Recovered
— количество ошибок считывания, исправленных
оборудованием накопителя с применением кода коррекции ошибок.
Подобные ошибки не требуют повторного считывания сектора, и не приводят к
потере скорости обмена данными, но большое их количество говорит об ухудшении
параметров тракта считывания.

196 (C4h) Reallocation Event Count
raw value

Поле raw value
этого атрибута показывает
общее количество секторов, которые накопитель в данный момент считает
кандидатами на переназначение в резервную область. Если в дальнейшем
какой-то из этих секторов будет прочитан успешно, то он исключается из списка
кандидатов. Если же чтение сектора будет сопровождаться ошибками, то
накопитель попытается восстановить данные и перенести их в резервную область,
а сам сектор пометить как переназначенный (remapped).

198 (C6) Uncorrectable Sector Count
— Счетчик некорректируемых ошибок,
т.е, счетчик ошибок, которые не были исправлены внутренними
средствами коррекции оборудования накопителя. Это означает, что такие ошибки проявляются как
классические сбойные блоки файловой системы (Bad Block). Причиной подобных сбоев
диска, может быть неисправность отдельных элементов или отсутствие свободных секторов
в резервной области диска, когда возникла необходимость переназначения.

199 (C7h) UltraDMA CRC Error Rate
— Количество ошибок при передаче данных в режиме прямого доступа к памяти, обнаруженных средствами циклического избыточного кода (англ. Cyclic redundancy check, CRC). Аппаратные средства контроля передачи
данных из накопителя в оперативную память обнаружили ошибку контрольной
суммы и исправили ее “на лету”, если ошибка исправимая. В данном случае алгоритм обычной работы диска не изменяется. В случае же неисправимой ошибки, процедура ее обработки выполняется системой. Обычно, данный атрибут содержит счетчик любых видов ошибок CRC. Нередко этот тип ошибки связан не столько с оборудованием накопителя, сколько с неисправным интерфейсным кабелем, окислившимися контактами, некачественным электропитанием, разгоном частоты шины PCI, перегревом микросхем чипсета материнской платы и т.п.

200 (C8h) Write Error Rate (Multi Zone Error Rate)
— ошибки записи данных.

232 (E8h) Total Count of Write Sectors
Для SSD-дисков — количество записанных секторов. Значение Raw Value увеличивается на 1 на каждые 65 536 секторов (32 МБ), записываемых системой. Для SSD Intel — Intel SSD Available Reserved Space
— процент доступной резервной области, используемой для переназначения дефектных блоков.

233 (E9h) Power-On Hours
— Время работы накопителя. Для SSD-дисков этот атрибут интерпретируется как Remaining Life
— указатель износа носителя. Количество циклов
работы носителя NAND. Линейно снижается от 100 до 1 по мере увеличения среднего количества циклов стирания от 0 до максимального. Нормализованное значение перестанет уменьшаться после достижения 1, но, по всей вероятности, устройство выдержит значительный дополнительный износ.

241 (F1h) Total LBAs Written
— Общее количество записанных секторов LBA. Значение Raw Value: совокупное количество секторов, записанных системой. Значение увеличивается на 1 на каждые 65 536 секторов (32 МБ), записываемых системой.

242 (F2h) Total LBAs Read
— Общее количество прочитанных секторов LBA. Значение Raw Value увеличивается на 1 на каждые 65 536 секторов (32 МБ), прочитываемых системой.

254 (FEh) Free Fall Event Count
— количество событий ускорения свободного падения диска за время эксплуатации (сколько раз диск падал).

Оценка технического состояния жесткого диска по данным S.M.A.R.T

Набор атрибутов поддерживаемых конкретной моделью жесткого диска, даже если он минимален, позволяет с высокой достоверностью определить техническое состояние и перспективы эксплуатации устройства. Можно определить время нахождения во включенном состоянии по значению атрибута 9
, а в совокупности со значением атрибута 12
— количество включений /выключений электропитания, и следовательно, – круглосуточный или периодический режим эксплуатации. Интенсивность использования, температурный режим, негативные внешние воздействия – все эти факты легко отслеживаются по абсолютным значениям соответствующих атрибутов. Подобным же образом, можно оценить и уровень износа оборудования, качество поверхности и тракта записи/чтения.

Минимально информативный контроль состояния дисков может выполняться даже на уровне BIOS. В случае достижения критического значения любого атрибута, характеризующего работоспособность, при включенном мониторинге состояния S.M.A.R.T в настройках BIOS, загрузка
операционной системы приостанавливается и на экран выводится сообщение:

Primary Master Hard Disk: S.M.A.R.T status BAD!, Backup and Replace.

Press F1 to Resume

Таким образом, без установки или запуска дополнительного программного
обеспечения, имеется возможность вовремя определить факт критического состояния
накопителя средствами Базовой Системы Ввода-Вывода (BIOS) при включении компьютера.

Техническое состояние жесткого диска, не достигшее критического порога, характеризуется абсолютным значением атрибутов, отражающих счетчики сбоев, обнаруженных и исправленных
оборудованием накопителя.

001 (1) Raw Read Error Rate
— абсолютное значение ошибок
считывания. Существует некоторые отличия в формировании значения данного
атрибута разными производителями. На практике, накопители
Seagate могут иметь гигантское значение RAW этого атрибута, реально будучи в
хорошем состоянии, а накопители Western Digital могут иметь его нулевым, имея
критические показатели по другим характеристикам. Некоторые модели вообще могут не
поддерживать данный
атрибут.

005 (5) Reallocated Sector Count
— Количество переназначенных секторов. Ненулевое значение данного счетчика говорит о том, что были обнаружены дефектные блоки, данные которых перенесены в резервную область.

196 (C4) Reallocation Event Count
— Число событий
переназначения сбойных секторов. В поле raw value

данного атрибута хранится общее число попыток переноса данных из нестабильных секторов
в резервную область. Учитываются как успешные, так и неуспешные попытки.

197 (C5) Current Pending Sector Count
— Текущее количество
нестабильных секторов. Поле raw value
этого атрибута показывает
общее количество секторов, которые накопитель в данный момент считает
кандидатами на переназначение в резервную область (remap). Если в дальнейшем
какой-то из этих секторов будет прочитан успешно, то он исключается из списка
кандидатов. Если же чтение сектора будет сопровождаться ошибками, то
накопитель попытается восстановить данные и перенести их в резервную область,
а сам сектор пометить как переназначенный (remapped).
Если значение атрибутов 5,196,197 увеличивается за короткий промежуток времени (дни, или даже часы), то это является настораживающим признаком – либо ухудшаются технические параметры самого накопителя, либо сказывается влияние внешних воздействий.

007 (07h) Seek Error Rate
— Частота появления ошибок позиционирования блока магнитных головок (БМГ). Большое значение говорит о проблемах механизма позиционирования, хотя может быть вызвано и внешними факторами, такими как перегрев или повышенная вибрация.

008 (08h) Seek Time Performance
— средняя скорость позиционирования
магнитных головок. Если значение атрибута уменьшается
(замедление позиционирования), то велика вероятность проблем с
механической частью привода головок.

199 (C7) UltraDMA CRC Error Count
— Счетчик ошибок, возникших при
передаче данных в режиме UltraDMA. Рост абсолютного значения указывает на проблемы при передаче данных контроллером диска в оперативную память. Чаще всего, вызвано плохим кабелем и нестабильным электропитанием.

Изменение абсолютных значений атрибутов нужно рассматривать в динамике, и в логической взаимосвязи друг с другом.

Выполнение встроенных тестов S.M.A.R.T

Набор встроенных тестов S.M.A.R.T определяется производителем и может значительно отличаться для разных моделей жестких дисков. В основном, встроенные тесты SMART представлены короткими тестами (short self-test) и длинными (extended sels-test). Короткие тесты выполняют сканирование небольшой части дисковой поверхности, определенной производителем, и выполняются, в среднем, около 1 минуты. Длинные тесты выполняют сканирование всей рабочей поверхности диска и могут выполняться, в зависимости от быстродействия и объема диска, даже несколько часов. Также, для современных дисков, можно выполнять селективные тесты (selective self-test), параметры которых задаются пользователем и тесты после транспортировки устройства (conveyance self-test). Выполнение тестов можно прервать, если не задан режим захвата накопителя (captive) и накопитель поддерживает команду отмены теста. Что касается режима захвата накопителя при выполнении тестов captive
, то пользоваться им нужно осторожно, если диск используется системой.

Примеры:

smartctl —test=short /dev/sdb
— запустить короткий тест. В ответ на команду, будет выведена информация:

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: «Execute SMART Short self-test routine immediately in off-line mode».
Drive command «Execute SMART Short self-test routine immediately in off-line mode» successful.
Testing has begun (previous test aborted).
Please wait 1 minutes for test to complete.
Test will complete after Fri Dec 5 16:08:09 2014
Use smartctl -X to abort test.

Что означает, что диску отправлена команда на выполнение короткого теста, диск ее воспринял успешно, тест будет продолжаться 1 минуту, и для принудительного его прекращения можно воспользоваться командой smartctl –X.

Результат выполнения теста можно проверить, просмотрев журнал тестов командой smartctl –l selftest
. В ответ будет получена информация журнала selftest
:

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 831 —

Колонки журнала:
Num
— номер записи.
Test_Description
— описание теста.
Status
— статус завершения (выполнен без ошибок)
Remaining
— процент оставшегося времени до завершения теста, если он еще не завершен (00%)
LifeTime(hours)
— время работы накопителя с начала эксплуатации.
LBA_of_first_error
— номер логического блока LBA где обнаружена первая ошибка при выполнении теста. В данном примере, ошибок нет.

Для запуска длинного теста используется команда:

smartctl —test=long /dev/sdb

В ответ на команду выводится информация о начале теста:

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: «Execute SMART Extended self-test routine immediately in off-line mode».
Drive command «Execute SMART Extended self-test routine immediately in off-line mode» successful.
Testing has begun.
Please wait 70 minutes for test to complete.
Test will complete after Fri Dec 5 17:15:44 2014

Как видно, длинный тест для данной модели накопителя будет выполняться 70 минут.

Результат выполнения можно проверить командой smartctl –l selftest /dev/sda

Список команд ATA для работы с S.M.A.R.T

SMART_READ_VALUES 0xd0
SMART_READ_THRESHOLDS 0xd1
SMART_AUTOSAVE 0xd2
SMART_SAVE 0xd3
SMART_IMMEDIATE_OFFLINE 0xd4
SMART_READ_LOG_SECTOR 0xd5
SMART_WRITE_LOG_SECTOR 0xd6
SMART_ENABLE 0xd8
SMART_DISABLE 0xd9
SMART_STATUS 0xda
SMART_AUTO_OFFLINE 0xdb

Дополнительно по теме оборудования в Linux:

Состояние которого вызывает у вас подозрения, то первое, что нужно сделать, это проверить данные технологии SMART. Данная технология предназначена для сбора информации о состоянии жесткого диска и проведения процедуры самодиагностики. С помощью SMART можно быстро оценить, в каком состоянии находится жесткий диск, есть ли риск потери данных и что нужно делать для дальнейшей диагностики и ремонта компьютера.

Технология SMART (или S.M.A.R.T.) появилась в жестких дисках еще в 1992 году. Тогда первым накопителем с этой системой стал дисковый массив от компании IBM. С тех пор SMART получила широкое применение и сейчас используется абсолютно во всех HDD и большинстве SSD дисков.

Интерфейс программы CrystalDiskInfo очень прост и будет понятен даже начинающим пользователям. В верхней части окна находится список дисков, которые подключены к компьютеру. После выбора жесткого диска в нижней части окна появится вся информация, которая доступна для данного HDD.

Чуть ниже расположен блок основной информации о выбранном накопителе. Здесь можно узнать название диска, версию его прошивки, серийный номер, используемый интерфейс, скорость вращения шпинделя, число включений, общее время работы, а также другую информацию.

В блоке с основной информацией самыми важными данными является «Число включений» и «Общее время работы». Чем больше эти значения, тем хуже состояние жесткого диска, так как в процессе работы он неизбежно деградирует. В настольных компьютерах современные диски обычно нормально работают в течение 15-25 тысяч часов, после чего начинают появляться проблемы. Для ноутбуков это число еще меньше, там диски обычно выдерживают не больше 10-20 тысяч часов.

Ближе к левой части окна есть еще два важных параметра. Это оценка технического состояния жесткого диска и его температура. Оценка технического состояния жесткого диска – это общая оценка, которую программа присваивает на основе данных технологии SMART. Данная оценка может принимать одно из трех значений:

Хорошо
– с диском все в порядке, никакие действия не требуются.
Тревога
– у диска есть некоторые проблемы, стоит проверить наличие резервных копий, диск желательно заменить.
Плохо
– у диска есть значительные неисправности, диск необходимо заменить.

Не имеет прямого отношения к его состоянию. Нормальной температурой для HDD считается от 20 до 45 градусов Цельсия. Если температура превышает 45 градусов, то это говорит о плохом охлаждении корпуса компьютера.

Самая полезная информация о состоянии жесткого диска находится в нижней части окна программы. Здесь расположен список параметров, которые отслеживает технология SMART, а также присвоенные им значения. Используя эту информацию, можно быстро оценить состояние HDD и принять решение о дальнейших действиях.

При изучении списка параметров SMART следует смотреть на значение колонки «RAW-значение». Данные здесь указаны в формате HEX.

Список параметров, отслеживаемых технологией SMART, достаточно большой, но далеко не все из них имеют критическое значение для состояния жесткого диска. Ниже мы рассмотрим только самые важные из них.

03 – Время раскрутки (Spin-Up Time)
– время, которое требуется на раскрутку диска из выключенного состояния до рабочей скорости. Данное значение увеличивается при износе механической части накопителя, также большое время раскрутки может свидетельствовать о просадке напряжения при запуске диска.
05 – Переназначенные сектора (Reallocated Sectors Count)
– количество секторов, которые были признаны неисправными и были переназначены в резервную область. Наличие переназначенных секторов указывает на проблемы с поверхностью диска.
0A – Повторные попытки раскрутки (Spin-Up Retry Count)
– количество повторных попыток раскрутки диска. Данное значение увеличивается при износе механической части накопителя.
BB – Неисправимые ошибки (Reported UNC Errors)
– количество ошибок, которые не получилось устранить аппаратными средствами накопителя.
BC – Таймаут команды (Command Timeout)
– количество операций, которые были прерваны из-за таймаута. Увеличение данного параметра может свидетельствовать о проблемах с питанием диска или кабелями.
C4 – Попытки переназначения секторов (Reallocation Event Count)
– количество попыток выполнить операцию переназначения сектора. Учитываются как удачные, так и не удачные попытки переназначения секторов. Наличие попыток переназначения указывает на проблемы с поверхностью диска.
C5 – Нестабильные сектора (Current Pending Sector Count)
– количество подозрительных секторов, которые могут быть переназначены в будущем. Наличие нестабильных секторов указывает на проблемы с поверхностью диска.
C6 – Неисправимые ошибки секторов (Uncorrectable Sector Count)
– количество секторов, которые не могут быть исправлены средствами жесткого диска. Наличие неисправимых ошибок указывает на проблемы с поверхностью или механической частью диска.

Если RAW-значения для всех указанных выше параметров равняются нулю, то это указывает на то, что жесткий диск находится в отличном состоянии. Никаких проблем технология SMART не выявила. Если же некоторые параметры имеют значение больше нуля, то состояние HDD стоит проверить более тщательно, возможно, такой диск потребует скорой замены.

Самым важным параметром SMART является параметр «Переназначенные сектора» или «Reallocated Sectors Count». Он указывает на количество неисправных секторов, которые были переназначены диском в резервную область. Обычно, после появления всего нескольких переназначенных секторов поверхность диска начинает быстро деградировать и накопитель полностью выходит из строя спустя несколько дней или недель.

Поэтому при обнаружении переназначенных секторов необходимо проверить наличие резервных копий всех важных данных, которые хранятся на таком диске. Если резервных копий нет, то их нужно срочно сделать, иначе вы рискуете потерять данные.

Источник

Кто сейчас на конференции

Лаборатория

Новости

Содержание

Что такое SMART и что он показывает?

Ошибки S.M.A.R.T.

Примеры ошибок SMART

Ошибка «SMART failure predicted»

Ошибка «S.M.A.R.T. status BAD»

Ошибка «the smart hard disk check has detected»

Как исправить SMART ошибку?

Как отключить проверку SMART?

Что делать если данные были утеряны?

Часто задаваемые вопросы

Как пользоваться одной из легендарных программ по диагностике жёстких дисков под названием Victoria!

Критические значения

Расшифруем полученный вывод.

Показатели S.M.A.R.T

Проверка S.M.A.R.T

Примеры использования smartctrl.

Расшифровка атрибутов S.M.A.R.T

Оценка технического состояния жесткого диска по данным S.M.A.R.T

Выполнение встроенных тестов S.M.A.R.T

Список команд ATA для работы с S.M.A.R.T

Читайте также: