Smart 195 ecc error rate

Информация о состоянии диска доступна благодаря комплексу технологий, называемых общим именем S.M.A.R.T. Этот комплекс довольно обширен, но мы поговорим о тех его аспектах, которые позволяют посмотреть на атрибуты S.M.A.R.T., отображаемые в какой-либо программе по тестированию винчестера, и понять, что творится с диском.

Современный жёсткий диск — уникальный компонент компьютера. Он уникален тем, что хранит в себе служебную информацию, изучая которую, можно оценить «здоровье» диска. Эта информация содержит в себе историю изменения множества параметров, отслеживаемых винчестером в процессе функционирования. Больше ни один компонент системного блока не предоставляет владельцу статистику своей работы! Вкупе с тем, что HDD является одним из самых ненадёжных компонентов компьютера, такая статистика может быть весьма полезной и помочь его владельцу избежать нервотрёпки и потери денег и времени.

Информация о состоянии диска доступна благодаря комплексу технологий, называемых общим именем S.M.A.R.T. (Self-Monitoring, Analisys and Reporting Technology, т. е. технология самомониторинга, анализа и отчёта). Этот комплекс довольно обширен, но мы поговорим о тех его аспектах, которые позволяют посмотреть на атрибуты S.M.A.R.T., отображаемые в какой-либо программе по тестированию винчестера, и понять, что творится с диском.

Отмечу, что нижесказанное относится к дискам с интерфейсами SATA и РАТА. У дисков SAS, SCSI и других серверных дисков тоже есть S.M.A.R.T., но его представление сильно отличается от SATA/PATA. Да и мониторит серверные диски обычно не человек, а RAID-контроллер, потому про них мы говорить не будем.

Итак, если мы откроем S.M.A.R.T. в какой-либо из многочисленных программ, то увидим приблизительно следующую картину (на скриншоте приведён S.M.A.R.T. диска Hitachi Deskstar 7К1000.С HDS721010CLA332 в HDDScan 3.3):

S.M.A.R.T. в HDDScan 3.3

S.M.A.R.T. в HDDScan 3.3

В каждой строке отображается отдельный атрибут S.M.A.R.T. Атрибуты имеют более-менее стандартизованные названия и определённый номер, которые не зависят от модели и производителя диска.

Каждый атрибут S.M.A.R.T. имеет несколько полей. Каждое поле относится к определённому классу из следующих: ID, Value, Worst, Threshold и RAW. Рассмотрим каждый из классов.

  • ID (может также именоваться Number) — идентификатор, номер атрибута в технологии S.M.A.R.T. Название одного и того же атрибута программами может выдаваться по-разному, а вот идентификатор всегда однозначно определяет атрибут. Особенно это полезно в случае программ, которые переводят общепринятое название атрибута с английского языка на русский. Иногда получается такая белиберда, что понять, что же это за параметр, можно только по его идентификатору.
  • Value (Current) — текущее значение атрибута в попугаях (т. е. в величинах неизвестной размерности). В процессе работы винчестера оно может уменьшаться, увеличиваться и оставаться неизменным. По показателю Value нельзя судить о «здоровье» атрибута, не сравнивая его со значением Threshold этого же атрибута. Как правило, чем меньше Value, тем хуже состояние атрибута (изначально все классы значений, кроме RAW, на новом диске имеют максимальное из возможных значение, например 100).
  • Worst — наихудшее значение, которого достигало значение Value за всю жизнь винчестера. Измеряется тоже в «попугаях». В процессе работы оно может уменьшаться либо оставаться неизменным. По нему тоже нельзя однозначно судить о здоровье атрибута, нужно сравнивать его с Threshold.
  • Threshold — значение в «попугаях», которого должен достигнуть Value этого же атрибута, чтобы состояние атрибута было признано критическим. Проще говоря, Threshold — это порог: если Value больше Threshold — атрибут в порядке; если меньше либо равен — с атрибутом проблемы. Именно по такому критерию утилиты, читающие S.M.A.R.T., выдают отчёт о состоянии диска либо отдельного атрибута вроде «Good» или «Bad». При этом они не учитывают, что даже при Value, большем Threshold, диск на самом деле уже может быть умирающим с точки зрения пользователя, а то и вовсе ходячим мертвецом, поэтому при оценке здоровья диска смотреть стоит всё-таки на другой класс атрибута, а именно — RAW. Однако именно значение Value, опустившееся ниже Threshold, может стать легитимным поводом для замены диска по гарантии (для самих гарантийщиков, конечно же) — кто же яснее скажет о здоровье диска, как не он сам, демонстрируя текущее значение атрибута хуже критического порога? Т. е. при значении Value, большем Threshold, сам диск считает, что атрибут здоров, а при меньшем либо равном — что болен. Очевидно, что при Threshold=0 состояние атрибута не будет признано критическим никогда. Threshold — постоянный параметр, зашитый производителем в диске.
  • RAW (Data) — самый интересный, важный и нужный для оценки показатель. В большинстве случаев он содержит в себе не «попугаи», а реальные значения, выражаемые в различных единицах измерения, напрямую говорящие о текущем состоянии диска. Основываясь именно на этом показателе, формируется значение Value (а вот по какому алгоритму оно формируется — это уже тайна производителя, покрытая мраком). Именно умение читать и анализировать поле RAW даёт возможность объективно оценить состояние винчестера.

Этим мы сейчас и займёмся — разберём все наиболее используемые атрибуты S.M.A.R.T., посмотрим, о чём они говорят и что нужно делать, если они не в порядке.

Аттрибуты S.M.A.R.T.
  01 02 03 04 05 07 08 09 10 11 12 183 184 187 188 189 190
0x 01 02 03 04 05 07 08 09 0A 0B 0C B7 B8 BB BC BD BE
 
  191 192 193 194 195 196 197 198 199 200 201 202 203 220 240 254  
0x BF С0 С1 С2 С3 С4 С5 С6 С7 С8 С9 СА CB DC F0 FE  

Перед тем как описывать атрибуты и допустимые значения их поля RAW, уточню, что атрибуты могут иметь поле RAW разного типа: текущее и накапливающее. Текущее поле содержит значение атрибута в настоящий момент, для него свойственно периодическое изменение (для одних атрибутов — изредка, для других — много раз за секунду; другое дело, что в программах чтения S.M.A.R.T. такое быстрое изменение не отображается). Накапливающее поле — содержит статистику, обычно в нём содержится количество возникновений конкретного события со времени первого запуска диска.

Текущий тип характерен для атрибутов, для которых нет смысла суммировать их предыдущие показания. Например, показатель температуры диска является текущим: его цель — в демонстрации температуры в настоящий момент, а не суммы всех предыдущих температур. Накапливающий тип свойственен атрибутам, для которых весь их смысл заключается в предоставлении информации за весь период «жизни» винчестера. Например, атрибут, характеризующий время работы диска, является накапливающим, т. е. содержит количество единиц времени, отработанных накопителем за всю его историю.

Приступим к рассмотрению атрибутов и их RAW-полей.

Атрибут: 01 Raw Read Error Rate

Тип текущий, может быть накапливающим для WD и старых Hitachi
Описание содержит частоту возникновения ошибок при чтении с пластин

Для всех дисков Seagate, Samsung (начиная с семейства SpinPoint F1 (включительно)) и Fujitsu 2,5″ характерны огромные числа в этих полях.

Для остальных дисков Samsung и всех дисков WD в этом поле характерен 0.

Для дисков Hitachi в этом поле характерен 0 либо периодическое изменение поля в пределах от 0 до нескольких единиц.

Такие отличия обусловлены тем, что все жёсткие диски Seagate, некоторые Samsung и Fujitsu считают значения этих параметров не так, как WD, Hitachi и другие Samsung. При работе любого винчестера всегда возникают ошибки такого рода, и он преодолевает их самостоятельно, это нормально, просто на дисках, которые в этом поле содержат 0 или небольшое число, производитель не счёл нужным указывать истинное количество этих ошибок.

Таким образом, ненулевой параметр на дисках WD и Samsung до SpinPoint F1 (не включительно) и большое значение параметра на дисках Hitachi могут указывать на аппаратные проблемы с диском. Необходимо учитывать, что утилиты могут отображать несколько значений, содержащихся в поле RAW этого атрибута, как одно, и оно будет выглядеть весьма большим, хоть это и будет неверно (подробности см. ниже).

На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания.

Атрибут: 02 Throughput Performance

Тип текущий
Описание содержит значение средней производительности диска и измеряется в каких-то «попугаях». Обычно его ненулевое значение отмечается на винчестерах Hitachi. На них он может изменяться после изменения параметров ААМ, а может и сам по себе по неизвестному алгоритму

Параметр не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.

Атрибут: 03 Spin-Up Time

Тип текущий
Описание содержит время, за которое шпиндель диска в последний раз разогнался из состояния покоя до номинальной скорости. Может содержать два значения — последнее и, например, минимальное время раскрутки. Может измеряться в миллисекундах, десятках миллисекунд и т. п. — это зависит от производителя и модели диска

Время разгона может различаться у разных дисков (причём у дисков одного производителя тоже) в зависимости от тока раскрутки, массы блинов, номинальной скорости шпинделя и т. п.

Кстати, винчестеры Fujitsu всегда имеют единицу в этом поле в случае отсутствия проблем с раскруткой шпинделя.

Практически ничего не говорит о здоровье диска, поэтому при оценке состояния винчестера на параметр можно не обращать внимания.

Атрибут: 04 Number of Spin-Up Times (Start/Stop Count)

Тип накапливающий
Описание содержит количество раз включения диска. Бывает ненулевым на только что купленном диске, находившемся в запаянной упаковке, что может говорить о тестировании диска на заводе. Или ещё о чём-то, мне не известном :)

При оценке здоровья не обращайте на атрибут внимания.

Атрибут: 05 Reallocated Sector Count

Тип накапливающий
Описание содержит количество секторов, переназначенных винчестером в резервную область. Практически ключевой параметр в оценке состояния

Поясним, что вообще такое «переназначенный сектор». Когда диск в процессе работы натыкается на нечитаемый/плохо читаемый/незаписываемый/плохо записываемый сектор, он может посчитать его невосполнимо повреждённым. Специально для таких случаев производитель предусматривает на каждом диске (на каких-то моделях — в центре (логическом конце) диска, на каких-то — в конце каждого трека и т. д.) резервную область. При наличии повреждённого сектора диск помечает его как нечитаемый и использует вместо него сектор в резервной области, сделав соответствующие пометки в специальном списке дефектов поверхности — G-list. Такая операция по назначению нового сектора на роль старого называется remap (ремап) либо переназначение, а используемый вместо повреждённого сектор — переназначенным. Новый сектор получает логический номер LBA старого, и теперь при обращении ПО к сектору с этим номером (программы же не знают ни о каких переназначениях!) запрос будет перенаправляться в резервную область.

Таким образом, хоть сектор и вышел из строя, объём диска не изменяется. Понятно, что не изменяется он до поры до времени, т. к. объём резервной области не бесконечен. Однако резервная область вполне может содержать несколько тысяч секторов, и допустить, чтобы она закончилась, будет весьма безответственно — диск нужно будет заменить задолго до этого.

Кстати, ремонтники говорят, что диски Samsung очень часто ни в какую не хотят выполнять переназначение секторов.

На счёт этого атрибута мнения разнятся. Лично я считаю, что если он достиг 10, диск нужно обязательно менять — ведь это означает прогрессирующий процесс деградации состояния поверхности либо блинов, либо головок, либо чего-то ещё аппаратного, и остановить этот процесс возможности уже нет. Кстати, по сведениям лиц, приближенных к Hitachi, сама Hitachi считает диск подлежащим замене, когда на нём находится уже 5 переназначенных секторов. Другой вопрос, официальная ли эта информация, и следуют ли этому мнению сервис-центры. Что-то мне подсказывает, что нет :)

Другое дело, что сотрудники сервис-центров могут отказываться признавать диск неисправным, если фирменная утилита производителя диска пишет что-то вроде «S.M.A.R.T. Status: Good» или значения Value либо Worst атрибута будут больше Threshold (собственно, по такому критерию может оценивать и сама утилита производителя). И формально они будут правы. Но кому нужен диск с постоянным ухудшением его аппаратных компонентов, даже если такое ухудшение соответствует природе винчестера, а технология производства жёстких дисков старается минимизировать его последствия, выделяя, например, резервную область?

Атрибут: 07 Seek Error Rate

Тип текущий
Описание содержит частоту возникновения ошибок при позиционировании блока магнитных головок (БМГ)

Описание формирования этого атрибута почти полностью совпадает с описанием для атрибута 01 Raw Read Error Rate, за исключением того, что для винчестеров Hitachi нормальным значением поля RAW является только 0.

Таким образом, на атрибут на дисках Seagate, Samsung SpinPoint F1 и новее и Fujitsu 2,5″ не обращайте внимания, на остальных моделях Samsung, а также на всех WD и Hitachi ненулевое значение свидетельствует о проблемах, например, с подшипником и т. п.

Атрибут: 08 Seek Time Performance

Тип текущий
Описание содержит среднюю производительность операций позиционирования головок, измеряется в «попугаях». Как и параметр 02 Throughput Performance, ненулевое значение обычно отмечается на дисках Hitachi и может изменяться после изменения параметров ААМ, а может и само по себе по неизвестному алгоритму

Не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.

Атрибут: 09 Power On Hours Count (Power-on Time)

Тип накапливающий
Описание содержит количество часов, в течение которых винчестер был включён

Ничего не говорит о здоровье диска.

Атрибут: 10 (0А — в шестнадцатеричной системе счисления) Spin Retry Count

Тип накапливающий
Описание содержит количество повторов запуска шпинделя, если первая попытка оказалась неудачной

О здоровье диска чаще всего не говорит.

Основные причины увеличения параметра — плохой контакт диска с БП или невозможность БП выдать нужный ток в линию питания диска.

В идеале должен быть равен 0. При значении атрибута, равном 1-2, внимания можно не обращать. Если значение больше, в первую очередь следует обратить пристальное внимание на состояние блока питания, его качество, нагрузку на него, проверить контакт винчестера с кабелем питания, проверить сам кабель питания.

Наверняка диск может стартовать не сразу из-за проблем с ним самим, но такое бывает очень редко, и такую возможность нужно рассматривать в последнюю очередь.

Атрибут: 11 (0B) Calibration Retry Count (Recalibration Retries)

Тип накапливающий
Описание содержит количество повторных попыток сброса накопителя (установки БМГ на нулевую дорожку) при неудачной первой попытке

Ненулевое, а особенно растущее значение параметра может означать проблемы с диском.

Атрибут: 12 (0C) Power Cycle Count

Тип накапливающий
Описание содержит количество полных циклов «включение-отключение» диска

Не связан с состоянием диска.

Атрибут: 183 (B7) SATA Downshift Error Count

Тип накапливающий
Описание содержит количество неудачных попыток понижения режима SATA. Суть в том, что винчестер, работающий в режимах SATA 3 Гбит/с или 6 Гбит/с (и что там дальше будет в будущем), по какой-то причине (например, из-за ошибок) может попытаться «договориться» с дисковым контроллером о менее скоростном режиме (например, SATA 1,5 Гбит/с или 3 Гбит/с соответственно). В случае «отказа» контроллера изменять режим диск увеличивает значение атрибута

Не говорит о здоровье накопителя.

Атрибут: 184 (B8) End-to-End Error

Тип накапливающий
Описание содержит количество ошибок, возникших при передаче данных через кэш винчестера

Ненулевое значение указывает на проблемы с диском.

Атрибут: 187 (BB) Reported Uncorrected Sector Count (UNC Error)

Тип накапливающий
Описание содержит количество секторов, которые были признаны кандидатами на переназначение (см. атрибут 197) за всю историю жизни диска. Причём если сектор становится кандидатом повторно, значение атрибута тоже увеличивается

Ненулевое значение атрибута явно указывает на ненормальное состояние диска (в сочетании с ненулевым значением атрибута 197) или на то, что оно было таковым ранее (в сочетании с нулевым значением 197).

Атрибут: 188 (BC) Command Timeout

Тип накапливающий
Описание содержит количество операций, выполнение которых было отменено из-за превышения максимально допустимого времени ожидания отклика

Такие ошибки могут возникать из-за плохого качества кабелей, контактов, используемых переходников, удлинителей и т. д., а также из-за несовместимости диска с конкретным контроллером SATA/РАТА на материнской плате (либо дискретным). Из-за ошибок такого рода возможны BSOD в Windows.

Ненулевое значение атрибута говорит о потенциальной «болезни» диска.

Атрибут: 189 (BD) High Fly Writes

Тип накапливающий
Описание содержит количество зафиксированных случаев записи при высоте полета головки выше рассчитанной — скорее всего, из-за внешних воздействий, например вибрации

Для того чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи S.M.A.R.T., которые содержат специфичную для каждого производителя информацию, что на сегодняшний день не реализовано в общедоступном ПО — следовательно, на атрибут можно не обращать внимания.

Атрибут: 190 (BE) Airflow Temperature

Тип текущий
Описание содержит температуру винчестера для дисков Hitachi, Samsung, WD и значение «100 − [RAW-значение атрибута 194]» для Seagate

Не говорит о состоянии диска.

Атрибут: 191 (BF) G-Sensor Shock Count (Mechanical Shock)

Тип накапливающий
Описание содержит количество критических ускорений, зафиксированных электроникой диска, которым подвергался накопитель и которые превышали допустимые. Обычно это происходит при ударах, падениях и т. п.

Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т. к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухи.

Вообще срабатывание датчика не является признаком удара. Может расти даже от позиционирования БМГ самим диском, особенно если его не закрепить. Основное назначение датчика — прекратить операцию записи при вибрациях, чтобы избежать ошибок.

Не говорит о здоровье диска.

Атрибут: 192 (С0) Power Off Retract Count (Emergency Retry Count)

Тип накапливающий
Описание для разных винчестеров может содержать одну из следующих двух характеристик: либо суммарное количество парковок БМГ диска в аварийных ситуациях (по сигналу от вибродатчика, обрыву/понижению питания и т. п.), либо суммарное количество циклов включения/выключения питания диска (характерно для современных WD и Hitachi)

Не позволяет судить о состоянии диска.

Атрибут: 193 (С1) Load/Unload Cycle Count

Тип накапливающий
Описание содержит количество полных циклов парковки/распарковки БМГ. Анализ этого атрибута — один из способов определить, включена ли на диске функция автоматической парковки (столь любимая, например, компанией Western Digital): если его содержимое превосходит (обычно — многократно) содержимое атрибута 09 — счётчик отработанных часов, — то парковка включена

Не говорит о здоровье диска.

Атрибут: 194 (С2) Temperature (HDA Temperature, HDD Temperature)

Тип текущий/накапливающий
Описание содержит текущую температуру диска. Температура считывается с датчика, который на разных моделях может располагаться в разных местах. Поле вместе с текущей также может содержать максимальную и минимальную температуры, зафиксированные за всё время эксплуатации винчестера

О состоянии диска атрибут не говорит, но позволяет контролировать один из важнейших параметров. Моё мнение: при работе старайтесь не допускать повышения температуры винчестера выше 50 градусов, хоть производителем обычно и декларируется максимальный предел температуры в 55-60 градусов.

Атрибут: 195 (С3) Hardware ECC Recovered

Тип накапливающий
Описание содержит количество ошибок, которые были скорректированы аппаратными средствами ECC диска

Особенности, присущие этому атрибуту на разных дисках, полностью соответствуют таковым атрибутов 01 и 07.

Атрибут: 196 (С4) Reallocated Event Count

Тип накапливающий
Описание содержит количество операций переназначения секторов

Косвенно говорит о здоровье диска. Чем больше значение — тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты.

Этот атрибут непосредственно связан с атрибутом 05. При росте 196 чаще всего растёт и 05. Если при росте атрибута 196 атрибут 05 не растёт, значит, при попытке ремапа кандидат в бэд-блоки оказался софт-бэдом (подробности см. ниже), и диск исправил его, так что сектор был признан здоровым, и в переназначении не было необходимости.

Если атрибут 196 меньше атрибута 05, значит, во время некоторых операций переназначения выполнялся перенос нескольких повреждённых секторов за один приём.

Если атрибут 196 больше атрибута 05, значит, при некоторых операциях переназначения были обнаружены исправленные впоследствии софт-бэды.

Атрибут: 197 (С5) Current Pending Sector Count

Тип текущий
Описание содержит количество секторов-кандидатов на переназначение в резервную область

Натыкаясь в процессе работы на «нехороший» сектор (например, контрольная сумма сектора не соответствует данным в нём), диск помечает его как кандидат на переназначение, заносит его в специальный внутренний список и увеличивает параметр 197. Из этого следует, что на диске могут быть повреждённые секторы, о которых он ещё не знает — ведь на пластинах вполне могут быть области, которые винчестер какое-то время не использует.

При попытке записи в сектор диск сначала проверяет, не находится ли этот сектор в списке кандидатов. Если сектор там не найден, запись проходит обычным порядком. Если же найден, проводится тестирование этого сектора записью-чтением. Если все тестовые операции проходят нормально, то диск считает, что сектор исправен. (Т. е. был т. н. «софт-бэд» — ошибочный сектор возник не по вине диска, а по иным причинам: например, в момент записи информации отключилось электричество, и диск прервал запись, запарковав БМГ. В итоге данные в секторе окажутся недописанными, а контрольная сумма сектора, зависящая от данных в нём, вообще останется старой. Налицо будет расхождение между нею и данными в секторе.) В таком случае диск проводит изначально запрошенную запись и удаляет сектор из списка кандидатов. При этом атрибут 197 уменьшается, также возможно увеличение атрибута 196.

Если же тестирование заканчивается неудачей, диск выполняет операцию переназначения, уменьшая атрибут 197, увеличивая 196 и 05, а также делает пометки в G-list.

Итак, ненулевое значение параметра говорит о неполадках (правда, не может сказать о том, в само́м ли диске проблема).

При ненулевом значении нужно обязательно запустить в программах Victoria или MHDD последовательное чтение всей поверхности с опцией remap. Тогда при сканировании диск обязательно наткнётся на плохой сектор и попытается произвести запись в него (в случае Victoria 3.5 и опции Advanced remap — диск будет пытаться записать сектор до 10 раз). Таким образом программа спровоцирует «лечение» сектора, и в итоге сектор будет либо исправлен, либо переназначен.

Идёт последовательное чтение с ремапом в Victoria 4.46b

Идёт последовательное чтение с ремапом в Victoria 4.46b

В случае неудачи чтения как с remap, так и с Advanced remap, стоит попробовать запустить последовательную запись в тех же Victoria или MHDD. Учитывайте, что операция записи стирает данные, поэтому перед её применением обязательно делайте бэкап!

Запуск последовательной записи в Victoria 4.46b

Запуск последовательной записи в Victoria 4.46b

Иногда от невыполнения ремапа могут помочь следующие манипуляции: снимите плату электроники диска и почистите контакты гермоблока винчестера, соединяющие его с платой — они могут быть окислены. Будь аккуратны при выполнении этой процедуры — из-за неё можно лишиться гарантии!

Невозможность ремапа может быть обусловлена ещё одной причиной — диск исчерпал резервную область, и ему просто некуда переназначать секторы.

Если же значение атрибута 197 никакими манипуляциями не снижается до 0, следует думать о замене диска.

Атрибут: 198 (С6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)

Тип текущий
Описание означает то же самое, что и атрибут 197, но отличие в том, что данный атрибут содержит количество секторов-кандидатов, обнаруженных при одном из видов самотестирования диска — оффлайн-тестировании, которое диск запускает в простое в соответствии с параметрами, заданными прошивкой

Параметр этот изменяется только под воздействием оффлайн-тестирования, никакие сканирования программами на него не влияют. При операциях во время самотестирования поведение атрибута такое же, как и атрибута 197.

Ненулевое значение говорит о неполадках на диске (точно так же, как и 197, не конкретизируя, кто виноват).

Атрибут: 199 (С7) UltraDMA CRC Error Count

Тип накапливающий
Описание содержит количество ошибок, возникших при передаче по интерфейсному кабелю в режиме UltraDMA (или его эмуляции винчестерами SATA) от материнской платы или дискретного контроллера контроллеру диска

В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E компьютера либо плохой контакт в SATA-разъёме на диске или на материнской плате/контроллере.

Ошибки при передаче по интерфейсу и, как следствие, растущее значение атрибута могут приводить к переключению операционной системой режима работы канала, на котором находится накопитель, в режим PIO, что влечёт резкое падение скорости чтения/записи при работе с ним и загрузку процессора до 100% (видно в Диспетчере задач Windows).

В случае винчестеров Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в режим SATA 3 Гбит/с.

Моё мнение: при наличии ошибок — переподключите кабель с обоих концов; если их количество растёт и оно больше 10 — выбрасывайте шлейф и ставьте вместо него новый или снимайте разгон.

Можно считать, что о здоровье диска атрибут не говорит.

Атрибут: 200 (С8) Write Error Rate (MultiZone Error Rate)

Тип текущий
Описание содержит частоту возникновения ошибок при записи

Ненулевое значение говорит о проблемах с диском — в частности, у дисков WD большие цифры могут означать «умирающие» головки.

Атрибут: 201 (С9) Soft Read Error Rate

Тип текущий
Описание содержит частоту возникновения ошибок чтения, произошедших по вине программного обеспечения

Влияние на здоровье неизвестно.

Атрибут: 202 (СА) Data Address Mark Error

Тип неизвестно
Описание содержание атрибута — загадка, но проанализировав различные диски, могу констатировать, что ненулевое значение — это плохо

Атрибут: 203 (CB) Run Out Cancel

Тип текущий
Описание содержит количество ошибок ECC

Влияние на здоровье неизвестно.

Атрибут: 220 (DC) Disk Shift

Тип текущий
Описание содержит измеренный в неизвестных единицах сдвиг пластин диска относительно оси шпинделя

Влияние на здоровье неизвестно.

Атрибут: 240 (F0) Head Flying Hours

Тип накапливающий
Описание содержит время, затраченное на позиционирование БМГ. Счётчик может содержать несколько значений в одном поле

Влияние на здоровье неизвестно.

Атрибут: 254 (FE) Free Fall Event Count

Тип накапливающий
Описание содержит зафиксированное электроникой количество ускорений свободного падения диска, которым он подвергался, т. е., проще говоря, показывает, сколько раз диск падал

Влияние на здоровье неизвестно.

Подытожим описание атрибутов. Ненулевые значения:

  • атрибутов 01, 07, 195 — вызывают подозрения в «болезни» у некоторых моделей дисков;
  • атрибутов 10, 11, 188, 196, 199, 202 — вызывают подозрения у всех дисков;
  • и, наконец, атрибутов 05, 184, 187, 197, 198, 200 — прямо говорят о неполадках.

При анализе атрибутов учитывайте, что в некоторых параметрах S.M.A.R.T. могут храниться несколько значений этого параметра: например, для предпоследнего запуска диска и для последнего. Такие параметры длиной в несколько байт логически состоят из нескольких значений длиной в меньшее количество байт — например, параметр, хранящий два значения для двух последних запусков, под каждый из которых отводится 2 байта, будет иметь длину 4 байта. Программы, интерпретирующие S.M.A.R.T., часто не знают об этом, и показывают этот параметр как одно число, а не два, что иногда приводит к путанице и волнению владельца диска. Например, «Raw Read Error Rate», хранящий предпоследнее значение «1» и последнее значение «0», будет выглядеть как 65536.

Надо отметить, что не все программы умеют правильно отображать такие атрибуты. Многие как раз и переводят атрибут с несколькими значениями в десятичную систему счисления как одно огромное число. Правильно же отображать такое содержимое — либо с разбиением по значениям (тогда атрибут будет состоять из нескольких отдельных чисел), либо в шестнадцатеричной системе счисления (тогда атрибут будет выглядеть как одно число, но его составляющие будут легко различимы с первого взгляда), либо и то, и другое одновременно. Примерами правильных программ служат HDDScan, CrystalDiskInfo, Hard Disk Sentinel.

Продемонстрируем отличия на практике. Вот так выглядит мгновенное значение атрибута 01 на одном из моих Hitachi HDS721010CLA332 в неучитывающей особенности этого атрибута Victoria 4.46b:

Атрибут 01 в Victoria 4.46b

Атрибут 01 в Victoria 4.46b

А так выглядит он же в «правильной» HDDScan 3.3:

Атрибут 01 в HDDScan 3.3

Атрибут 01 в HDDScan 3.3

Плюсы HDDScan в данном контексте очевидны, не правда ли?

Если анализировать S.M.A.R.T. на разных дисках, то можно заметить, что одни и те же атрибуты могут вести себя по-разному. Например, некоторые параметры S.M.A.R.T. винчестеров Hitachi после определённого периода неактивности диска обнуляются; параметр 01 имеет особенности на дисках Hitachi, Seagate, Samsung и Fujitsu, 03 — на Fujitsu. Также известно, что после перепрошивки диска некоторые параметры могут установиться в 0 (например, 199). Однако подобное принудительное обнуление атрибута ни в коем случае не будет говорить о том, что проблемы с диском решены (если таковые были). Ведь растущий критичный атрибут — это следствие неполадок, а не причина.

При анализе множества массивов данных S.M.A.R.T. становится очевидным, что набор атрибутов у дисков разных производителей и даже у разных моделей одного производителя может отличаться. Связано это с так называемыми специфичными для конкретного вендора (vendor specific) атрибутами (т. е. атрибутами, используемыми для мониторинга своих дисков определённым производителем) и не должно являться поводом для волнения. Если ПО мониторинга умеет читать такие атрибуты (например, Victoria 4.46b), то на дисках, для которых они не предназначены, они могут иметь «страшные» (огромные) значения, и на них просто не нужно обращать внимания. Вот так, например, Victoria 4.46b отображает RAW-значения атрибутов, не предназначенных для мониторинга у Hitachi HDS721010CLA332:

«Страшные» значения в Victoria 4.46b

«Страшные» значения в Victoria 4.46b

Нередко встречается проблема, когда программы не могут считать S.M.A.R.T. диска. В случае исправного винчестера это может быть вызвано несколькими факторами. Например, очень часто не отображается S.M.A.R.T. при подключении диска в режиме AHCI. В таких случаях стоит попробовать разные программы, в частности HDD Scan, которая обладает умением работать в таком режиме, хоть у неё и не всегда это получается, либо же стоит временно переключить диск в режим совместимости с IDE, если есть такая возможность. Далее, на многих материнских платах контроллеры, к которым подключаются винчестеры, бывают не встроенными в чипсет или южный мост, а реализованы отдельными микросхемами. В таком случае DOS-версия Victoria, например, не увидит подключённый к контроллеру жёсткий диск, и ей нужно будет принудительно указывать его, нажав клавишу [Р] и введя номер канала с диском. Часто не читаются S.M.A.R.T. у USB-дисков, что объясняется тем, что USB-контроллер просто не пропускает команды для чтения S.M.A.R.T. Практически никогда не читается S.M.A.R.T. у дисков, функционирующих в составе RAID-массива. Здесь тоже есть смысл попробовать разные программы, но в случае аппаратных RAID-контроллеров это бесполезно.

Если после покупки и установки нового винчестера какие-либо программы (HDD Life, Hard Drive Inspector и иже с ними) показывают, что: диску осталось жить 2 часа; его производительность — 27%; здоровье — 19,155% (выберите по вкусу) — то паниковать не стоит. Поймите следующее. Во-первых, нужно смотреть на показатели S.M.A.R.T., а не на непонятно откуда взявшиеся числа здоровья и производительности (впрочем, принцип их подсчёта понятен: берётся наихудший показатель). Во-вторых, любая программа при оценке параметров S.M.A.R.T. смотрит на отклонение значений разных атрибутов от предыдущих показаний. При первых запусках нового диска параметры непостоянны, необходимо некоторое время на их стабилизацию. Программа, оценивающая S.M.A.R.T., видит, что атрибуты изменяются, производит расчёты, у неё получается, что при их изменении такими темпами накопитель скоро выйдет из строя, и она начинает сигнализировать: «Спасайте данные!» Пройдёт некоторое время (до пары месяцев), атрибуты стабилизируются (если с диском действительно всё в порядке), утилита наберёт данных для статистики, и сроки кончины диска по мере стабилизации S.M.A.R.T. будут переноситься всё дальше и дальше в будущее. Оценка программами дисков Seagate и Samsung — вообще отдельный разговор. Из-за особенностей атрибутов 1, 7, 195 программы даже для абсолютно здорового диска обычно выдают заключение, что он завернулся в простыню и ползёт на кладбище.

Обратите внимание, что возможна следующая ситуация: все атрибуты S.M.A.R.T. — в норме, однако на самом деле диск — с проблемами, хоть этого пока ни по чему не заметно. Объясняется это тем, что технология S.M.A.R.T. работает только «по факту», т. е. атрибуты меняются только тогда, когда диск в процессе работы встречает проблемные места. А пока он на них не наткнулся, то и не знает о них и, следовательно, в S.M.A.R.T. ему фиксировать нечего.

Таким образом, S.M.A.R.T. — это полезная технология, но пользоваться ею нужно с умом. Кроме того, даже если S.M.A.R.T. вашего диска идеален, и вы постоянно устраиваете диску проверки — не полагайтесь на то, что ваш диск будет «жить» ещё долгие годы. Винчестерам свойственно ломаться так быстро, что S.M.A.R.T. просто не успевает отобразить его изменившееся состояние, а бывает и так, что с диском — явные нелады, но в S.M.A.R.T. — всё в порядке. Можно сказать, что хороший S.M.A.R.T. не гарантирует, что с накопителем всё хорошо, но плохой S.M.A.R.T. гарантированно свидетельствует о проблемах. При этом даже с плохим S.M.A.R.T. утилиты могут показывать, что состояние диска — «здоров», из-за того, что критичными атрибутами не достигнуты пороговые значения. Поэтому очень важно анализировать S.M.A.R.T. самому, не полагаясь на «словесную» оценку программ.

Хоть технология S.M.A.R.T. и работает, винчестеры и понятие «надёжность» настолько несовместимы, что принято считать их просто расходным материалом. Ну, как картриджи в принтере. Поэтому во избежание потери ценных данных делайте их периодическое резервное копирование на другой носитель (например, другой винчестер). Оптимально делать две резервные копии на двух разных носителях, не считая винчестера с оригинальными данными. Да, это ведёт к дополнительным затратам, но поверьте: затраты на восстановление информации со сломавшегося HDD обойдутся вам в разы — если не на порядок-другой — дороже. А ведь данные далеко не всегда могут восстановить даже профессионалы. Т. е. единственная возможность обеспечить надёжное хранение ваших данных — это делать их бэкап.

Напоследок упомяну некоторые программы, которые хорошо подходят для анализа S.M.A.R.T. и тестирования винчестеров: HDDScan (работает в Windows, бесплатная), CrystalDiskInfo (Windows, бесплатная), Hard Disk Sentinel (платная для Windows, бесплатная для DOS), HD Tune (Windows, платная, есть бесплатная старая версия).

И наконец, мощнейшие программы для тестирования: Victoria (Windows, DOS, бесплатная), MHDD (DOS, бесплатная).

&nbsp &nbsp Все современные накопители на жестких магнитных дисках поддерживают технологию самотестирования, анализа состояния, и накопления статистических данных об ухудшении собственных характеристик S.M.A.R.T. (Self-Monitoring Analysis and Reporting Technology). Основы S.M.A.R.T. были разработаны в 1995 г. совместными усилиями ведущих производителями жестких дисков.
В процессе совершенствования оборудования накопителей, возможности технологии также дорабатывались, и после стандарта SMART появился SMART II, затем — SMART III, который, очевидно, тоже не станет последним.

&nbsp &nbsp Жесткий диск в процессе своего функционирования постоянно отслеживает определенные параметры своего состояния и отражает их в специальных характеристиках — атрибутах (Attribute), сохраняющихся, как правило, в специально выделенной части дисковой поверхности, доступной только внутренней микропрограмме накопителя — служебной зоне . Данные атрибутов могут быть считаны специальным программным обеспечением.
&nbsp &nbsp Атрибуты идентифицируются своим цифровым номером, большинство из которых одинаково интерпретируется накопителями разных моделей. Некоторые атрибуты могут быть определены конкретным производителем оборудования, и поддерживаться только отдельными моделями накопителей.

&nbsp &nbsp Атрибуты состоят из нескольких полей, каждое из которых имеет определенный смысл. Обычно, программы считывания S.M.A.R.T. выдают расшифровку атрибутов в виде:

Type (необязательно) — тип атрибута — характеризует производительность (PR — Performance-related), характеризует сбои (ER — Error rate), счетчик событий (EC — Events count), определено производителем или не используется (SP — Self-preserve);

&nbsp &nbsp Для анализа состояния накопителя, пожалуй, самым важным значением атрибута является Value — условное число (обычно от 0 до 100 или до 253), заданное производителем. Значение Value изначально установлено на максимум при производстве накопителя и уменьшается в случае ухудшения его параметров. Для каждого атрибута существует пороговое значение, до достижения которого, производитель гарантирует его работоспособность — поле Threshold . Если значение Value приближается или становится меньше значения Threshold, — накопитель пора менять. Перечень атрибутов и их значения жестко не стандартизированы и определяются изготовителем накопителя, но наиболее важные из них интерпретируются одинаково. Например, атрибут с идентификатором 5 ( Reallocated sector count ) будет характеризовать число забракованных и переназначенных из резервной области секторов диска, и для устройств производства компании Seagate, и для Western Digital, Samsung, Maxtor.

Жесткий диск не имеет возможности, по собственной инициативе, передать данные SMART потребителю. Их считывание выполняется специальным программным обеспечением.

В настройках большинства современных BIOS материнских плат имеется пункт позволяющий запретить или разрешить считывание и анализ атрибутов SMART в процессе выполнения тестов оборудования перед выполнением начальной загрузки системы. Включение опции позволяет подпрограмме тестирования оборудования BIOS считать значения критических атрибутов и, при превышении порога, предупредить об этом пользователя. Как правило, без особой детализации:
Primary Master Hard Disk: S.M.A.R.T status BAD!, Backup and Replace.
Выполнение подпрограммы BIOS приостанавливается, чтобы привлечь внимание:
Press F1 to Resume
Таким образом, без установки или запуска дополнительного программного обеспечения, имеется возможность вовремя определить критическое состояние накопителя (при включении данной опции) средствами Базовой Системы Ввода-Вывода (BIOS).

Анализ данных S.M.A.R.T. жесткого диска

&nbsp &nbsp Для получения данных SMART в среде операционной системы могут использоваться специальные программы, в частности, практически все утилиты для тестирования оборудования жестких дисков.

Одной из самых популярных программ для тестирования жестких дисков является Victoria Сергея Казанского.

На сайте автора найдете последнюю версию программы, а также массу полезной информации, в том числе и подробное описание работы с Victoria.

Программа Victoria имеет две разновидности — для работы в среде DOS и, для работы в среде Windows. DOS-версия может напрямую работать с контроллером жесткого диска и обладает значительно большими возможностями по сравнению с версией для Windows.
Назначение, основные возможности и порядок использования программы найдете на сайте автора
Программа проста в использовании и позволяет оценить техническое состояние накопителя, выполнить его тестирование и некоторые настройки — уровня шума, производительности, физического объема. Режимы тестирования поверхности накопителя позволяют принудительно избавиться от сбойных секторов с помощью режима Remap нескольких видов. Вызов меню тестирования выполняется по нажатию клавиши F4 ( SCAN ). Пользователь имеет возможность задать

область тестирования
Start LBA :0 — начало области (по умолчанию — 0)
End LBA :14680064 — конец области (по умолчанию — номер последнего блока диска)

Режим тестирования
Линейное чтение — последовательное чтение от начального блока до конечного
Случайное чтение — номер считываемого блока формируется случайным образом.
BUTTERFLY чтение — выполняется чтение блоков, начиная от граничных номеров (начала и конца), к центру области тестирования.
Изменение режима выполняется по нажатию клавиши «пробел»

Режим обработки ошибок
Этот пункт позволяет выполнить скрытие дефектных блоков, с использованием переназначения (ремап) из резервной области. Выбор режима выполняется клавишей «пробел». Выбранный метод работы с дефектами отображается в правом верхнем углу экрана, под часами, а также в нижней строке в момент запуска теста. Изменить режим можно в и в процессе выполнения сканирования.
Ignore Bad Blocks — программа не будет выполнять никаких действий при обнаружении ошибки.
BB = RESTORE DATA — программа попытается восстановить данные из поврежденных секторов.
BB = Classic REMAP — выполняется запись в поврежденный сектор для вызова процедуры переназначения.
BB = Advanced REMAP — улучшенный алгоритм скрытия сбойных блоков. Используется, когда не помогает классический ремап. Программа выполняет специальную последовательность операций с целью формирования признака кандидата на ремап (атрибут 197) у сбойного блока. Затем выполняется 10-кратная запись, обрабатываемая микропрограммой накопителя как обычная обработка кандидата на ремап — если есть ошибка, выполняется переназначение, если нет ошибки — блок считается нормальным и удаляется из кандидатов на ремап. Данный режим позволяет выполнить скрытие сбойных блоков без потери пользовательских данных. Конечно, только в случаях, когда накопитель технически исправен и есть свободное место в резервной области для переназначения.
BB = Fujitsu Remap — выполнение специфических алгоритмов, основанных на недокументированных возможностях некоторых моделей накопителей Fujitsu
BB = Erase 256 sect — при обнаружении сбойного сектора выполняется перезаписывание блока из 256 секторов. Пользовательские данные не сохраняются.

В процессе работы с программой можно вызвать контекстную справку клавишей F1

Расшифровка кодов ошибок в Victoria:

BBK (Bad Block Detected) — Найден бэд-блок.

UNCR (Uncorrectable Error) — Неисправимая ошибка. Не удалось скорректировать данные избыточным кодом, блок признан нечитаемым. Может быть как следствием нарушения контрольной суммы данных (софтовый Bad Block), так и неисправностью HDD;

IDNF (ID Not Found) — Не найде идентификатор сектора. Обычно говорит о разрушении микрокода или формата низкого (физического уровня) HDD . У исправных HDD такая ошибка выдается при попытке обратиться к несуществующему адресу физического сектора;

ABRT (Aborted Command) — HDD отверг команду в результате неисправности, или команда не поддерживается данным HDD (пароль, устаревшая или слишком новая модель и т.д.)

T0NF (Track 0 Not Found) — не найдена нулевая дорожку, невозможно выполнить рекалибровку на стартовый цилиндр рабочей области. На современных HDD говорит о неисправности микрокода или магнитных головок;

AMNF (Address Mark Not Found) — адресный маркер не найден, невозможно прочитать сектор, обычно в результате неисправности тракта чтения или дефекта поверхности.

&nbsp &nbsp Версия Victoria For Windows обладает более скромными возможностями по настройке накопителя и выбору режимов тестирования, и на данный момент не имеет поддержки русского языка , однако ей проще пользоваться и имеющихся возможностей вполне достаточно для считывания таблицы SMART и оценки технического состояния накопителя.

Программа не требует установки, просто скачайте ее по ссылке на странице загрузки сайта автора.

Программа должна выполняться под учетной записью с павами администратора. В среде Windows 7 / 8 необходимо использовать контекстное меню «Запуск от имени администратора».

Для анализа состояния SMART-атрибутов выбираем режим работы через программный интерфейс Windows — включаем кнопку API в правой верхней части основного окна. Затем выбираем накопитель для проверки — нажимаем на кнопку Standard в основном меню программы и подсвечиваем мышкой нужный диск в окне со списком. В информационном окне будет отображен паспорт накопителя — модель, версию аппаратной прошивки, серийный номер, размер и т.п. Для получения данных SMART выбираем пункт меню SMART и жмем кнопку «Get SMART». Результат будет отображен в информационном окне программы.

Краткое описание атрибутов (в скобках дано шестнадцатеричное значение номера):

231 ( E7 ) Hard Disk Temperature — температура, зафиксированная внутренними датчиками накопителя.

Современные накопители поддерживают не только формирование атрибутов S.M.A.R.T, но и ведут дополнительные журналы статистики, а также поддерживают протокол SCT (SMART Command Transport), обеспечивающий считывание данных журналов. Журнал статистики устройства — это доступный только для чтения журнал SMART, передаваемый накопителем при получении команд READ LOG EXT, READ LOG DMA EXT или SMART READ LOG. В журналах отображается информация о выполнении встроенных тестов S.M.A.R.T ( self-test ), статистика ошибок, номера сбойных блоков LBA и т.п.

Анализ данных SMART и выполнение внутренних тестов в среде Linux — Обновленная статья об использовании утилиты smartctl в Linux для анализа технического состояния HDD, просмотра внутренних журналов SMART и выполнения встроенных тестов. В статье также имеется более подробное описание атрибутов S.M.A.R.T, в том числе, и для SSD-дисков.

Ремап (Remap) и проверка поверхности жесткого диска

&nbsp &nbsp Удивительно, как долго могут существовать ошибочные представления о жестких дисках и их правильной эксплуатации. В частности, даже неплохие специалисты в области компьютерной техники, бывает, рекомендуют выполнять в среде ОС Windows полное форматирование поверхности вместо быстрого, или даже низкоуровневое форматирование. Что касается последнего, свою лепту в путаницу с форматированием вносят и некоторые производители программного обеспечения, выпускающие программы для «низкоуровневого форматирования», которые ничего не форматируют. Низкоуровневое форматирование (Low Level Format) — это разметка поверхности диска специальной служебной информацией, в соответствии с геометрией накопителя, выполняемой специальной командой посылаемой накопителю. В стандарте ST506/412, который предшествовал современному стандарту ATA (AT attachment) имелась команда 50h (Format Track), при выполнении которой производилась разметка дорожки адресными маркерами, в соответствии с геометрией диска, т.е. в соответствии с номером цилиндра, номером головки и количеством секторов на дорожке. В дальнейшем, при записи данных, эта часть информации никогда не изменялась. При выполнении команды записи данных в сектор, накопитель никогда и ничего не записывает в ту область дорожки, которая является служебной и была создана при низкоуровневом форматировании дорожек поверхности специально для этого предназначенной командой 50h.

В современных накопителях стандарта ATA команды низкоуровневого форматирования вообще отсутствуют, а рекламируемые некоторыми производителями программы для выполнения данной операции являются простыми «стиралками» данных, выполняющими запись в область данных секторов. Нет, и не может быть, никаких программ для выполнения настоящего низкоуровневого форматирования в среде любой операционной системы. Любое подобное «низкоуровневое» форматирование — это высокоуровневое форматирование логической структуры пользовательских данных.

Что же касается полного форматирования в среде Windows, то по сравнению с быстрым, сразу создающим пустое оглавление, оно просто добавляет проверку поверхности диска перед тем, как выполнить то же самое, что делает быстрое форматирование. Что также не имеет смысла, поскольку проверка и отбраковка нестабильных секторов выполняется средствами аппаратной реализации технологии S.M.A.R.T накопителя, которая с данной задачей справляется гораздо эффективнее автоматически и в непрерывном режиме. Полное форматирование имело смысл на старых дисках, которые не могли выполнять замену нестабильных секторов на сектора из резервной зоны, и такие сектора сразу становились дефектными блоками ( Bad Block ), которые исключались из файловой структуры при форматировании с проверкой поверхности. Существует также утверждение, что при полном форматировании выполняется стирание всей поверхности диска. Это тоже не соответствует действительности, что легко проверяется любыми программами мониторинга обращений к диску , например, утилитой Disk Monitor из пакета Sysinternals Suite. Программа показывает, что при полном форматировании выполняется чтение поверхности, и небольшое количество операций записи, выполняемой после проверки поверхности при формировании пустого оглавления, в самом конце работы. И даже из того факта, что существую программы для восстановления данных после форматирования ( любого, в том числе и полного ) вполне логично следует вывод – никакого стирания данных не происходит.

При записи жесткий диск не проверяет, что и как было записано в область данных сектора, кроме случаев, когда предварительная диагностика, которой накопитель занимается все «свободное время», не пометила в соответствующих журналах эти сектора, как проблемные, или кандидаты на переназначение, что отражается в атрибуте 197 SMART (Current Pending Sectors).

Кандидат — это сектор (или группа секторов), который не был считан за стандартное время и с установленным числом повторов. В режиме простоя, запустится программа самотестирования, которая попытается считать данные с применением дополнительных режимов. Если сектор будет успешно считан — программа самодиагностики попытается записать данные обратно, и если запись выполнится успешно, то из кандидатов такой сектор удалится. Если же записанная на то же место информация не будет нормально считываться, то выполнится переназначение сектора (Remap), данные запишутся в сектор из специально для этого предназначенной резервной области (spare area). В дальнейшем, всегда вместо этого сбойного сектора будут считываться данные из резервной области. А сектор-кандидат на переназначение, не исправленный программой самотестирования, увеличит значение атрибута 198 (Offline Scan UNC Sectors). Убрать такой «бед» можно только перезаписью. Но если резервная область закончилась, то все последующие кандидаты на переназначение превратятся в реальные «плохие секторы» (Bad Blocks). В этом случае программы полного форматирования и проверки поверхности могут исключить сбойный сектор из логической структуры диска, однако, использовать накопитель с закончившейся резервной областью — это очень рискованная идея, которая обязательно закончится потерей данных. Использовать такой диск можно разве что для опасных экспериментов, хранения некритичных данных, или выбросить его на помойку.

При возникновении плохих блоков (Bad Block) нередко возникает необходимость проверки принадлежности сбойного участка конкретному файлу. Для этих целей можно воспользоваться консольной утилитой NFI.EXE (NTFS File Sector Information Utility) из состава пакета Support Tools от Microsoft. Скачать 10кб
Формат командной строки
nfi.exe Диск Номер логического сектора
Подсказку по использованию NFI.EXE можно получить по команде nfi.exe /?

Букву логического диска можно задавать без двоеточия. Номер логического сектора — это номер сектора относительно начала логического диска. Обратите внимание на тот факт, что программы сканирования работают со всей поверхностью физического диска и используют нумерацию секторов, не привязанную к его логической структуре. А номер сектора, задаваемый в качестве параметра утилиты NFI.EXE — это номер сектора логического диска (раздела), и он отличается величиной смещения начального сектора раздела от начала диска. Значение номеров начальных секторов логических дисков можно получить нажав кнопку View part data вкладки «Advanced» программы Victoria For Windows.

nfi.exe C: 655234 — выдать имя файла, которому принадлежит сектор 655234
nfi.exe C: 0xBF5E34 — то же самое, но номер сектора задан в шестнадцатеричной системе счисления
В результате выполнения команды будет выдано сообщение

***Logical sector 12541492 (0xbf5e34) on drive C is in file number 49502.
WINDOWS system32 D3DCompiler_38.dll

Т.е. интересующий нас сбойный сектор принадлежит файлу D3DCompiler_38.dll в каталоге Windowssystem32. В случае, когда сбойные блоки принадлежат системным файлам Windows, возможно появление синих экранов смерти или зависаний системы с перезагрузкой. В большинстве случаев, информация о наличии сбоев дисковой подсистемы, будет отображаться в системном журнале Windows.

Для выполнения тестирования поверхности накопителя с принудительным переназначением (ремапом) сбойных секторов можно воспользоваться программами тестирования HDD, алгоритм работы которых специально разработан таким образом, чтобы «заставить» внутреннюю микропрограмму накопителя выполнить переназначение нестабильного участка.
Так, например, подобные алгоритмы будут использоваться, в упоминаемой выше программе Victoria, если выбран режим тестирования поверхности с выполнением операций восстановления или переназначения (Classic Remap, Advanced Remap :). Изначально режим выполнения теста установлен в Ignore Bad Blocks

Нажатие пробела изменяет режим обработки сбоев. При выполнении такого вида тестирования накопителя, пользовательские данные остаются в сохранности.
Добавлю, что режим Advanced Remap, хотя и является наиболее эффективным, на практике может приводить к «зависанию» микропрограммы на некоторых моделях HDD, выйти из которого можно только с использованием принудительного сброса (режим Reset , клавиша F3). После чего можно продолжить тестирование. Если в режиме Advanced Remap таймауты происходят слишком часто, имеет смысл перейти к использованию классического ремапа.

Для программы Victoria For Windows переназначение сбойных секторов включается установками режима выполнения теста в правой части основного окна. По умолчанию установлен режим Ignore — ничего не делать при обнаружении сбоя, а нужно установить режим Remap

Для тестирования с переназначением сбойных секторов в программе MHDD , используется команда SCAN ( клавиша F4) и выбор режима Remap: ON . Изменение режима (OFF / ON )выполняется нажатием клавиши ENTER или пробел.

Добавлю, что особого выбора алгоритмов тестирования с переназначением сбойных секторов у программы MHDD, в отличие от Victoria, нет, однако MHDD обладает несколько большими возможностями, в т.ч. позволяет работать с SCSI-дисками и съемными USB HDD, при использовании драйверов, позволяющих получить доступ к съемному диску как SCSI-устройству (драйверы ASPIEHCI.SYS, USBASPI.SYS).

&nbsp &nbsp Для компьютеров, не имеющих накопителей на гибких магнитных дисках, возможность загрузки DOS-версий MHDD и Victoria можно реализовать c использованием USB флешки. Один из вариантов — мультизагрузочная флешка на основе загрузчика GRUB и набора образов загружаемых CD и Floppy дисков. Практический пример создания мультизагрузочной флешки приведен в статье Создание загрузочной флешки ERD Commander . Часть статьи посвящена использованию, в качестве полезного дополнения к ERDC, некоторых других программных продуктов, в том числе и загрузке образов дискет с DOS и программами MHDD 4.60 и Victoria For DOS v 3.52 .

Вернуть переназначенные сектора на место, обычными программными средствами, невозможно. Однако, с использованием специального оборудования и методик можно выполнить внутренние технологические утилиты (selfscan, или селфскан), которые заново произведут те операции, которые выполняются для анализа поверхности при изготовлении накопителя, аналогично настоящему низкоуровневому форматированию, предназначенному для проверки поверхности и физической разметки дорожек.

Заводские тесты заново сформируют таблицы дефектов P-List (Primary List) и G-List (Grown List) — заводской и полученный в процессе эксплуатации списки дефектных блоков. При изготовлении накопителя выполняется анализ состояния поверхности и ее разметка. При этом создается таблица дефектов P-List, а G-List остается пустым. В процессе эксплуатации накопитель сам помещает в G-List найденные дефекты. Это может происходить как во время работы (автоматическое переназначение — auto reassign), так и в процессе выполнения встроенных тестов, которые накопитель выполняет при отсутствии обращений от управляющего компьютера.

HDAT2 – альтернатива программам MHDD и Victoria.

Упоминаемые выше программы Victoria for DOS и MHDD являются наиболее известными средствами диагностики жестких дисков. Однако, они имеют существенный недостаток — работа возможна только с дисками ATA/SATA, или с некоторыми типами SCSI-устройств ( MHDD). Программы не поддерживаются авторами, и не обновляются уже несколько лет. В качестве альтернативы, на сегодняшний день, можно рассматривать либо специализированные программы производителей оборудования, как правило, не являющиеся универсальными, либо программу HDAT2, поддерживающую работу с более обширным списком накопителей, в том числе с интерфейсами SCSI и USB. Кроме того, HDAT2 поддерживает различные режимы тестирования и восстановления поверхности, а также позволяет выполнять встроенные тесты SMART и просматривать внутренние журналы накопителей. При меньшей наглядности выполняемых тестов, программа HDAT2 значительно превосходит MHDD и Victoria по своим функциональным возможностям.

Для работы HDAT2 используется загрузка в среде Windows98 с возможностью выбора конфигурации драйверов, которые будут использоваться для доступа к накопителям:

Программа HDAT2 обеспечивает 3 вида доступа к дисковым устройствам:

через прерывание INT13h BIOS;

через порты ввода вывода;

через драйверы ASPI;

Благодаря хорошо реализованному алгоритму распознавания подключенных дисковых устройств, программа, как правило, верно определяет их характеристики и задает необходимые режимы работы с ними. Хотя бывают и исключения, как например, приходилось сталкиваться с тем, что неверно определяется объем жестких дисков некоторых моделей емкостью 4 Тб. Тем не менее, программа позволяет, например, выполнить тестирование SD-карты, установленной в телефон Alcatel, подключенный к компьютеру через USB-порт, что невозможно с использованием MHDD и Victoria:

На сайте разработчика можно скачать документацию к программе на английском языке, актуальные версии HDAT2 и загрузочные образы дискет или компакт дисков на на странице загрузки

Лучшая, в свое время, программа для тестирования жестких дисков Victoria возвращается!

В июле 2018 года, после 8-летнего перерыва, автором, Сергеем Казанским, возобновлен проект «Victoria». Вышла очередная версия программы Victoria for Windows со значительными переделками — в программу встроен мощный сканер поверхности HDD, который позволяет продиагностировать накопитель на наличие сбойных участков, плавающих дефектов и ошибок интерфейса. Victoria способна протестировать большинство дисков на предельной скорости, независимо от их типа. Особенность сканера — применение специальных алгоритмов, что позволяет эффективно проверять как медленные, так и быстрые диски. Сделано получение S.M.A.R.T.-параметров HDD и SSD, подключенных через USB. В версии 4.66b поддерживаются 80% моделей USB-SATA мостов, и этот показатель будет увеличиваться. Добавлено управление кэшем через USB, SMART-тесты через USB. Работает также и Automatic Acoustic Management (AAM) на USB-накопителях: программное управление уровнем акустического шума за счёт изменения скорости перемещения головок. Victoria способна показать паспорт USB-накопителя, и таким образом определить тип установленного внутри накопителя без вскрытия бокса. Сопровождение программы включает в себя статьи, документацию, обзор наиболее частых вопросов и ответы на них. Эти материалы будут постепенно создаваться и добавляться в раздел «Статьи», доступный в главном меню официального сайта.

Обновленная Victoria работает в среде операционных систем Windows 2000/XP/8/10 x32. В среде Windows 9х программа работает только в режиме PIO.

Технические требования к оборудованию:

— Память 2 Gb или более.

— Видеокарта SVGA. Рекомендуется видеорежим от 1280*1024.

— Желательно наличие доступа в Интернет.

— Программа должна выполняться в контексте учетной записи пользователя с правами администратора.

В среде 64-разрядных ОС Windows работоспособность Victoria сохраняется, за исключением режима PIO.

Мониторинг состояния HDD.

&nbsp &nbsp Для отслеживания технического состояния диска в непрерывном режиме используется специальное программное обеспечение (нередко, платное), главной задачей которого является периодическое считывание и анализ значений атрибутов таблицы SMART с целью предупредить пользователя о достижении порога критического состояния, когда работоспособность устройства и сохранность пользовательских данных не гарантируются. Одним из бесплатных, и тем не менее, популярных в среде пользователей ПК, представителей программ для мониторинга состояния HDD является CrystalDiskInfo

Основные достоинства — простота и удобство использования, компактность и нетребовательность к ресурсам, поддержка большого количества жестких дисков различных моделей. Несложные настройки пороговых значений температуры и некоторых атрибутов S.M.A.R.T позволяют организовать оповещение пользователя при их достижении. Программа постоянно совершенствуется разработчиками и приобретает все большую функциональность, удобный и приятный интерфейс.

Кроме CrystalDiskInfo, на сайте разработчика вы можете также скачать другие программы для тестирования, настройки и оценки производительности — CrystalDiskMark, CrystalCPUID, CrystalDMI, CrystalMark .

Список команд жестких дисков стандарта ATA для работы с данными S.M.A.R.T

Наименование &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp Код операции

SMART_READ_VALUES&nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp 0xd0
SMART_READ_THRESHOLDS &nbsp &nbsp &nbsp &nbsp &nbsp&nbsp 0xd1
SMART_AUTOSAVE&nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp&nbsp 0xd2
SMART_SAVE&nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp 0xd3
SMART_IMMEDIATE_OFFLINE &nbsp &nbsp &nbsp &nbsp 0xd4
SMART_READ_LOG_SECTOR &nbsp &nbsp &nbsp &nbsp &nbsp&nbsp 0xd5
SMART_WRITE_LOG_SECTOR &nbsp &nbsp &nbsp &nbsp&nbsp 0xd6
SMART_ENABLE &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp&nbsp 0xd8
SMART_DISABLE &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp&nbsp&nbsp 0xd9
SMART_STATUS &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp0xda
SMART_AUTO_OFFLINE &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp 0xdb

В качестве дополнительного материала по технологии S.M.A.R.T и использованию программного обеспечения smartmontools в операционных системах семейства Linux, может пригодиться статья S.M.A.R.T и оценка технического состояния жесткого диска в Linux

Использование терминального режима для ремонта HDD.

&nbsp &nbsp Данный материал предоставляется чисто в ознакомительных целях. Работа с диском в терминальном режиме требует осторожности, определенных знаний, и понимания того, что вы делаете. Даже одна единственная ошибка в команде может привести к полной неработоспособности накопителя. Если на проблемном устройстве у вас хранились бесценные данные, и у вас нет достаточного опыта — лучше обратитесь к специалистам по восстановлению информации. Начинать учиться, лучше всего, на частично неисправном накопителе, который вам не жалко выбросить.

&nbsp &nbsp За основу я взял методику, описанную здесь и здесь
Применяется для реанимации накопителей Seagate Barracuda 7200.11 с прошивкой SD15 производства Таиланд. Проблема заключается в ошибке прошивки SD15, приводящей к разрушению информации в служебной области накопителя и, как следствие, недоступности накопителя в BIOS или неправильного определения его объема (LBA 0). Причем сам накопитель исправен, но недоступен по интерфейсу из-за установленного сигнала занятости выполнением операции (BSY),. Пока этот сигнал активен, никакие другие сигналы интерфейса недействительны, и, следовательно, заменить прошивку с использованием фирменных утилит с сайта производителя невозможно. Для возвращения накопителя в рабочее состояние, позволяющее заменить прошивку, используется выполнение нескольких команд в терминальном режиме подключения накопителя.
&nbsp &nbsp Для подключения используется стандартный последовательный порт компьютера (COM) и адаптер RS-232 — TTL, необходимый для преобразования уровней сигналов интерфейса RS-232 в уровни TTL. Схему адаптера можно легко собрать самостоятельно, но проще использовать готовый кабель — переходник, применяемый для подключения мобильного телефона к последовательному порту. За неимением «настоящего» COM-кабеля для подобного подключения, я использовал кабель USB-to-Serial, эмулирующий последовательный порт при подключении через USB с помощью драйвера Proliffic-USB-To-Serial-Com-Port (ser2pl.sys).

&nbsp &nbsp Методика несложная и вполне работоспособная, но, в основном, рассчитана на применение опытными специалистами по ремонту HDD. Я постараюсь дать некоторые пояснения, которых в оригинале нет.

&nbsp &nbsp Итак, кроме обычного интерфейса ATA или SATA, современные накопители имеют служебный интерфейс для подключения в терминальном режиме. На плате электроники накопителя любого производителя вы найдете кроме стандартных разъемов питания и интерфейса, еще и дополнительный разъем, никак не обозначенный, и имеющий не менее 3-х контактов. Это и есть разъем для подключения терминала через последовательный порт накопителя.

Для разных моделей и для разных производителей оборудования, разъемы будут отличаться. Общее у них то, что для обмена данными используется упрощенный последовательный порт с уровнями сигнала стандарта TTL. Поэтому и необходим, при подключению к последовательному порту (COM) компьютера, адаптер, согласующий уровни сигналов RS-232 (от -12V до +12V) и TTL (от 0V до +5V). Из набора линий стандарта RS-232 используются только общий (Ground) , TX для передаваемых данных и RX — для принимаемых. При подключении жесткого диска к терминалу, нужно линию передачи данных (контакт TX технологического разъема HDD) соединить с линией принимаемых данных терминала (контакт RX разъема адаптера) и наоборот, линию TX адаптера — с линией RX накопителя. В качестве терминала можно использовать любой компьютер с последовательным портом и программой эмуляции терминала, обычно Hyperterminal или putty. Параметры порта (скорость, число битов, четность, количество стоп-битов) могут отличаться для разных моделей накопителей. Обычно, отличается только скорость передачи данных. А остальные — 8 бит, нет бита четности, 1 стоповый бит. Иногда параметры записывается в виде «9600, 8 ,N ,1» — скорость 9600 бит/сек, 8-битовые посылки, без бита четности с 1 стоповым битом.

В разных моделях накопителей используются свои контакты для подключения к терминалу

3,5″ накопители Seagate PATA :

Интерфейсный разъём. : : | : RX / TX Разъём питания

3,5″ и 2.5″ накопители Seagate SATA, а также 2.5″ Samsung SATA :

Разъём питания. Разъём SATA . . . . RX TX

3,5″ накопители Samsung PATA :

Интерфейсный разъём. : : : | RX / TX Разъём питания

3,5″ накопители Samsung SATA :

Разъём питания. Разъём SATA : : : | RX / TX

Особенность накопителей производства Western Digital — отсутствие штатного разъема для терминального подключения, которое практически не используется для ремонта накопителей WD из-за примитивных возможностей и сложности подключения. Для диагностики и ремонта используется дополнительное оборудование и специализированное программное обеспечение.

Использование Hiperterminal для подключения накопителей Seagate.

Выполняете «Пуск — Программы — Стандартные — Связь — Hiper Terminal» После старта выбираете существующее или создаете новое подключение. Выбираете порт, к которому подключен накопитель

и задаете параметры обмена для него — 9600,8,N,1 , управление потоком — Нет.
Во многих методиках скорость обмена данными указывается 38400. Однако, это зависит от конкретной модели накопителя, и у Seagate часто встречается скорость 9600 бит/сек. Если у вас возникнут проблемы с обменом данными накопителя и терминала, попробуйте подобрать скорость последовательного порта.

После определения параметров последовательного порта нужно установить параметры эмуляции терминала в свойствах созданного подключения ( «Файл» — «Свойства» — «Настройка» — «Параметры ASCII»)

Дистрибутив операционной системы Windows 7 не содержит привычного Гипертерминала , однако можно воспользоваться этим средством из комплекта стандартных программ Windows XP, скачать, около 600кб . Для работы с терминалом нужно использовать «Запуск от имени Администратора». В архиве также имеется исполняемый файл PuTTY версии 6.0, работающий во всех версиях Windows.

Режим «Отображать введенные символы на экране» в дальнейшем можно будет выключить, чтобы не было удвоения вводимых с клавиатуры символов, однако на начальном этапе настройки и проверки подключения, он может оказаться полезным — вы будете видеть в окне терминала вводимые вами символы.

&nbsp &nbsp Убедитесь, что ваш терминал работает. Для этого соедините RX и TX между собой. При наборе с клавиатуры вы должны видеть удвоение набираемых символов, поскольку на экран терминала сначала выводится введенный символ, передаваемый по линии TX, а затем, этот же символ, принятый по линии RX. Если режим «Отображать введенные символы на экране» выключить, то удвоения символов не будет, поскольку будут отображаться только символы, принятые по линии RX.

&nbsp &nbsp Убедившись в правильности работы терминала, подключите к нему жесткий диск, соединив линию передаваемых данных (выход TX накопителя) с линией принимаемых (входом RX адаптера) и наоборот — RX адаптера с TX накопителя. Если ошибетесь, — ничего страшного не случится, поменяйте контакты местами. Интерфейсный кабель (SATA или ATA) должен быть отключен.

&nbsp &nbsp Если параметры порта выбраны правильно и накопитель поддерживает терминал, то, при нажатии CTRL-Z вы должны увидеть приглашение:

F3 в строке приглашения к вводу команд служит индикатором поколения архитектуры накопителей Seagate . Символ «T» — указывает, что команды относятся к уровню диагностического монитора (Diagnostic Monitor Level), на котором возможно выполнение внутренних тестов и процедур отладки. На каждом уровне используется свой набор команд, например, для уровня 1 — это команды для работы с памятью, системными переменными и т.п, для уровня 2 — команды для работы с накопителем — остановка и запуск двигателя, выполнение встроенных тестов и т.п. Уровни обозначаются цифрами или буквами. Набор уровней, и команд внутри уровня, зависят от модели накопителя. Некоторые из команд доступны на любом уровне, например, команда перехода на новый уровень, команды для отображения содержимого памяти и т.п. В зависимости от версии микропрограммного обеспечения, в качестве общих команд могут использоваться точка ( . ), восклицательный знак ( ! ), знак вопроса ( ? ) тильда (

), в ответ на которые накопитель выводит диагностические данные о своем текущем состоянии.

Переход на нужный уровень выполняется с помощью команды:

/номер уровня
Например: /2 — перейти на уровень 2

&nbsp &nbsp Будьте внимательны, соблюдайте синтаксис команд. Строчные и заглавные символы при работе в терминале отличаются . Многие команды выполняют запись в служебную область дискового пространства накопителя и, уже поэтому, потенциально опасны.
В моделях накопителей Seagate 7200.11 появилась возможность получить краткую подсказку по уровням и командам. Для этого нужно перейти на уровень «C»
/C
И ввести команду «Q»
C> Q
В ответ вы получите список уровней и команд, доступных для данной модели накопителя. Подсказку по конкретной команде можно получить с помощью конструкции:

&nbsp &nbsp При некоторых неисправностях, при нажатии CTRL-Z , вместо приглашения уровня T> вы можете увидеть подобное сообщение:

LED: 000000CC FAddr: 0024A051

В среде специалистов по ремонту накопителей эта ошибка получила название «муха це-це», что созвучно коду ошибки 000000CC на латыни. Обычно сообщение появляется с определенным интервалом и означает, что терминал заблокирован, и ввод с клавиатуры не воспринимается накопителем. Никакие команды, вводимые с клавиатуры, не выполняются. Как правило, код ошибки 000000CC вызван тем, что внутренняя микропрограмма накопителя не может считать необходимые данные из служебной области дисковой поверхности. Ошибка может быть вызвана многими причинами, например, неисправной головкой, дефектом поверхности, ошибкой при записи журналов в момент выключения питания и т.п. Вполне понятно, что при механических неисправностях или дефектах , использование диагностического режима не имеет смысла. Тем не менее, в некоторых случаях, использование внутренних диагностических команд, вводимых с использованием терминального подключения, позволяет решить проблему восстановления данных, или даже полной работоспособности ( на какое-то время) устройства.

Для разблокировки терминала используются несколько методик, зависящих от конкретной модели. Для семейства Barracuda 7200.11 обычно используется следующая методика:

Теперь остается только подсоединить плату электроники с разблокированным терминалом к контейнеру. Но если это сделать, без команды остановки двигателя, плата электроники может просто выгореть. Чтобы этого не случилось, выполняется переход на уровень «2»

и вводится команда остановки двигателя — «Z».

О выполнении операции остановки и так остановленного двигателя вы увидите сообщение в окне терминала:
Spin Down Complete
Elapsed Time 0.138 msecs
F3 2>
После этого, осторожно, не отключая питания, плата электроники подключается к контейнеру и выполняется команда включения двигателя — «U»:

После раскручивания двигателя, увидите сообщение:

Spin Up Complete
Elapsed Time 7.146 secs

Теперь накопитель готов к работе в терминальном режиме.

Если при выполнении команды U получено сообщение содержащее код ошибки 84150180 , то возможно, отсутствует контакт между платой электроники и контейнером :

Spin Error
Elapsed Time 12.917 secs
R/W Status 2 R/W Error 84150180

Данная ошибка означает, что внутренняя микропрограмма не видит серворазметку, что может быть вызвано не только отсутствием контакта, но и, в худшем случае, неисправностью тракта чтения-записи, неисправностями схем запуска шпиндельного двигателя, его заклиниванием и т.п. При наличии подобной неисправности, нет смысла во всех последующих действиях — накопитель не сможет ничего прочитать из служебной области или записать в нее.

&nbsp &nbsp В сети встречается несколько методик восстановления работоспособности накопителей семейства 7200.11, которые позволили добиться положительного результата. Логика подсказывает, что как минимум, нужно:
— обнулить содержимое SMART Причиной разрушения транслятора, судя по всему, является ошибка в микропрограмме, связанная с обработкой этого содержимого. Иначе причина разрушения транслятора не будет устранена.
— пересчитать содержимое транслятора заново, что вернет работоспособность внутренней микропрограмме накопителя.

В большинстве методик используется команда обнуления списка переназначенных в процессе эксплуатации секторов G-List (Grown List). Мне кажется, в случае восстановления не только работоспособности, но и целостности данных, это будет лишним, хотя, вероятность порчи транслятора в зависимости от содержимого G-List, очевидно, исключить нельзя. На практике, очистку G-List я никогда не использовал, а восстановление нескольких Barracuda 7200.11 выполнилось вполне успешно.

&nbsp &nbsp Для очистки данных SMART нужно перейти на уровень 1

/1
и выполнить команду управления S.M.A.R.T (SMART Control) N . Данная команда имеет несколько подкоманд, идентифицируемых цифрой или буквой после «N» — N1 — создать SMART-сектор (очистка SMART), N2 — обновить SMART-атрибуты, N3- выполнить обновление прошивки, N5 — выдать данные атрибутов, N6 — выдать данные о пороговых значениях атрибутов, N7 — выполнить дамп G-List, N8 — дамп журнала критических событий, N9 — дамп содержимого P-List, NA — выдать журнал состояния накопителя за последние 2 часа. Для обнуления данных SMART используется команда N1:
F3 1> N1
После успешного выполнения команды обязательно нужно выключить и снова включить питание накопителя.
Для перегенерации транслятора используется команда форматирования (FormatPartition ) «m» уровня T. В команде используется индекс раздела, для которого будет пересчитываться транслятор, m0 — пользовательский (user partition index), m1 — системный (system partition index).

F3 T> m0,2,2,0,0,0,0,22

Обратите внимание, в набираемой команде никаких пробелов нет. В некоторых методиках команда представлена с пробелом после первой запятой (m0, 2,2,0,0,0,0,22) — это ошибка. Значения параметров команды:

2 — опция форматирования [FormatOpts] — 2 — информация не затирается.
2 — опция обработки таблиц дефектов [DefectListOpts] 2 — не изменять.
0,0,0,0 — опции обработки ошибок при выполнении команды.
22 — ключ достоверности [ValidKey] — дополнительная защита от неправильного набора команды. Должен быть равен 22.

Команда будет выполняться от нескольких секунд до минут. Нужно обязательно дождаться ее завершения, о чем будет выдано сообщение на терминал:
Max Wr Retries = 00, Max Rd Retries = 00, Max ECC T-Level = 14, Max Certify Rewrite Retries = 00C8
User Partition Format 10% complete, Zone 00, Pass 00, LBA 00004339, ErrCode 00000080, Elapsed Time 0 mins 07 secs
User Partition Format Successful — Elapsed Time 0 mins 07 secs

После выполнения этой команды рекомендуется остановить двигатель командой Z уровня 2 и выключить питание компьютера. Отключите терминал и подключите интерфейсный кабель к накопителю. После включения питания, если восстановление прошло успешно, накопитель должен правильно определиться в BIOS. Для исключения повторения ситуации остается только взять свежую прошивку для вашей модели с сайта Seagate и записать ее в накопитель. Обычно, для этого используется образ загрузочного CD (файл .iso), который можно взять на сайте производителя под конкретную модель и редакцию жесткого диска. Образ записывается на болванку и выполняется загрузка в DOS с автоматическим запуском программы для обновления прошивки.

Восстановление работоспособности накопителя ST3640323AS с прошивкой SD35.

&nbsp &nbsp Представитель того же проблемного семейства Barracuda 7200.11 с прошивкой не SD15, или, вроде бы, исправленной SD1A, а — SD35 !. Да, похоже, что в самом деле, 7200.11 — не очень удачное семейство «рыбок».

Внешнее проявление — диск не определяется в BIOS. После включения электропитания, двигатель запускается, слышен характерный щелчок, затем двигатель останавливается, и все повторяется с интервалом 10-15 секунд. При подключении терминала выяснилось, что скорость обмена для последовательного порта данной модели накопителя равна 38400 кбит/сек. На экран терминала выводится сообщения:

Rst 0x20M
(P) SATA Reset

LED:000000CC FAddr:0024CDC9
Rst 0x20M
(P) SATA Reset
LED:000000CC FAddr:0024CDC9
Rst 0x20M

Реакция на CTRL-Z присутствует, накопитель переходит на уровень /T, однако, тут же возвращается на «SATA Reset» :

Практика эксплуатации Seagate семейства 7200.11 показала, что обновление прошивок не является кардинальным решением проблемы самоблокировки накопителей внутренней микропрограммой. Очевидно, проблема не только в ошибках, допущенных разработчиками , но и в сложности алгоритмов обработки журналов, сбоев, трудности имитации реальных условий возникновения проблемной ситуации. На данный момент, известно несколько моделей, которые с большой вероятностью, через определенное время эксплуатации, отказываются работать. На сайте производителя периодически выкладываются обновления прошивок для различных типов накопителей, и тем не менее, проблема пока остается.

В описываемом случае, была применена методика, описанная выше, хотя версия прошивки (SD35) по данным сайта Seagate на тот момент времени, не являлась проблемной. Практика эксплуатации накопителей серии 7200.11 показала, что замена прошивки SD15 на рекомендуемую производителем версию SD1A , проблемы не решает. Через некоторое время ошибка может повториться. Затем на сайте была выложена версия SD1B, которая также не решила проблему саморазрушения транслятора. Теперь вот появилась и проблемная прошивка SD35. Кроме того, на тематических форумах встречается упоминание подобной ошибки на накопителях с прошивками AD14, SD15, SD16, SD17, SD18, SD19, SD81. Для проверки наличия обновленных прошивок для конкретной модели накопителя можно воспользоваться страницей поиска загрузок Seagate

Если вы желаете поделиться ссылкой на эту страницу в своей социальной сети, пользуйтесь кнопкой «Поделиться»

Источник

В сегодняшней статье:

1. Как узнать в каком состоянии мой жёсткий диск или твердотельный накопитель SSD, сколько он ещё проживёт. Как узнать состояние здоровья жёсткого диска или SSD бывшего в употреблении. Что такое  S.M.A.R.T и о чём говорят его показатели: Value, Worst, Raw, Threshold? 

2. Что такое бэд-блоки? Как установить — сколько сбойных секторов (бэд-блоков) на моём жёстком диске, можно ли их исправить, а самое главное, как исправить?

3. Что делать, если операционная система не загружается или зависает даже после переустановки, а жёсткий диск при работе издаёт щелчки и посторонние звуки? Почему каждый раз при загрузке Windows запускается утилита проверки диска chkdsk?

4. Как создать загрузочную флешку с программой Victoria и проверить жёсткий диск компьютера, ноутбука на бэд-блоки даже если он не загружается и так далее…

Как пользоваться одной из легендарных программ по диагностике жёстких дисков под названием Victoria!

Приветствую Вас друзья на нашем сайте remontcompa.ru! Сегодняшняя статья о программе Victoria. Скажу уверенно, данная программа самая лучшая среди утилит по диагностике и лечению жёстких дисков. Разработал сиё творение чародей первой категории Сергей Казанский.

Я  очень долго и ответственно готовился к данной статье чувствуя благодарность к этой программе. Бывало Victoria спасала казалось бы уже пропавшие данные на жёстких дисках моих клиентов, друзей и знакомых (часто перед мастером НЕ стоит задача вернуть к нормальной работе неисправный жёсткий диск, а только спасти данные находящиеся на нём), а иногда возвращала к жизни и сам винчестер!

  • Очень хотелось написать статью, которая помогла бы начинающим пользователям разобраться, а главное не боятся этой программы, а боятся есть чего, если пользоваться программой неосторожно, к примеру запустить бездумно сканирование в режиме Erase или ещё хуже Write , то можно удалить все данные на винте, если вы даже вовремя опомнитесь, то всё равно грохните загрузочную запись MBR и Вам не удастся в следующий раз загрузиться в операционную систему.

Друзья, невозможно всё, что я хочу рассказать и показать о программе Victoria поместить в одну статью. В результате моих стараний получилось несколько статей:

  1. Сегодняшняя статья. Как скачать и запустить прямо из работающей Windows программу Victoria. Что такое S.M.A.R.T. или как за пару секунд определить состояние здоровья Вашего жёсткого диска или SSD. Ещё статьи…
  2. Как произвести тест жёсткого диска или твердотельного накопителя SSD на наличие сбойных секторов (бэд-блоков) в программе Victoria для Windows. Как вылечить жёсткий диск.
  3. Как создать загрузочную флешку с программой Victoria, загрузить с неё компьютер или ноутбук (если они не загружаются нормально из-за сбойных секторов) и протестировать поверхность жёсткого диска на бэд-блоки. Как избавиться от бэд-блоков в DOS (ДОС) режиме.
  4. Как с помощью программы Victora произвести посекторное стирание информации с жёсткого диска и этим избавиться от сбойных секторов (бэд-блоков).
  5. Как обрезать на жёстком диске участок со сбойными секторами.
  6. Как установить точный адрес сбойного сектора в программе Victoria и исправить этот сектор.
  7. Как сопоставить принадлежность сбойного сектора (бэд-блока) конкретному файлу в Windows?
  8. Как избавить жёсткий диск ноутбука от бэд-блоков в программе Victoria
  9. Загрузочная флешка Live CD AOMEI PE Builder с программами для диагностики жёсткого диска: Victoria, HDDScan, CrystalDiskInfo 6.7.4, DiskMark, HDTune, DMDE

Во первых, основных версий программы Victoria две:

Первая версия позволит нам произвести диагностику и небольшой ремонт жёстких дисков прямо в работающей Windows, но хочу сказать, что диагностику винчестера с помощью этой версии произвести можно, а вот исправление сбойных секторов (ремап) часто заканчивается неудачей, да и вероятность ошибок при работе с Викторией прямо «из винды» присутствует, поэтому многие опытные пользователи и профессионалы предпочитают вторую версию программы.

Вторая версия программы Victoria будет находиться на загрузочном диске или флешке, с данного диска (флешки) мы загрузим наш стационарный компьютер или ноутбук и также проведём диагностику и если нужно лечение жёсткого диска.

Примечание: Вторая версия очень пригодится многим, так как у большинства пользователей один жёсткий диск в компьютере или тем более в ноутбуке, в этом случае можно загрузиться с диска (флешки) Виктории и работать с одним единственным винчестером.

1. Victoria на загрузочном диске очень пригодится, если из-за бэд блоков Вы не можете запустить операционную систему.

2. Если у Вас один жёсткий диск и на нём установлена операционная система и в этой же работающей операционке Вы запустите Викторию, то наверняка она откажется исправлять сбойные сектора (бэд-блоки).

Многие пользователи заметят, что зачастую хороший бэд не исправит даже Виктория, на что ответить можно так — не все бэды имеют физическую природу (разрушившийся сектор на жёстком диске), многие бэды имеют логическую природу и легко исправляются этой программой.

Примечание: все подробности о существующих бэд-блоках винчестеров, какие они бывают, логические или физические, читайте в нашей статье- Как проверить состояние жесткого диска.

Коротко лишь скажу, что физические бэды (физически разрушившийся сектор) восстановить невозможно, а логические (программные, ошибки логики сектора) восстановить можно. 

Друзья, можно много говорить, но есть хорошая жизненная пословица: «Лучше один раз увидеть, чем сто раз услышать», поэтому я приведу для Вас несколько примеров работы программы Victoria.

Victoria для работы с загрузочного диска

Идём на официальный сайт программы и выбираем Victoria 3.5 Russian ISO-образ загрузочного CD-ROM.

Victoria на загрузочном диске нам тоже нужна, но работу с этой версией мы рассмотрим во вторую очередь. Если у Вас нет дисковода, тогда мы сделаем загрузочную флешку с программой Victoria.

Victoria для работы непосредственно в операционной системе Windows XP, 7, 8, 10

Также скачиваем на моём облаке версию для Windows. 

Щёлкаем на скачанном архиве программы правой мышью и выбираем Извлечь файлы. 

 

Файлы извлекаются в создавшуюся папку vcr43. Заходим в эту папку и обязательно запускаем от имени администратора исполняемый файл программы victoria43.exe.

Главное окно программы Victoria 

В главном окне программы пройдёмся по всем вкладкам поверхностно, а затем подробно.

Standard

Выбираем начальную вкладку Standard. Если у Вас несколько жёстких дисков, то в правой части окна выделите левой мышью нужный Вам жёсткий диск и сразу в левой части окна отобразятся паспортные данные нашего жёсткого диска: где родился и женился, модель, прошивка, серийный номер, объём кэша и так далее. В нижней части ведётся лог наших действий.

Что такое S.M.A.R.T.

Затем выбираем в правой части окна нужный нам жёсткий диск, если у Вас их несколько и выделяем его левой мышью. Выберем к примеру жёсткий диск WDC WD5000AAKS-00A7B2(объём 500 ГБ). 

Переходим на вкладку SMART, жмем кнопку Get SMART, справа от кнопки засветится сообщение GOOD и откроется S.M.A.R.T. выбранного нами жёсткого диска.

S.M.A.R.T. (от англ. self-monitoring, analysis and reporting technology) — разработанная в 1995 году крупнейшими производители жёстких дисков усовершенствованная технология самоконтроля, анализа и отчётности винчестера.

Другими словами друзья, если посмотреть это окно, то можно узнать в каком состоянии Ваш жёсткий диск.

Обратите внимания программа Victoria подсветила красным (тревога!) цифру на значении Raw, самого важного для здоровья жёсткого диска атрибута 

Reallocated Sector Count — (remap), обозначающий число переназначенных секторов. 

Примечание: значение атрибута Raw очень важно, читаем почему.  

Простыми словами, если микропрограмма, встроенная в жёсткий диск, обнаружит сбойный сектор (бэд-блок), то она переназначит этот сектор сектором с резервной дорожки (процесс называется remapping). Но резервных секторов на жёстком диске не бесконечное число и программа нас предупреждает, что скоро бэд-блоки переназначать будет нечем, а это чревато потерей данных и нам надо готовиться менять жёсткий диск на новый. Забегая вперёд, скажу, что в следующей статье мы попробуем подлечить этот жёсткий диск.

9 Power-On time — общее количество отработанных жёстким диском часов 14810, не подсвечено красным, но хочу сказать, что приближение к цифре 20000 наработки в большинстве случаев связано с болезнями и нестабильной работой жёсткого диска.

Также подсвечены атрибуты:

196 Reallocation Event Count3. Количество операций переназначения бэд-блоков секторами с резервных дорожек (ремаппинг), учитываются как успешные, так и неуспешные операции.

197 Current Pending Sector13. Показатель количества нестабильных секторов реальных претендентов в бэд-блоки. Данные сектора микропрограмма жёсткого диска планирует в будущем заменить секторами из резервной области (remap), но всё же есть надежда, что в дальнейшем какой-то из этих секторов прочитается хорошо и будет исключён из списка претендентов.

198 Offline scan UNC sectors13. Количество реально существующих на жёстком диске не переназначенных бэдов (возможно исправимых имеющих логическую структуру — подробности далее в статье).

199 UltraDMA CRC Errors63771. Ошибки, возникающие при передаче информации по внешнему интерфейсу, причина — возможно перекрученный и некачественный SATA шлейф и его нужно заменить или расшатанный разъём SATA на материнской плате или на самом жёстком диске. А может сам винчестер интерфейса SATA 6 Гбит/с подключен в разъём на материнской плате SATA 3 Гбит/с, надо переподключить.

Атрибуты S.M.A.R.T и их значения. Очень важно знать!

Значения атрибутов

Val—текущее значение атрибута, оно должно быть высоким (до 255), если значение Val равно критическому Tresh или даже менее его, то это соответствует неудовлетворительной оценке параметра. К примеру в нашем случае на жёстком диске WDC WD5000AAKS-00A7B2  (500 ГБ, 7200 RPM, SATA-II) атрибут Reallocated Sector Count имеет значение Val199, а атрибут Tresh (порог) имеет значение 140, это плохо, но значение Val199 ещё не равно значению Tresh (порог) 140 и у нас есть время скопировать данные с этого диска и отправить его на пенсию.

Wrst—самый низкий показатель атрибута Val за всё время работы винчестера.

Tresh—пороговое значения атрибута, данное значение должно быть намного ниже значения Val (текущее значение).

Raw«сырое значение», которое будет пересчитано в значение Value, чем меньше это значение, тем лучше. Важный показатель для оценки атрибута, представляет реальное число, исходя из которого формируется значение Value, но как именно происходит процесс формирования значения Value — это фирменный секрет каждого производителя жёсткого диска!

Расшифровка S.M.A.R.T.

Давайте разберёмся во всех атрибутах S.M.A.R.T, но хочу сказать, что чаще всего на «плохих» жёстких дисках неудовлетворительным будет именно этот атрибут Reallocated Sector Count (Переназначенные сектора). Это уже повод насторожиться и провести тест поверхности жёсткого диска или SSD (как это сделать узнаем далее в статье).

Друзья, для моментальной оценки здоровья жёсткого диска S.M.A.R.T я использую ещё одну простую программу на русском языке CrystalDiskInfo, обязательно скачайте и установите её себе. В ней все атрибуты указаны на русском языке! 

http://crystalmark.info/download/index-e.html

Выберите Shizuku Edition (exe).

В данном окне язык программы можете выбрать русский. 

Как видите, CrystalDiskInfo прямо указывает нам (подтверждая опасения «Виктории»), на жёстком диске WDC WD5000AAKS-00A7B2 (объём 500 ГБ) нехорошие значения атрибутов отвечающих за Переназначенные сектора, Нестабильные сектора, Неисправимые ошибки секторов, подсвечивая их жёлтым цветом и указывает на тех. состояние жёсткого диска одним словом «Тревога»

 

Как выглядит S.M.A.R.T неисправного жёсткого диска

А вот S.M.A.R.T неисправного жёсткого диска WDC WD500BPVT ноутбука, который мне принесли на ремонт.

Victoria из Windows. Обратите внимание на атрибут:

5 Reallocated Sector Count (переназначенные сектора), он имеет значение Val133, а атрибут Tresh (порог) имеет значение 140, это неудовлетворительно, так как значение Val133 не должно быть меньше предельного значения Tresh (порог) 140, то есть количество сбойных секторов будет расти, а переназначать их уже нечем, запасные сектора на резервных дорожках уже закончились.

197 Current Pending Sector — показатель количества нестабильных секторов реальных претендентов в бэд-блоки зашкалил все возможные пределы.

И самое главное, самооценка SMART status=BAD (непригоден).

Программа CrystalDiskInfo (ссылка на скачивание чуть выше). Видим тоже самое, атрибут Переназначенные сектора (Reallocated Sector Count) имеет значение Val (текущее)—133, а атрибут Tresh (порог) имеет значение 140, программа оценила оценку тех состояния жёсткого диска как Плохо.

этот ноутбук ужасно тормозит, данные c него невозможно скопировать, Windows невозможно переустановить, периодически винчестер пропадает из БИОС, то есть такой жёсткий диск подлежит замене без раздумий, даже наша Victoria не сможет полностью вылечить подобный винт, так как здоровые сектора на резервных дорожках закончились и сбойные сектора переназначать уже нечем, а копирование данных с него будет настоящим приключением на неделю (обязательно напишу про это статью).

Забегая вперёд скажу, что тест этого винта в программе Victoria показал наличие 500 неисправимых сбойных секторов (бэд-блоков).

ДОС — версия программы Виктория.

Примечание: Чтобы Вам упростить жизнь, некоторые программы диагностики жёстких дисков сопоставляют каждый атрибут, хороший он или плохой, цвету значка.

Зелёный—атрибут жёсткого диска соответствует нормальному.

Жёлтый—говорит о небольшом расхождении с эталоном и на этом винте важные данные лучше не хранить, если у Вас на таком жёстком диске находится Windows, перенесите её на SSD.

Красный—говорит о значительном расхождении с эталоном и жёсткий диск нужно было менять уже вчера.

S.M.A.R.T этого же жёсткого диска WDC WD500BPVT в программе HDDScan 

Атрибуты

001 Raw Read Error Rate—частота ошибок при чтении информации с диска

002 Spinup Time—время раскрутки дисков до рабочего состояния 

003 Start/Stop Count—общее количество стартов/остановок шпинделя.

005 Reallocated Sector Count — (remap) говорит о числе переназначенных секторов. Если микропрограмма встроенная в жёсткий диск обнаружит сбойный сектор (бэд-блок), то она переназначит этот сектор сектором с резервной дорожки (процесс называется remapping). Но резервных секторов на жёстком диске не бесконечное число и программа нас предупреждает, что скоро бэд-блоки переназначать будет нечем, а это чревато потерей данных и нам надо готовиться менять жёсткий диск на новый

007 Seek Error Rate—частота ошибок при позиционировании блока головок, постоянно растущее значение, говорит о перегреве винчестера и неустойчивом положении в корзине, к примеру плохо закреплён. 

009 Power-on Hours Count—число часов, проведённых во включенном состоянии.

010 Spin Retry Count—число повторных раскруток диска до рабочей скорости при неудачной первой.

012 Device Power Cycle Count—Число полных циклов включения-выключения дисков

187 Reported Uncorrectable Error—Ошибки, которые не не смогла восстановить микропрограмма винчестера, используя свои методы устранения ошибки аппаратными средствами, последствия перегрева и вибрации.

189 High Fly Writes—записывающая головка находилась над поверхностью выше, чем нужно, а значит магнитное поле было недостаточным для надежной записи носителя. Причина– вибрация (удар).

Для ноутбуков данная цифра немного выше. 

190 Важные параметры касающиеся температуры. Важно, что бы температура не поднималась выше 45 градусов.

194 HDA Temperature—температура механической части жёсткого диска 

195 Hardware ECC Recovered—число ошибок, которые были исправлены самим винчестером.

196 Reallocation Event Count — Количество операций переназначения бэд-блоков секторами с резервных дорожек (ремаппинг), учитываются как успешные, так и неуспешные операции. 

197 Current Pending Errors Count — неисправимые ошибки секторов, тоже важный параметр, число секторов, считывание которых затруднено и сильно отличается от считывания нормального сектора. То есть, эти секторы контроллер жёсткого диска не смог прочитать с первого раза, обычно к данным секторам принадлежат софт-бэды, ещё называют программные или логические бэд-блоки (ошибка логики сектора) — при записи в сектор пользовательской информации, так же записывается служебная информация, а именно контрольная сумма сектора ECC (Error Correction Code-код коррекции ошибок), она позволяет восстанавливать данные, если они были прочитаны с ошибкой, но иногда данный код не записывается, а значит сумма пользовательских данных в секторе не совпадает с контрольной суммой ECC. К примеру так происходит при внезапном отключении компьютера из-за сбоев с электричеством, из-за этого информация в сектор жёсткого диска была записана, а контрольная сумма нет.

  • Логические бэд-блоки нельзя исправить простым форматированием, так как при форматировании контроллер жёсткого диска попытается в первую очередь прочитать информацию из сбойного сектора, если ему это не удастся (в большинстве случаев), то значит не произойдёт никакой перезаписи и бэд-блок останется бэд-блоком. Исправить положение можно в программе Victoria, она принудительно впишет в сектор информацию (вылечит сектор), затем прочитает её, сравнит контрольную сумму ECC и бэд-блок станет нормальным сектором. Более подробно про все виды бэд-блоков в нашей статье Как проверить жёсткий диск.

198 Offline scan UNC sectors — Количество реально существующих на жёстком диске непереназначенных бэдов (возможно исправимых имеющих логическую структуру — подробности далее в статье).

198 Uncorrectable Errors Count—число нескорректированных ошибок при обращении к сектору, указывает на дефекты поверхности.

Reported Uncorrectable Errors — показывает число неисправленных сбойных секторов.

199 UltraDMA CRC Errors—число ошибок, возникающих при передаче информации по внешнему интерфейсу, причина- перекрученный и некачественный SATA шлейф, возможно его нужно поменять.

200 Write Error Rate—частота ошибок, происходящих при записи на винчестер, по данному показателю обычно судят о качестве поверхности накопителя и его механической части.

202 Data Address Mark Errors—расшифровки нигде не встречал, буквально Ошибка данных адресного маркера, означать может то, что знает один лишь производитель данного винчестера.

Как быстро проверить жёсткий диск или SSD на пригодность к работе?

Друзья, Вы меня часто спрашиваете: «Как быстро проверить жёсткий диск или SSD на пригодность к работе?»

Ответ: «Используйте программы: Victoria, CrystalDiskInfo, HDDScan, они сразу покажут Вам S.M.A.R.T любого жёсткого диска.

Как выглядит S.M.A.R.T абсолютно нового жёсткого диска

Во первых, смотрите как выглядит S.M.A.R.T абсолютно нового жёсткого диска WDC WD2500AAKX-00ERMA0

Как видим, все показатели накопителя в отличном состоянии и отработал он ноль часов (параметр 9 Power-On Time)

Теперь берём почти новый жёсткий диск WDC WD2500AAKX-001CA0 и смотрим S.M.A.R.T, как видим, винчестер практически в идеальном состоянии, хотя и отработал уже 8000 часов (параметр 9 Power-On Time)

Victoria 

Тест поверхности жёсткого диска!

В правой части окна программы отметьте пункт Ignor и пункт read и нажмите Start. Этим Вы запустите простой тест поверхности жёсткого диска без исправления ошибок. Данный тест не принесёт никаких отрицательных и положительных воздействий на жёсткий диск, но зато по окончании теста Вы будете знать в каком состоянии находится Ваш винчестер..

Результаты теста отличные. Ни одного блока с задержкой более 30 мc!

CrystalDiskInfo

HDDScan

Жёсткий диск SAMSUNG HD403LJ (372 ГБ) из недавней статьи Как перенести Windows 7, 8, 8,1 на SSD с помощью программы Acronis True Image.

На нём были бэд-блоки и мне пришлось переносить с него Windows 8 на SSD, после успешного переноса, хозяин (мой одноклассник) подарил мне этот винт и Victoria вскоре вернула его к жизни после «записи по всей поляне» (алгоритм Write). Прежний хозяин забирать вылеченный винчестер отказался. 

Результаты теста чуть хуже. 3 блока с задержкой более 200 мс и 1 блок с задержкой 600 мс (возможно кандидат в бэды).

Не вполне исправный жёсткий диск MAXTOR STM3250310AS  (250 ГБ, 7200 RPM, SATA-II) ему 8 лет (ветеран) и он всё ещё работает, правда я его берегу, храню на нём только файлы неважных данных.

Хоть явных бэдов на нём и нет, видим, что атрибут 5 Reallocated Sector Count — (remap), обозначающий число переназначенных секторов критический и скоро бэды переназначать будет нечем.

9 Power-On time — общее количество отработанных жёстким диском часов 23668, это очень много, обычно проблемы у жёстких дисков начинаются после 20000 часов отработки.

Также неважнецкий атрибут 199 UltraDMA CRC Errors — 63771,ошибки, возникающие при передаче информации по внешнему интерфейсу, причина — некачественный шлейф SATA шлейф и его нужно заменить (не всегда дело в этом). 

Результаты теста ещё хуже. 71 блок с задержкой более 200 мс и 1 блок с задержкой 600 мс (возможно кандидат в бэды).

Жёсткий диск ST3200826AS (200 ГБ, 7200 RPM, SATA). Винту около трёх лет и полёт пока нормальный.

Результаты теста. 6 блоков с задержкой более 200 мс.

Новый твердотельный накопитель SSD SPCC SSD162 

Тест

Под конец статьи проверим мой самый старый твердотельный накопитель SSD — ADATA S510 60GB (60 ГБ, SATA-III)

Ему уже третий год, но работает он отменно, жалко что объём всего 60 ГБ, но когда я его покупал больше и не было, а стоил он около двухсот баксов.

Первую часть этого материала можно прочитать здесь.

Технология S.M.A.R.T. родилась в далеком 1995 году, так что возраст у нее почтенный. Предполагалось, что атрибуты SMART (давайте для простоты писать аббревиатуру без точек), формируемые микропрограммой жесткого диска, позволят программно оценивать состояние накопителя, а также дадут механизм для предсказания выхода его из строя. Последнее в те времена было достаточно актуально: срок жизни дисков в серверах, например, исчислялся годом-полутора, и знать, когда готовить замену, было нелишним.

Со временем многое поменялось: что-то отмерло, какие-то стороны развились сильнее (например, контроль механики диска). Первоначальный набор из десятка простейших атрибутов усложнился и разросся в несколько раз, порой менялся их смысл, многие производители ввели собственные атрибуты с не всегда ясным функционалом. Появилась масса программ для анализа SMART (как правило, невысокого качества, но с эффектным интерфейсом, да еще и за деньги) и т.п.

Так что не мешает описать современное состояние SMART. Начнем с критически важных атрибутов, ухудшение которых почти всегда свидетельствует о проблемах с накопителем. Именно их первым делом смотрят ремонтники при диагностике HDD.

  • #01 Raw Read Error Rate — частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска. Для всех дисков Seagate, Samsung (семейства F1 и более новые) и Fujitsu 2,5″ это — число внутренних коррекций данных, проведенных ДО выдачи в интерфейс; на пугающе огромные цифры можно не обращать внимания.
  • #03 Spin-Up Time — время раскрутки пакета пластин из состояния покоя до рабочей скорости. Растет при износе механики (повышенное трение в подшипнике и т.п.), также может свидетельствовать о некачественном питании (например, просадке напряжения при старте диска).
  • #05 Reallocated Sectors Count — число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор переназначенным и переносит данные в резервную область. Вот почему на современных HDD нельзя увидеть bad-блоки — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, на жаргоне — ремап. Поле Raw Value атрибута содержит общее количество переназначенных секторов. Чем оно больше, тем хуже состояние поверхности диска.
  • #07 Seek Error Rate — частота ошибок при позиционировании блока магнитных головок (БМГ). Рост этого атрибута свидетельствует о низком качестве поверхности или о поврежденной механике накопителя. Также может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине).
  • #10 Spin-Up Retry Count — число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута растет, то велика вероятность проблем с механикой.
  • #196 Reallocation Event Count — число операций переназначения. В поле Raw Value атрибута хранится общее число попыток переноса информации со сбойных секторов в резервную область диска (она, как правило, не слишком велика — несколько тысяч секторов). Учитываются как успешные, так и неудачные операции.
  • #197 Current Pending Sector Count — текущее число нестабильных секторов. Здесь хранится число секторов, являющихся кандидатами на замену. Они не были еще определены как плохие, но считывание с них происходит с затруднениями (например, не с первого раза). Если «подозрительный» сектор будет в дальнейшем считываться успешно, то он исключается из числа кандидатов. В случае же повторных ошибочных чтений накопитель попытается восстановить его и выполнить ремап.
  • #198 Uncorrectable Sector Count — число секторов, при чтении которых возникают неисправимые (внутренними средствами) ошибки. Рост этого атрибута указывает на серьезные дефекты поверхности или на проблемы с механикой накопителя.
  • #220 Disk Shift — сдвиг пакета пластин относительно оси шпинделя. В основном возникает из-за сильного удара или падения диска. Единица измерения неизвестна, но при сильном росте атрибута диск не жилец.

    Также следует принимать во внимание и информационные атрибуты, способные много чего поведать об «истории» диска.

  • #02 Throughput Performance — средняя производительность диска. Если значение атрибута уменьшается, то велика вероятность, что у накопителя есть проблемы.
  • #04 Start/Stop Count — число циклов запуск-остановка шпинделя. У дисков некоторых производителей (например, Seagate) — счетчик включения режима энергосбережения.
  • #08 Seek Time Performance — средняя производительность операции позиционирования головок. Снижение значения этого атрибута свидетельствует о неполадках в механике привода головок (в первую очередь о замедленном позиционировании).
  • #09 Power-On Hours (POH) — время, проведённое во включенном состоянии. Показывает общее время работы диска, единица измерения зависит от модели (не только 1 час, но и 30 мин, и даже 1 минута).
  • #11 Recalibration Retries — число повторов рекалибровки в случае, если первая попытка была неудачной. Рост этого атрибута указывает на проблемы с механикой диска.
  • #12 Device Power Cycle Count — число полных циклов включения-выключения диска.
  • #13 Soft Read Error Rate — частота появления «программных» ошибок при чтении данных. Сюда можно отнести ошибки программного обеспечения, драйверов, файловой системы, неверную разметку диска — в общем, почти все, что не относится к аппаратной части.
  • #190 Airflow Temperature — температура воздуха внутри корпуса HDD. Для дисков Seagate атрибут выдается в нормировке 100º минус температура (тем самым критический нагрев соответствует значению 45), а модели Western Digital используют нормировку 125º минус температура.
  • #191 Gsense error rate — число ошибок, возникших из-за внешних нагрузок. Атрибут хранит показания встроенного акселерометра, который фиксирует все удары, толчки, падения и даже неаккуратную установку диска в корпус компьютера.
  • #192 Poweroff retract count — число зафиксированных повторов включения/выключения питания накопителя.
  • #193 Load/Unload Cycle Count — число циклов перемещения БМГ в специальную парковочную зону/в рабочее положение.
  • #194 HDA temperature — температура механической части диска, в просторечии банки (HDA — Hard Disk Assembly). Информация снимается со встроенного термодатчика, которым служит одна из магнитных головок, обычно нижняя в банке. В битовых полях атрибута фиксируются текущая, минимальная и максимальная температура. Не все программы, работающие со SMART, правильно разбирают эти поля, так что к их показаниям стоит относиться критично.
  • #195 Hardware ECC Recovered — число ошибок, скорректированных аппаратной частью диска. Сюда входят ошибки чтения, ошибки позиционирования, ошибки передачи по внешнему интерфейсу. На дисках с SATA-интерфейсом значение нередко ухудшается при повышении частоты системной шины — SATA очень чувствителен к разгону.
  • #199 UltraDMA (Ultra ATA) CRC Error Count — число ошибок, возникающих при передаче данных по внешнему интерфейсу в режиме UltraDMA (нарушения целостности пакетов и т.п.). Рост этого атрибута свидетельствует о плохом (мятом, перекрученном) кабеле и плохих контактах. Также подобные ошибки появляются при разгоне шины PCI, сбоях питания, сильных электромагнитных наводках, а иногда и по вине драйвера.
  • #200 Write Error Rate/ Multi-Zone Error Rate — частота появления ошибок при записи данных. Показывает общее число ошибок записи на диск. Чем больше значение атрибута, тем хуже состояние поверхности и механики накопителя.

Как видим, большинство «интересных» атрибутов отражает функционирование механики накопителя. Технология SMART действительно позволяет предсказывать выход диска из строя в результате механических неисправностей, что, по статистике, составляет около 60% всех отказов. Полезен и мониторинг температур: перегрев головок резко ускоряет их деградацию, так что превышение опасного порога (45-55º в зависимости от модели) — сигнал срочно улучшить охлаждение диска.

Вместе с тем не следует переоценивать возможности SMART. Современные диски нередко «дохнут» на фоне отличных атрибутов, что связано с тонкими процессами дефект-менеджмента в условиях высокой плотности записи и не всегда, мягко говоря, качественных компонентов (разнобой в отдаче головок сегодня — обычное дело). Тем более SMART не способен предсказать последствия таких «форс-мажоров», как скачок напряжения, перегрев платы электроники или повреждение накопителя от удара.

Практически у всех атрибутов наибольший интерес представляет поле Raw Value: «сырые» значения наиболее информативны. Их нормировка (степень приближения к абстрактному порогу) часто ничего не дает и только запутывает дело. Поэтому и программы, полагающиеся на эти проценты, нельзя считать вполне надежными. Типичный случай для них — ложные тревоги. Программа сообщает, что новый, недавно установленный накопитель того и гляди «склеит ласты». А все дело в том, что в начале эксплуатации некоторые атрибуты SMART быстро меняются и примитивная экстраполяция приводит к пугающим пользователя прогнозам.

Я советую бесплатную программу HDDScan — она корректно понимает все атрибуты, в том числе и новые, правильно разбирает температурные показатели. Отчет выводится в виде аккуратной xml-таблицы с цветовой индикацией, которую можно сохранить или распечатать.

SMART диска WD пятилетнего возраста. О его близкой кончине свидетельствуют ненулевые значения атрибутов 1 и 200 (для WD они особенно чреваты), а также тот факт, что после ремапа атрибут 197 снова растет. Это значит, что возможности исправления дефектов исчерпаны

Крайне полезна у HDDScan возможность считывать SMART у внешних накопителей, столь распространенных сегодня. Практически ни одна другая программа этого не умеет, ведь на пути данных стоит контроллер, преобразующий интерфейс PATA/SATA в USB или FireWire. Автор целенаправленно работал в этом направлении, и ему удалось охватить широкий спектр контроллеров. Не забыты и диски с интерфейсом SCSI, до сих пор широко применяемые в серверах (атрибуты у них особые — например, выводится общее число записанных или считанных байтов за всю жизнь накопителя).

Функционал HDDScan полностью отвечает потребностям ремонтника. Когда первичную диагностику принесенного внешнего диска можно провести, не разбирая корпус, — это удобно, экономит время, а порой и сохраняет гарантию.

SMART, снятый со SCSI-диска. Здесь исторически сложились совсем другие атрибуты

⇡#Барьеры HDD

Механика давно стала ахиллесовой пятой HDD, и даже не столько из-за чувствительности к ударам и вибрации (это еще можно компенсировать), сколько из-за медлительности. Самые быстрые «дерганья» блоком магнитных головок (2-3 мс у лучших серверных моделей) в тысячи раз уступают скоростям электроники.

И принципиально ничего тут не улучшишь. Поднимать скорость вращения пакета дисков некуда, 15000 об./мин уже предел. Японцы несколько лет назад подступались к 20000 об./мин (вполне гироскопная скорость), но в итоге отказались — не выдерживают материалы, конструкция получается слишком дорогая и для массового производства слабо пригодная. В малых же сериях винчестеры выйдут золотыми, такие никто не купит — это не гироскопы, которые заменить нечем.

Выходит, уткнулись в барьер. Механику на кривой козе не объедешь. Единственный выход — поднимать плотность записи, поперечную и продольную. Продольная плотность (вдоль дорожки) влияет на производительность накопителя, т.е. на поток данных к остальным узлам компьютера. Но все равно, даже достигнутые 100-130 Мбайт/с — это для нынешних компьютеров слишком мало. Например, рядовая оперативная память (DRAM) имеет реальную производительность около 3 Гбайт/с, а кеш процессора — еще больше. Разница на порядки, и она сильно сказывается на общем быстродействии. Конечно, никто не требует от энергонезависимого накопителя, емкость которого в сотни раз превышает DRAM, такой же производительности. Но даже простое удвоение было бы заметно любому пользователю.

Поперечная плотность записи — это густота дорожек на пластине, в современных HDD она превышает 10000 на 1 миллиметр. Получается, что сама дорожка имеет ширину менее 100 нм (между прочим, нанотехнологии в чистом виде). Это позволяет резко поднять емкость в расчете на одну поверхность, а также ускоряет позиционирование за счет изощренных алгоритмов (их разработка потянула бы на пару докторских диссертаций).

Как итог, за последние годы емкость и производительность HDD значительно выросли. Все это стало возможным благодаря технологии перпендикулярной записи, которая существует уже более 20 лет, но до массового внедрения дозрела только в 2007 году. Причем емкость тогда выросла даже сильнее, чем требуется: первые терабайтные диски встретили вялый отклик пользователей. Народ просто не понимал, куда приспособить таких монстров, тем более что они поначалу строились на пяти пластинах, были капризными, шумными и горячими (речь о тогдашних флагманах Hitachi).

Потом, конечно, люди разобрались, торренты заработали в полную силу, да и количество пластин поуменьшилось. В то же время плотность записи выросла до 500-750 Гбайт на пластину (имеются в виду диски настольного сегмента с форм-фактором 3,5″). Вот-вот в массовое производство пойдут терабайтные пластины, что даст возможность выпустить винчестеры объемом до 4 Тбайт (больше четырех пластин в стандартном корпусе высотой 26,1 мм не уместить; хитачевские пятипластинные первенцы большого развития не получили).

Трехтерабайтный диск WD Caviar Green WD30EZRX, наиболее емкий на сегодня. Имеет четырехпластинный дизайн, выпускается ровно год (с 20 октября 2010 г.). Как полагается, весной и летом дешевел, но в последние дни резко подорожал из-за наводнения в Таиланде (там расположены сборочные заводы WD, и стихия блокировала подвоз комплектующих)

Увы, скорость позиционирования выросла, мягко говоря, несильно, а у массовых моделей так вообще осталась на прежнем уровне, а то и упала в угоду… тишине. Маркетологи доказали, что потребитель голосует кошельком за гигабайты в расчете на один доллар, а не за миллисекунды доступа. Поэтому и небыстры дешевые диски по сравнению с породистыми серверными собратьями. Медлительность хорошо проявляется в скорости загрузки ОС, когда надо читать с диска большое количество мелких файлов, разбросанных по пластинам. Здесь главную роль играет скорость вращения шпинделя и мощный привод БМГ, дающий возможность больших ускорений.

Между прочим, «быстрые» диски легко отличить даже на вес — они заметно тяжелее «медленных». Полноразмерная банка с утолщенными стенками, способствующая геометрической стабильности и подавлению вибраций, скоростной шпиндельный двигатель, мощные магниты позиционера, двухслойная крышка повышенной жесткости — все это прибавляет такому накопителю десятки и сотни граммов. Еще больше отрыв в серверных моделях на 15000 об./мин, где пластины уменьшенного размера окружены внушительным объемом литого алюминия, а общий вес «харда» доходит до килограмма.

Высокопроизводительный диск WD Raptor со скоростью вращения шпинделя 10 000 об./мин. При емкости 150 Гбайт весит 740 г (массовые модели той же емкости — 400-500 г). Обратите внимание на размер магнитов и толщину стенок

С удешевлением твердотельных SSD, использующихся, в первую очередь, под операционную систему, нужда в высокопроизводительных HDD стала снижаться, а сами они постепенно выделяются в особый сегмент рынка (такова, например, «черная» серия у WD). Подобными дисками комплектуются профессиональные рабочие станции с ресурсоемкими приложениями, критичными к скорости доступа. Рядовые же пользователи брать достаточно дорогие накопители не торопятся, предпочитая объем производительности.

На другом конце спектра — популярные «зеленые» модели с намеренно замедленным вращением шпинделя (5400-5900 об./мин вместо 7200) и небыстрым позиционированием головок. Дешевые, тихие, холодные и достаточно надежные, эти винчестеры идеально подходят для хранения мультимедийных данных в домашних компьютерах, внешних корпусах и сетевых хранилищах. На наших прилавках все эти Green и LP сильно потеснили другие линейки, так что в мелких «точках» порой ничего больше и не найдешь.

⇡#Расточительность магнитной записи

Намагниченность доменов жесткого диска, как и в середине двадцатого века, меняют с помощью магнитной головки, поле которой возбуждается переменным электрическим током и действует на магнитный слой через зазор. Также эта технология требует быстрого вращения пластин, прецизионного контроля положения головки и т.д. Двигатель и позиционер жесткого диска, а также управляющая ими электроника потребляют заметную мощность, да и стоят немало. Но главное — на само возбуждение магнитного поля тратится очень много энергии.

Расточительность стандартного метода магнитной записи трудно оценить, работая на персональном компьютере. Жесткие диски массовых серий даже при активной работе потребляют менее 10 Вт, что на фоне прочих комплектующих (100 Вт и более) почти незаметно. Но ваши взгляды сразу переменятся после посещения серверной комнаты какого-нибудь крупного банка, а чтобы получить впечатлений на всю оставшуюся жизнь, достаточно подойти к дисковой стойке суперкомпьютера. В шуме сотен и тысяч жестких дисков, обдувающих их вентиляторов и прецизионных кондиционеров становится понятно, сколько энергии в глобальном масштабе тратится на такую работу.

Недаром для систем хранения данных энергоэффективность в списке характеристик выходит на первый план. Вот уже и Google переводит свои дата-центры на баржи в море (вот где настоящие офшоры!). Оказывается, охлаждение СХД забортной водой радикально сокращает операционные затраты, в первую очередь за счет экономии на кондиционерах.

⇡#О питании жестких дисков

Будет ли работать обычная 220-вольтовая лампочка от 230 В? Конечно, будет. А от 240 В? Тоже. Вопрос — сколько она протянет? Понятно, что меньше или существенно меньше — это зависит от конкретной лампочки. Ей суждена яркая, но короткая жизнь.

Примерно та же ситуация и с жесткими дисками. Наивные производители проектировали их, полагаясь на стандартные +5 В и +12 В. Однако в типичном компьютерном блоке питания (БП) стабилизируется лишь линия 5 В. К чему же это приводит?

При высокой нагрузке на процессор (а современные «камни» потребляют немало) и недостаточной мощности БП линия 5 В проседает, и система стабилизации отрабатывает это дело, повышая напряжение до номинального значения. Одновременно повышается и напряжение 12 В (из-за отсутствия стабилизации по нему). В результате и так нестойкий к нагреву HDD работает еще и при повышенном напряжении, которое подается на самые греющиеся узлы — микросхему управления двигателем (на жаргоне ремонтников — «крутилка») и привод головок (т.н. «звуковая катушка»). Итог — смотри рассуждение о лампочке.

Сгоревшая «крутилка» на плате как результат повышенного напряжения и плохого охлаждения. Нередко микросхема сгорает в буквальном смысле, с пиротехническими эффектами и выгоранием дорожек на плате. Такое ремонту не подлежит

Отсюда советы по блоку питания. Чем больше его мощность, тем лучше (в разумных пределах: запас более 30-35% по отношению к реальному потреблению снижает КПД блока, так что вы будете греть комнату). Менее мощный, но фирменный БП лучше более мощного, но безродно-китайского. Помните — разгоняют не только процессоры. В первом приближении, 420 «китайских» ватт эквивалентны 300 «правильным».

По-хорошему, надо бы еще учитывать возраст БП: после 2-3 лет эксплуатации его реальная мощность заметно снижается, а выходные напряжения дрейфуют. Разумеется, в некачественных изделиях, работающих на честном китайском слове, процессы старения выражены гораздо резче. Хорошо еще, если подобный блок тихо умрет сам, а не утащит за собой в агонии половину системного блока!

Максимально допустимым считается 12,6 В (+5% от номинала). Однако у многих дисков c ростом напряжения наблюдается нелинейно-резкий нагрев упомянутых выше узлов — «крутилки» и «катушки». Поэтому я рекомендую строже контролировать БП с помощью внешнего вольтметра (датчики на материнской плате, измеряющие напряжение для BIOS и программ типа AIDA, могут быть весьма неточны).

Измерять напряжение лучше всего на разъемах Molex и обязательно под полной нагрузкой: процессор занят вычислениями с плавающей точкой, видеокарта — выводом динамичной трехмерной графики, а диск — дефрагментацией. При 12,2-12,4 В стоит призадуматься, 12,4-12,6 В — поволноваться, 12,6-13 В — бить тревогу, а в случае 13 В и выше — копить деньги на новый диск или положить гарантийный талон на видное место…

Конденсаторы (2200 мкФ, 25 В), напаянные на цепи питания HDD (желтый провод — +12 В, красный — +5 В, черный — земля). В данном случае они уменьшают пульсации напряжения, от которых блок питания издает раздражающий высокочастотный писк

Если напряжение по линии 12 В сильно завышено, а вы не боитесь паяльника и способны отличить транзистор от диода, то можете включить последний в разрыв питания HDD (напомню, линии 12 В соответствует желтый провод). Диод сыграет роль ограничителя — на его p-n переходе упадут «лишние» 0,2-0,7 В (в зависимости от типа диода), и диску станет полегче. Только диод надо брать достаточно мощный, чтобы он выдерживал пусковой ток в 2-3 А.

И без фанатизма: результирующее напряжение не должно опускаться ниже 11,7 В. В противном случае возможна неустойчивая работа диска (множественные рестарты) и даже порча данных. А некоторые модели (в частности, Seagate 7200.10 и 7200.11) могут вообще не запуститься.

⇡#Миграция с флеш

Память NAND Flash появилась много позднее, чем HDD, и переняла ряд его технологий — взять хотя бы коды ECC. Далее оба направления развивались параллельно и сравнительно независимо. Но в последнее время наметился и обратный процесс: миграция технологий с флеш-памяти на жесткие диски. Конкретно речь идет о выравнивании износа.

Как известно, любой флеш-чип имеет ограниченный ресурс по числу стираний-записей в одну ячейку. В какой-то момент стереть ее уже не удается, и она навсегда застывает с последним записанным значением. Поэтому контроллер считает количество записей в каждую страницу и в случае превышения копирует ее на менее изношенное место. В дальнейшем вся работа ведется с новым участком (этим заведует транслятор), а старая страница остается как есть и не используется. Данная технология получила название Wear Leveling. Так вот, износ есть и в жестких дисках, но там он механический и температурный. Если магнитная головка все время висит над одной дорожкой (скажем, постоянно изменяется тот или иной файл), то растет вероятность повреждения дорожки при случайных толчках или вибрации диска (например, от соседних накопителей в корзине). Головка может коснуться пластины и повредить магнитный слой со всеми вытекающими печальными последствиями. Даже если вредного контакта нет, неподвижная головка локально нагревается и пусть обратимо, но деградирует. Запись в данное место происходит менее надежно, растет вероятность последующего неустойчивого считывания (а при современных огромных плотностях записи любое отклонение параметров губительно).

Эти соображения достаточно очевидны, и прошивка серверных дисков с интерфейсом SCSI/SAS (а они весьма горячи) давно научилась перемещать головки в простое, дабы они не перегревались. Но еще лучше вместе с головкой «перебрасывать» и информацию по пластине — в этом случае описанные эффекты подавляются максимально, а надежность накопителя растет. Вот Western Digital и ввел подобный механизм в новых моделях VelociRaptor. Это дорогие высокопроизводительные диски со скоростью вращения шпинделя 10000 об./мин и пятилетней гарантией, так что Wear Leveling там уместен.

VelociRaptor снаружи и внутри. Привлекает внимание мощный радиатор. Пластины же имеют уменьшенный диаметр — это характерно для современных скоростных дисков.

Кроме того, вся линейка VelociRaptor нацелена на использование в высоконагруженных системах, в первую очередь серверах, где запись на диск ведется очень интенсивно и зачастую в одни и те же файлы (типичный пример — логи транзакций). Массовым «ширпотребным» дискам высокие нагрузки не грозят, греются они тоже умеренно, так что подобный изыск там вряд ли появится. Впрочем, поживем — увидим.

⇡#Аdvanced Format и его применение

Вот уже более 20 лет все жесткие диски имеют одинаковый размер физического сектора: 512 байт. Это минимальная порция записи на диск, позволяющая гибко управлять распределением дискового пространства. Однако с ростом объема HDD все сильнее стали проявляться недостатки такого подхода — в первую очередь неэффективное использование емкости магнитной пластины, а также высокие накладные расходы при организации потока данных.

Поэтому диски большой емкости (терабайт и выше) стали производиться по технологии Advanced Format, которая оперирует «длинными» физическими секторами в 4096 байт. Разметка магнитных пластин под AF весьма выгодна для производителя: меньше межсекторных промежутков, выше полезная емкость дорожки и всей пластины (а это, наряду с магнитными головками, самый дорогой компонент HDD). Именно Advanced Format позволил выпустить на рынок недорогие винчестеры, столь популярные ныне у потребителей аудио- и видеоконтента. AF-дисками емкостью 1-3 Тбайт комплектуются не только компьютеры, но и масса внешних накопителей, сетевых хранилищ и медиаплееров.

Один из первых дисков 3,5″ с Advanced Format, выпущенный в 2009 г

Но даром ничего не дается, новые диски уже начинают приносить в ремонт. Похоже, надежность все-таки просела. Ведь единичный сбой диска или дефект поверхности портит теперь в 8 раз больше данных пользователя, чем обычно. При физическом секторе в 4 Кбайт и эмуляции «коротких» секторов в 512 байт не будет читаться от 1 до 8 секторов. Операционная система на это реагирует понятно как: авария, все пропало! В итоге мелкая проблема на пластинах вырастает для пользователя в зависание или чего еще хуже.

Я считаю, на дисках с AF не стоит держать ОС, прикладные программы и базы данных со множеством мелких файлов. Пока что их удел — мультимедийные данные, некритичные к выпадениям.

⇡#Что стоит почитать о жестких дисках

В первую очередь рекомендую заглянуть на форум HARDW.net. Его раздел «Накопители информации» посещает множество профессиональных ремонтников и энтузиастов (почти 40 тыс. участников). Там можно найти ответы практически по любой теме, связанной с HDD, за исключением самых новых «нераскопанных» моделей. Начните с подраздела «Песочница»: на простые (в понимании профессионалов) вопросы там отвечают подробно и содержательно, а не отшивают, как в других местах, — «несите к ремонтнику».

Еще больше информации, правда, на английском языке, можно найти на портале HDDGURU. Помимо ремонтно-диагностического ПО и статей по отдельным вопросам (например, как поменять головки у диска), там есть международный форум ремонтников, а также огромный архив ресурсов по HDD (firmware, документация, фото и т.п.). Портал прививает широкий взгляд на вещи, он будет интересен подготовленным и мотивированным людям. Во всяком случае, в закрытых конференциях ремонтников ссылки на него пробегают постоянно.

Сошлюсь и на свою статью «Как продлить жизнь жестким дискам» в трех частях. Она дает начальные сведения по обращению с HDD, и хотя написана более трех лет назад, устарела мало — диски за это время принципиально не изменились, разве что стали еще менее надежными из-за свирепой экономии. Производители, застигнутые мировым кризисом, снижали свои затраты по всем направлениям, что и послужило причиной ряда громких провалов 2008-2009 гг. Об одном из них речь пойдет в продолжении этого материала, которое выйдет в ближайшее время.

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

25.08.2012, 03:11. Показов 587210. Ответов 2


В первую очередь хочу сказать спасибо Charles Kludge и nonym4uk за помощь в написании этой статьи.

Итак, S.M.A.R.T. (от англ. self-monitoring, analysis and reporting technology — технология самоконтроля, анализа и отчётности) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.
Много пользователей знает что такое S.M.A.R.T., немного меньше даже знают как его получить… Но когда встает вопрос проанализировать полученную таблицу, обычно дело стопорится. В этой статье я приведу основные значения и их расшифровку

Для любознательных

SMART производит наблюдение за основными характеристиками накопителя, каждая из которых получает оценку. Характеристики можно разбить на две группы:
параметры, отражающие процесс естественного старения жёсткого диска (число оборотов шпинделя, число премещений головок, количество циклов включения-выключения);
текущие параметры накопителя (высота головок над поверхностью диска, число переназначенных секторов, время поиска дорожки и количество ошибок поиска).

Данные хранятся в шестнадцатеричном виде, называемом «raw value», а потом пересчитываются в «value» — значение, символизирующее надёжность относительно некоторого эталонного значения. Обычно «value» располагается в диапазоне от 0 до 100 (некоторые атрибуты имеют значения от 0 до 200 и от 0 до 253).
Высокая оценка говорит об отсутствии изменений данного параметра или медленном его ухудшении. Низкая говорит о возможном скором сбое.
Значение, меньшее, чем минимальное, при котором производителем гарантируется безотказная работа накопителя, означает выход узла из строя.

Технология SMART позволяет осуществлять:
мониторинг параметров состояния;
сканирование поверхности;
сканирование поверхности с автоматической заменой сомнительных секторов на надёжные.

Следует заметить, что технология SMART позволяет предсказывать выход устройства из строя в результате механических неисправностей, что составляет около 60 % причин, по которым винчестеры выходят из строя.
Предсказать последствия скачка напряжения или повреждения накопителя в результате удара SMART не способна.

Следует отметить, что накопители НЕ МОГУТ сами сообщать о своём состоянии посредством технологии SMART, для этого существуют специальные программы.

Любая программа, показывающая S.M.A.R.T. для каждого атрибута имеет несколько значений, разберемся сначала с ними — ID, Value, Worst, Threshold и RAW. Итак:

ID (Number) — собственно, сам индикатор атрибута. Номера стандартны для значений атрибутов, но например,из-за кривизны перевода один и тот же атрибут может называться по-разному, проще орентироваться по ID, логично?

Value

(Current) — текущее значение атрибута в условных единицах, никому наверное неведомых . В процессе работы винчестера оно может уменьшаться, увеличиваться и оставаться неизменным. По показателю Value нельзя судить о «здоровье» атрибута, не сравнивая его со значением Threshold этого же атрибута. Как правило, чем меньше Value, тем хуже состояние атрибута (изначально все классы значений, кроме RAW, на новом диске имеют максимальное из возможных значение, например 100).

Worst — наихудшее значение, которого достигало значение Value за всю жизнь винчестера. Измеряется тоже в уе. В процессе работы оно может уменьшаться либо оставаться неизменным. По нему тоже нельзя однозначно судить о здоровье атрибута, нужно сравнивать его с Threshold.

Threshold — значение в (сюрприз!!!) уе, которого должен достигнуть Value этого же атрибута, чтобы состояние атрибута было признано критическим. Проще говоря, Threshold — это порог: если Value больше Threshold — атрибут в порядке; если меньше либо равен — с атрибутом проблемы. Именно по такому критерию утилиты, читающие S.M.A.R.T., выдают отчёт о состоянии диска либо отдельного атрибута вроде «Good» или «Bad». При этом они не учитывают, что даже при Value, большем Threshold, диск на самом деле уже может быть умирающим с точки зрения пользователя, а то и вовсе ходячим мертвецом, поэтому при оценке здоровья диска смотреть стоит всё-таки на другой класс атрибута, а именно — RAW. Однако именно значение Value, опустившееся ниже Threshold, может стать легитимным поводом для замены диска по гарантии (для самих гарантийщиков, конечно же) — кто же яснее скажет о здоровье диска, как не он сам, демонстрируя текущее значение атрибута хуже критического порога? Т. е. при значении Value, большем Threshold, сам диск считает, что атрибут здоров, а при меньшем либо равном — что болен. Очевидно, что при Threshold=0 состояние атрибута не будет признано критическим никогда. Threshold — постоянный параметр, зашитый производителем в диске.

RAW (Data) — самый интересный, важный и нужный для оценки показатель. В большинстве случаев он содержит в себе не уе, а реальные значения, выражаемые в различных единицах измерения, напрямую говорящие о текущем состоянии диска. Основываясь именно на этом показателе, формируется значение Value (а вот по какому алгоритму оно формируется — это уже тайна производителя, покрытая мраком). Именно умение читать и анализировать поле RAW даёт возможность объективно оценить состояние винчестера.

Теперь перейдем непосредственно к самим атрибутам.

01 (01) Raw Read Error Rate — Частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска. Для всех дисков Seagate, Samsung (семейства F1 и более новые) и Fujitsu 2,5″ это — число внутренних коррекций данных, проведенных до выдачи в интерфейс, следовательно, на пугающе огромные цифры можно реагировать спокойно.

02 (02) Throughput Performance — Общая производительность диска. Если значение атрибута уменьшается, то велика вероятность, что с диском есть проблемы.

03 (03) Spin-Up Time — Время раскрутки пакета дисков из состояния покоя до рабочей скорости. Растет при износе механики (повышенное трение в подшипнике и т. п.), также может свидетельствовать о некачественном питании (например, просадке напряжения при старте диска).

04 (04) Start/Stop Count — Полное число циклов запуск-остановка шпинделя. У дисков некоторых производителей (например, Seagate) — счётчик включения режима энергосбережения. В поле raw value хранится общее количество запусков/остановок диска.

05 (05) Reallocated Sectors Count — Число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным» и переносит данные в специально отведённую резервную область. Вот почему на современных жёстких дисках нельзя увидеть bad-блоки — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, а переназначенный сектор — remap. Чем больше значение, тем хуже состояние поверхности дисков. Поле raw value содержит общее количество переназначенных секторов. Рост значения этого атрибута может свидетельствовать об ухудшении состояния поверхности блинов диска.

06 (06) Read Channel Margin — Запас канала чтения. Назначение этого атрибута не документировано. В современных накопителях не используется.

07 (07) Seek Error Rate — Частота ошибок при позиционировании блока магнитных головок. Чем их больше, тем хуже состояние механики и/или поверхности жёсткого диска. Также на значение параметра может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине).

08 (08) Seek Time Performance — Средняя производительность операции позиционирования магнитными головками. Если значение атрибута уменьшается (замедление позиционирования), то велика вероятность проблем с механической частью привода головок.

09 (09) Power-On Hours (POH) — Число часов (минут, секунд — в зависимости от производителя), проведённых во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ (MTBF — mean time between failure).

10 (0А) Spin-Up Retry Count — Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то велика вероятность неполадок с механической частью.

11 (0В) Recalibration Retries — Количество повторов запросов рекалибровки в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то велика вероятность проблем с механической частью.

12 (0С) Device Power Cycle Count — Количество полных циклов включения-выключения диска.

13 (0D) Soft Read Error Rate — Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению. Все ошибки имеют

не механическую

природу и указывают лишь на неправильную размётку/взаимодействие с диском программ или операционной системы.

100(64) Erase/Program Cycles (для SSD) Общее количество циклов стирания/программирования для всей флэш-памяти за всё время ее существования. Твердотельный накопитель имеет ограничение на количество записей в него. Точные значения (ресурс) зависят от установленных микросхем флэш-памяти.
В накопителях Kingston — объём стёртого в гигабайтах.

103(67) Translation Table Rebuild (для SSD) Количество событий, когда внутренние таблицы адресов блоков были повреждены и впоследствии восстановлены. Raw-значение этого атрибута указывает фактическое количество событий.

170(AA) Reserved Block Count (для SSD) Состояние пула резервных блоков. Значение атрибута показывает процент оставшегося пула. Иногда raw-значение содержит фактическое количество использованных резервных блоков.
170 атрибут связан с атрибутом 5, числом использованных резервных блоков.

171(AB) Program Fail Count (для SSD) Число попыток, когда запись во флэш-память не удалась. Raw-значение показывает фактическое количество отказов. Процесс записи технически называется «программирование флэш-памяти» — отсюда и название атрибута. Когда флэш-память изношена, она больше не может быть записана и становится доступной только для чтения.
Значение обычно идентично атрибуту 181.

172(AC) Erase Fail Count (для SSD) Количество сбоев операции стирания на флэш-памяти. Raw-значение показывает фактическое количество отказов. Полный цикл записи флэш-памяти состоит из двух этапов. Сначала необходимо удалить память, а затем данные должны быть записаны («запрограммированы») в память. Когда флэш-память изношена, она больше не может быть записана и становится доступной только для чтения.
Идентичен атрибуту 182.

173(AD) Wear Leveller Worst Case Erase Count (для SSD) Максимальное количество операций стирания, выполняемых для одного блока флэш-памяти.

174(AE) Unexpected Power Loss (для SSD) Число неожиданных отключений питания, когда питание было потеряно до получения команды на отключение диска. На жестком диске срок службы при таких отключениях намного меньше, чем при обычном отключении. На SSD существует риск потери внутренней таблицы состояний при неожиданном завершении работы.

175(AF) Program Fail Count (для SSD) Число попыток, когда запись во флэш-память не удалась. Raw-значение показывает фактическое количество отказов. Процесс записи технически называется «программирование флэш-памяти», отсюда и название атрибута. Когда флэш-память изношена, она больше не может быть записана и становится доступной только для чтения.

176(B0) Erase Fail Count (для SSD) Количество сбоев операции стирания на флэш-памяти. Raw-значение показывает фактическое количество отказов. Полный цикл записи флэш-памяти состоит из двух этапов. Сначала необходимо удалить память, а затем данные должны быть записаны («запрограммированы») в память. Когда флэш-память изношена, она больше не может быть записана и становится доступной только для чтения.

177(B1) Wear Leveling Count (для SSD)
Wear Range Delta В зависимости от производителя, максимальное количество операций стирания, выполняемых для одного блока флэш-памяти[источник не указан 269 дней] или разница между максималоьно изношенными (больше всего раз записанными) и минимально изношенными (записанными наименьшее число раз) блоками[4].

178(B2) Used Reserved Block Count (для SSD) Состояние пула резервных блоков. Значение атрибута показывает процент оставшегося пула. Raw-значение этого атрибута иногда содержит фактическое количество использованных резервных блоков.

179(B3) Used Reserved Block Count (для SSD) Состояние пула резервных блоков. Значение атрибута показывает процент оставшегося пула. Raw-значение этого атрибута иногда содержит фактическое количество использованных резервных блоков.

180(B4) Unused Reserved Block Count (для SSD) Состояние пула резервных блоков. Значение атрибута показывает процент оставшегося пула. Raw-значение этого атрибута иногда содержит фактическое количество неиспользованных резервных блоков.

181(B5) Program Fail Count (для SSD) Число попыток, когда запись во флэш-память не удалась. Raw-значение показывает фактическое количество отказов.

182(B6) Erase Fail Count (для SSD) Количество сбоев операции стирания на флэш-памяти. Raw-значение показывает фактическое количество отказов.

183(B7) SATA Downshifts (для SSD) Указывает, как часто требовалось снизить скорость передачи данных SATA (с 6 Гбит/с до 3 или 1,5 Гбит/с или с 3 Гбит/с до 1,5 Гбит/с) для успешной передачи данных. Если значение атрибута уменьшается, попробуйте заменить кабель SATA.
Суть в том, что винчестер, работающий в режимах SATA 3 Гбит/с или 6 Гбит/с (и что там дальше будет в будущем), по какой-то причине (например, из-за ошибок) может попытаться «договориться» с дисковым контроллером о менее скоростном режиме (например, SATA 1.5 Гбит/с или 3 Гбит/с соответственно). В случае «отказа» контроллера изменять режим диск увеличивает значение атрибута (Western Digital und Samsung).

184 (B8) End-to-End error — Назначение зависит от производителя.
У HP (часть технологии HP SMART IV) увеличивается в случае, когда после передачи данных через кэш-память чётность данных между хостом и жёстким диском не совпадает.
У Kinston это количество ошибок чтения из флэш-памяти.

185 (B9) Head Stability Стабильность головок (Western Digital).

187 (BB) Reported UNC Errors — Количество ошибок, которое накопитель сообщил хосту (интерфейсу компьютера) при любых операциях, обычно это ошибки данных на диске, которые не исправлены средствами ECC

188 (BC) Command Timeout — содержит количество операций, выполнение которых было отменено из–за превышения максимально допустимого времени ожидания отклика.Такие ошибки могут возникать из-за плохого качества кабелей, контактов, используемых переходников, удлинителей и т.д., несовместимости диска с конкретным контроллером SATA/РАТА на материнской плате и т.д. Из-за ошибок такого рода возможны BSOD в Windows.
Ненулевое значение атрибута говорит о потенциальной «болезни» диска.

189 (BD) High Fly Writes — содержит количество зафиксированных случаев записи при высоте «полета» головки выше рассчитанной, скорее всего, из-за внешних воздействий, например, вибрации.
Для того, чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи S.M.A.R.T., которые содержат специфичную для каждого производителя информацию

190 (BE) Airflow Temperature (WDC) — Температура воздуха внутри корпуса жёсткого диска. Для дисков Seagate рассчитывается по формуле (100 — HDA temperature). Для дисков

Western Digital

— (125 — HDA).

191 (BF) G-sense error rate — Количество ошибок, возникающих в результате ударных нагрузок. Атрибут хранит показания встроенного акселерометра, который

фиксирует все удары, толчки, падения и даже неаккуратную установку диска в корпус компьютера.

Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т.к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухой.
Вообще срабатывание датчика не является признаком удара. Может расти даже от позиционирования БМГ самим диском, особенно, если его не закрепить. Основное назначение датчика – прекратить операцию записи при вибрациях, чтобы избежать ошибок.



75



Технология S.M.A.R.T. позволяет считывать сохраняемые в служебной области жесткого диска сведения, необходимые для оценки его состояния. Расшифровка термина такова: Self – сам, Monitoring – контроль, Analysis – анализ, Reporting Technology – технология отчетов. Как и для чего использовать S.M.A.R.T., детально рассмотрено в данной статье. Проверить звук микрофона онлайн.

HDD

Содержание

  1. Для чего нужна эта технология
  2. Программы для просмотра S.M.A.R.T.
  3. CrystalDiskInfo
  4. AIDA64
  5. Victoria
  6. HDDScan
  7. Speccy
  8. Сложности при сканировании
  9. Значение атрибутов S.M.A.R.T.
  10. 01 Raw Read Error Rate
  11. 02 Throughput Performance
  12. 03 Spin-Up Time
  13. 04 Number of Spin-Up Times (Start/Stop Count)
  14. 05 Reallocated Sector Count
  15. 07 Seek Error Rate
  16. 08 Seek Time Performance
  17. 09 Power On Hours Count (Power-on Time)
  18. 10 (0A) Spin Retry Count
  19. 11 (0B) Calibration Retry Count (Recalibration Retries)
  20. 12 (0C) Power Cycle Count
  21. 183 (B7) SATA Downshift Error Count
  22. 184 (B8) End-to-End Error
  23. 187 (BB) Reported Uncorrected Sector Count (UNC Error)
  24. 188 (BC) Command Timeout
  25. 189 (BD) High Fly Writes
  26. 190 (BE) Airflow Temperature
  27. 191 (BF) G-Sensor Shock Count (Mechanical Shock)
  28. 192 (C0) Power Off Retract Count (Emergency Retry Count)
  29. 193 (C1) Load/Unload Cycle Count
  30. 194 (C2) Temperature (HDA Temperature, HDD Temperature)
  31. 195 (C3) Hardware ECC Recovered
  32. 196 (C4) Reallocated Event Count
  33. 197 (C5) Current Pending Sector Count
  34. 198 (C6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)
  35. 199 (C7) UltraDMA CRC Error Count
  36. 200 (C8) Write Error Rate (MultiZone Error Rate)
  37. 201 (C9) Soft Read Error Rate
  38. 202 (CA) Data Address Mark Error
  39. 203 (CB) Run Out Cancel
  40. 220 (DC) Disk Shift
  41. 240 (F0) Head Flying Hours
  42. 254 (FE) Free Fall Event Count
  43. Предсказание поломки диска в командной строке
  44. Определение статуса диска
  45. Прогнозируемый сбой
  46. Предсказание в Windows PowerShell
  47. Анализ в приложении Системный монитор
  48. Что делать с ошибками S.M.A.R.T.
  49. Прекратите использование сбойного HDD
  50. Восстановите удаленные данные диска
  51. Просканируйте диск на наличие битых секторов
  52. Снизьте температуру диска
  53. Произведите дефрагментацию жесткого диска
  54. Приобретите новый жесткий диск
  55. Как сбросить S.M.A.R.T ошибку и стоит ли это делать?

Для чего нужна эта технология

Все современные жесткие диски оснащены S.M.A.R.T.-блоком, ответственным за отслеживание и сохранение информации об их основных параметрах: нагревание винчестера в процессе работы, скорость вращения, время позиционирования магнитных головок, предназначенных для записи и считывания данных. Также отслеживаются сбои, возникающие при эксплуатации накопителя. Инструкция как сделать тест веб камеры.

В случае обнаружения на дисковой поверхности битых секторов производится их замещение резервными блоками. Использование данной технологии позволяет своевременно предвидеть выход из строя винчестера и заранее позаботиться об его замене на исправное дисковое устройство. Пользователь может, не дожидаясь окончательной поломки жесткого диска, создать резервную копию всех хранящихся на нем файлов. В таком случае потери информации можно больше не опасаться.

Программы для просмотра S.M.A.R.T.

Ряд производителей HDD выпускают также утилиты собственной разработки, предназначенные для получения информации от S.M.A.R.T. Они максимально адаптированы для работы с носителями определенных моделей. Но такой софт разработан не для всех винчестеров, да и его возможностей иногда оказывается недостаточно для всесторонней оценки состояния накопителя.

В качестве альтернативы можно использовать один из многочисленных программных продуктов, созданных сторонними разработчиками. Далее мы рассмотрим несколько хорошо зарекомендовавших себя приложений, предоставляющих доступ к S.M.A.R.T.

CrystalDiskInfo

CrystalDiskMark

CrystalDiskInfo – бесплатное приложение для просмотра параметров S.M.A.R.T. и оценки тенденции их изменений. Интерфейс утилиты полностью русифицирован (язык можно переключить с помощью меню). Температура винчестера или твердотельного накопителя показывается в системном трее (внизу экрана справа). Программа позволяет построить график, на котором будут наглядно отображены изменения, произошедшие за последний месяц с носителем информации. В случае необходимости приложение может быть запущено с задержкой. С помощью CrystalDiskInfo пользователю удобно изменить режим работы жесткого диска: установить максимально возможную скорость либо включить режим экономии электроэнергии (при этом также уменьшится издаваемый HDD шум). Помимо этого, разработчиками реализована поддержка внешних HDD и карманов, а также RAID-массивов Intel.

AIDA64

AIDA64 Extreme

С помощью данного приложения можно получить информацию обо всех аппаратных компонентах системы и их технических характеристиках, а также выполнить их тестирование. Для просмотра информации о жестком диске следует перейти к разделу «Меню» в левой части окна и щелчком по треугольнику слева открыть подменю «Хранение данных». В его нижней части присутствует пункт «SMART», именно его и нужно выбрать. В правой секции окна вверху появится список всех установленных в системе жестких дисков. Остается выбрать только нужный накопитель и щелкнуть мышью по соответствующей строке. Сведения о выбранном диске будут отображены в секции ниже.

AIDA64 – условно-бесплатное приложение, период безвозмездного пользования которым ограничен 30 днями. Чтобы иметь возможность работать с ним и дальше, необходимо купить лицензию.

Victoria

Victoria

Victoria – одна из лучших утилит для диагностики и восстановления неисправностей жестких дисков. Существует 2 версии программы: для запуска с загрузочного носителя и для работы непосредственно в среде Windows. В последнем случае для корректной работы приложения его следует запускать от имени администратора (соответствующую команду можно выбрать из его контекстного меню посредством щелчка по значку правой кнопкой мыши). Для загрузки с внешнего носителя потребуется предварительно создать загрузочный USB-диск или CD (DVD) и записать на него образ приложения.

После того, как Victoria запустится, на вкладке «Standard» в правой половине окна вверху выбираем тестируемый HDD и жмем на кнопку «Passport» для обновления сведений о нем. В самом низу окна отобразится информация о модели винчестера, его вместимости в дорожках и серийном номере. Затем можно переходить на вкладку “SMART”. Для считывания данных нажимаем на кнопку «Get SMART» в правой секции окна вверху.

При всех своих прочих достоинствах программа бесплатна. Также следует отметить, что ее новейшие версии поддерживают работу со S.M.A.R.T.-данными SSD-накопителей.

HDDScan

HDDScan

Отличительной особенностью утилиты является предельная простота в использовании. Достаточно выбрать из списка «Select Drive» жесткий диск и нажать на кнопку «S.M.A.R.T.», как на экране появится новое окно с подобной информацией о жестком диске. Разработчиками предусмотрена возможность менять некоторые из этих параметров (AAM, APM и др.). И за все это платить ничего не надо.

Speccy

Speccy

С помощью бесплатного приложения Speccy с поддержкой русского языка можно получить сведения об установленных в компьютере комплектующих и их технических характеристиках. Предусмотрена возможность сохранения этой информации в виде подробного отчета.

Из меню в левой части экрана выбираем «Хранение данных», и в правой части окна приложения появятся сведения сразу обо всех установленных на машине пользователя жестких дисках. Если информация сразу не будет выведена на экран, надо подождать несколько секунд до завершения ее считывания.

Сложности при сканировании

Как правило, при проверке жестких дисков никаких проблем не возникают. Сканирование невозможно только для старых моделей винчестеров, не поддерживающих S.M.A.R.T.-технологию, или самотестирование которых отключено. Но тут уж ничего не поделать.

Определенные проблемы возникнут и в случае подключения винчестера в AHCI-режиме, поскольку данные S.M.A.R.T. в такой ситуации прочесть нельзя. Об этом выводится соответствующее сообщение на экран (например, может отображаться надпись «Non ATA». Чтобы обойти данное ограничение, необходимо загрузить BIOS и перейти на вкладку «Config > Serial ATA (SATA) > SATA Controller Mode Option». Вместо AHCI нужно выбрать Compatibility и сохранить изменения. Когда тестирование закончено, следует вернуться к прежней настройке.

Значение атрибутов S.M.A.R.T.

Для каждого из атрибутов программа тестирования отобразит следующие сведения (в зависимости от приложения они могут несколько отличаться от приведенного здесь списка):

  • наименование;
  • номер;
  • пороговое значение;
  • текущее значение;
  • графический индикатор состояния на момент тестирования;
  • динамика зарегистрированных изменений;
  • приблизительная дата окончательной поломки накопителя.

Здесь следует обратить внимание на цвета индикаторов атрибутов. Зеленый цвет говорит о том, что соответствующий ему показатель в норме. Если же какие-то атрибуты попали в желтую зону, ситуацию следует расценивать как тревожную. В случае же окраски индикатора в красный цвет состояние винчестера критическое, и полностью сломаться он может в любой момент.

Рассмотрим каждый из S.M.A.R.T.-атрибутов жесткого диска.

01 Raw Read Error Rate

Этот показатель используется для определения числа ошибок, возникающих при считывании данных с винчестера. Его значения могут интерпретироваться по-разному в зависимости от модели устройства. Для одних производителей идеалом считается нулевое значение, для других же – чем больше, тем лучше.

02 Throughput Performance

Отображает среднее значение производительности накопителя. Строгих норм для него не существует. Для диагностики HDD практически бесполезен.

03 Spin-Up Time

Позволяет установить время, необходимое винчестеру для раскрутки. Сам по себе данный параметр мало что значит. Его следует оценивать только с учетом заявленных технических характеристик конкретного жесткого диска.

04 Number of Spin-Up Times (Start/Stop Count)

Показывает, сколько раз производилось включение жесткого диска за весь период его эксплуатации. Может использоваться для получения косвенной оценки длительности и интенсивности использования устройства.

05 Reallocated Sector Count

Один из важнейших атрибутов, позволяющий определить физическое состояние винчестера. Показывает количество сбойных секторов, замененных на исправные из резервной области. Такая замена называется ремапом. Ремап производится автоматически в случае, если чтение информации с какого-либо участка диска сильно затруднено или невозможно. При этом поврежденный сектор помечается как неисправный, чтобы операционная система больше не пыталась его использовать.

Надо понимать, что резервная область не безгранична, и когда возможности резервирования будут исчерпаны, начнется необратимое разрушение жесткого диска. Число резервных секторов у разных моделей винчестеров различно. Но максимальное их количество не превышает нескольких тысяч (чаще всего не больше тысячи).

07 Seek Error Rate

Отображает данные, с помощью которых можно определить частоту появления сбоев в ходе позиционирования блока магнитных головок. Во многом схож с атрибутом Raw Read Error Rate. Отличие состоит в том, что для дисков Hitachi нормальным считается только нулевое значение. На дисках Seagate, Samsung SpinPoint F1 и более новых его моделей, а также Fujitsu 2.5’’ этот показатель вообще не стоит учитывать.

08 Seek Time Performance

Показывает среднее значение производительности операций позиционирования дисковых головок. Никаких предельных значений для него не предусмотрено.

09 Power On Hours Count (Power-on Time)

С помощью этого параметра мы можем узнать, сколько часов отработал жесткий диск с начала его использования.

10 (0A) Spin Retry Count

Позволяет определить, сколько раз производились повторные запуски шпинделя с момента первой неудачной попытки его старта. Однако рост данного показателя не всегда означает физическую неисправность винчестера. В большинстве случаев проблема связана с плохим контактом HDD с блоком питания или недостаточным количеством получаемой устройством электроэнергии. Если значение атрибута не превышает 2, то все в порядке. В противном случае следует проверить блок питания и его контакт с жестким диском.

11 (0B) Calibration Retry Count (Recalibration Retries)

Здесь отображается число повторных попыток произвести сброс носителя информации (в результате такой процедуры магнитные головки устанавливаются на нулевую дорожку) после того, как была зарегистрирована первая неудачная попытка. Если значение атрибута нулевое, проблемы отсутствуют, если нет – устройство, скорее всего, неисправно.

12 (0C) Power Cycle Count

Отмечается общее число циклов «включение-отключение» винчестера.

183 (B7) SATA Downshift Error Count

В этом параметре хранится информация о том, сколько попыток понижения режима SATA завершилось неудачей. Дело в том, что при выявлении определенных ошибок HDD может попытаться переключиться на работу в режиме с меньшей скоростью. Такое переключение завершится неудачей, если контроллер по каким-либо причинам откажется выполнять поступившую команду. Но в любом случае к здоровью накопителя это отношения не имеет.

184 (B8) End-to-End Error

Дает возможность оценить, сколько всего ошибок возникло в процессе передачи информации через кэш жесткого диска за все время его использования. О проблеме с устройством может свидетельствовать любое ненулевое значение.

187 (BB) Reported Uncorrected Sector Count (UNC Error)

Означает число секторов, которые в скором времени подлежат переназначению. Иногда сектор повторно может определяться как кандидат на переназначение, что также приводит к увеличению значения атрибута. Если в этой строке не ноль (особенно когда атрибут 197 тоже не равен нулю), с винчестером начали происходить деструктивные изменения.

188 (BC) Command Timeout

Сохраняет данные о том, сколько операций пришлось прервать в связи с превышением предельно допустимого периода ожидания. Любое значение больше нуля свидетельствует о наличии таких сбоев. Но не всегда это связано с неисправностью жесткого диска. Проблема может возникнуть также при использовании некачественных кабелей, плохих переходников, поврежденных контактов, несовместимости с контроллером SATA/PATA на системной плате. В Windows такая ошибка может проявляться появлением «синего экрана смерти».

189 (BD) High Fly Writes

Показывает, сколько было зарегистрировано процессов записи на носитель, когда скорость головки превышала рассчитанную величину. Основной причиной этого явления является внешнее влияние (толчки, удары, вибрация). Однако каких-либо стандартов по данному пункту нет.

190 (BE) Airflow Temperature

Выводит на экран температуру жесткого диска в момент тестирования. Нагревание выше +55 – +60ºC негативно отражается на работе устройства. В таком случае полезно будет установить дополнительное охлаждение.

191 (BF) G-Sensor Shock Count (Mechanical Shock)

По этому параметру можно определить число критических ускорений головки HDD. Причинами их появления могут стать падания накопителя либо удары по его корпусу. Но даже если такие ускорения были зарегистрированы датчиками устройства, это еще не значит, что он был поврежден. Состояние HDD нужно оценивать с учетом значений других атрибутов. Также следует отметить, что у жестких дисков Samsung данный параметр можно не смотреть, поскольку его датчики могут реагировать едва ли не на движение воздуха.

192 (C0) Power Off Retract Count (Emergency Retry Count)

Отображаемая в соответствующей строке информация зависит от модели устройства. Здесь может выводиться или общее количество операций парковок магнитных головок, производящихся при появлении аварийных ситуаций, или число циклов включения/выключения устройства за все время его работы.

193 (C1) Load/Unload Cycle Count

Показывает суммарное количество циклов парковки и распарковки магнитных головок накопителя. С помощью этого параметра мы можем узнать, активирована ли автоматическая парковка HDD. Если значение атрибута 192 превышает значение атрибута 09, это означает, что автоматическая парковка включена и используется.

194 (C2) Temperature (HDA Temperature, HDD Temperature)

Выводит температуру винчестера в момент считывания информации из S.M.A.R.T. Также может содержать сведения о минимальной и максимальной температурах устройства, зарегистрированных за период его эксплуатации. Нужно убедиться, что жесткий диск не перегревается (предельно допустимая температура составляет +55ºC).

195 (C3) Hardware ECC Recovered

Позволяет определить общее количество ошибок, обработанных аппаратными средствами ECC HDD. Является аналогом атрибутов 01 и 07.

196 (C4) Reallocated Event Count

Один из наиболее значимых атрибутов для определения реального состояния винчестера. Чем выше его значение, тем хуже обстоят дела. Но для того, чтобы дать объективную оценку состояния устройства, следует учитывать значения и остальных параметров.

Данный показатель находится в тесной связи с атрибутом 05. Если один из них начал ухудшаться, негативные перемены обычно начинают происходить и с другим. Если же перемены затрагивают только атрибут 196, это означает, что в ходе выполнения ремапа оказалось, что проблемы с сектором обусловлены нарушением логической структуры, а не физической неисправностью, и были устранены средствами жесткого диска.

Иногда возникает ситуация, когда значение атрибута 05 больше аналогичного показателя у атрибута 196. В таком случае был выполнен ремап нескольких секторов одновременно.

197 (C5) Current Pending Sector Count

Выводит информацию о количестве секторов, подлежащих перераспределению. Но не всегда они имеют физическую неисправность. Перераспределяются только кандидаты, получившие статус bad, а сектора со статусом soft (логическая ошибка) после их исправления снова становятся пригодными для использования.

198 (C6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)

Во многом схож с атрибутом 197. Основное отличие заключается в том, что атрибут 198 показывает зафиксированное число кандидатов на ремап, выявленных в процессе оффлайн-тестирования (оно запускается во время простоя).

199 (C7) UltraDMA CRC Error Count

Этот показатель позволяет определить, сколько ошибок произошло в ходе выполнения операций передачи информации по интерфейсному кабелю, осуществляемых в режиме UltraDMA. Если наблюдается тенденция к росту параметра, это может свидетельствовать о некачественном или поврежденном шлейфе передачи данных, работе шин PCI/PCI-E в режиме разгона или плохом подключении кабеля SATA к соответствующему разъему на материнской плате или винчестере.

При появлении таких ошибок HDD может быть автоматически переключен в режим PIO, следствием чего станет ощутимое снижение его производительности. В большинстве случаев проблема решается переподключением интерфейсного кабеля или заменой его на новый.

200 (C8) Write Error Rate (MultiZone Error Rate)

Данный параметр отвечает за количество ошибок, зарегистрированных при выполнении записи на информационный носитель. Если их число неуклонно возрастает, жесткий диск уже нельзя считать надежным устройствам. В первую очередь это относится к накопителям WD. Для них высокие значения атрибута 200 могут означать скорый выход из строя пишущей головки.

201 (C9) Soft Read Error Rate

Показывает, сколько ошибок возникает в ходе считывания информации.

202 (CA) Data Address Mark Error

Высокие значения этого показателя свидетельствуют о проблемах, возникающих при работе винчестера.

203 (CB) Run Out Cancel

Здесь фиксируется количество ошибок ECC.

220 (DC) Disk Shift

Позволяет узнать значение сдвига пластин по отношению к оси шпинделя накопителя.

240 (F0) Head Flying Hours

Атрибут можно использовать для оценки времени, которое требуется для позиционирования головки. Позволяет отслеживать состояние блока магнитных головок.

254 (FE) Free Fall Event Count

Регистрирует факты падения жесткого диска и предоставляет возможность определить их количество. Если здесь не нулевое значение, это повод для беспокойства, поскольку в таком случае нельзя исключать физическое повреждение HDD.

Предсказание поломки диска в командной строке

Проверить винчестер на наличие неисправностей с использованием командной строки можно двумя способами. Это определение статуса диска и получение информации о его прогнозируемом сбое.

Определение статуса диска

Для того, чтобы проверить S.M.A.R.T. жесткого диска с помощью командной строки, следует придерживаться такой последовательности действий:

  1. Запустить системное приложение «Командная строка» с административными правами. Найти ярлык командной строки можно в меню «Пуск». Для того, выполнить запуск приложения с привилегированными правами доступа в Windows 10, нужно кликнуть по его ярлыку правой кнопкой мыши, перейти в меню «Дополнительно» и активировать команду «Запуск от имени администратора».
  2. После того, как окно консоли появится на экране, ввести в него команду wmic diskdrive get status.
  3. Подтвердить выполнение команды нажатием клавиши «Enter».
  4. Подождать пару секунд окончания выполнения команды. Результаты проверки отобразятся в столбце «Status». Если с установленными в компьютере дисками все нормально, везде будет стоять «OK». При выявлении ошибок статус может иметь значения «bad», «unknown» или «caution».

Прогнозируемый сбой

Чтобы заранее предсказать вероятную поломку винчестера, пользователю следует придерживаться такого алгоритма:

  1. Выполнить запуск командной строки в режиме администратора (как это делается, описано в предыдущем разделе).
  2. Ввести в консоль команду wmic /namespace:\rootwmi path MSStorageDriver_FailurePredictStatus.
  3. Подтвердить выполнение операции нажатием на «Enter».
  4. Дождаться вывода результата на экран. Нужная нам информация будет находиться в столбце «PredictFailure». Если результат тестирования – «FALSE», накопитель функционирует нормально. Значение «TRUE» свидетельствует о серьезных проблемах с HDD, в такой ситуации можно ожидать его скорую поломку. Также следует обратить внимание на столбец «Reason», особенно если в нем отображается число больше нуля. Значение выводимого здесь числового кода у разных производителей винчестеров может расшифровываться по-разному.

Предсказание в Windows PowerShell

Windows PowerShell – встроенный расширяемый инструмент автоматизации, предоставляемый компанией «Microsoft». Чтобы предсказать с его помощью возможные неполадки, нужно выполнить следующие шаги:

  1. Произвести запуск приложения «Windows PowerShell». В Windows 10 проще всего это сделать с помощью меню «Опытного пользователя». Процедура запуска такова: после щелчка правой кнопкой мыши по кнопке «Пуск» откройте это самое меню и выберите в нем команду «Windows PowerShell (администратор)».
  2. Введите в консоль команду Get-WmiObject -namespace rootwmi –class SStorageDriver_FailurePredictStatus.
  3. Нажмите «Enter».
  4. После того, как команда будет выполнена, на экране отобразится отчет в виде таблицы. В ней будет присутствовать информация обо всех установленных в компьютере дисках. Нас прежде всего интересует значение строки «PredictFailure». Если здесь стоит «FALSE», за судьбу жесткого диска можно пока не переживать. «TRUE» свидетельствует о серьезных проблемах с устройством и предсказывает ему скорую утрату работоспособности. О неисправностях может говорить и ненулевое значение строки «Reason» (что означает то или иное число, можно уточнить, обратившись в службу поддержки производителя HDD).

Анализ в приложении Системный монитор

В отличие от рассмотренных ранее предустановленных в систему приложений, «Системный монитор» работает не в консольном, а в графическом режиме. Для оценки состояния винчестера пользователю потребуется:

  1. Запустить программу «Системный монитор». Для этого нужно щелкнуть на кнопку «Пуск и открыть панель поиска, в которую ввести запрос «Системный монитор». Искомое приложение будет показано в разделе «Лучшее соответствие». Останется только произвести по нему щелчок левой кнопкой мыши.
  2. В левой секции появившегося окна щелчком по стрелке слева открыть раздел группы «Сборщиков данных». Ниже будут показаны вложенные в него элементы.
  3. Открыть подраздел «Системные».
  4. Перейти на вкладку «System Diagnostics (Диагностика системы)». Вызвать ее контекстное меню щелчком правой кнопки мыши. Выбрать в нем строку «Пуск».
  5. Еще раз развернуть вложенные элементы и открыть раздел «Отчеты».
  6. Найти подраздел «Системные» и раскрыть его.
  7. Развернуть содержимое подраздела «System Diagnostics» и изучить его содержимое.
  8. Кликнуть мышью по диагностическому отчету, наименование которого соответствует кодовому имени компьютера.
  9. Через некоторое время детальный отчет будет выведен в правой части окна. В нем следует открыть раздел «Предупреждения», а затем в таблице «Базовые системные проверки» в графе «Тесты» щелкнуть по кнопке с плюсом (она располагается около пункта «Проверка диска»).
  10. Ознакомиться с содержанием строки «Проверка SMART – предсказания сбоя». Если в колонке «Отказ» стоит нулевое значение, а в колонке «Описание» отображается надпись «Выполнена», то проблем с жестким диском не выявлено.

Что делать с ошибками S.M.A.R.T.

Ответ на этот вопрос зависит от характера проблем с винчестером и степени его неисправности.

Прекратите использование сбойного HDD

Если на жестком диске уже появились битые сектора, это говорит о его значительном износе. Фактически он уже начал рассыпаться, и остановить этот процесс невозможно. Дальнейшее использование такого HDD чревато потерей данных. Поскольку причина этого – физическая неисправность устройства, восстановить их скорее всего не получится.

Восстановите удаленные данные диска

Информация с носителя может исчезать и вследствие логических ошибок (они могут возникать при повреждении файловой системы. В таком случае пропавшие в результате сбоя данные подлежат восстановлению (если они не были перезаписаны другими данными), поскольку физические повреждения на жестком диске отсутствуют. Их можно восстановить, например, с помощью программы R-Studio, которая позволяет спасти информацию даже с удаленных или отформатированных разделов.

Просканируйте диск на наличие битых секторов

Проверить HDD на битые сектора можно с помощью стандартных средств Windows. Для этого необходимо перейти к нужному диску (или разделу), вызвать его контекстное меню и открыть пункт «Свойства». Затем на вкладке «Сервис» кликнуть по кнопке «Выполнить проверку» и в открывшемся окне поставить галочки «Автоматически исправлять системные ошибки» и «Проверять и восстанавливать поврежденные сектора». Возможно, потребуется перезагрузка компьютера после нажатия кнопки «Запуск». Проверка очень объемных винчестеров может длиться до нескольких часов. После завершения процедуры логические ошибки будут исправлены, а bad-сектора подвергнуты ремапу (если их резерв еще не исчерпан).

Проверка диска

Сканирование может быть выполнено и рядом сторонних приложений. Для этого отлично подходит программа Victoria. Чтобы полностью проверить весь винчестер на битые сектора, следует на вкладке «Standard» выбрать HDD, а затем перейти на вкладку «Tests» и нажать там кнопку «Start». Количество найденных сбойных секторов будет отображаться в процессе сканирования справа от синего прямоугольника, обозначенного «Err». Цифры рядом с красным и оранжевым прямоугольниками – это еще рабочие сектора, но скорость доступа к ним очень низкая (небольшое их количество может находиться даже на новом винчестере). Полная проверка может продолжаться несколько часов.

Снизьте температуру диска

Перегрев жесткого диска может оказывать негативное влияние на работу его механических компонентов и электроники. Поэтому при подъеме его температуры до 55ºC и выше ему требуется дополнительное охлаждение. Для снижения температуры устройства можно установить в корпус компьютера еще один вентилятор. Также существуют специальные вентиляторы, предназначенные для охлаждения винчестеров. Наконец, температуру накопителя можно немного понизить, если отключить установленные в корпус ПК устройства, выделяющие тепло, без которых можно некоторое время обойтись (например, второй HDD или видеокарта в случае наличия в системной плате интегрированной видеокарты).

Произведите дефрагментацию жесткого диска

Замедление скорости чтения и записи на диск зачастую обусловлено высокой степенью фрагментации хранящихся на нем файлов. Сильная фрагментация файловой системы может способствовать ускоренному износу блока магнитных головок. Это приведет к дополнительным проблемам, связанным с ухудшением показателей их позиционирования, а также с ростом температуры накопителя (поскольку файлы разбиваются на фрагменты, зачастую расположенные друг от друга на значительном удалении, магнитным головкам приходится выполнять дополнительные перемещения, что увеличивает выделение тепла).

SSD-диски дефрагментировать не нужно, т.к. в них нет движущихся пластин и головок, в отличии от HDD.

Для предотвращения этих проблем следует выполнить дефрагментацию диска. Для этого нужно зайти в его свойства (путем вызова контекстного меню), перейти на вкладку «Сервис» и нажать на кнопку «Оптимизировать» (в Windows 10). Затем установить курсор на нужный диск или раздел и уже в этом окне кликнуть по кнопке «Оптимизировать». Обычно процедура оптимизации продолжается несколько минут.

Приобретите новый жесткий диск

Если количество сбойных секторов превышает резерв для их переназначения, приближается к этому показателю или неуклонно возрастает, следует позаботиться о покупке нового винчестера. После покупки надо как можно быстрее установить на него операционную систему и скопировать всю информацию, пока ее считывание еще возможно.

Как сбросить S.M.A.R.T ошибку и стоит ли это делать?

Информацию, записанную в S.M.A.R.T. HDD, в принципе можно удалить. После того, как все данные о накопителе будут сброшены, его S.M.A.R.T. станет выглядеть как у совершенно нового диска, котором еще не начали пользоваться. Конечно же, физические проблемы от этого никуда не исчезнут. Но такой возможностью иногда полезно воспользоваться (и не только недобросовестным продавцам бывших в употреблении винчестеров), если, например, сектора, обозначенные как кандидаты на ремап, оказались физически исправными, а такой статус они получили в результате логических проблем с файловой системой.

Данную операцию можно выполнить при помощи специальных приложений. Одной из таких программ является DRevitalize (с некоторыми моделями винчестеров она не работает). После запуска этой утилиты следует выбрать подлежащий обнулению HDD и нажать на кнопку «Start». Далее выбираем пункт «Features menu and firmware data», после чего жмем по строке «Clear defect reassign list» и подтверждаем выполнение операции. Через несколько секунд можно будет перейти на «SMART Reset Attribute Values» и нажать «ОК». Если после проведения этих манипуляций обновление S.M.A.R.T. не произойдет, следует выполнить перезапуск компьютера.

«Тестировать нельзя диагностировать» – куда бы вы поставили запятую в данном предложении? Надеемся, что после прочтения данного материала вы без проблем можете чётко дать ответ на этот вопрос. Многие пользователи когда-либо сталкивались с потерей данных по той или иной причине, будь то программная или аппаратная проблема самого накопителя или же нестандартное физическое воздействие на него, если вы понимаете, о чём мы. Но именно о физических повреждениях сегодня речь и не пойдёт. Поговорим мы как раз о том, что от наших рук не зависит. Стоит ли тестировать SSD каждый день/неделю/месяц или это пустая трата его ресурса? А чем их вообще тестировать? Получая определённые результаты, вы правильно их понимаете? И как можно просто и быстро убедиться, что диск в порядке или ваши данные под угрозой?

Тестирование или диагностика? Программ много, но суть одна

На первый взгляд диагностика и подразумевает тестирование, если думать глобально. Но в случае с накопителями, будь то HDD или SSD, всё немного иначе. Под тестированием рядовой пользователь подразумевает проверку его характеристик и сопоставление полученных показателей с заявленными. А под диагностикой – изучение S.M.A.R.T., о котором мы сегодня тоже поговорим, но немного позже. На фотографию попал и классический HDD, что, на самом деле, не случайность…

Так уж получилось, что именно подсистема хранения данных в настольных системах является одним из самых уязвимых мест, так как срок службы накопителей чаще всего меньше, чем у остальных компонентов ПК, моноблока или ноутбука. Если ранее это было связано с механической составляющей (в жёстких дисках вращаются пластины, двигаются головки) и некоторые проблемы можно было определить, не запуская каких-либо программ, то сейчас всё стало немного сложнее – никакого хруста внутри SSD нет и быть не может. Что же делать владельцам твердотельных накопителей?

Программ для тестирования SSD развелось великое множество. Какие-то стали популярными и постоянно обновляются, часть из них давно забыта, а некоторые настолько хороши, что разработчики не обновляют их годами – смысла просто нет. В особо тяжёлых случаях можно прогонять полное тестирование по международной методике Solid State Storage (SSS) Performance Test Specification (PTS), но в крайности мы бросаться не будем. Сразу же ещё отметим, что некоторые производители заявляют одни скорости работы, а по факту скорости могут быть заметно ниже: если накопитель новый и исправный, то перед нами решение с SLC-кешированием, где максимальная скорость работы доступна только первые несколько гигабайт (или десятков гигабайт, если объём диска более 900 ГБ), а затем скорость падает. Это совершенно нормальная ситуация. Как понять объём кеша и убедиться, что проблема на самом деле не проблема? Взять файл, к примеру, объёмом 50 ГБ и скопировать его на подопытный накопитель с заведомо более быстрого носителя. Скорость будет высокая, потом снизится и останется равномерной до самого конца в рамках 50-150 МБ/с, в зависимости от модели SSD. Если же тестовый файл копируется неравномерно (к примеру, возникают паузы с падением скорости до 0 МБ/с), тогда стоит задуматься о дополнительном тестировании и изучении состояния SSD при помощи фирменного программного обеспечения от производителя.

Яркий пример корректной работы SSD с технологией SLC-кеширования представлен на скриншоте:

Те пользователи, которые используют Windows 10, могут узнать о возникших проблемах без лишних действий – как только операционная система видит негативные изменения в S.M.A.R.T., она предупреждает об этом с рекомендацией сделать резервные копии данных. Но вернёмся немного назад, а именно к так называемым бенчмаркам. AS SSD Benchmark, CrystalDiskMark, Anvils Storage Utilities, ATTO Disk Benchmark, TxBench и, в конце концов, Iometer – знакомые названия, не правда ли? Нельзя отрицать, что каждый из вас с какой-либо периодичностью запускает эти самые бенчмарки, чтобы проверить скорость работы установленного SSD. Если накопитель жив и здоров, то мы видим, так сказать, красивые результаты, которые радуют глаз и обеспечивают спокойствие души за денежные средства в кошельке. А что за цифры мы видим? Чаще всего замеряют четыре показателя – последовательные чтение и запись, операции 4K (КБ) блоками, многопоточные операции 4K блоками и время отклика накопителя. Важны все вышеперечисленные показатели. Да, каждый из них может быть совершенно разным для разных накопителей. К примеру, для накопителей №1 и №2 заявлены одинаковые скорости последовательного чтения и записи, но скорости работы с блоками 4K у них могут отличаться на порядок – всё зависит от памяти, контроллера и прошивки. Поэтому сравнивать результаты разных моделей попросту нельзя. Для корректного сравнения допускается использовать только полностью идентичные накопители. Ещё есть такой показатель, как IOPS, но он зависит от иных вышеперечисленных показателей, поэтому отдельно говорить об этом не стоит. Иногда в бенчмарках встречаются показатели случайных чтения/записи, но считать их основными, на наш взгляд, смысла нет.

И, как легко догадаться, результаты каждая программа может демонстрировать разные данные – всё зависит от тех параметров тестирования, которые устанавливает разработчик. В некоторых случаях их можно менять, получая разные результаты. Но если тестировать «в лоб», то цифры могут сильно отличаться. Вот ещё один пример теста, где при настройках «по умолчанию» мы видим заметно отличимые результаты последовательных чтения и записи. Но внимание также стоит обратить на скорости работы с 4K блоками – вот тут уже все программы показывают примерно одинаковый результат. Собственно, именно этот тест и является одним из ключевых.

Но, как мы заметили, только одним из ключевых. Да и ещё кое-что надо держать в уме – состояние накопителя. Если вы принесли диск из магазина и протестировали его в одном из перечисленных выше бенчмарков, практически всегда вы получите заявленные характеристики. Но если повторить тестирование через некоторое время, когда диск будет частично или почти полностью заполнен или же был заполнен, но вы самым обычным способом удалили некоторое количество данных, то результаты могут разительно отличаться. Это связано как раз с принципом работы твердотельных накопителей с данными, когда они не удаляются сразу, а только помечаются на удаление. В таком случае перед записью новых данных (тех же тестовых файлов из бенчмарков), сначала производится удаление старых данных. Более подробно мы рассказывали об этом в предыдущем материале.

На самом деле в зависимости от сценариев работы, параметры нужно подбирать самим. Одно дело – домашние или офисные системы, где используется Windows/Linux/MacOS, а совсем другое – серверные, предназначенные для выполнения определённых задач. К примеру, в серверах, работающих с базами данных, могут быть установлены NVMe-накопители, прекрасно переваривающие глубину очереди хоть 256 и для которых таковая 32 или 64 – детский лепет. Конечно, применение классических бенчмарков, перечисленных выше, в данном случае – пустая трата времени. В крупных компаниях используют самописные сценарии тестирования, например, на основе утилиты fio. Те, кому не требуется воспроизведение определённых задач, могут воспользоваться международной методикой SNIA, в которой описаны все проводимые тесты и предложены псевдоскрипты. Да, над ними потребуется немного поработать, но можно получить полностью автоматизированное тестирование, по результатам которого можно понять поведение накопителя – выявить его сильные и слабые места, посмотреть, как он ведёт себя при длительных нагрузках и получить представление о производительности при работе с разными блоками данных.

В любом случае надо сказать, что у каждого производителя тестовый софт свой. Чаще всего название, версия и параметры выбранного им бенчмарка дописываются в спецификации мелким шрифтом где-нибудь внизу. Конечно, результаты примерно сопоставимы, но различия в результатах, безусловно, могут быть. Из этого следует, как бы грустно это ни звучало, что пользователю надо быть внимательным при тестировании: если результат не совпадает с заявленным, то, возможно, просто установлены другие параметры тестирования, от которых зависит очень многое.

Теория – хорошо, но давайте вернёмся к реальному положению дел. Как мы уже говорили, важно найти данные о параметрах тестирования производителем именно того накопителя, который вы приобрели. Думаете это всё? Нет, не всё. Многое зависит и от аппаратной платформы – тестового стенда, на котором проводится тестирование. Конечно, эти данные также могут быть указаны в спецификации на конкретный SSD, но так бывает не всегда. Что от этого зависит? К примеру, перед покупкой SSD, вы прочитали несколько обзоров. В каждом из них авторы использовали одинаковые стандартные бенчмарки, которые продемонстрировали разные результаты. Кому верить? Если материнские платы и программное обеспечение (включая операционную систему) были одинаковы – вопрос справедливый, придётся искать дополнительный независимый источник информации. А вот если платы или ОС отличаются – различия в результатах можно считать в порядке вещей. Другой драйвер, другая операционная система, другая материнская плата, а также разная температура накопителей во время тестирования – всё это влияет на конечные результаты. Именно по этой причине получить те цифры, которые вы видите на сайтах производителей или в обзорах, практически невозможно. И именно по этой причине нет смысла беспокоиться за различия ваших результатов и результатов других пользователей. Например, на материнской плате иногда реализовывают сторонние SATA-контроллеры (чтобы увеличить количество соответствующих портов), а они чаще всего обладают худшими скоростями. Причём разница может составлять до 25-35%! Иными словами, для воспроизведения заявленных результатов потребуется чётко соблюдать все аспекты методики тестирования. Поэтому, если полученные вами скоростные показатели не соответствуют заявленным, нести покупку обратно в магазин в тот же день не стоит. Если, конечно, это не совсем критичная ситуация с минимальным быстродействием и провалами при чтении или записи данных. Кроме того, скорости большинства твердотельных накопителей меняются в худшую скорость с течением времени, останавливаясь на определённой отметке, которая называется стационарная производительность. Так вот вопрос: а надо ли в итоге постоянно тестировать SSD? Хотя не совсем правильно. Вот так лучше: а есть ли смысл постоянно тестировать SSD?

Регулярное тестирование или наблюдение за поведением?

Так надо ли, приходя с работы домой, приниматься прогонять в очередной раз бенчмарк? Вот это, как раз, делать и не рекомендуется. Как ни крути, но любая из существующих программ данного типа пишет данные на накопитель. Какая-то больше, какая-то меньше, но пишет. Да, по сравнению с ресурсом SSD записываемый объём достаточно мал, но он есть. Да и функции TRIM/Deallocate потребуется время на обработку удалённых данных. В общем, регулярно или от нечего делать запускать тесты никакого смысла нет. Но вот если в повседневной работе вы начинаете замечать подтормаживания системы или тяжёлого программного обеспечения, установленного на SSD, а также зависания, BSOD’ы, ошибки записи и чтения файлов, тогда уже следует озадачиться выявлением причины возникающей проблемы. Не исключено, что проблема может быть на стороне других комплектующих, но проверить накопитель – проще всего. Для этого потребуется фирменное программное обеспечение от производителя SSD. Для наших накопителей – Kingston SSD Manager. Но перво-наперво делайте резервные копии важных данных, а уже потом занимайтесь диагностикой и тестированием. Для начала смотрим в область SSD Health. В ней есть два показателя в процентах. Первый – так называемый износ накопителя, второй – использование резервной области памяти. Чем ниже значение, тем больше беспокойства с вашей стороны должно быть. Конечно, если значения уменьшаются на 1-2-3% в год при очень интенсивном использовании накопителя, то это нормальная ситуация. Другое дело, если без особых нагрузок значения снижаются необычно быстро. Рядом есть ещё одна область – Health Overview. В ней кратко сообщается о том, были ли зафиксированы ошибки разного рода, и указано общее состояние накопителя. Также проверяем наличие новой прошивки. Точнее программа сама это делает. Если таковая есть, а диск ведёт себя странно (есть ошибки, снижается уровень «здоровья» и вообще исключены другие комплектующие), то можем смело устанавливать.

Если же производитель вашего SSD не позаботился о поддержке в виде фирменного софта, то можно использовать универсальный, к примеру – CrystalDiskInfo. Нет, у Intel есть своё программное обеспечение, на скриншоте ниже – просто пример :) На что обратить внимание? На процент состояния здоровья (хотя бы примерно, но ситуация будет понятна), на общее время работы, число включений и объёмы записанных и считанных данных. Не всегда эти значения будут отображены, а часть атрибутов в списке будут видны как Vendor Specific. Об этом чуть позже.

А вот яркий пример уже вышедшего из строя накопителя, который работал относительно недолго, но потом начал работать «через раз». При включении система его не видела, а после перезагрузки всё было нормально. И такая ситуация повторялась в случайном порядке. Главное при таком поведении накопителя – сразу же сделать бэкап важных данных, о чём, правда, мы сказали совсем недавно. Но повторять это не устанем. Число включений и время работы – совершенно недостижимые. Почти 20 тысяч суток работы. Или около 54 лет…

Но и это ещё не всё – взгляните на значения из фирменного ПО производителя! Невероятные значения, верно? Вот в таких случаях может помочь обновление прошивки до актуальной версии. Если таковой нет, то лучше обращаться к производителю в рамках гарантийного обслуживания. А если новая прошивка есть, то после обновления не закидывать на диск важные данные, а поработать с ним осторожно и посмотреть на предмет стабильности. Возможно, проблема будет решена, но возможно – нет.

Добавить можно ещё вот что. Некоторые пользователи по привычке или незнанию используют давно знакомый им софт, которым производят мониторинг состояния классических жёстких дисков (HDD). Так делать настоятельно не рекомендуется, так как алгоритмы работы HDD и SSD разительно отличаются, как и набор команд контроллеров. Особенно это касается NVMe SSD. Некоторые программы (например, Victoria) получили поддержку SSD, но их всё равно продолжают дорабатывать (а доработают ли?) в плане корректности демонстрации информации о подключённых носителях. К примеру, прошло лишь около месяца с того момента, как показания SMART для SSD Kingston обрели хоть какой-то правильный вид, да и то не до конца. Всё это касается не только вышеупомянутой программы, но и многих других. Именно поэтому, чтобы избежать неправильной интерпретации данных, стоит пользоваться только тем софтом, в котором есть уверенность, – фирменные утилиты от производителей или же крупные и часто обновляемые проекты.

Присмотр за каждой ячейкой – смело. Глупо, но смело

Некоторые производители реализуют в своём программном обеспечении возможность проверки адресов каждого логического блока (LBA) на предмет наличия ошибок при чтении. В ходе такого тестирования всё свободное пространство накопителя используется для записи произвольных данных и обратного их считывания для проверки целостности. Такое сканирование может занять не один час (зависит от объёма накопителя и свободного пространства на нём, а также его скоростных показателей). Такой тест позволяет выявить сбойные ячейки. Но без нюансов не обходится. Во-первых, по-хорошему, SSD должен быть пуст, чтобы проверить максимум памяти. Отсюда вытекает ещё одна проблема: надо делать бэкапы и заливать их обратно, что отнимает ресурс накопителя. Во-вторых, ещё больше ресурса памяти тратится на само выполнение теста. Не говоря уже о затрачиваемом времени. А что в итоге мы узнаем по результатам тестирования? Варианта, как вы понимаете, два – или будут битые ячейки, или нет. В первом случае мы впустую тратим ресурс и время, а во втором – впустую тратим ресурс и время. Да-да, это так и звучит. Сбойные ячейки и без такого тестирования дадут о себе знать, когда придёт время. Так что смысла в проверки каждого LBA нет никакого.

А можно несколько подробнее о S.M.A.R.T.?

Все когда-то видели набор определённых названий (атрибутов) и их значений, выведенных списком в соответствующем разделе или прямо в главном окне программы, как это видно на скриншоте выше. Но что они означают и как их понять? Немного вернёмся в прошлое, чтобы понять что к чему. По идее, каждый производитель вносит в продукцию что-то своё, чтобы этой уникальностью привлечь потенциального покупателя. Но вот со S.M.A.R.T. вышло несколько иначе.

В зависимости от производителя и модели накопителя набор параметров может меняться, поэтому универсальные программы могут не знать тех или иных значений, помечая их как Vendor Specific. Многие производители предоставляют в открытом доступе документацию для понимания атрибутов своих накопителей – SMART Attribute. Её можно найти на сайте производителя.

Именно поэтому и рекомендуется использовать именно фирменный софт, который в курсе всех тонкостей совместимых моделей накопителей. Кроме того, настоятельно рекомендуется использовать английский интерфейс, чтобы получить достоверную информацию о состоянии накопителя. Зачастую перевод на русский не совсем верен, что может привести в замешательство. Да и сама документация, о которой мы сказали выше, чаще всего предоставляется именно на английском.

Сейчас мы рассмотрим основные атрибуты на примере накопителя Kingston UV500. Кому интересно – читаем, кому нет – жмём PageDown пару раз и читаем заключение. Но, надеемся, вам всё же интересно – информация полезная, как ни крути. Построение текста может выглядеть необычно, но так для всех будет удобнее – не потребуется вводить лишние слова-переменные, а также именно оригинальные слова будет проще найти в отчёте о вашем накопителе.

(ID 1) Read Error Rate – содержит частоту возникновения ошибок при чтении.

(ID 5) Reallocated Sector Count – количество переназначенных секторов. Является, по сути, главным атрибутом. Если SSD в процессе работы находит сбойный сектор, то он может посчитать его невосполнимо повреждённым. В этом случае диск использует вместо него сектор из резервной области. Новый сектор получает логический номер LBA старого, после чего при обращении к сектору с этим номером запрос будет перенаправляться в тот, что находится в резервной области. Если ошибка единичная – это не проблема. Но если такие сектора будут появляться регулярно, то проблему можно считать критической.

(ID 9) Power On Hours – время работы накопителя в часах, включая режим простоя и всяческих режимов энергосбережения.

(ID 12) Power Cycle Count – количество циклов включения и отключения накопителя, включая резкие обесточивания (некорректное завершение работы).

(ID 170) Used Reserved Block Count – количество использованных резервных блоков для замещения повреждённых.

(ID 171) Program Fail Count – подсчёт сбоев записи в память.

(ID 172) Erase Fail Count – подсчёт сбоев очистки ячеек памяти.

(ID 174) Unexpected Power Off Count – количество некорректных завершений работы (сбоев питания) без очистки кеша и метаданных.

(ID 175) Program Fail Count Worst Die – подсчёт ошибок сбоев записи в наихудшей микросхеме памяти.

(ID 176) Erase Fail Count Worst Die – подсчёт ошибок сбоев очистки ячеек наихудшей микросхемы памяти.

(ID 178) Used Reserved Block Count worst Die – количество использованных резервных блоков для замещения повреждённых в наихудшей микросхеме памяти.

(ID 180) Unused Reserved Block Count (SSD Total) – количество (или процент, в зависимости от типа отображения) ещё доступных резервных блоков памяти.

(ID 187) Reported Uncorrectable Errors – количество неисправленных ошибок.

(ID 194) Temperature – температура накопителя.

(ID 195) On-the-Fly ECC Uncorrectable Error Count – общее количество исправляемых и неисправляемых ошибок.

(ID 196) Reallocation Event Count – количество операций переназначения.

(ID 197) Pending Sector Count – количество секторов, требующих переназначения.

(ID 199) UDMA CRC Error Count – счётчик ошибок, возникающих при передаче данных через SATA интерфейс.

(ID 201) Uncorrectable Read Error Rate – количество неисправленных ошибок для текущего периода работы накопителя.

(ID 204) Soft ECC Correction Rate – количество исправленных ошибок для текущего периода работы накопителя.

(ID 231) SSD Life Left – индикация оставшегося срока службы накопителя на основе количества циклов записи/стирания информации.

(ID 241) GB Written from Interface – объём данных в ГБ, записанных на накопитель.

(ID 242) GB Read from Interface – объём данных в ГБ, считанных с накопителя.

(ID 250) Total Number of NAND Read Retries – количество выполненных попыток чтения с накопителя.

Пожалуй, на этом закончим список. Конечно, для других моделей атрибутов может быть больше или меньше, но их значения в рамках производителя будут идентичны. А расшифровать значения достаточно просто и обычному пользователю, тут всё логично: увеличение количества ошибок – хуже диску, снижение резервных секторов – тоже плохо. По температуре – всё и так ясно. Каждый из вас сможет добавить что-то своё – это ожидаемо, так как полный список атрибутов очень велик, а мы перечислили лишь основные.

Паранойя или трезвый взгляд на сохранность данных?

Как показывает практика, тестирование нужно лишь для подтверждения заявленных скоростных характеристик. В остальном – это пустая трата ресурса накопителя и вашего времени. Никакой практической пользы в этом нет, если только морально успокаивать себя после вложения определённой суммы денег в SSD. Если есть проблемы, они дадут о себе знать. Если вы хотите следить за состоянием своей покупки, то просто открывайте фирменное программное обеспечение и смотрите на показатели, о которых мы сегодня рассказали и которые наглядно показали на скриншотах. Это будет самым быстрым и самым правильным способом диагностики. И ещё добавим пару слов про ресурс. Сегодня мы говорили, что тестирование накопителей тратит их ресурс. С одной стороны – это так. Но если немного подумать, то пара-тройка, а то и десяток записанных гигабайт – не так уж много. Для примера возьмём бюджетный Kingston A400R ёмкостью 256 ГБ. Его значение TBW равно 80 ТБ (81920 ГБ), а срок гарантии – 1 год. То есть, чтобы полностью выработать ресурс накопителя за этот год, надо ежедневно записывать на него 224 ГБ данных. Как это сделать в офисных ПК или ноутбуках? Фактически – никак. Даже если вы будете записывать порядка 25 ГБ данных в день, то ресурс выработается лишь практически через 9 лет. А ведь у накопителей серии A1000 ресурс составляет от 150 до 600 ТБ, что заметно больше! С учётом 5-летней гарантии, на флагман ёмкостью 960 ГБ надо в день записывать свыше 330 ГБ, что маловероятно, даже если вы заядлый игрок и любите новые игры, которые без проблем занимают под сотню гигабайт. В общем, к чему всё это? Да к тому, что убить ресурс накопителя – достаточно сложная задача. Куда важнее следить за наличием ошибок, что не требует использования привычных бенчмарков. Пользуйтесь фирменным программным обеспечением – и всё будет под контролем. Для накопителей Kingston и HyperX разработан SSD Manager, обладающий всем необходимым для рядового пользователя функционалом. Хотя, вряд ли ваш Kingston или HyperX выйдет из строя… На этом – всё, успехов во всём и долгих лет жизни вашим накопителям!

P.S. В случае возникновения проблем с SSD подорожник всё-таки не поможет :(

Для получения дополнительной информации о продуктах Kingston обращайтесь на сайт компании.

  • #1

smartctl on a 1.5T Seagate HDD, found out error on 195 Hardware_ECC_Recovered 0x001a 055 038 000 Old_age Always — 110511057

Can someone explain how critical is this number? What should I do to this drive?

Thanks,
S

Code:

[root@freenas] ~# smartctl -a /dev/ada2
smartctl 6.5 2016-05-07 r4318 [FreeBSD 10.3-STABLE amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:	 Seagate Barracuda LP
Device Model:	 ST31500541AS
Serial Number:	6XW0S5QD
LU WWN Device Id: 5 000c50 01b9d195a
Firmware Version: CC94
User Capacity:	1,500,301,910,016 bytes [1.50 TB]
Sector Size:	  512 bytes logical/physical
Rotation Rate:	5900 rpm
Device is:		In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:	Wed Mar 21 12:36:01 2018 EDT

==> WARNING: A firmware update for this drive may be available,
see the following Seagate web pages:
http://knowledge.seagate.com/articles/en_US/FAQ/207931en
http://knowledge.seagate.com/articles/en_US/FAQ/213915en

SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
										was completed without error.
										Auto Offline Data Collection: Enabled.
Self-test execution status:	  (   0) The previous self-test routine completed
										without error or no self-test has ever
										been run.
Total time to complete Offline
data collection:				(  653) seconds.
Offline data collection
capabilities:					(0x7b) SMART execute Offline immediate.
										Auto Offline data collection on/off support.
										Suspend Offline collection upon new
										command.
										Offline surface scan supported.
										Self-test supported.
										Conveyance Self-test supported.
										Selective Self-test supported.
SMART capabilities:			(0x0003) Saves SMART data before entering
										power-saving mode.
										Supports SMART auto save timer.
Error logging capability:		(0x01) Error logging supported.
										General Purpose Logging supported.
Short self-test routine
recommended polling time:		(   1) minutes.
Extended self-test routine
recommended polling time:		( 377) minutes.
Conveyance self-test routine
recommended polling time:		(   2) minutes.
SCT capabilities:			  (0x103f) SCT Status supported.
										SCT Error Recovery Control supported.
										SCT Feature Control supported.
										SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME		  FLAG	 VALUE WORST THRESH TYPE	  UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate	 0x000f   116   099   006	Pre-fail  Always	   -	   110511057
  3 Spin_Up_Time			0x0003   100   100   000	Pre-fail  Always	   -	   0
  4 Start_Stop_Count		0x0032   037   037   020	Old_age   Always	   -	   65535
  5 Reallocated_Sector_Ct   0x0033   100   100   036	Pre-fail  Always	   -	   0
  7 Seek_Error_Rate		 0x000f   078   060   030	Pre-fail  Always	   -	   77894739
  9 Power_On_Hours		  0x0032   085   085   000	Old_age   Always	   -	   13520
 10 Spin_Retry_Count		0x0013   100   100   097	Pre-fail  Always	   -	   0
 12 Power_Cycle_Count	   0x0032   100   100   020	Old_age   Always	   -	   122
183 Runtime_Bad_Block	   0x0032   100   100   000	Old_age   Always	   -	   0
184 End-to-End_Error		0x0032   100   100   099	Old_age   Always	   -	   0
187 Reported_Uncorrect	  0x0032   100   100   000	Old_age   Always	   -	   0
188 Command_Timeout		 0x0032   100   099   000	Old_age   Always	   -	   12885098501
189 High_Fly_Writes		 0x003a   096   096   000	Old_age   Always	   -	   4
190 Airflow_Temperature_Cel 0x0022   069   053   045	Old_age   Always	   -	   31 (Min/Max 29/34)
194 Temperature_Celsius	 0x0022   031   047   000	Old_age   Always	   -	   31 (0 14 0 0 0)
195 Hardware_ECC_Recovered  0x001a   055   038   000	Old_age   Always	   -	   110511057
197 Current_Pending_Sector  0x0012   100   100   000	Old_age   Always	   -	   0
198 Offline_Uncorrectable   0x0010   100   100   000	Old_age   Offline	  -	   0
199 UDMA_CRC_Error_Count	0x003e   200   200   000	Old_age   Always	   -	   0
240 Head_Flying_Hours	   0x0000   100   253   000	Old_age   Offline	  -	   5741 (125 68 0)
241 Total_LBAs_Written	  0x0000   100   253   000	Old_age   Offline	  -	   3969767324
242 Total_LBAs_Read		 0x0000   100   253   000	Old_age   Offline	  -	   2020012498

  • #2

Can someone explain how critical is this number?

Not critical at all, normalized value is currently 55, worst it’s ever been was 38, and threshold is 0, so only if the normalized values reaches 0 (or close to it) there’s case for concern.

  • #3

Not critical at all, normalized value is currently 55, worst it’s ever been was 38, and threshold is 0, so only if the normalized values reaches 0 (or close to it) there’s case for concern.

Thanks for the reply. Does this value means that there is memory issue or this ECC is something built-in within the HDD?

  • #4

All HDDs have ECC, some Seagates report that attribute, but only the normalized value is important, you can ignore the RAW value.

  • #5

I have a new Dell T40 Server with a Seagate 1TB HDD. The values are typically much worse than the OP’s

Code:

195 Hardware_ECC_Recovered  0x001a   005   001   000    Old_age   Always       -       110949816

Raw_Read_Error_Rate and Seek_Error_Rate are marginal too. They get reset after a power cycle but quickly return with hard use. Can I have confidence in this drive? Will Dell RMA it?

  • #6

Raw_Read_Error_Rate and Seek_Error_Rate are marginal too. They get reset after a power cycle but quickly return with hard use. Can I have confidence in this drive?

You should post the complete SMART report, the ECC recovered attribute is still above the failure threshold, though it came very close to it at some point in the past.

  • #7

Here’s the complete report

Code:

$ sudo smartctl -a /dev/sda
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.15.0-72-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     ST1000DM010-2EP102
Serial Number:    ZN19HSZA
LU WWN Device Id: 5 000c50 0c2dcc56a
Firmware Version: CC45
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Wed Jan  1 06:27:40 2020 EST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (    0) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 114) minutes.
Conveyance self-test routine
recommended polling time:        (   2) minutes.
SCT capabilities:              (0x1085) SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   083   064   006    Pre-fail  Always       -       206490856
  3 Spin_Up_Time            0x0003   097   097   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       45
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   072   060   045    Pre-fail  Always       -       17428901
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       85
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       42
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   058   055   040    Old_age   Always       -       42 (Min/Max 36/44)
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       47
194 Temperature_Celsius     0x0022   042   016   000    Old_age   Always       -       42 (0 16 0 0 0)
195 Hardware_ECC_Recovered  0x001a   006   001   000    Old_age   Always       -       206490856
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       84 (140 120 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       8455202338
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       34614579829

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%        66         -
# 2  Short offline       Completed without error       00%        66         -
# 3  Short offline       Completed without error       00%        66         -
# 4  Short offline       Aborted by host               60%        65         -
# 5  Extended offline    Completed without error       00%        62         -
# 6  Extended offline    Completed without error       00%        39         -
# 7  Short offline       Completed without error       00%        37         -
# 8  Short offline       Completed without error       00%         2         -
# 9  Short offline       Completed without error       00%         2         -
#10  Extended offline    Aborted by host               90%         1         -
#11  Short offline       Aborted by host               60%         1         -
#12  Short offline       Completed without error       00%         0         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

  • #8

Raw_Read_Error and Seek_Error attributes are perfectly normal, both have 0 errors, the raw values are 48-bit hexadecimal values, where the first 16 bits (4 hexadecmal digits) represent the total number of read or seek errors, if you convert either to hex you see only the last 8 hex digits have a value, and that represents the total number of reads/seeks, also the attribute values (not raw values) are perfectly normal and well above the fail threshold, and also worst recorded.

Hardware_ECC also has 0 errors, the attribute value is a little lower than normal, at least from what I remember, but it’s still above threshold, and it’s better than it was at some point in the past (6 vs 1), so nothing to worry about for now and no reason to RMA the drive, just make sure you do regular SMART tests.

01 Raw Read Error Rate Ниже Критично Частота ошибок при чтении данных с жёсткого диска. Происхождение их обусловлено износом аппаратной части винчестера. 02 Throughput Performance Выше Общая производительность накопителя. Если значение атрибута уменьшается поступательно, то велика вероятность проблем с винчестером. 03 Spin-Up Time Ниже Критично Время раскрутки «блинов» из состояния покоя до рабочей скорости ( чаще, всего с 0 rpm до 7200 rpm (оборотов в минуту). 04 Start/Stop Count Значение Полное число запусков, остановок шпинделя. Иногда в том числе количество включений режима энергосбережения. В поле raw value хранится общее количество запусков/остановок жёсткого диска. 05 Reallocated Sectors Count Ниже Критично Число операций переназначения секторов. При обнаружении повреждённого сектора на винчестере, информация из него помечается и переносится в специально отведённую зону, происходит утилизация bad блоков, с последующим консервированием этих мест на диске. Этот процесс называют remapping. Чем больше значение Reallocated Sectors Count, тем хуже состояние поверхности дисков — физический износ поверхности. Поле raw value содержит общее количество переназначенных секторов. 07 Seek Error Rate Ниже Критично Частота ошибок при позиционировании блока головок. Чем больше значение, тем хуже состояние механики, или поверхности жёсткого диска. 08 Seek Time Performance Выше Средняя производительность операции позиционирования. Если значение атрибута уменьшается, то велика вероятность проблем с механической частью. 09 Power-On Hours (POH) Ниже Время, проведённое устройством, во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ. 0A Spin-Up Retry Count Ниже Критично Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. 0B Recalibration Retries Ниже Количество повторов рекалибровки в случае, если первая попытка была неудачной. 0C Device Power Cycle Count Значение Число циклов включения-выключения винчестера. 0D Soft Read Error Rate Ниже Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению. BB Reported UNC Errors Ниже Критично Неустранимые аппаратные ошибки. BE Airflow Temperature Ниже Температура воздуха внутри корпуса жёсткого диска. Целое значение, либо значение по формуле 100 — Airflow Temperature. BF G-sense error rate Ниже Количество ошибок, возникающих в результате ударов. C0 Power-off retract count Ниже Число циклов аварийных выключений. C1 Load/Unload Cycle Ниже Количество циклов перемещения блока головок в парковочную зону. C2 HDA temperature Ниже Показания встроенного термодатчика накопителя. C3 Hardware ECC Recovered Ниже Критично Число коррекции ошибок аппаратной частью диска (ошибок чтения, ошибок позиционирования, ошибок передачи по внешнему интерфейсу). C4 Reallocation Event Count Ниже Критично Число операций переназначения в резервную область, успешные и неудавшиеся попытки. C5 Current Pending Sector Count Ниже Критично Число секторов- кандидатов на перенос в резервную зону. Помечены как не надёжные. При последующих корректных операциях атрибут может быть снят. C6 Uncorrectable Sector Count Ниже Критично Число некорректируемых ошибок при обращении к сектору. C7 UltraDMA CRC Error Count Ниже Число ошибок при передаче данных по внешнему интерфейсу. C8 Write Error Rate /Multi-Zone Error Rate Ниже Общее количество ошибок при заполнения сектора информацией. Показатель качества накопителя. C9 Soft read error rate Ниже Частота появления «программных» ошибок при чтении данных с диска, а не аппаратной части HDD. CA Data Address Mark errors Ниже Число ошибок адресно помеченной информации (Data Address Mark (DAM)).Если автоматически не корректируется — заменить устройство. CB Run out cancel Ниже Количество ошибок ECC данных, присоединяемые к передаваемому сигналу, позволяющие принимающей стороне определить факт сбоя или исправить несущественную ошибку. CC Soft ECC correction Ниже Количество ошибок ECC, скорректированных программным способом. CD Thermal asperity rate (TAR) Ниже Число ошибок в следствии температурных колебаний. CE Flying height Значение Высота между головкой и поверхностью диска компьютера. D1 Offline seek performance Значение Drive’s seek performance during offline operations. DC Disk Shift Ниже Критично Дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения. DD G-Sense Error Rate Ниже Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного crash датчика. DE Loaded Hours Значение Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область. DF Load/Unload Retry Count Значение Количество новых попыток выгрузок/загрузок блока магнитных головок винчестера в/из парковочной области после неудачной попытки. E0 Load Friction Ниже Величина силы трения блока магнитных головок при его выгрузке из парковочной области. E1 Load Cycle Count Ниже Число циклов вход-выход в парковочную зону. E2 Load ‘In’-time Значение Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска. E3 Torque Amplification Count Ниже Количество попыток скомпенсировать вращающий момент. E4 Power-Off Retract Cycle Ниже Количество повторов автоматической парковки блока магнитных головок в результате выключения питания. E6 GMR Head Amplitude Значение Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок). E7 Temperature Ниже Температура жёсткого диска. F0 Head flying hours Значение Время позиционирования головки. FA Read error retry rate Ниже Число ошибок во время чтения жёсткого диска.

Что такое SMART HDD (жёсткого диска) и что нужно делать, если компьютер выдаёт надпись «smart status bad backup and replace».

Во всех современных накопителях последних лет абсолютно любого производителя присутствует система SMART (self-monitoring, analysis and reporting technology — технология предупреждения, анализа и самопроверки) жесткого диска, очень тесно связанная с функционированием накопителя.

Современные технологии SMART осуществляют: мониторинг различных параметров состояния диска, сканирование поверхности жесткого диска с дальнейшей автоматической заменой нечитаемых секторов и занесение их в error-log, т.н. список, где номера этих секторов хранятся в виде таблицы, периодическое повторное сканирование «ненадежных» секторов из error-log и, если система определяет, что данный сектор исправен — то исключает его из данного списка и он становится доступен на поверхности для пользовательской информации (но также помечается для дальнейшей перепроверки при следующем сканировании поверхности), либо, если сектор не прочитывается несколько раз подряд, не переписывается, то он отправляется в следующий дефект-лист,именуемый у разных производителей по-разному, но имеющий одинаковое предназначение — этот лист является как бы посредником между error-log таблицей и финальным G-листом, где дефект уже будет занесен в G-лист навсегда, станет отображаться в SMART, в строке current pending sectors/offline UNC sectors.

Из статуса current pending поврежденный сектор после очередной перепроверки на «живучесть», если не прошел чтение/запись, то окончательно отправляется в статус переназначенных и там уже остается. Диск в дальнейшей работе его уже не использует, не тестирует повторно на чтение/запись.

В строке reallocated sector count изменяется значение с N на N+1.

Если накопитель имеет уже серьёзные повреждения, то при загрузке компьютера может выводиться надпись: «smart status bad backup and replace». Это значит, что статус SMART жёсткого диска изменился из состояния GOOD в состояние BAD, на диске как минимум имеются BAD-блоки и состояние диска продолжает ухудшаться. Пользователю рекомендуется сохранить свои данные, если они ещё доступны для чтения и заменить жёсткий диск на новый.

SMART ВЫГЛЯДИТ ТАК:

Выводится в виде таблицы со следующими столбцами:

ID – ИДЕНТИФИКАЦИОННЫЙ НОМЕР ПАРАМЕТРА

Name – выводимое программой имя параметра

VAL – НОРМАЛИЗОВАННОЕ ЗНАЧЕНИЕ ПАРАМЕТРА (НОРМАЛИЗОВАННОЕ ЗНАЧИТ, В ДАННОМ СЛУЧАЕ, ЧТО ВНУТРЕННЕЕ (RAW) ЗНАЧЕНИЕ ПАРАМЕТРА ПРЕОБРАЗОВАНО ПО ОПРЕДЕЛЁННОМУ АЛГОРИТМУ ДЛЯ БОЛЕЕ УДОБНОГО И ПОНЯТНОГО ПРОСМОТРА ЗНАЧЕНИЯ. НАПРИМЕР, ВНУТРЕННИЙ ПАРАМЕТР ВСЕГДА УВЕЛИЧИВАЕТСЯ И МОЖЕТ ПРИНИМАТЬ ЗНАЧЕНИЕ В НЕСКОЛЬКО ТЫСЯЧ ЕДИНИЦ, А ВЫВОДИМОЕ ЗНАЧЕНИЕ ИЗМЕНЯЕТСЯ ОТ 100 ДО 0 И ОТОБРАЖЕНИЕ ВНУТРЕННЕГО ДИАПАЗОНА ИЗМЕНЕНИЯ ПАРАМЕТРА НА ВЫВОДИМЫЙ И ЕСТЬ, В ДАННОМ СЛУЧАЕ, НОРМАЛИЗАЦИЯ)

Wrst – худшее значение параметра за отрезок времени время

Thresh – пороговое значение, при достижении которого диск рекомендуется заменить

РАССМОТРИМ, КАКИЕ СУЩЕСТВУЮТ ПАРАМЕТРЫ В СИСТЕМЕ SMART. НАБОР ОТСЛЕЖИВАЕМЫХ ПАРАМЕТРОВ ЗАВИСИТ ОТ ПРОИЗВОДИТЕЛЯ ДИСКА И НЕ ВСЕ ИЗ ПЕРЕЧИСЛЕННЫХ БУДУТ ПРИСУТСТВОВАТЬ В ВАШЕМ СЛУЧАЕ.

Атрибуты SMART:

1 Raw read error rate — количество ошибок при считывании секторов с пластин.

2 Throughput Performance — общая производительность диска в относительных единицах.

3 Spin-up time — время раскрутки пластин от нуля до номинальной скорости вращения в миллисекундах

4 Number of spin-up times — количество циклов раскрутки/остановки пластин; отражает механический ресурс диска из-за ограниченного количества циклов запуска/останова.

5 Reallocated sector count — параметр отражает количество запасных секторов; когда диск находит ошибку чтения/записи/проверки, он переназначает плохой сектор на хороший из запасной зоны; нормализованное значение атрибута уменьшается по мере убывания запасных секторов; RAW-значение показывает количество преназначенных секторов, которое в норме должно быть ноль; на SSDRAW значение показывает количество неисправных блоков флеш-памяти.

6 Read Channel Margin — данный атрибут не используется в современных накопителях.

7 Seek error rate — количество ошибок позиционирования магнитных головок.

8 Seek Time Performance — средняя скорость позиционирования привода магнитных головок на указанный сектор; в SSDпараметр не используется

9 Power-on time — ожидаемое время жизни диска, основанное на времени, проведённом во включённом состоянии; нормализованное значение уменьшается со 100 до 0, связано с ресурсом диска; уменьшение этого параметра косвенно говорит о состоянии механики диска

10 Spin-up retries — количество попыток раскруток пластин при условии, что первая попытка была неудачная; считается с момента начала использования; на SSD не используется

12 Start/stop count — ожидаемое время жизни, основанное на количестве пусков/остановов пластин; каждый диск имеет ограниченное количество пусков/остановов, параметр уменьшается со 100 до 0; RAW значение показывает число включений/выключений

13 Soft Read Error Rate — у одних производителей этот параметр описывается, как указывающий на количество ошибок, не восстановленных ECC, а у других наоборот — восстановленных

100 Erase/Program Cycles — общее количество циклов чтения/записи для всей флеш-памяти за весь срок службы; SSD имеет ограничение на количество циклов чтения/записи, конкретное значение зависит от типа и производителя микросхем флеш-памяти

103 Translation Table Rebuild — количество событий перестроения внутренней таблицы адресов блоков при её повреждении и восстановлении; RAW значение показывает актуальное количество данных событий

170 Reserved Block Count — описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество использованных резервных блоков

171 Program Fail Count — количество случаев неудавшейся записи блока флеш-памяти

172 Erase Fail Count — количество случаев неудавшейся операции стирания блока флеш-памяти

173 Wear Leveller Worst Case Erase Count — максимальное количество операций стирания, произведённых над блоком флеш-памяти

178 Used Reserved Block Count — описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество использованных резервных блоков

180 Unused Reserved Block Count — описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество неиспользованных резервных блоков

183 SATA Downshifts — показывает, как часто требовалось понизить скорость передачи по SATA (с 6Гб/c до 3Гб/с или 1.5Гб/с) для успешной передачи данных, при уменьшении значения атрибута следует заменить кабель

184 End-to-End error — количество ошибок, возникших в буфере диска; часть технологии HP SMART IV; может свидетельствовать о неисправности RAM-буффера диска

185 Head Stability — по атрибуту нет достоверной информации

186 Induced Op-Vibration Detection — по атрибуту нет достоверной информации

187 Reported UNC error — количество нескорректированных ошибок чтения

188 Command timeout — количество невыполненных диском команд из-за истечения времени ожидания

189 High Fly writes — количество ошибок записи, вызванных неправильной высотой полёта магнитной головки над поверхностью

190 Airflow temperature — температура воздуха внутри гермоблока HDD

191 G-Sense Errors — указывает сколько раз диск прерывал работу из-за ударов или вибрации

192 power-off retract cycles — количество неожиданных пропаданий питания, когда оно пропадало прежде, чем была получена команда на отключение диска; у hdd срок службы при неожиданном отключении значительно меньше, чем при нормальном; у ssd есть риск потери таблицы внутреннего состояния при неожиданном пропадании питания

193 load/unload cycles — количество перемещений бмг между зоной парковки и зоной данных; значение уменьшается от 100 до 0, raw содержит актуальное количество перемещений

194 hda temperature- температура блока магнитных головок

195 hardware ecc recovered- количество ошибок чтения, скорректированных кодом коррекции ошибок

196 reallocation events — общее количество переназначений секторов, включает и off-line сканирование и обычную работу

197 current pending sectors- количество нестабильных секторов, ожидающих перепроверки и, возможно, переназначения

198 offline scan unc sectors- количество плохих секторов, найденных диском при фоновом самосканировании; ухудшение этого параметра говорит о быстрой деградации поверхности

199 ultra dma crc errors- количество ошибок при передаче данных между диском и материнской платой; при ухудшении этого параметра стоит заменить кабель

200 write error rate — частота возникновения ошибок при записи

202 data address mark errors — количество ошибок при поиске запрошенного сектора

203 run out cancel — количество ошибок, вызванных неверной контрольной суммой при попытке коррекции ошибки

204 soft ecc corrections — количество ошибок, скорректированных кодом коррекции

206 flying height — девиация высоты полёта головки над поверхностью относительно оптимального значения; если головка слишком низко, она может повредить поверхность, если слишком высоко — увеличивается количество ошибок чтения

207 spin high current — величина тока, требуемая для раскрутки пластин

209 offline seek performance — производительность подсистемы поиска при выполнении off-line сканирования

220 disk shift — расстояние, на которое сместился пакет пластин относительно теоретического положения в результате механического повреждения или перегрева

227 torque amplification count — показывает сколько раз требовалось подавать увеличенный ток для раскрутки пластин

230 gmr head amplitude — амплитуда колебаний головок бмг

233 media wearout indicator — остаток ресурса памяти в ssd

240 head flying hours- время, проведённое головками в зоне пользовательских данных; значение уменьшается, обычно от 100 до 0

241 total lbas written — количество 512-и байтных блоков, записанных за всю жизнь устройства

242 total lbas read — количество 512-и байтных блоков, считанных за всю жизнь устройства

250 read error retry rate

Сложность интерпретации значений smart состоит в том, что ни на количество, ни на тип, ни на значения, ни на единицы измерения отслеживаемых параметров нет единого стандарта. поэтому реализация smart всегда зависит от конкретного производителя. нормализацию raw-значений в показатели атрибутов все делают по-своему, а результатом является статус проверки smart good или bad. поэтому достоверный вывод о состоянии диска можно сделать только проверив его поверхность какой-либо диагностической программой. но если нужно быстро оценить состояние диска и возможные проблемы, нужно обратить внимание на несколько основных, самых информативных атрибутов.

Наиболее важные аттрибуты smart:

5 reallocated sectors count — количество переназначенных секторов; рост значения этого атрибута свидетельствует об ухудшении состояния поверхности диска

7 seek error rate — частота ошибок позиционирования бмг (блока магнитных головок); чем больше, тем хуже состояние механики и поверхности жёсткого диска

11 recalibration retries — количество неудачных попыток калибровки бмг;

184 end-to-end error — количество ошибок возникших в буфере диска

187 reported unc errors — количество нескорректированных ошибок чтения

191 g-sense error rate — количество ударов диска во время работы

196 reallocation event count — общее количество переназначенных секторов

197 current pending sector count — количество нестабильных секторов, кандидаты в бэды, чем больше, тем хуже диск

198 uncorrectable sector count — количество плохих секторов, найденных при off-line сканировании, чем их больше, тем хуже поверхность

199 ultradma crc error count — количество ошибок передачи между диском и компьютером, при увеличении или отличном от нуля параметре стоит заменить кабель

Если попытка самостоятельно восстановить данные не принесла положительного результата, то Вы можете обратиться к специалистам лаборатории MHDD.RU. Позвоните и проконсультируйтесь у наших технических специалистов по телефону: 8(495)241-31-97.

Понравилась статья? Поделить с друзьями:

Читайте также:

  • Smart 183 sata downshift error count
  • Small error sans
  • Sm контроллер шины что это ошибка
  • Sm exception reported invalid database handle 0 error 4
  • Sm error line 0 column 0 stream failed to open

  • 0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии