Современный жёсткий диск — уникальный компонент компьютера. Он уникален тем, что хранит в себе служебную информацию, изучая которую, можно оценить «здоровье» диска. Эта информация содержит в себе историю изменения множества параметров, отслеживаемых винчестером в процессе функционирования. Больше ни один компонент системного блока не предоставляет владельцу статистику своей работы! Вкупе с тем, что HDD является одним из самых ненадёжных компонентов компьютера, такая статистика может быть весьма полезной и помочь его владельцу избежать нервотрёпки и потери денег и времени.
Информация о состоянии диска доступна благодаря комплексу технологий, называемых общим именем S.M.A.R.T. (Self-Monitoring, Analisys and Reporting Technology, т. е. технология самомониторинга, анализа и отчёта). Этот комплекс довольно обширен, но мы поговорим о тех его аспектах, которые позволяют посмотреть на атрибуты S.M.A.R.T., отображаемые в какой-либо программе по тестированию винчестера, и понять, что творится с диском.
Отмечу, что нижесказанное относится к дискам с интерфейсами SATA и РАТА. У дисков SAS, SCSI и других серверных дисков тоже есть S.M.A.R.T., но его представление сильно отличается от SATA/PATA. Да и мониторит серверные диски обычно не человек, а RAID-контроллер, потому про них мы говорить не будем.
Итак, если мы откроем S.M.A.R.T. в какой-либо из многочисленных программ, то увидим приблизительно следующую картину (на скриншоте приведён S.M.A.R.T. диска Hitachi Deskstar 7К1000.С HDS721010CLA332 в HDDScan 3.3):
S.M.A.R.T. в HDDScan 3.3
В каждой строке отображается отдельный атрибут S.M.A.R.T. Атрибуты имеют более-менее стандартизованные названия и определённый номер, которые не зависят от модели и производителя диска.
Каждый атрибут S.M.A.R.T. имеет несколько полей. Каждое поле относится к определённому классу из следующих: ID, Value, Worst, Threshold и RAW. Рассмотрим каждый из классов.
- ID (может также именоваться Number) — идентификатор, номер атрибута в технологии S.M.A.R.T. Название одного и того же атрибута программами может выдаваться по-разному, а вот идентификатор всегда однозначно определяет атрибут. Особенно это полезно в случае программ, которые переводят общепринятое название атрибута с английского языка на русский. Иногда получается такая белиберда, что понять, что же это за параметр, можно только по его идентификатору.
- Value (Current) — текущее значение атрибута в попугаях (т. е. в величинах неизвестной размерности). В процессе работы винчестера оно может уменьшаться, увеличиваться и оставаться неизменным. По показателю Value нельзя судить о «здоровье» атрибута, не сравнивая его со значением Threshold этого же атрибута. Как правило, чем меньше Value, тем хуже состояние атрибута (изначально все классы значений, кроме RAW, на новом диске имеют максимальное из возможных значение, например 100).
- Worst — наихудшее значение, которого достигало значение Value за всю жизнь винчестера. Измеряется тоже в «попугаях». В процессе работы оно может уменьшаться либо оставаться неизменным. По нему тоже нельзя однозначно судить о здоровье атрибута, нужно сравнивать его с Threshold.
- Threshold — значение в «попугаях», которого должен достигнуть Value этого же атрибута, чтобы состояние атрибута было признано критическим. Проще говоря, Threshold — это порог: если Value больше Threshold — атрибут в порядке; если меньше либо равен — с атрибутом проблемы. Именно по такому критерию утилиты, читающие S.M.A.R.T., выдают отчёт о состоянии диска либо отдельного атрибута вроде «Good» или «Bad». При этом они не учитывают, что даже при Value, большем Threshold, диск на самом деле уже может быть умирающим с точки зрения пользователя, а то и вовсе ходячим мертвецом, поэтому при оценке здоровья диска смотреть стоит всё-таки на другой класс атрибута, а именно — RAW. Однако именно значение Value, опустившееся ниже Threshold, может стать легитимным поводом для замены диска по гарантии (для самих гарантийщиков, конечно же) — кто же яснее скажет о здоровье диска, как не он сам, демонстрируя текущее значение атрибута хуже критического порога? Т. е. при значении Value, большем Threshold, сам диск считает, что атрибут здоров, а при меньшем либо равном — что болен. Очевидно, что при Threshold=0 состояние атрибута не будет признано критическим никогда. Threshold — постоянный параметр, зашитый производителем в диске.
- RAW (Data) — самый интересный, важный и нужный для оценки показатель. В большинстве случаев он содержит в себе не «попугаи», а реальные значения, выражаемые в различных единицах измерения, напрямую говорящие о текущем состоянии диска. Основываясь именно на этом показателе, формируется значение Value (а вот по какому алгоритму оно формируется — это уже тайна производителя, покрытая мраком). Именно умение читать и анализировать поле RAW даёт возможность объективно оценить состояние винчестера.
Этим мы сейчас и займёмся — разберём все наиболее используемые атрибуты S.M.A.R.T., посмотрим, о чём они говорят и что нужно делать, если они не в порядке.
Аттрибуты S.M.A.R.T. | |||||||||||||||||
01 | 02 | 03 | 04 | 05 | 07 | 08 | 09 | 10 | 11 | 12 | 183 | 184 | 187 | 188 | 189 | 190 | |
0x | 01 | 02 | 03 | 04 | 05 | 07 | 08 | 09 | 0A | 0B | 0C | B7 | B8 | BB | BC | BD | BE |
191 | 192 | 193 | 194 | 195 | 196 | 197 | 198 | 199 | 200 | 201 | 202 | 203 | 220 | 240 | 254 | ||
0x | BF | С0 | С1 | С2 | С3 | С4 | С5 | С6 | С7 | С8 | С9 | СА | CB | DC | F0 | FE |
Перед тем как описывать атрибуты и допустимые значения их поля RAW, уточню, что атрибуты могут иметь поле RAW разного типа: текущее и накапливающее. Текущее поле содержит значение атрибута в настоящий момент, для него свойственно периодическое изменение (для одних атрибутов — изредка, для других — много раз за секунду; другое дело, что в программах чтения S.M.A.R.T. такое быстрое изменение не отображается). Накапливающее поле — содержит статистику, обычно в нём содержится количество возникновений конкретного события со времени первого запуска диска.
Текущий тип характерен для атрибутов, для которых нет смысла суммировать их предыдущие показания. Например, показатель температуры диска является текущим: его цель — в демонстрации температуры в настоящий момент, а не суммы всех предыдущих температур. Накапливающий тип свойственен атрибутам, для которых весь их смысл заключается в предоставлении информации за весь период «жизни» винчестера. Например, атрибут, характеризующий время работы диска, является накапливающим, т. е. содержит количество единиц времени, отработанных накопителем за всю его историю.
Приступим к рассмотрению атрибутов и их RAW-полей.
Атрибут: 01 Raw Read Error Rate
Тип | текущий, может быть накапливающим для WD и старых Hitachi |
Описание | содержит частоту возникновения ошибок при чтении с пластин |
Для всех дисков Seagate, Samsung (начиная с семейства SpinPoint F1 (включительно)) и Fujitsu 2,5″ характерны огромные числа в этих полях.
Для остальных дисков Samsung и всех дисков WD в этом поле характерен 0.
Для дисков Hitachi в этом поле характерен 0 либо периодическое изменение поля в пределах от 0 до нескольких единиц.
Такие отличия обусловлены тем, что все жёсткие диски Seagate, некоторые Samsung и Fujitsu считают значения этих параметров не так, как WD, Hitachi и другие Samsung. При работе любого винчестера всегда возникают ошибки такого рода, и он преодолевает их самостоятельно, это нормально, просто на дисках, которые в этом поле содержат 0 или небольшое число, производитель не счёл нужным указывать истинное количество этих ошибок.
Таким образом, ненулевой параметр на дисках WD и Samsung до SpinPoint F1 (не включительно) и большое значение параметра на дисках Hitachi могут указывать на аппаратные проблемы с диском. Необходимо учитывать, что утилиты могут отображать несколько значений, содержащихся в поле RAW этого атрибута, как одно, и оно будет выглядеть весьма большим, хоть это и будет неверно (подробности см. ниже).
На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания.
Атрибут: 02 Throughput Performance
Тип | текущий |
Описание | содержит значение средней производительности диска и измеряется в каких-то «попугаях». Обычно его ненулевое значение отмечается на винчестерах Hitachi. На них он может изменяться после изменения параметров ААМ, а может и сам по себе по неизвестному алгоритму |
Параметр не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.
Атрибут: 03 Spin-Up Time
Тип | текущий |
Описание | содержит время, за которое шпиндель диска в последний раз разогнался из состояния покоя до номинальной скорости. Может содержать два значения — последнее и, например, минимальное время раскрутки. Может измеряться в миллисекундах, десятках миллисекунд и т. п. — это зависит от производителя и модели диска |
Время разгона может различаться у разных дисков (причём у дисков одного производителя тоже) в зависимости от тока раскрутки, массы блинов, номинальной скорости шпинделя и т. п.
Кстати, винчестеры Fujitsu всегда имеют единицу в этом поле в случае отсутствия проблем с раскруткой шпинделя.
Практически ничего не говорит о здоровье диска, поэтому при оценке состояния винчестера на параметр можно не обращать внимания.
Атрибут: 04 Number of Spin-Up Times (Start/Stop Count)
Тип | накапливающий |
Описание | содержит количество раз включения диска. Бывает ненулевым на только что купленном диске, находившемся в запаянной упаковке, что может говорить о тестировании диска на заводе. Или ещё о чём-то, мне не известном |
При оценке здоровья не обращайте на атрибут внимания.
Атрибут: 05 Reallocated Sector Count
Тип | накапливающий |
Описание | содержит количество секторов, переназначенных винчестером в резервную область. Практически ключевой параметр в оценке состояния |
Поясним, что вообще такое «переназначенный сектор». Когда диск в процессе работы натыкается на нечитаемый/плохо читаемый/незаписываемый/плохо записываемый сектор, он может посчитать его невосполнимо повреждённым. Специально для таких случаев производитель предусматривает на каждом диске (на каких-то моделях — в центре (логическом конце) диска, на каких-то — в конце каждого трека и т. д.) резервную область. При наличии повреждённого сектора диск помечает его как нечитаемый и использует вместо него сектор в резервной области, сделав соответствующие пометки в специальном списке дефектов поверхности — G-list. Такая операция по назначению нового сектора на роль старого называется remap (ремап) либо переназначение, а используемый вместо повреждённого сектор — переназначенным. Новый сектор получает логический номер LBA старого, и теперь при обращении ПО к сектору с этим номером (программы же не знают ни о каких переназначениях!) запрос будет перенаправляться в резервную область.
Таким образом, хоть сектор и вышел из строя, объём диска не изменяется. Понятно, что не изменяется он до поры до времени, т. к. объём резервной области не бесконечен. Однако резервная область вполне может содержать несколько тысяч секторов, и допустить, чтобы она закончилась, будет весьма безответственно — диск нужно будет заменить задолго до этого.
Кстати, ремонтники говорят, что диски Samsung очень часто ни в какую не хотят выполнять переназначение секторов.
На счёт этого атрибута мнения разнятся. Лично я считаю, что если он достиг 10, диск нужно обязательно менять — ведь это означает прогрессирующий процесс деградации состояния поверхности либо блинов, либо головок, либо чего-то ещё аппаратного, и остановить этот процесс возможности уже нет. Кстати, по сведениям лиц, приближенных к Hitachi, сама Hitachi считает диск подлежащим замене, когда на нём находится уже 5 переназначенных секторов. Другой вопрос, официальная ли эта информация, и следуют ли этому мнению сервис-центры. Что-то мне подсказывает, что нет
Другое дело, что сотрудники сервис-центров могут отказываться признавать диск неисправным, если фирменная утилита производителя диска пишет что-то вроде «S.M.A.R.T. Status: Good» или значения Value либо Worst атрибута будут больше Threshold (собственно, по такому критерию может оценивать и сама утилита производителя). И формально они будут правы. Но кому нужен диск с постоянным ухудшением его аппаратных компонентов, даже если такое ухудшение соответствует природе винчестера, а технология производства жёстких дисков старается минимизировать его последствия, выделяя, например, резервную область?
Атрибут: 07 Seek Error Rate
Тип | текущий |
Описание | содержит частоту возникновения ошибок при позиционировании блока магнитных головок (БМГ) |
Описание формирования этого атрибута почти полностью совпадает с описанием для атрибута 01 Raw Read Error Rate, за исключением того, что для винчестеров Hitachi нормальным значением поля RAW является только 0.
Таким образом, на атрибут на дисках Seagate, Samsung SpinPoint F1 и новее и Fujitsu 2,5″ не обращайте внимания, на остальных моделях Samsung, а также на всех WD и Hitachi ненулевое значение свидетельствует о проблемах, например, с подшипником и т. п.
Атрибут: 08 Seek Time Performance
Тип | текущий |
Описание | содержит среднюю производительность операций позиционирования головок, измеряется в «попугаях». Как и параметр 02 Throughput Performance, ненулевое значение обычно отмечается на дисках Hitachi и может изменяться после изменения параметров ААМ, а может и само по себе по неизвестному алгоритму |
Не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.
Атрибут: 09 Power On Hours Count (Power-on Time)
Тип | накапливающий |
Описание | содержит количество часов, в течение которых винчестер был включён |
Ничего не говорит о здоровье диска.
Атрибут: 10 (0А — в шестнадцатеричной системе счисления) Spin Retry Count
Тип | накапливающий |
Описание | содержит количество повторов запуска шпинделя, если первая попытка оказалась неудачной |
О здоровье диска чаще всего не говорит.
Основные причины увеличения параметра — плохой контакт диска с БП или невозможность БП выдать нужный ток в линию питания диска.
В идеале должен быть равен 0. При значении атрибута, равном 1-2, внимания можно не обращать. Если значение больше, в первую очередь следует обратить пристальное внимание на состояние блока питания, его качество, нагрузку на него, проверить контакт винчестера с кабелем питания, проверить сам кабель питания.
Наверняка диск может стартовать не сразу из-за проблем с ним самим, но такое бывает очень редко, и такую возможность нужно рассматривать в последнюю очередь.
Атрибут: 11 (0B) Calibration Retry Count (Recalibration Retries)
Тип | накапливающий |
Описание | содержит количество повторных попыток сброса накопителя (установки БМГ на нулевую дорожку) при неудачной первой попытке |
Ненулевое, а особенно растущее значение параметра может означать проблемы с диском.
Атрибут: 12 (0C) Power Cycle Count
Тип | накапливающий |
Описание | содержит количество полных циклов «включение-отключение» диска |
Не связан с состоянием диска.
Атрибут: 183 (B7) SATA Downshift Error Count
Тип | накапливающий |
Описание | содержит количество неудачных попыток понижения режима SATA. Суть в том, что винчестер, работающий в режимах SATA 3 Гбит/с или 6 Гбит/с (и что там дальше будет в будущем), по какой-то причине (например, из-за ошибок) может попытаться «договориться» с дисковым контроллером о менее скоростном режиме (например, SATA 1,5 Гбит/с или 3 Гбит/с соответственно). В случае «отказа» контроллера изменять режим диск увеличивает значение атрибута |
Не говорит о здоровье накопителя.
Атрибут: 184 (B8) End-to-End Error
Тип | накапливающий |
Описание | содержит количество ошибок, возникших при передаче данных через кэш винчестера |
Ненулевое значение указывает на проблемы с диском.
Атрибут: 187 (BB) Reported Uncorrected Sector Count (UNC Error)
Тип | накапливающий |
Описание | содержит количество секторов, которые были признаны кандидатами на переназначение (см. атрибут 197) за всю историю жизни диска. Причём если сектор становится кандидатом повторно, значение атрибута тоже увеличивается |
Ненулевое значение атрибута явно указывает на ненормальное состояние диска (в сочетании с ненулевым значением атрибута 197) или на то, что оно было таковым ранее (в сочетании с нулевым значением 197).
Атрибут: 188 (BC) Command Timeout
Тип | накапливающий |
Описание | содержит количество операций, выполнение которых было отменено из-за превышения максимально допустимого времени ожидания отклика |
Такие ошибки могут возникать из-за плохого качества кабелей, контактов, используемых переходников, удлинителей и т. д., а также из-за несовместимости диска с конкретным контроллером SATA/РАТА на материнской плате (либо дискретным). Из-за ошибок такого рода возможны BSOD в Windows.
Ненулевое значение атрибута говорит о потенциальной «болезни» диска.
Атрибут: 189 (BD) High Fly Writes
Тип | накапливающий |
Описание | содержит количество зафиксированных случаев записи при высоте полета головки выше рассчитанной — скорее всего, из-за внешних воздействий, например вибрации |
Для того чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи S.M.A.R.T., которые содержат специфичную для каждого производителя информацию, что на сегодняшний день не реализовано в общедоступном ПО — следовательно, на атрибут можно не обращать внимания.
Атрибут: 190 (BE) Airflow Temperature
Тип | текущий |
Описание | содержит температуру винчестера для дисков Hitachi, Samsung, WD и значение «100 − [RAW-значение атрибута 194]» для Seagate |
Не говорит о состоянии диска.
Атрибут: 191 (BF) G-Sensor Shock Count (Mechanical Shock)
Тип | накапливающий |
Описание | содержит количество критических ускорений, зафиксированных электроникой диска, которым подвергался накопитель и которые превышали допустимые. Обычно это происходит при ударах, падениях и т. п. |
Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т. к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухи.
Вообще срабатывание датчика не является признаком удара. Может расти даже от позиционирования БМГ самим диском, особенно если его не закрепить. Основное назначение датчика — прекратить операцию записи при вибрациях, чтобы избежать ошибок.
Не говорит о здоровье диска.
Атрибут: 192 (С0) Power Off Retract Count (Emergency Retry Count)
Тип | накапливающий |
Описание | для разных винчестеров может содержать одну из следующих двух характеристик: либо суммарное количество парковок БМГ диска в аварийных ситуациях (по сигналу от вибродатчика, обрыву/понижению питания и т. п.), либо суммарное количество циклов включения/выключения питания диска (характерно для современных WD и Hitachi) |
Не позволяет судить о состоянии диска.
Атрибут: 193 (С1) Load/Unload Cycle Count
Тип | накапливающий |
Описание | содержит количество полных циклов парковки/распарковки БМГ. Анализ этого атрибута — один из способов определить, включена ли на диске функция автоматической парковки (столь любимая, например, компанией Western Digital): если его содержимое превосходит (обычно — многократно) содержимое атрибута 09 — счётчик отработанных часов, — то парковка включена |
Не говорит о здоровье диска.
Атрибут: 194 (С2) Temperature (HDA Temperature, HDD Temperature)
Тип | текущий/накапливающий |
Описание | содержит текущую температуру диска. Температура считывается с датчика, который на разных моделях может располагаться в разных местах. Поле вместе с текущей также может содержать максимальную и минимальную температуры, зафиксированные за всё время эксплуатации винчестера |
О состоянии диска атрибут не говорит, но позволяет контролировать один из важнейших параметров. Моё мнение: при работе старайтесь не допускать повышения температуры винчестера выше 50 градусов, хоть производителем обычно и декларируется максимальный предел температуры в 55-60 градусов.
Атрибут: 195 (С3) Hardware ECC Recovered
Тип | накапливающий |
Описание | содержит количество ошибок, которые были скорректированы аппаратными средствами ECC диска |
Особенности, присущие этому атрибуту на разных дисках, полностью соответствуют таковым атрибутов 01 и 07.
Атрибут: 196 (С4) Reallocated Event Count
Тип | накапливающий |
Описание | содержит количество операций переназначения секторов |
Косвенно говорит о здоровье диска. Чем больше значение — тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты.
Этот атрибут непосредственно связан с атрибутом 05. При росте 196 чаще всего растёт и 05. Если при росте атрибута 196 атрибут 05 не растёт, значит, при попытке ремапа кандидат в бэд-блоки оказался софт-бэдом (подробности см. ниже), и диск исправил его, так что сектор был признан здоровым, и в переназначении не было необходимости.
Если атрибут 196 меньше атрибута 05, значит, во время некоторых операций переназначения выполнялся перенос нескольких повреждённых секторов за один приём.
Если атрибут 196 больше атрибута 05, значит, при некоторых операциях переназначения были обнаружены исправленные впоследствии софт-бэды.
Атрибут: 197 (С5) Current Pending Sector Count
Тип | текущий |
Описание | содержит количество секторов-кандидатов на переназначение в резервную область |
Натыкаясь в процессе работы на «нехороший» сектор (например, контрольная сумма сектора не соответствует данным в нём), диск помечает его как кандидат на переназначение, заносит его в специальный внутренний список и увеличивает параметр 197. Из этого следует, что на диске могут быть повреждённые секторы, о которых он ещё не знает — ведь на пластинах вполне могут быть области, которые винчестер какое-то время не использует.
При попытке записи в сектор диск сначала проверяет, не находится ли этот сектор в списке кандидатов. Если сектор там не найден, запись проходит обычным порядком. Если же найден, проводится тестирование этого сектора записью-чтением. Если все тестовые операции проходят нормально, то диск считает, что сектор исправен. (Т. е. был т. н. «софт-бэд» — ошибочный сектор возник не по вине диска, а по иным причинам: например, в момент записи информации отключилось электричество, и диск прервал запись, запарковав БМГ. В итоге данные в секторе окажутся недописанными, а контрольная сумма сектора, зависящая от данных в нём, вообще останется старой. Налицо будет расхождение между нею и данными в секторе.) В таком случае диск проводит изначально запрошенную запись и удаляет сектор из списка кандидатов. При этом атрибут 197 уменьшается, также возможно увеличение атрибута 196.
Если же тестирование заканчивается неудачей, диск выполняет операцию переназначения, уменьшая атрибут 197, увеличивая 196 и 05, а также делает пометки в G-list.
Итак, ненулевое значение параметра говорит о неполадках (правда, не может сказать о том, в само́м ли диске проблема).
При ненулевом значении нужно обязательно запустить в программах Victoria или MHDD последовательное чтение всей поверхности с опцией remap. Тогда при сканировании диск обязательно наткнётся на плохой сектор и попытается произвести запись в него (в случае Victoria 3.5 и опции Advanced remap — диск будет пытаться записать сектор до 10 раз). Таким образом программа спровоцирует «лечение» сектора, и в итоге сектор будет либо исправлен, либо переназначен.
Идёт последовательное чтение с ремапом в Victoria 4.46b
В случае неудачи чтения как с remap, так и с Advanced remap, стоит попробовать запустить последовательную запись в тех же Victoria или MHDD. Учитывайте, что операция записи стирает данные, поэтому перед её применением обязательно делайте бэкап!
Запуск последовательной записи в Victoria 4.46b
Иногда от невыполнения ремапа могут помочь следующие манипуляции: снимите плату электроники диска и почистите контакты гермоблока винчестера, соединяющие его с платой — они могут быть окислены. Будь аккуратны при выполнении этой процедуры — из-за неё можно лишиться гарантии!
Невозможность ремапа может быть обусловлена ещё одной причиной — диск исчерпал резервную область, и ему просто некуда переназначать секторы.
Если же значение атрибута 197 никакими манипуляциями не снижается до 0, следует думать о замене диска.
Атрибут: 198 (С6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)
Тип | текущий |
Описание | означает то же самое, что и атрибут 197, но отличие в том, что данный атрибут содержит количество секторов-кандидатов, обнаруженных при одном из видов самотестирования диска — оффлайн-тестировании, которое диск запускает в простое в соответствии с параметрами, заданными прошивкой |
Параметр этот изменяется только под воздействием оффлайн-тестирования, никакие сканирования программами на него не влияют. При операциях во время самотестирования поведение атрибута такое же, как и атрибута 197.
Ненулевое значение говорит о неполадках на диске (точно так же, как и 197, не конкретизируя, кто виноват).
Атрибут: 199 (С7) UltraDMA CRC Error Count
Тип | накапливающий |
Описание | содержит количество ошибок, возникших при передаче по интерфейсному кабелю в режиме UltraDMA (или его эмуляции винчестерами SATA) от материнской платы или дискретного контроллера контроллеру диска |
В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E компьютера либо плохой контакт в SATA-разъёме на диске или на материнской плате/контроллере.
Ошибки при передаче по интерфейсу и, как следствие, растущее значение атрибута могут приводить к переключению операционной системой режима работы канала, на котором находится накопитель, в режим PIO, что влечёт резкое падение скорости чтения/записи при работе с ним и загрузку процессора до 100% (видно в Диспетчере задач Windows).
В случае винчестеров Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в режим SATA 3 Гбит/с.
Моё мнение: при наличии ошибок — переподключите кабель с обоих концов; если их количество растёт и оно больше 10 — выбрасывайте шлейф и ставьте вместо него новый или снимайте разгон.
Можно считать, что о здоровье диска атрибут не говорит.
Атрибут: 200 (С8) Write Error Rate (MultiZone Error Rate)
Тип | текущий |
Описание | содержит частоту возникновения ошибок при записи |
Ненулевое значение говорит о проблемах с диском — в частности, у дисков WD большие цифры могут означать «умирающие» головки.
Атрибут: 201 (С9) Soft Read Error Rate
Тип | текущий |
Описание | содержит частоту возникновения ошибок чтения, произошедших по вине программного обеспечения |
Влияние на здоровье неизвестно.
Атрибут: 202 (СА) Data Address Mark Error
Тип | неизвестно |
Описание | содержание атрибута — загадка, но проанализировав различные диски, могу констатировать, что ненулевое значение — это плохо |
Атрибут: 203 (CB) Run Out Cancel
Тип | текущий |
Описание | содержит количество ошибок ECC |
Влияние на здоровье неизвестно.
Атрибут: 220 (DC) Disk Shift
Тип | текущий |
Описание | содержит измеренный в неизвестных единицах сдвиг пластин диска относительно оси шпинделя |
Влияние на здоровье неизвестно.
Атрибут: 240 (F0) Head Flying Hours
Тип | накапливающий |
Описание | содержит время, затраченное на позиционирование БМГ. Счётчик может содержать несколько значений в одном поле |
Влияние на здоровье неизвестно.
Атрибут: 254 (FE) Free Fall Event Count
Тип | накапливающий |
Описание | содержит зафиксированное электроникой количество ускорений свободного падения диска, которым он подвергался, т. е., проще говоря, показывает, сколько раз диск падал |
Влияние на здоровье неизвестно.
Подытожим описание атрибутов. Ненулевые значения:
- атрибутов 01, 07, 195 — вызывают подозрения в «болезни» у некоторых моделей дисков;
- атрибутов 10, 11, 188, 196, 199, 202 — вызывают подозрения у всех дисков;
- и, наконец, атрибутов 05, 184, 187, 197, 198, 200 — прямо говорят о неполадках.
При анализе атрибутов учитывайте, что в некоторых параметрах S.M.A.R.T. могут храниться несколько значений этого параметра: например, для предпоследнего запуска диска и для последнего. Такие параметры длиной в несколько байт логически состоят из нескольких значений длиной в меньшее количество байт — например, параметр, хранящий два значения для двух последних запусков, под каждый из которых отводится 2 байта, будет иметь длину 4 байта. Программы, интерпретирующие S.M.A.R.T., часто не знают об этом, и показывают этот параметр как одно число, а не два, что иногда приводит к путанице и волнению владельца диска. Например, «Raw Read Error Rate», хранящий предпоследнее значение «1» и последнее значение «0», будет выглядеть как 65536.
Надо отметить, что не все программы умеют правильно отображать такие атрибуты. Многие как раз и переводят атрибут с несколькими значениями в десятичную систему счисления как одно огромное число. Правильно же отображать такое содержимое — либо с разбиением по значениям (тогда атрибут будет состоять из нескольких отдельных чисел), либо в шестнадцатеричной системе счисления (тогда атрибут будет выглядеть как одно число, но его составляющие будут легко различимы с первого взгляда), либо и то, и другое одновременно. Примерами правильных программ служат HDDScan, CrystalDiskInfo, Hard Disk Sentinel.
Продемонстрируем отличия на практике. Вот так выглядит мгновенное значение атрибута 01 на одном из моих Hitachi HDS721010CLA332 в неучитывающей особенности этого атрибута Victoria 4.46b:
Атрибут 01 в Victoria 4.46b
А так выглядит он же в «правильной» HDDScan 3.3:
Атрибут 01 в HDDScan 3.3
Плюсы HDDScan в данном контексте очевидны, не правда ли?
Если анализировать S.M.A.R.T. на разных дисках, то можно заметить, что одни и те же атрибуты могут вести себя по-разному. Например, некоторые параметры S.M.A.R.T. винчестеров Hitachi после определённого периода неактивности диска обнуляются; параметр 01 имеет особенности на дисках Hitachi, Seagate, Samsung и Fujitsu, 03 — на Fujitsu. Также известно, что после перепрошивки диска некоторые параметры могут установиться в 0 (например, 199). Однако подобное принудительное обнуление атрибута ни в коем случае не будет говорить о том, что проблемы с диском решены (если таковые были). Ведь растущий критичный атрибут — это следствие неполадок, а не причина.
При анализе множества массивов данных S.M.A.R.T. становится очевидным, что набор атрибутов у дисков разных производителей и даже у разных моделей одного производителя может отличаться. Связано это с так называемыми специфичными для конкретного вендора (vendor specific) атрибутами (т. е. атрибутами, используемыми для мониторинга своих дисков определённым производителем) и не должно являться поводом для волнения. Если ПО мониторинга умеет читать такие атрибуты (например, Victoria 4.46b), то на дисках, для которых они не предназначены, они могут иметь «страшные» (огромные) значения, и на них просто не нужно обращать внимания. Вот так, например, Victoria 4.46b отображает RAW-значения атрибутов, не предназначенных для мониторинга у Hitachi HDS721010CLA332:
«Страшные» значения в Victoria 4.46b
Нередко встречается проблема, когда программы не могут считать S.M.A.R.T. диска. В случае исправного винчестера это может быть вызвано несколькими факторами. Например, очень часто не отображается S.M.A.R.T. при подключении диска в режиме AHCI. В таких случаях стоит попробовать разные программы, в частности HDD Scan, которая обладает умением работать в таком режиме, хоть у неё и не всегда это получается, либо же стоит временно переключить диск в режим совместимости с IDE, если есть такая возможность. Далее, на многих материнских платах контроллеры, к которым подключаются винчестеры, бывают не встроенными в чипсет или южный мост, а реализованы отдельными микросхемами. В таком случае DOS-версия Victoria, например, не увидит подключённый к контроллеру жёсткий диск, и ей нужно будет принудительно указывать его, нажав клавишу [Р] и введя номер канала с диском. Часто не читаются S.M.A.R.T. у USB-дисков, что объясняется тем, что USB-контроллер просто не пропускает команды для чтения S.M.A.R.T. Практически никогда не читается S.M.A.R.T. у дисков, функционирующих в составе RAID-массива. Здесь тоже есть смысл попробовать разные программы, но в случае аппаратных RAID-контроллеров это бесполезно.
Если после покупки и установки нового винчестера какие-либо программы (HDD Life, Hard Drive Inspector и иже с ними) показывают, что: диску осталось жить 2 часа; его производительность — 27%; здоровье — 19,155% (выберите по вкусу) — то паниковать не стоит. Поймите следующее. Во-первых, нужно смотреть на показатели S.M.A.R.T., а не на непонятно откуда взявшиеся числа здоровья и производительности (впрочем, принцип их подсчёта понятен: берётся наихудший показатель). Во-вторых, любая программа при оценке параметров S.M.A.R.T. смотрит на отклонение значений разных атрибутов от предыдущих показаний. При первых запусках нового диска параметры непостоянны, необходимо некоторое время на их стабилизацию. Программа, оценивающая S.M.A.R.T., видит, что атрибуты изменяются, производит расчёты, у неё получается, что при их изменении такими темпами накопитель скоро выйдет из строя, и она начинает сигнализировать: «Спасайте данные!» Пройдёт некоторое время (до пары месяцев), атрибуты стабилизируются (если с диском действительно всё в порядке), утилита наберёт данных для статистики, и сроки кончины диска по мере стабилизации S.M.A.R.T. будут переноситься всё дальше и дальше в будущее. Оценка программами дисков Seagate и Samsung — вообще отдельный разговор. Из-за особенностей атрибутов 1, 7, 195 программы даже для абсолютно здорового диска обычно выдают заключение, что он завернулся в простыню и ползёт на кладбище.
Обратите внимание, что возможна следующая ситуация: все атрибуты S.M.A.R.T. — в норме, однако на самом деле диск — с проблемами, хоть этого пока ни по чему не заметно. Объясняется это тем, что технология S.M.A.R.T. работает только «по факту», т. е. атрибуты меняются только тогда, когда диск в процессе работы встречает проблемные места. А пока он на них не наткнулся, то и не знает о них и, следовательно, в S.M.A.R.T. ему фиксировать нечего.
Таким образом, S.M.A.R.T. — это полезная технология, но пользоваться ею нужно с умом. Кроме того, даже если S.M.A.R.T. вашего диска идеален, и вы постоянно устраиваете диску проверки — не полагайтесь на то, что ваш диск будет «жить» ещё долгие годы. Винчестерам свойственно ломаться так быстро, что S.M.A.R.T. просто не успевает отобразить его изменившееся состояние, а бывает и так, что с диском — явные нелады, но в S.M.A.R.T. — всё в порядке. Можно сказать, что хороший S.M.A.R.T. не гарантирует, что с накопителем всё хорошо, но плохой S.M.A.R.T. гарантированно свидетельствует о проблемах. При этом даже с плохим S.M.A.R.T. утилиты могут показывать, что состояние диска — «здоров», из-за того, что критичными атрибутами не достигнуты пороговые значения. Поэтому очень важно анализировать S.M.A.R.T. самому, не полагаясь на «словесную» оценку программ.
Хоть технология S.M.A.R.T. и работает, винчестеры и понятие «надёжность» настолько несовместимы, что принято считать их просто расходным материалом. Ну, как картриджи в принтере. Поэтому во избежание потери ценных данных делайте их периодическое резервное копирование на другой носитель (например, другой винчестер). Оптимально делать две резервные копии на двух разных носителях, не считая винчестера с оригинальными данными. Да, это ведёт к дополнительным затратам, но поверьте: затраты на восстановление информации со сломавшегося HDD обойдутся вам в разы — если не на порядок-другой — дороже. А ведь данные далеко не всегда могут восстановить даже профессионалы. Т. е. единственная возможность обеспечить надёжное хранение ваших данных — это делать их бэкап.
Напоследок упомяну некоторые программы, которые хорошо подходят для анализа S.M.A.R.T. и тестирования винчестеров: HDDScan (работает в Windows, бесплатная), CrystalDiskInfo (Windows, бесплатная), Hard Disk Sentinel (платная для Windows, бесплатная для DOS), HD Tune (Windows, платная, есть бесплатная старая версия).
И наконец, мощнейшие программы для тестирования: Victoria (Windows, DOS, бесплатная), MHDD (DOS, бесплатная).
Эта работа была прислана на наш «бессрочный» конкурс статей, однако была снята с конкурса из-за многочисленных заимствований из этой работы.
Доброго времени суток, уважаемые читатели. Идея написать эту статью появилась у меня после того, как мне достался 10GB WesternDigital, сильно убитый (Windows 98 с него загружался около 10 минут, и постоянно включалась проверка диска при запуске компьютера). У владельца этого HDD S.M.A.R.T. был отключен, и поэтому не появлялось сообщения об ошибках. На моем компьютере в конце Post выскакивало сообщение – «Один из атрибутов S.M.A.R.T.(Seek Time Performance, как потом выяснилось) превысил пороговое значение, рекомендуется сделать резервную копию данных» (не помню как это на английском). Дальше компьютер не грузился. Загрузка продолжалась, когда S.M.A.R.T. был отключен в биосе. После отрезания бэдов диск все равно работал плохо. Обнуление атрибутов ни к чему не привело, после 2ой перезагрузки наблюдалась та же картина, вот и пришлось выяснять, что это за атрибут и с чем он связан.
В этой статье я постараюсь описать технологию S.M.A.R.T. – Self-Monitoring, Analysis and Reporting Technology («Технология Самодиагностики, Анализа и Отчета») — в доступной для понимания форме. Конечно, полностью охватить все ее возможности не возможно, т.к. в настоящее время отсутствует какая-либо полная документация по этому вопросу, да и производители накопителей о своих продвижениях в этой области сообщать не спешат.
Что такое S.M.A.R.T.
Итак, S.M.A.R.T. позволяет отслеживать и, самое главное, предсказывать возникновение ошибок, связанных с функционированием HDD, отсюда появляется возможность вовремя сделать резервную копию данных, тем самым избежать морального и материального ущерба от потери информации, ограничившись лишь покупкой нового диска.
S.M.A.R.T. – это набор программ, вшитых в микрокод винчестера. Каждая фирма-производитель дисков ведет свои разработки, отсюда и разнообразие параметров для разных дисков. Однако существуют общие параметры:
- Атрибуты, отражающие общее состояние диска (примерно 30);
- Внутренние тесты (self-tests);
- журналы S.M.A.R.T. (ошибок, общего состояния, дефектных секторов и т.п.).
Полный обязательный перечень S.M.A.R.T атрибутов описан в стандарте ATA/ATAPI-6.
рекомендации
3060 дешевле 30тр цена — как при курсе 68
Выбираем игровой ноут: на что смотреть, на чем сэкономить
3070 Ti дешевле 60 тр — цена как при курсе 65
MSI 3060 Ti Ventus OC за 40 тр
Много 4080 от 100тр — цены в рублях не растут
3070 Gainward Phantom дешевле 50 тр
-7% на ASUS 3050 — дешевле 30 тр
5 видов 4090 в Ситилинке по норм ценам
-19% на 13900KF — цены рухнули
13700K дешевле 40 тр в Регарде
Ищем PHP-программиста для апгрейда конфы
3070 Gigabyte Gaming за 50 тр с началом
13600K дешевле 30 тр в Регарде
3070 дешевле 50 тр в Ситилинке
MSI 3050 за 25 тр в Ситилинке
3060 Gigabyte Gaming за 30 тр с началом
12900K за 40тр с началом в Ситилинке
3060 Ti Gigabyte за 40тр в Регарде
Атрибуты S.M.A.R.T.
Атрибуты S.M.A.R.T. – особые характеристики, которые используются при анализе состояния и запаса производительности накопителя. Они выбираются производителем, основываясь на их способности предсказывать ухудшение рабочих характеристик накопителя или определить его дефектность.
Значения атрибутов (value) используются для представления относительной надежности отдельного эксплуатационного или эталонного атрибута. Допустимое значение атрибута лежит в диапазоне от 1 до 255. Его высокое значение говорит о том, что результат анализа данной рабочей характеристики указывает на низкую вероятность ее ухудшения или выхода накопителя из строя. Соответственно, низкое значение атрибута говорит о том, что результат анализа данной рабочей характеристики указывает на высокую вероятность ее ухудшения или выхода накопителя из строя.
Каждый атрибут имеет собственное пороговое значение (threshold), которое используется для сравнения со значением атрибута (value) и указывает на ухудшение рабочих характеристик или дефектность накопителя. Числовое значение порогового атрибута определяется производителем через конструкционные особенности накопителя и анализ результатов испытаний на надежность. Пороговое значение каждого атрибута указывает на его нижнюю допустимую границу, до которой накопитель нормально функционирует.
Ниже приведено краткое описание основных атрибутов:
Raw Read Error Rate — Частота появления ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине аппаратной части накопителя.
Throughput Performance — Средняя производительность (пропускная способность) диска. Уменьшение значения value этого атрибута с большой вероятностью указывает на проблемы в накопителе.
Spin Up Time — Время раскрутки шпинделя. Среднее время раскрутки шпинделя диска от 0 RPM до рабочей скорости.
Start/Stop Count — Количество циклов запуск/останов шпинделя. Хранит общее количество включений/выключений диска.
Reallocated Sectors Count — Количество переназначенных секторов. Когда жесткий диск встречает ошибку чтения/записи/верификации, он пытается переместить данные в специальную резервную область (spare area) и, в случае успеха, помечает сектор как «переназначенный». Также, этот процесс называют remapping, а переназначенный сектор — remap. Благодаря этой возможности, на современных жестких дисках очень редко видны (при тестировании поверхности) так называемые bad block. Однако, при большом количестве ремапов, на графике чтения с поверхности будут заметны «провалы» — резкое падение скорости чтения (до 10% и более).
Seek Error Rate — Частота появления ошибок позиционирования МГ (магнитной головки). В случае сбоя в механической системе позиционирования, повреждения сервометок (servo), сильного термического расширения дисков и т.п. возникают ошибки позиционирования. Чем их больше, тем хуже состояние механики и/или поверхности жесткого диска.
Seek Time Performance — Средняя производительность операций позиционирования МГ. Данный параметр показывает среднюю скорость позиционирования привода МГ на указанный сектор. Снижение значения этого атрибута говорит о неполадках в механике привода.
Power-On Hours — Количество отработанных часов во включенном состоянии. Значение value этого атрибута показывает количество часов (минут, секунд — в зависимости от производителя), отработанных жестким диском. Снижение значения атрибута до критического уровня (threshold) указывает на выработку диском ресурса. На практике, даже падение этого атрибута до нулевого значения не всегда указывает на реальное исчерпывание ресурса и накопитель может продолжать нормально функционировать.
Spin Retry Count — Количество повторов попыток старта шпинделя диска. Данный атрибут фиксирует общее количество попыток раскрутки шпинделя и его выхода на рабочую скорость, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода.
Recalibration Retries — Количество повторов попыток рекалибровки накопителя. Данный атрибут фиксирует общее количество попыток сброса состояния накопителя и установки головок на нулевую дорожку, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода.
Device Power Cycle Count — Количество полных циклов запуска/останова жесткого диска.
Soft Read Error Rate — Частота появления «программных» ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине программного обеспечения, а не аппаратной части накопителя.
Load/Unload Cycle Count — Количество циклов вывода МГ в специальную парковочную зону/в рабочее положение.
Temperature — Температура. Данный параметр отражает показание встроенного температурного сенсора в градусах Цельсия.
Reallocation Event Count — Количество операций переназначения (ремаппинга). Показывает общее количество попыток переназначения сбойных секторов в резервную область, предпринятых накопителем. При этом, учитываются как успешные, так и неудачные операции.
Current Pending Sector Count — Текущее количество нестабильных секторов. Показывает общее количество секторов, которые накопитель в данный момент считает претендентами на переназначение в резервную область (remap). Если в дальнейшем какой-то из этих секторов будет прочитан успешно, то он исключается из списка претендентов. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить данные и перенести их в резервную область, а сам сектор пометить как переназначенный (remapped).
Uncorrectable Sector Count — Количество нескорректированных ошибок. Атрибут показывает общее количество ошибок, возникших при чтении/записи сектора, которые не удалось скорректировать. Рост значения в поле raw value этого атрибута указывает на явные дефекты поверхности и/или проблемы в работе механики накопителя.
UltraDMA CRC Error Count — Общее количество ошибок CRC в режиме UltraDMA, содержит количество ошибок, возникших в режиме передачи данных UltraDMA в контрольной сумме (ICRC — Interface CRC). В большинстве случаев ошибки CRC возникают при сильном завышении частоты PCI (больше номинальных 33.3 MHz), сильно перекрученом кабеле, а также — по вине драйверов ОС, которые не соблюдают требований к передачи/приему данных в режимах UltraDMA.
Write Error Rate — Частота появления ошибок при записи данных. Показывает общее количество ошибок, обнаруженных во время записи сектора. Чем ниже значение value, тем хуже состояние поверхности диска и/или механики привода.
Disk Shift — Сдвиг пакета дисков относительно оси шпинделя.
G-Sense Error Rate — Частота появления ошибок в результате ударных нагрузок. Данный атрибут хранит показания ударочувствительного сенсора — общее количество ошибок, возникших в результате полученных накопителем внешних ударных нагрузок (при падении, неправильной установке, и т.п.).
Здесь приведены атрибуты, с помощью которых можно определить надежность функционирования диска. Остальные же не представляют практической важности.
Автономное сканирование поверхности (off-line read scanning).
Большинство накопителей обеспечивают поддержку автономного сканирования поверхности, которое является одной из функций подпрограммы автономного сбора данных о состоянии накопителя (off-line data collection). При выполнении этой функции, накопитель выполняет полное сканирование поверхности путем чтения каждого сектора с замещением ненадежных секторов на запасные из резервной области (spare area) для предотвращения потери пользовательских данных.
Примечание! Если во время выполнения сканирования накопитель получает команду по интерфейсу, то процесс сканирования прерывается и накопитель приступает к обработке поступившей команды. При этом гарантируется максимальное время реагирования на поступившую команду — до 2 секунд.
Встроенные функции самоконтроля (self-test)
Практически с момента появления стандарта S.M.A.R.T. II, в большинстве накопителей появилась новая функция — внутренняя диагностика и самоконтроль, для углубленного контроля состояния механики накопителя, поверхности дисков и т.п. Для запуска этой функции, в набор команд S.M.A.R.T. была введена новая команда — SMART EXECUTE OFF-LINE IMMEDIATE. Результат работы сохраняется либо в специализированных атрибутах, либо отдельным параметром среди других данных в атрибутах
После выполнения теста, накопитель в обязательном порядке обновляет показания во всех атрибутах и других параметрах. Если во время выполнения внутреннего теста накопитель получит по интерфейсу новую команду, то выполнение теста прерывается и накопитель приступает к обработке поступившей команды.
Методы тестирования.
Существует два способа запуска тестов S.M.A.R.T.: автономный (off-line) или монопольный (captive). Результат теста всегда сохраняется накопителем в данных S.M.A.R.T.
При автономном запуске накопитель сообщает о успешном завершении команды до ее фактического исполнения и только после этого выполняет тест. При этом, по интерфейсу флаг «занято» (busy) не выставляется и накопитель в любой момент готов приступить к выполнению очередной интерфейсной команды, приостанавливая работу теста. Фактически, тест выполняется в фоновом режиме.
При запуске теста в монопольном режиме, по интерфейсу выставляется флаг «занято» (busy) и накопитель начинает непосредственное выполнение теста в режиме реального времени. Любая интерфейсная команда во время выполнения этого теста приведет к его прерыванию и остановке, после чего накопитель приступит к обработке поступившей команды.
Монитор параметров S.M.A.R.T. программа SIGuardian.
Существует большое количество программ, контролирующих SMART, это может быть специально направленная программа (Drive Health, SIGuardian), или программа, содержащая контроль параметров SMART как дополнительную функцию. На мой взгляд, наиболее функциональной является SIGuardian (http://www.siguardian.ru/). Программа предоставляет возможность следить за практически всеми атрибутами SMART, имеет приятный интерфейс, и обладает большим количеством настроек.
Общие сведения о дисках.
Рис. 1
Рис. 2
Закладка «Общие» содержит общую информацию о выбранном жестком диске. В левой половине указаны: технические характеристики, такие как объем диска, количество цилиндров, головок и т.п.; режим работы диска в настоящий момент (PIO, multiword DMA, UDMA); поддерживаемые режимы работы диска (только в Расширенном режиме). В правой половине показывается логотип фирмы-производителя жесткого диска и ниже – общая информация о диске: модель диска, серийный номер диска, дата/ревизия прошивки микропрограммы.
Обратите внимание, на рис. 1 отсутствует показание температуры. Диск достаточно старый и не обладает таким сенсором.
Общие сведения S.M.A.R.T.
Рис. 3.
Закладка «S.M.A.R.T.» показывает общую информацию о состоянии диска на основе S.M.A.R.T. атрибутов или S.M.A.R.T. – информацию:
- Дату начала мониторинга S.M.A.R.T. – т.е. дату, когда вы начали контроль за состоянием диска при помощи SIGuardian. Чаще всего, это дата первого запуска SIGuardian.
- Ближайшую прогнозируемую дату T.E.C. (ThresholdExceedCondition) – т.е. дату, когда по прогнозам SIGuardian один из S.M.A.R.T. атрибутов достигнет порогового (критического) значения.
S.M.A.R.T. подробно
Рис.4.
Закладка «Подробно» предназначена для отображения полной информации о S.M.A.R.T.-атрибутах диска. Она показывает:
- Attribute name – Графическое отображение значения атрибута. При наводке указателя мыши на него показывается в окне всплывающей подсказки более подробное текстовое описание смысла этого атрибута;
- 1/month – скорость падения атрибута – на сколько пунктов в месяц упало значение атрибута. Этот коэффициент вычисляется автоматически при любом изменении атрибутов S.M.A.R.T. для каждого атрибута в отдельности. Вычисление производится ежедневно, поэтому относитесь нормально к колебаниям этого показателя, особенно сразу после изменения атрибута;
- Value – значение атрибута – текущее значение данного атрибута S.M.A.R.T.;
- Threshold – пороговое (критическое) значение атрибута – значение, величину которого производитель жесткого диска считает критической и при достижении которого вполне вероятен выход диска из строя;
- T.E.C. – Threshold Exceeds Condition – предполагаемая дата, когда данный атрибут достигнет порогового значения, иначе говоря, дата возможного выхода из строя диска. Прогноз этой даты делается на основе показателя «скорости падения атрибута», поэтому не удивляйтесь сильным колебаниям даты сразу после изменения атрибутов S.M.A.R.T.;
- Worst – худшее значение атрибута – самое худшее (минимальное) значение, которое данный атрибут принимал за всё время жизни жесткого диска. Может использоваться чисто в ознакомительных целях;
- Raw — «чистое» значение атрибута – просто числовое значение атрибута в чистом, необработанном виде.
Настройки
Рис. 5.
Закладка «Настройка» предназначена для самостоятельной настройки пользователем параметров SIGuardian для работы на компьютере. Если вы не считаете себя опытным пользователем, рекомендуем воспользоваться «Мастером настройки» — он поможет вам выбрать наиболее подходящие параметры работы.
Основные и наиболее важные настройки:
При загрузке проверка и выход – отметьте этот режим, если вы хотите чтобы SIGuardian проверял состояние S.M.A.R.T. только при загрузке операционной системы.
Общие настройки для всех дисков – SIGuardian будет использовать общие настройки для всех дисков в компьютере. Они включают: контроль S.M.A.R.T., период опроса S.M.A.R.T. и адрес электронной почты для сообщений. Вы можете установить общие или индивидуальные для каждого диска параметры.
Включить контроль S.M.A.R.T. – при выключении этого режима SIGuardian не будет проверять этот диск (или все диски) на значения атрибутов S.M.A.R.T.
Режим работы – Обычный или Расширенный – Обычный режим – основной для пользователей. В этом режиме SIGuardian показывает значение атрибута, пороговое значение и T.E.C., скорость падения атрибута. На закладке «Общее» Вы не увидите информации о поддерживаемых диском режимах работы (передачи данных). В расширенном режиме дополнительно показывают Худшее и Чистое (Raw) значение атрибута и полную информацию о диске на закладке «Общее».
Опрос S.M.A.R.T. – установите здесь период опроса S.M.A.R.T. при работе SIGuardian фоном.
Отчеты на e-mail – введите здесь адрес электронной почты, на который SIGuardian должен посылать сообщения. Вы не должны видеть никаких сообщений при работе в этом случае.
WiseControl – информация только о значительных изменениях (ухудшениях) параметров S.M.A.R.T.
Hibernate on overheat temperature – если температура HDD превышает установленное значение, компьютер переходит в режим hibernate.
Кутюгин Игорь.
Ждём Ваших комментариев в специально созданной ветке конференции.
Первую часть этого материала можно прочитать здесь.
Технология S.M.A.R.T. родилась в далеком 1995 году, так что возраст у нее почтенный. Предполагалось, что атрибуты SMART (давайте для простоты писать аббревиатуру без точек), формируемые микропрограммой жесткого диска, позволят программно оценивать состояние накопителя, а также дадут механизм для предсказания выхода его из строя. Последнее в те времена было достаточно актуально: срок жизни дисков в серверах, например, исчислялся годом-полутора, и знать, когда готовить замену, было нелишним.
Со временем многое поменялось: что-то отмерло, какие-то стороны развились сильнее (например, контроль механики диска). Первоначальный набор из десятка простейших атрибутов усложнился и разросся в несколько раз, порой менялся их смысл, многие производители ввели собственные атрибуты с не всегда ясным функционалом. Появилась масса программ для анализа SMART (как правило, невысокого качества, но с эффектным интерфейсом, да еще и за деньги) и т.п.
Так что не мешает описать современное состояние SMART. Начнем с критически важных атрибутов, ухудшение которых почти всегда свидетельствует о проблемах с накопителем. Именно их первым делом смотрят ремонтники при диагностике HDD.
- #01 Raw Read Error Rate — частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска. Для всех дисков Seagate, Samsung (семейства F1 и более новые) и Fujitsu 2,5″ это — число внутренних коррекций данных, проведенных ДО выдачи в интерфейс; на пугающе огромные цифры можно не обращать внимания.
- #03 Spin-Up Time — время раскрутки пакета пластин из состояния покоя до рабочей скорости. Растет при износе механики (повышенное трение в подшипнике и т.п.), также может свидетельствовать о некачественном питании (например, просадке напряжения при старте диска).
- #05 Reallocated Sectors Count — число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор переназначенным и переносит данные в резервную область. Вот почему на современных HDD нельзя увидеть bad-блоки — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, на жаргоне — ремап. Поле Raw Value атрибута содержит общее количество переназначенных секторов. Чем оно больше, тем хуже состояние поверхности диска.
- #07 Seek Error Rate — частота ошибок при позиционировании блока магнитных головок (БМГ). Рост этого атрибута свидетельствует о низком качестве поверхности или о поврежденной механике накопителя. Также может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине).
- #10 Spin-Up Retry Count — число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута растет, то велика вероятность проблем с механикой.
- #196 Reallocation Event Count — число операций переназначения. В поле Raw Value атрибута хранится общее число попыток переноса информации со сбойных секторов в резервную область диска (она, как правило, не слишком велика — несколько тысяч секторов). Учитываются как успешные, так и неудачные операции.
- #197 Current Pending Sector Count — текущее число нестабильных секторов. Здесь хранится число секторов, являющихся кандидатами на замену. Они не были еще определены как плохие, но считывание с них происходит с затруднениями (например, не с первого раза). Если «подозрительный» сектор будет в дальнейшем считываться успешно, то он исключается из числа кандидатов. В случае же повторных ошибочных чтений накопитель попытается восстановить его и выполнить ремап.
- #198 Uncorrectable Sector Count — число секторов, при чтении которых возникают неисправимые (внутренними средствами) ошибки. Рост этого атрибута указывает на серьезные дефекты поверхности или на проблемы с механикой накопителя.
- #220 Disk Shift — сдвиг пакета пластин относительно оси шпинделя. В основном возникает из-за сильного удара или падения диска. Единица измерения неизвестна, но при сильном росте атрибута диск не жилец.
Также следует принимать во внимание и информационные атрибуты, способные много чего поведать об «истории» диска.
- #02 Throughput Performance — средняя производительность диска. Если значение атрибута уменьшается, то велика вероятность, что у накопителя есть проблемы.
- #04 Start/Stop Count — число циклов запуск-остановка шпинделя. У дисков некоторых производителей (например, Seagate) — счетчик включения режима энергосбережения.
- #08 Seek Time Performance — средняя производительность операции позиционирования головок. Снижение значения этого атрибута свидетельствует о неполадках в механике привода головок (в первую очередь о замедленном позиционировании).
- #09 Power-On Hours (POH) — время, проведённое во включенном состоянии. Показывает общее время работы диска, единица измерения зависит от модели (не только 1 час, но и 30 мин, и даже 1 минута).
- #11 Recalibration Retries — число повторов рекалибровки в случае, если первая попытка была неудачной. Рост этого атрибута указывает на проблемы с механикой диска.
- #12 Device Power Cycle Count — число полных циклов включения-выключения диска.
- #13 Soft Read Error Rate — частота появления «программных» ошибок при чтении данных. Сюда можно отнести ошибки программного обеспечения, драйверов, файловой системы, неверную разметку диска — в общем, почти все, что не относится к аппаратной части.
- #190 Airflow Temperature — температура воздуха внутри корпуса HDD. Для дисков Seagate атрибут выдается в нормировке 100º минус температура (тем самым критический нагрев соответствует значению 45), а модели Western Digital используют нормировку 125º минус температура.
- #191 G—sense error rate — число ошибок, возникших из-за внешних нагрузок. Атрибут хранит показания встроенного акселерометра, который фиксирует все удары, толчки, падения и даже неаккуратную установку диска в корпус компьютера.
- #192 Power—off retract count — число зафиксированных повторов включения/выключения питания накопителя.
- #193 Load/Unload Cycle Count — число циклов перемещения БМГ в специальную парковочную зону/в рабочее положение.
- #194 HDA temperature — температура механической части диска, в просторечии банки (HDA — Hard Disk Assembly). Информация снимается со встроенного термодатчика, которым служит одна из магнитных головок, обычно нижняя в банке. В битовых полях атрибута фиксируются текущая, минимальная и максимальная температура. Не все программы, работающие со SMART, правильно разбирают эти поля, так что к их показаниям стоит относиться критично.
- #195 Hardware ECC Recovered — число ошибок, скорректированных аппаратной частью диска. Сюда входят ошибки чтения, ошибки позиционирования, ошибки передачи по внешнему интерфейсу. На дисках с SATA-интерфейсом значение нередко ухудшается при повышении частоты системной шины — SATA очень чувствителен к разгону.
- #199 UltraDMA (Ultra ATA) CRC Error Count — число ошибок, возникающих при передаче данных по внешнему интерфейсу в режиме UltraDMA (нарушения целостности пакетов и т.п.). Рост этого атрибута свидетельствует о плохом (мятом, перекрученном) кабеле и плохих контактах. Также подобные ошибки появляются при разгоне шины PCI, сбоях питания, сильных электромагнитных наводках, а иногда и по вине драйвера.
- #200 Write Error Rate/ Multi-Zone Error Rate — частота появления ошибок при записи данных. Показывает общее число ошибок записи на диск. Чем больше значение атрибута, тем хуже состояние поверхности и механики накопителя.
Как видим, большинство «интересных» атрибутов отражает функционирование механики накопителя. Технология SMART действительно позволяет предсказывать выход диска из строя в результате механических неисправностей, что, по статистике, составляет около 60% всех отказов. Полезен и мониторинг температур: перегрев головок резко ускоряет их деградацию, так что превышение опасного порога (45-55º в зависимости от модели) — сигнал срочно улучшить охлаждение диска.
Вместе с тем не следует переоценивать возможности SMART. Современные диски нередко «дохнут» на фоне отличных атрибутов, что связано с тонкими процессами дефект-менеджмента в условиях высокой плотности записи и не всегда, мягко говоря, качественных компонентов (разнобой в отдаче головок сегодня — обычное дело). Тем более SMART не способен предсказать последствия таких «форс-мажоров», как скачок напряжения, перегрев платы электроники или повреждение накопителя от удара.
Практически у всех атрибутов наибольший интерес представляет поле Raw Value: «сырые» значения наиболее информативны. Их нормировка (степень приближения к абстрактному порогу) часто ничего не дает и только запутывает дело. Поэтому и программы, полагающиеся на эти проценты, нельзя считать вполне надежными. Типичный случай для них — ложные тревоги. Программа сообщает, что новый, недавно установленный накопитель того и гляди «склеит ласты». А все дело в том, что в начале эксплуатации некоторые атрибуты SMART быстро меняются и примитивная экстраполяция приводит к пугающим пользователя прогнозам.
Я советую бесплатную программу HDDScan — она корректно понимает все атрибуты, в том числе и новые, правильно разбирает температурные показатели. Отчет выводится в виде аккуратной xml-таблицы с цветовой индикацией, которую можно сохранить или распечатать.
SMART диска WD пятилетнего возраста. О его близкой кончине свидетельствуют ненулевые значения атрибутов 1 и 200 (для WD они особенно чреваты), а также тот факт, что после ремапа атрибут 197 снова растет. Это значит, что возможности исправления дефектов исчерпаны
Крайне полезна у HDDScan возможность считывать SMART у внешних накопителей, столь распространенных сегодня. Практически ни одна другая программа этого не умеет, ведь на пути данных стоит контроллер, преобразующий интерфейс PATA/SATA в USB или FireWire. Автор целенаправленно работал в этом направлении, и ему удалось охватить широкий спектр контроллеров. Не забыты и диски с интерфейсом SCSI, до сих пор широко применяемые в серверах (атрибуты у них особые — например, выводится общее число записанных или считанных байтов за всю жизнь накопителя).
Функционал HDDScan полностью отвечает потребностям ремонтника. Когда первичную диагностику принесенного внешнего диска можно провести, не разбирая корпус, — это удобно, экономит время, а порой и сохраняет гарантию.
SMART, снятый со SCSI-диска. Здесь исторически сложились совсем другие атрибуты
⇡#Барьеры HDD
Механика давно стала ахиллесовой пятой HDD, и даже не столько из-за чувствительности к ударам и вибрации (это еще можно компенсировать), сколько из-за медлительности. Самые быстрые «дерганья» блоком магнитных головок (2-3 мс у лучших серверных моделей) в тысячи раз уступают скоростям электроники.
И принципиально ничего тут не улучшишь. Поднимать скорость вращения пакета дисков некуда, 15000 об./мин уже предел. Японцы несколько лет назад подступались к 20000 об./мин (вполне гироскопная скорость), но в итоге отказались — не выдерживают материалы, конструкция получается слишком дорогая и для массового производства слабо пригодная. В малых же сериях винчестеры выйдут золотыми, такие никто не купит — это не гироскопы, которые заменить нечем.
Выходит, уткнулись в барьер. Механику на кривой козе не объедешь. Единственный выход — поднимать плотность записи, поперечную и продольную. Продольная плотность (вдоль дорожки) влияет на производительность накопителя, т.е. на поток данных к остальным узлам компьютера. Но все равно, даже достигнутые 100-130 Мбайт/с — это для нынешних компьютеров слишком мало. Например, рядовая оперативная память (DRAM) имеет реальную производительность около 3 Гбайт/с, а кеш процессора — еще больше. Разница на порядки, и она сильно сказывается на общем быстродействии. Конечно, никто не требует от энергонезависимого накопителя, емкость которого в сотни раз превышает DRAM, такой же производительности. Но даже простое удвоение было бы заметно любому пользователю.
Поперечная плотность записи — это густота дорожек на пластине, в современных HDD она превышает 10000 на 1 миллиметр. Получается, что сама дорожка имеет ширину менее 100 нм (между прочим, нанотехнологии в чистом виде). Это позволяет резко поднять емкость в расчете на одну поверхность, а также ускоряет позиционирование за счет изощренных алгоритмов (их разработка потянула бы на пару докторских диссертаций).
Как итог, за последние годы емкость и производительность HDD значительно выросли. Все это стало возможным благодаря технологии перпендикулярной записи, которая существует уже более 20 лет, но до массового внедрения дозрела только в 2007 году. Причем емкость тогда выросла даже сильнее, чем требуется: первые терабайтные диски встретили вялый отклик пользователей. Народ просто не понимал, куда приспособить таких монстров, тем более что они поначалу строились на пяти пластинах, были капризными, шумными и горячими (речь о тогдашних флагманах Hitachi).
Потом, конечно, люди разобрались, торренты заработали в полную силу, да и количество пластин поуменьшилось. В то же время плотность записи выросла до 500-750 Гбайт на пластину (имеются в виду диски настольного сегмента с форм-фактором 3,5″). Вот-вот в массовое производство пойдут терабайтные пластины, что даст возможность выпустить винчестеры объемом до 4 Тбайт (больше четырех пластин в стандартном корпусе высотой 26,1 мм не уместить; хитачевские пятипластинные первенцы большого развития не получили).
Трехтерабайтный диск WD Caviar Green WD30EZRX, наиболее емкий на сегодня. Имеет четырехпластинный дизайн, выпускается ровно год (с 20 октября 2010 г.). Как полагается, весной и летом дешевел, но в последние дни резко подорожал из-за наводнения в Таиланде (там расположены сборочные заводы WD, и стихия блокировала подвоз комплектующих)
Увы, скорость позиционирования выросла, мягко говоря, несильно, а у массовых моделей так вообще осталась на прежнем уровне, а то и упала в угоду… тишине. Маркетологи доказали, что потребитель голосует кошельком за гигабайты в расчете на один доллар, а не за миллисекунды доступа. Поэтому и небыстры дешевые диски по сравнению с породистыми серверными собратьями. Медлительность хорошо проявляется в скорости загрузки ОС, когда надо читать с диска большое количество мелких файлов, разбросанных по пластинам. Здесь главную роль играет скорость вращения шпинделя и мощный привод БМГ, дающий возможность больших ускорений.
Между прочим, «быстрые» диски легко отличить даже на вес — они заметно тяжелее «медленных». Полноразмерная банка с утолщенными стенками, способствующая геометрической стабильности и подавлению вибраций, скоростной шпиндельный двигатель, мощные магниты позиционера, двухслойная крышка повышенной жесткости — все это прибавляет такому накопителю десятки и сотни граммов. Еще больше отрыв в серверных моделях на 15000 об./мин, где пластины уменьшенного размера окружены внушительным объемом литого алюминия, а общий вес «харда» доходит до килограмма.
Высокопроизводительный диск WD Raptor со скоростью вращения шпинделя 10 000 об./мин. При емкости 150 Гбайт весит 740 г (массовые модели той же емкости — 400-500 г). Обратите внимание на размер магнитов и толщину стенок
С удешевлением твердотельных SSD, использующихся, в первую очередь, под операционную систему, нужда в высокопроизводительных HDD стала снижаться, а сами они постепенно выделяются в особый сегмент рынка (такова, например, «черная» серия у WD). Подобными дисками комплектуются профессиональные рабочие станции с ресурсоемкими приложениями, критичными к скорости доступа. Рядовые же пользователи брать достаточно дорогие накопители не торопятся, предпочитая объем производительности.
На другом конце спектра — популярные «зеленые» модели с намеренно замедленным вращением шпинделя (5400-5900 об./мин вместо 7200) и небыстрым позиционированием головок. Дешевые, тихие, холодные и достаточно надежные, эти винчестеры идеально подходят для хранения мультимедийных данных в домашних компьютерах, внешних корпусах и сетевых хранилищах. На наших прилавках все эти Green и LP сильно потеснили другие линейки, так что в мелких «точках» порой ничего больше и не найдешь.
⇡#Расточительность магнитной записи
Намагниченность доменов жесткого диска, как и в середине двадцатого века, меняют с помощью магнитной головки, поле которой возбуждается переменным электрическим током и действует на магнитный слой через зазор. Также эта технология требует быстрого вращения пластин, прецизионного контроля положения головки и т.д. Двигатель и позиционер жесткого диска, а также управляющая ими электроника потребляют заметную мощность, да и стоят немало. Но главное — на само возбуждение магнитного поля тратится очень много энергии.
Расточительность стандартного метода магнитной записи трудно оценить, работая на персональном компьютере. Жесткие диски массовых серий даже при активной работе потребляют менее 10 Вт, что на фоне прочих комплектующих (100 Вт и более) почти незаметно. Но ваши взгляды сразу переменятся после посещения серверной комнаты какого-нибудь крупного банка, а чтобы получить впечатлений на всю оставшуюся жизнь, достаточно подойти к дисковой стойке суперкомпьютера. В шуме сотен и тысяч жестких дисков, обдувающих их вентиляторов и прецизионных кондиционеров становится понятно, сколько энергии в глобальном масштабе тратится на такую работу.
Недаром для систем хранения данных энергоэффективность в списке характеристик выходит на первый план. Вот уже и Google переводит свои дата-центры на баржи в море (вот где настоящие офшоры!). Оказывается, охлаждение СХД забортной водой радикально сокращает операционные затраты, в первую очередь за счет экономии на кондиционерах.
⇡#О питании жестких дисков
Будет ли работать обычная 220-вольтовая лампочка от 230 В? Конечно, будет. А от 240 В? Тоже. Вопрос — сколько она протянет? Понятно, что меньше или существенно меньше — это зависит от конкретной лампочки. Ей суждена яркая, но короткая жизнь.
Примерно та же ситуация и с жесткими дисками. Наивные производители проектировали их, полагаясь на стандартные +5 В и +12 В. Однако в типичном компьютерном блоке питания (БП) стабилизируется лишь линия 5 В. К чему же это приводит?
При высокой нагрузке на процессор (а современные «камни» потребляют немало) и недостаточной мощности БП линия 5 В проседает, и система стабилизации отрабатывает это дело, повышая напряжение до номинального значения. Одновременно повышается и напряжение 12 В (из-за отсутствия стабилизации по нему). В результате и так нестойкий к нагреву HDD работает еще и при повышенном напряжении, которое подается на самые греющиеся узлы — микросхему управления двигателем (на жаргоне ремонтников — «крутилка») и привод головок (т.н. «звуковая катушка»). Итог — смотри рассуждение о лампочке.
Сгоревшая «крутилка» на плате как результат повышенного напряжения и плохого охлаждения. Нередко микросхема сгорает в буквальном смысле, с пиротехническими эффектами и выгоранием дорожек на плате. Такое ремонту не подлежит
Отсюда советы по блоку питания. Чем больше его мощность, тем лучше (в разумных пределах: запас более 30-35% по отношению к реальному потреблению снижает КПД блока, так что вы будете греть комнату). Менее мощный, но фирменный БП лучше более мощного, но безродно-китайского. Помните — разгоняют не только процессоры. В первом приближении, 420 «китайских» ватт эквивалентны 300 «правильным».
По-хорошему, надо бы еще учитывать возраст БП: после 2-3 лет эксплуатации его реальная мощность заметно снижается, а выходные напряжения дрейфуют. Разумеется, в некачественных изделиях, работающих на честном китайском слове, процессы старения выражены гораздо резче. Хорошо еще, если подобный блок тихо умрет сам, а не утащит за собой в агонии половину системного блока!
Максимально допустимым считается 12,6 В (+5% от номинала). Однако у многих дисков c ростом напряжения наблюдается нелинейно-резкий нагрев упомянутых выше узлов — «крутилки» и «катушки». Поэтому я рекомендую строже контролировать БП с помощью внешнего вольтметра (датчики на материнской плате, измеряющие напряжение для BIOS и программ типа AIDA, могут быть весьма неточны).
Измерять напряжение лучше всего на разъемах Molex и обязательно под полной нагрузкой: процессор занят вычислениями с плавающей точкой, видеокарта — выводом динамичной трехмерной графики, а диск — дефрагментацией. При 12,2-12,4 В стоит призадуматься, 12,4-12,6 В — поволноваться, 12,6-13 В — бить тревогу, а в случае 13 В и выше — копить деньги на новый диск или положить гарантийный талон на видное место…
Конденсаторы (2200 мкФ, 25 В), напаянные на цепи питания HDD (желтый провод — +12 В, красный — +5 В, черный — земля). В данном случае они уменьшают пульсации напряжения, от которых блок питания издает раздражающий высокочастотный писк
Если напряжение по линии 12 В сильно завышено, а вы не боитесь паяльника и способны отличить транзистор от диода, то можете включить последний в разрыв питания HDD (напомню, линии 12 В соответствует желтый провод). Диод сыграет роль ограничителя — на его p-n переходе упадут «лишние» 0,2-0,7 В (в зависимости от типа диода), и диску станет полегче. Только диод надо брать достаточно мощный, чтобы он выдерживал пусковой ток в 2-3 А.
И без фанатизма: результирующее напряжение не должно опускаться ниже 11,7 В. В противном случае возможна неустойчивая работа диска (множественные рестарты) и даже порча данных. А некоторые модели (в частности, Seagate 7200.10 и 7200.11) могут вообще не запуститься.
⇡#Миграция с флеш
Память NAND Flash появилась много позднее, чем HDD, и переняла ряд его технологий — взять хотя бы коды ECC. Далее оба направления развивались параллельно и сравнительно независимо. Но в последнее время наметился и обратный процесс: миграция технологий с флеш-памяти на жесткие диски. Конкретно речь идет о выравнивании износа.
Как известно, любой флеш-чип имеет ограниченный ресурс по числу стираний-записей в одну ячейку. В какой-то момент стереть ее уже не удается, и она навсегда застывает с последним записанным значением. Поэтому контроллер считает количество записей в каждую страницу и в случае превышения копирует ее на менее изношенное место. В дальнейшем вся работа ведется с новым участком (этим заведует транслятор), а старая страница остается как есть и не используется. Данная технология получила название Wear Leveling. Так вот, износ есть и в жестких дисках, но там он механический и температурный. Если магнитная головка все время висит над одной дорожкой (скажем, постоянно изменяется тот или иной файл), то растет вероятность повреждения дорожки при случайных толчках или вибрации диска (например, от соседних накопителей в корзине). Головка может коснуться пластины и повредить магнитный слой со всеми вытекающими печальными последствиями. Даже если вредного контакта нет, неподвижная головка локально нагревается и пусть обратимо, но деградирует. Запись в данное место происходит менее надежно, растет вероятность последующего неустойчивого считывания (а при современных огромных плотностях записи любое отклонение параметров губительно).
Эти соображения достаточно очевидны, и прошивка серверных дисков с интерфейсом SCSI/SAS (а они весьма горячи) давно научилась перемещать головки в простое, дабы они не перегревались. Но еще лучше вместе с головкой «перебрасывать» и информацию по пластине — в этом случае описанные эффекты подавляются максимально, а надежность накопителя растет. Вот Western Digital и ввел подобный механизм в новых моделях VelociRaptor. Это дорогие высокопроизводительные диски со скоростью вращения шпинделя 10000 об./мин и пятилетней гарантией, так что Wear Leveling там уместен.
VelociRaptor снаружи и внутри. Привлекает внимание мощный радиатор. Пластины же имеют уменьшенный диаметр — это характерно для современных скоростных дисков.
Кроме того, вся линейка VelociRaptor нацелена на использование в высоконагруженных системах, в первую очередь серверах, где запись на диск ведется очень интенсивно и зачастую в одни и те же файлы (типичный пример — логи транзакций). Массовым «ширпотребным» дискам высокие нагрузки не грозят, греются они тоже умеренно, так что подобный изыск там вряд ли появится. Впрочем, поживем — увидим.
⇡#Аdvanced Format и его применение
Вот уже более 20 лет все жесткие диски имеют одинаковый размер физического сектора: 512 байт. Это минимальная порция записи на диск, позволяющая гибко управлять распределением дискового пространства. Однако с ростом объема HDD все сильнее стали проявляться недостатки такого подхода — в первую очередь неэффективное использование емкости магнитной пластины, а также высокие накладные расходы при организации потока данных.
Поэтому диски большой емкости (терабайт и выше) стали производиться по технологии Advanced Format, которая оперирует «длинными» физическими секторами в 4096 байт. Разметка магнитных пластин под AF весьма выгодна для производителя: меньше межсекторных промежутков, выше полезная емкость дорожки и всей пластины (а это, наряду с магнитными головками, самый дорогой компонент HDD). Именно Advanced Format позволил выпустить на рынок недорогие винчестеры, столь популярные ныне у потребителей аудио- и видеоконтента. AF-дисками емкостью 1-3 Тбайт комплектуются не только компьютеры, но и масса внешних накопителей, сетевых хранилищ и медиаплееров.
Один из первых дисков 3,5″ с Advanced Format, выпущенный в 2009 г
Но даром ничего не дается, новые диски уже начинают приносить в ремонт. Похоже, надежность все-таки просела. Ведь единичный сбой диска или дефект поверхности портит теперь в 8 раз больше данных пользователя, чем обычно. При физическом секторе в 4 Кбайт и эмуляции «коротких» секторов в 512 байт не будет читаться от 1 до 8 секторов. Операционная система на это реагирует понятно как: авария, все пропало! В итоге мелкая проблема на пластинах вырастает для пользователя в зависание или чего еще хуже.
Я считаю, на дисках с AF не стоит держать ОС, прикладные программы и базы данных со множеством мелких файлов. Пока что их удел — мультимедийные данные, некритичные к выпадениям.
⇡#Что стоит почитать о жестких дисках
В первую очередь рекомендую заглянуть на форум HARDW.net. Его раздел «Накопители информации» посещает множество профессиональных ремонтников и энтузиастов (почти 40 тыс. участников). Там можно найти ответы практически по любой теме, связанной с HDD, за исключением самых новых «нераскопанных» моделей. Начните с подраздела «Песочница»: на простые (в понимании профессионалов) вопросы там отвечают подробно и содержательно, а не отшивают, как в других местах, — «несите к ремонтнику».
Еще больше информации, правда, на английском языке, можно найти на портале HDDGURU. Помимо ремонтно-диагностического ПО и статей по отдельным вопросам (например, как поменять головки у диска), там есть международный форум ремонтников, а также огромный архив ресурсов по HDD (firmware, документация, фото и т.п.). Портал прививает широкий взгляд на вещи, он будет интересен подготовленным и мотивированным людям. Во всяком случае, в закрытых конференциях ремонтников ссылки на него пробегают постоянно.
Сошлюсь и на свою статью «Как продлить жизнь жестким дискам» в трех частях. Она дает начальные сведения по обращению с HDD, и хотя написана более трех лет назад, устарела мало — диски за это время принципиально не изменились, разве что стали еще менее надежными из-за свирепой экономии. Производители, застигнутые мировым кризисом, снижали свои затраты по всем направлениям, что и послужило причиной ряда громких провалов 2008-2009 гг. Об одном из них речь пойдет в продолжении этого материала, которое выйдет в ближайшее время.
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
В:
О: S.M.A.R.T. (англ. Self Monitoring Analysing and Reporting Technology) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя. По материалам с сайта wikipedia.org.
В:
О: SMART производит наблюдение за основными характеристиками накопителя, каждая из которых получает оценку. Характеристики можно разбить на две группы:
Данные хранятся в шестнадцатеричном виде называемом «raw value» а потом пересчитывает в «value», значение, символизирующее надёжность относительно некоторого эталонного значения. Обычно «value» располагается в диапазоне от 0 до 100 (некоторые атрибуты имеют значения от 0 до 200 и от 0 до 253). Высокая оценка говорит об отсутствии изменений данного параметра или медленном его ухудшении. Низкая говорит о возможном скором сбое. Значение, меньшее чем минимальное значение, при котором производителем гарантируется безотказная работа накопителя, означает выход узла из строя. Технология SMART позволяет осуществлять:
Следует заметить, что технология SMART позволяет предсказывать выход устройства из строя в результате механических неисправностей, что составляет около 60 % от причин, по которым винчестеры выходят из строя. Предсказать последствия скачка напряжения или повреждения накопителя в результате удара, SMART неспособен. Следует отметить, что накопители НЕ МОГУТ сами сообщать о своем состоянии посредством технологии SMART, для этого существуют специальные программы. Таким образом, использовании технологии SMART немыслимо без двух составляющих:
Программы, отображающие состояние SMART атрибутов, работают по следующему алгоритму:
По материалам с сайта wikipedia.org.
В:
О: Полная таблица всех возможных атрибутов SMART выглядит следующим образом:
По материалам с сайта wikipedia.org. |
0
—
0
Сидит программист за компьютером. Звонок в дверь.
Открывает, а там маленькая Смерть с отверткой.
— Мне рано умирать, я еще молод!
— Не бойся, парень, я за винтом пришла…
Анекдот
Жесткий диск — зверь очень хитрый. Так и норовит куда-то упасть, рассыпать таблицы разделов, забыть пару кластеров, а то и рухнуть всеми 32-мя битами FAT’а на голову несчастному пользователю. В один миг вы можете лишиться всей бесценной, накопленной за долгие годы работы информации. Конечно, можно проклинать судьбу и тщательно затирать свое горе спиртом — но не разумнее ли будет предупредить возможный сбой, нежели надеяться на его величество случай!?
Что такое S.M.A.R.T?
Впервые над этим задумались в 1995 году. Именно тогда инженеры IBM предложили систему предсказания надежности Predictive Failure Analysis. Вся соль технологии состояла в попытке предсказания того самого дня X и времени Ч, когда наш друг-винчестер решит отойти в мир иной. Немногим позже корпорация Compaq в коалиции с Seagate, Quantum и Conner разработали собственную технологию мониторинга состояния жесткого диска. Проект получил название IntelliSafe. Новоиспеченная технология отслеживала ряд критических характеристик диска, сравнивала полученные значения с допустимыми и рапортовала системе в случае опасности.
— DTemp — грамотно, просто и со вкусом |
Еще некоторое время спустя при участии большинства крупных производителей жестких дисков появилась технология S.M.A.R.T. — Self Monitoring Analysing and Reporting Technology (от англ. «технология самодиагностики, анализа и отчета»), в основе которой лежали наработки как IntelliSafe, так и PFA.
Вкратце, технология работает следующим образом. Устройство — дисковый накопитель, в котором реализованы функции S.M.A.R.T., — ведет статистику своих рабочих параметров (количество наработанных часов, время разгона шпинделя, обнаруженные/исправленные ошибки и т.п.). Показания S.M.A.R.T. накапливаются в служебных зонах или в энергонезависимой памяти носителя. На основе этой информации можно судить о состоянии механики, условиях эксплуатации, а также своевременно заметить предаварийное состояние диска. Между тем, необходимо понимать, что технология S.M.A.R.T. не в силах устранить возникшую проблему. Она лишь способна предупредить о возможном крушении диска и последующей за этим потере информации.
В своем развитии технология S.M.A.R.T. прошла три этапа. В первом поколении было реализовано наблюдение лишь за небольшим количеством параметров диска. Никаких самостоятельных действий со стороны накопителя не предусматривалось. Все функции управления ложились на внешние программные утилиты. Строгих спецификаций, четко описывающих стандарт, не было. Как следствие, каждый производитель самостоятельно решал, какие именно показатели надлежит мониторить в каждой конкретной модели дискового накопителя. Только в следующем воплощении S.M.A.R.T. появилась фоновая проверка поверхности в автоматическом режиме и ведение журналов ошибок. Значительно расширился список контролируемых параметров и появилось нечто вроде спецификации, определяющей, какие из этих параметров являются обязательными и критически важными, а какие можно причислить к вспомогательным и необязательным.
Разумно сделать небольшое лирическое отступление и вкратце поведать о такой неотъемлемой части технологии, как «журнал ошибок диска». По спецификации, винчестер сохраняет историю пяти последних ошибок (это число может варьироваться). Кроме того, запоминаются последние пять команд, за которыми, собственно, и последовала каждая из ошибок. Зачем это надо? Дело в том, что журналы ошибок S.M.A.R.T. помогают в деталях воссоздать картину крушения диска. Другой вопрос — кому это надо. Ясное дело — рядовой пользователь слыхом не слыхивал ни об ATA-командах, ни о кодах и расшифровках сбойных ситуаций. Потому расшифровать журнал могут только высококвалифицированные специалисты, которым по гарантии возвращается диск.
Воля случая |
Как известно, жесткий диск — устройство очень хрупкое. Порой падение винчестера даже с небольшой высоты может вызвать внутренние повреждения или клиническую смерть. Такова жизнь, и никто в этом мире не застрахован от роковой случайности… Самым распространенным последствием удара является «шлепок головок». Он происходит, когда энергия удара направлена вертикально или под некоторым углом к горизонтальной плоскости диска. Проще говоря, подобного эффекта можно добиться, если как следует — резко и энергично — потрясти диск вверх-вниз. При особо сильных пертурбациях происходит отрыв магнитной головки от поверхности накопителя, а затем резкий удар о поверхность магнитного диска. Результаты подобных коллизий довольно плачевны. На месте соприкосновения головки с диском появляются поврежденные сектора, и как следствие — теряется бесценная информация. |
Это могут быть как лаборанты на мощностях вендора/дилера/продавца, так и инженеры с завода самого производителя.
Современный этап развития представлен технологией третьего поколения — S.M.A.R.T III. Конечно, спецификация еще далека от совершенства, однако в сравнении с предыдущими версиями она стала значительным шагом вперед. Наглядный пример тому — неумолимая статистика, которая утверждает, что число правильно и своевременно предсказанных сбоев достигло 80%! Важно отметить, что в третьей модификации S.M.A.R.T. появилась функция обнаружения дефектов поверхностии возможность их последующего «прозрачного» восстановления. Выражаясь простыми словами, жесткий диск неспешно сканирует поверхность и при наличии испорченных секторов замещает их на запасные из резервной области. Причем пользователь даже не заметит каких-либо действий со стороны винчестера. Меньше знаешь — крепче спишь!
Атрибуты «умного» диска
Нам уже известно, что S.M.A.R.T. производит наблюдение за основными характеристиками или, как их еще называют, атрибутами винчестера. Каждый атрибут имеет вполне определенное значение — value, которое характеризует собой степень надежности. Обычно эта величина изменяется в диапазоне от 1 до 100. Реже встречаются значения от 1 до 253. Чем выше значение value, тем лучше. Исправный жесткий диск должен выдавать максимум по всем параметрам, а изменяющиеся во времени или уверенно убывающие значения не сулят ничего хорошего. Это в теории. На практике же нужно учитывать, что спецификация универсальна и адаптирована для огромного спектра дисковых накопителей, имеющих разное механическое устройство и электронику. То есть конкретное устройство вполне может иметь средние показатели надежности по всем атрибутам, работая при этом исправно много лет. Поэтому для каждого атрибута принято выбирать минимальное значение (это делает сам производитель), при котором гарантируется безотказная работа данной конкретной модели жесткого диска. Эта величина именуется пороговым значением — threshold.
В настоящий момент официальная документация и подробные описания технологии S.M.A.R.T. журналистам недоступны. В связи с этим отыскать исчерпывающую информацию по всем параметрам S.M.A.R.T. достаточно трудно. Тем не менее мы собрали и систематизировали те из них, которые тем или иным способом стали известны широкой общественности. Полагаю, начать следует с наиболее важных и повсеместно наблюдаемых атрибутов.
* Raw Read Error Rate — частота ошибок при чтении данных с диска.
Частота ошибок чтения информации с диска, происхождение которых обусловлено аппаратной частью жесткого диска.
* Read Channel Margin — запас канала чтения.
Увы, назначение этого атрибута покрыто завесой тайны.
— DriveHealth сочетает в себе массу полезных возможностей. Огорчает лишь то, что за полноценное использование программы разработчик требует пеню |
Доподлинно известно лишь одно — он используется в накопителях производства Maxtor.
* Reallocated Sector Count — число переназначенных секторов.
Когда жесткий диск встречает ошибку чтения/записи, он пытается переместить поврежденные данные в специальную резервную область и, в случае успеха, помечает сектор как переназначенный. Благодаря этой возможности современные жесткие диски способны скрывать незначительное число плохих секторов. Однако при большом количестве переназначенных секторов (до 10% от общего количества секторов и более) наблюдается резкое падение скорости чтения.
* Reallocation Event Count — количество операций переназначения сбойных секторов.
Показывает общее число попыток переназначения сбойных секторов в резервную область диска. При этом учитываются как успешные, так и неудачные операции.
* Seek Error Rate — ошибки позиционирования блока головок.
Ошибки позиционирования возникают при повреждении сервометок, перегреве носителя или в случае сбоя механической системы позиционирования. Большое количество ошибок позиционирования свидетельствует о низком качестве поверхности или поврежденной механике головок носителя.
* Spin Up Time — время раскрутки диска из состояния покоя до рабочей скорости.
Среднее время раскрутки шпинделя диска до рабочей скорости. Предположительно, в поле «value» содержится время в миллисекундах/секундах.
* Spin Retry Count — число повторных попыток раскрутки дисков до рабочей скорости.
Данный атрибут характеризует число попыток раскрутки шпинделя до рабочей скорости, при условии что первая попытка была неудачной. Напомним, что атрибут имеет не прямое значение, а отражает лишь некий сборный параметр надежности по отдельно взятой характеристике. Соответственно, большое значение — значит «хорошо», а маленькое говорит о неполадках в механике привода.
Разобравшись с критически важными атрибутами, поговорим об информационных значениях S.M.A.R.T.
* Current Pending Sector Count — текущее число нестабильных секторов.
Здесь хранится число претендентов на переназначение в резервную область диска. Судьба отдельно взятого сектора, попавшего в этот список, решается следующим образом. Если сектор будет считываться успешно, то он исключается из списка. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить и перенести информацию в резервную область, а сам сектор пометит как переназначенный. Постоянно ненулевое значение этого атрибута говорит о низком качестве поверхности диска.
* Drive Temperature — температура.
Отображает показания встроенного термодатчика.
Анатомия жесткого диска |
Все знают, что такое винчестер. Однако немногие знают, что у него внутри. Позволю себе приоткрыть завесу тайны. Любой винчестер состоит из гермоблока и платы электроники. В гермоблоке размещена вся механика, то есть сами диски, двигатель и магнитные головки по одной на каждый диск. Между тем, дисков, также называемых «блинами», в устройстве может быть несколько. На один блин вмещается до 80 гигабайт (в последних моделях) информации. К примеру, 120-гигабайтный винчестер может состоять из трех дисков по 40 Гб или двух по 60 Гб. В свою очередь, диски собраны в так называемый дисковый пакет. Оный пакет дисков закрепляется на оси шпинделя, в котором, собственно, и находится движок винчестера. Что касается электронной части винчестера… На самом деле, плата электроники современного жесткого диска — это настоящий микрокомпьютер с собственным процессором, памятью, внешними интерфейсами, устройствами ввода/вывода и прочими неотъемлемыми компонентами. Нетрудно догадаться, что основные задачи электроники — это управление механикой диска, а также преобразование магнитных сигналов в цифровые и наоборот. |
Температура имеет огромное влияние на срок службы диска. По непонятным причинам этот атрибут отсутствует у Western Digital.
* Device (Drive) Power Cycle Count — число полных циклов включения-выключения винчестера.
По этому атрибуту можно оценить, как часто использовался диск.
* Power-On Hours — количество наработанных часов.
Поле «value» этого параметра показывает общее время работы диска. В качестве порогового значения выбирается паспортное время наработки на отказ (MTBF — Mean Time Between Failures). Принимая во внимание заоблачно высокие паспортные значения MTBF, маловероятно, что атрибут может достигнуть критического порога.
* Start/Stop Count — число циклов запуск-остановка шпинделя.
Моторчик жесткого диска может пережить определенное — гарантированное производителем — число старт-стопов. Это значение и выбирается в качестве критического порога. Важно сказать, что первые модели дисков со скоростью вращения 7200 оборотов в минуту имели не самый надежный двигатель и, как следствие, частенько выходили из строя.
* G-Sense Error Rate — частота появления ошибок в результате ударных нагрузок.
Хранит показания ударочувствительного сенсора. Точнее, выводит общее количество ошибок, возникших в результате удара, падения или неаккуратной установки диска в корпус компьютера.
* Load-in Friction (HoursTime) — общее время работы головки под влиянием нагрузок.
Предположительно, данный атрибут показывает общее время работы блока головок под воздействием центробежных сил. Не углубляясь в туманные просторы физики, попробую объяснить сей факт на пальцах. На высокой скорости вращения дисков (5000-10000 оборотов в минуту) в накопителе неизбежно возникают центробежные силы. Очевидно, что головка при перемещении по диску также испытывает воздействие этих сил.
* GMR Head Amplitude — амплитуда дрожания головок в рабочем состоянии.
Воздействие центробежной силы приводит к дрожанию головок над поверхностью диска. Высокая амплитуда дрожания может вызвать соприкосновение блока головок с поверхностью. Как следствие — появление поврежденных секторов. Чем меньше амплитуда, тем лучше. Тем не менее, касательно значения, данного атрибутом, все в точности наоборот. Больше — лучше!
* Recalibration Retries — количество повторов рекалибровки.
Характеризует количество попыток установки головок на нулевую дорожку, при условии что первая попытка была неудачной. Значение этого атрибута, меньшее порогового threshold, говорит о неполадках в механике жесткого диска.
* Soft Read Error Rate — частота появления «программных» ошибок при чтении данных с диска.
В переводе на общедоступный язык — параметр информирует нас о программных ошибках чтения данных. К таковым можно отнести ошибки программного обеспечения, драйверов, файловой системы и неверную разметку диска. Словом, почти все, что не относится к аппаратной части винчестера.
* Throughput Performance — средняя производительность диска.
Предположительно, параметр показывает среднюю пропускную способность жесткого диска. Уменьшение значения с некоторой вероятностью указывает на проблемы в накопителе.
* UltraDMA CRC Error Count — общее количество ошибок CRC в режиме UltraDMA.
Выражаясь простым русским языком, атрибут отображает число ошибок контрольной суммы CRC. На практике подобные ошибки появляются при разгоне системы, сильно перекрученном шлейфе, а также по вине драйверов нерадивого Windows.
* Uncorrectable Sector Count — число нескорректированных ошибок.
Этот атрибут информирует нас об ошибках чтения/записи, которые не удалось исправить. Возможной причиной возникновения ошибок подобного рода может быть повреждение поверхности диска.
* Write Error Rate (Multi Zone Error Rate) — частота появления ошибок при записи данных.
Показывает общее число ошибок записи на диск. Чем больше значение, тем хуже состояние поверхности или механики винчестера.
Все происходящие ошибки и изменения параметров заносятся в журналы S.M.A.R.T. При значении атрибута ниже величины порога threshold жесткий диск сиюминутно рапортует о неполадке напрямую в BIOS системы. Затем информация по цепочке передается драйверам Windows, которые и сообщают пользователю о возникшей проблеме.
Защити данные с умом!
Жаль, но встроенными — зачастую скромными — функциями BIOS и операционной системы не отделаешься. Системный драйвер на пару с БИОСом не покажут вам текущую температуру жесткого диска, не сообщат об очередной ошибке чтения и не поведают о количестве переназначенных секторов. Поэтому имеет смысл установить специальные утилиты для чтения показаний атрибутов и содержимого журналов S.M.A.R.T.
Одна из самых простых и несложных программок — DTemp (ищите на нашем диске). Весит она не больше 100 кб, но пользы способна принести на целый гигабайт!
Как и любая другая программа подобного рода, DTemp выводит таблицу со значениями каждого атрибута, величинами критического порога, а также, кроме всего прочего, показывает приблизительную дату того самого «дня X«.
В общем и целом табличный вывод программы расшифровывается следующим образом.
Attribute |
Value |
Threshold |
RAW |
Attribute Flags |
Spin Up Time |
102 |
21 |
000000001612h |
PR SP CR OC |
* Attribute — имя атрибута;
* ID — номер атрибута;
* Value — значение атрибута (чем оно больше — тем супер);
* Threshold — пороговое значение атрибута (если value меньше, чем threshold, готовьтесь к неприятностям);
* Raw — текущее значение атрибута в шестнадцатеричной системе исчисления;
* Type (Flags) — тип атрибута.
Стоит ли говорить, что DTemp следит за температурой вашего диска и в случае перегрева незамедлительно бьет тревогу. Плюс ко всему, эта чудо-программка бесплатна! То бишь, не мудрствуя лукаво, достаем компакт-диск «Игромании», лезем в раздел «По журналу», устанавливаем и наслаждаемся.
По сути дела, возможностей DTemp должно хватить за глаза. Тем не менее, существуют и другие утилиты, достойные нашего пристального внимания. Как вариант, на страже здоровья вашего диска встанет DriveHealth, который по своим возможностям даже несколько превосходит расхваленный выше DTemp. В частности, DriveHealth выводит краткую аннотацию к каждому атрибуту, фиксирует любое изменение состояния диска, следит за температурой винчестера. Словом, целая корзина вкусностей и полезностей. Свежую версию программы можно скачать с сайта разработчика — www.drivehealth.com — или взять с нашего компакта.
Закончить сегодняшнюю статью хочется словами одного небезызвестного телеведущего: «В наши дни надежность ценится все больше. Покупая автомобиль, мы непременно хотим приобрести надежный. Приятно иметь надежных друзей, а директор счастлив, если его работники отличаются надежностью«… Чего уж говорить про жесткие диски?
Терминология |
||
Блок головок — или, попросту, головка жесткого диска. Данные с поверхности диска считываются непосредственно магнитной головкой. Принцип действия головок жесткого диска мало чем отличается от принципа действия головки обычного магнитофона. Действительно, при записи головка создает магнитное поле, за счет чего участок диска намагничивается. При считывании же — наоборот, поле диска возбуждает сигнал в головке. |
Таким образом, ненулевой параметр на дисках WD и Samsung до SpinPoint F1 (невключительно) и большое значение параметра на дисках Hitachi могут указывать на аппаратные проблемы с диском. На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания.
Практически ничего не говорит о здоровье диска. Время разгона может различаться у разных дисков (даже одного и того же производителя) в зависимости от тока раскрутки, массы блинов, номинальной скорости шпинделя и т.п. Винчестеры Fujitsu всегда имеют 1 в этом поле в случае отсутствия проблем с раскруткой шпинделя.
Start/Stop Count
Чем больше это значение, тем хуже состояние поверхности дисков. При достижении определённого порогового значения (например, 10 ремапов) диск нужно обязательно менять, ведь это означает прогрессирующую деградацию состояния поверхности блинов, головок или другие аппаратные проблемы.
Чем их больше, тем хуже состояние механики и/или поверхности жёсткого диска. Также на значение параметра может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине).
На дисках Seagate, Samsung SpinPoint F1 и новее и Fujitsu 2,5″ на значение атрибута можно не обращать внимание, на остальных моделях Samsung, а также на всех WD и Hitachi ненулевое значение свидетельствует об аппаратных проблемах. Для винчестеров Hitachi нормальным значением является только 0.
Power-on Time
В идеале должен быть равен 0. При значении атрибута, равном 1-2, внимания можно не обращать. Если значение больше, в первую очередь следует обратить пристальное внимание на состояние блока питания, его качество, нагрузку на него, проверить контакт винчестера с кабелем питания, проверить сам кабель питания.
Recalibration Retries
UNC Error
Такие ошибки могут возникать из-за плохого качества кабелей, контактов, используемых переходников, удлинителей и т.д., а также из-за несовместимости диска с конкретным контроллером SATA/РАТА. Из-за ошибок такого рода возможны «синие экраны смерти» в Windows. Ненулевое значение атрибута говорит о потенциальной «болезни» диска.
Для того, чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи SMART, которые содержат специфичную для каждого производителя информацию, что на сегодняшний день не реализовано в общедоступном ПО.
Mechanical Shock
Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т.к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухи.
Emergency Retry Count
HDA Temperature
HDD Temperature
Косвенно говорит о здоровье диска. Чем больше значение — тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты.
При ненулевом значении нужно обязательно запустить в программах Victoria или MHDD последовательное чтение всей поверхности с опцией remap. Тогда при сканировании диск обязательно наткнётся на плохой сектор и попытается произвести запись в него (в случае Victoria 3.5 и опции Advanced remap диск будет пытаться записать сектор до 10 раз). Таким образом программа спровоцирует «лечение» сектора, и в итоге он будет либо исправлен, либо переназначен.
В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E либо плохой контакт в SATA-разъёме на диске или на материнской плате/контроллере. Для Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в режим SATA 3 Гбит/с.
Multi-Zone Error Rate
-
vltk
Member
- Звідки: Kyiv
AK_47
У вас проблемы с интерфейсом сигнальным или питания. Сбои контроллера сата на матери очень маловероятны. Установите нормальные сата-6 провода и питания, проверьте плотность вставки разъемов проводов в БП и диск. После этого, для душевного спокойствия, можете сделать полное форматирование диска (часа 3-4) и с большой долей вероятности (если в целом не дохнет мать или проблемы с ее запиткой) у вас будет все хорошо.
-
Caesar
Member
- Звідки: Горішні Плавні — Одеса
Повідомлення
28.02.2019 22:33
AK_47:но у многих все работает хорошо
еще вопрос последний по теме а то минусуют мне..в hd tune ошибок нету при сканировании,вернее битых секторов а вот смарт у меня такой
Оффтоп (поза темою)… у цих багатьох, ймовірно, ревізія 3.0 і останній BIOS 15-го року.
Немає єдиного стандарту SMART — кожний виробник сам вирішує, які і де помилки рахувати, тільки критичні чи некритичні теж. У Seagate на рядки 1, 7, 195 (С3) зазвичай можна не звертати уваги. Але
змініть одиниці у «Функція» — «Додаткові можливості» — «HEX-значення» («Сервис» — «Дополнительно» — «RAW-значения») на «10 [DEC] — 2byte» — тоді усе має стати на свої місця.
побачите в цих рядках по два числа, поточне і попередне, і викладіть новий скрін. Схоже, що не все гаразд з кабелем SATA до цього диску — чи добре вставили?
-
AK_47
Member
- Звідки: Запорожье
Повідомлення
28.02.2019 22:42
Caesar
перепроверю,куплю новые если не поможет
Отправлено спустя 3 минуты 30 секунд:
змініть одиниці у «Функція» — «Додаткові можливості» — «HEX-значення» («Сервис» — «Дополнительно» — «RAW-значения») на «10 [DEC] — 2byte» — тоді усе має стати на свої місця.
не понял где это?
-
Caesar
Member
- Звідки: Горішні Плавні — Одеса
Повідомлення
28.02.2019 23:10
AK_47:
змініть одиниці у «Функція» — «Додаткові можливості» — «HEX-значення» («Сервис» — «Дополнительно» — «RAW-значения») на «10 [DEC] — 2byte» — тоді усе має стати на свої місця.
не понял где это?
CristalDiskInfo
-
AK_47
Member
- Звідки: Запорожье
Повідомлення
28.02.2019 23:41
Caesar
сменил сата кабель с двд ром…питалово ток отстегнул и пристегнул…другой не стал уложенный с хомутов подымать но наверное надо тоже?
в бп просадок нету,спокойно могу стресс тестами нагрузить всю систему..макс что будет это на 12в- 11.9в,на 5в запас еще и никогда ниже не садится…уже и кристал диск инфо обновил до последнего..все так же…
ну и сменил значение
- спойлер
-
Востаннє редагувалось 28.02.2019 23:49 користувачем AK_47, всього редагувалось 2 разів.
-
DarkJoney
Member
- Звідки: Одеса-Відень
Повідомлення
28.02.2019 23:42
Столкнулся со следующем проблемой:
— на моих двух сигейтах (SkyHawk 3TB и на моей Firecuda) изредка растет параметр высокоуровневая запись
и на моей Тошибе MG04ACA600E с момента установки постепенно растет параметр ошибки при ударных нагрузках…
ВД не жалуется, ибо там ничего подобного в смарте нет.
Что делать? Компьютер во время работы никто не двигает, не бьет. Перемещаю только выключенным.
Корпус стоит ровно, вибрации на корпусе нет, сабвуфера рядом тоже нет, все диски прикручены 4 винтами в салазках корпуса. Что может давать увеличение атрибутов в смарте? Неужели пора 690й выкинуть на помойку?
За исключением Firecuda, другой Сигейт и Тошиба работают нормально.
- спойлер
-
Caesar
Member
- Звідки: Горішні Плавні — Одеса
Повідомлення
01.03.2019 08:09
AK_47, не потрібно. Гадаю, що все гаразд. Сумнів виключно тому, що у рядку С3 «Текущее» та «Наихудшее» чомусь надто малий відсоток, самі ж RAW-значення у нормі. В мене зараз ще більші, 2544 і 31899, після 5 років і 25 тисяч годин, утім і модель інша, удвічі менша щільність і менший о’бєм.
DarkJoney, складності перекладу:
189 (BD) High Fly Writes — кількість випадків запису з висотою головки над поверхнею вище розрахункової, не є критичним.
А 191 (BF) G-Sensor Shock Count — лічильник датчику прискорення. Взагалі-то призначений для мобільних пристроїв і примусового паркування.
Обидва можуть спрацьовувати від найменших коливань, інколи аж занадто, навіть від зміни тиску на долю мм.рт.ст. чи температури на 0,1°С, або від руху власних головок з одного кінця диску в інший.
Судячи з кількості паркувань > вимикань — в обох випадках, це реакція на пробудження (старт) інших дисків поряд, після простою.
Або не звертайте уваги, кількість зовсім незначна, або усім вимкніть паркування.
-
AK_47
Member
- Звідки: Запорожье
Повідомлення
01.03.2019 12:31
Caesar
спасибо за помощь,значит не стоит волноваться?
еще когда умер прошлый hdd,в попытках хоть как-то его оживить и увидеть признаки жизни от него на горячую подключал..хотя вроде знаю этого нельзя делать…с hdd мало знаком…не помню в каком разьеме сата на матери это было…могло ли это повлиять на разьем и таким образом теперь на hdd? хотя с ssd все норм абсолютно…тасовал их местами тогда (старый hdd и ssd)
кстате очень тихий хдд,мой прошлый 003 1тб громче этого 003 1тб в раза два был..такое ощущение что в этом нету парковки головок..а том было слышно даже при его простое
-
Caesar
Member
- Звідки: Горішні Плавні — Одеса
Повідомлення
01.03.2019 14:06
AK_47, ні, не бачу підстав.
Взагалі-то, hot swap на SATA передбачений — у BIOS потрібно увімкнути, якщо там є, hot swap, і тоді можна витягати диск 2,5″ із кишені (боксу) як флєшку після «Безопасное отключение». Але не варто це робити з десктопними 3,5″ дисками, вони на подібні пересування не розраховані. Не повинно впливати. Якщо, звичайно, витягували і вставляли з розумом.
Може різні моделі, чи версії. Так, у SMART кількість парковок=вмикань, без простоїв. Можливо, старий був ушкоджений ще до того, як потрапив до Вас, впустили, а підшипники ударів не люблять та починають гудіти або гриміти.
На все добре!
-
Alekseeyyy
Junior
Повідомлення
02.03.2019 01:30
Alekseeyyy:Приветствую. Купили месяц назад HDD Toshiba в Эльдорадо. Так сложилось что только на днях смог его запустить и проверить. в первый же час работы, диск начал щелкать в простое, что насторожило. При проверке выдало вот такой СМАРТ. Я так понимаю много бэд все очень плохо? Это является гарантийным случаем?
- спойлер
- Безымянный.png
Звонили по телефону отказ в гарантии с причиной «Следы удара по корпусу», при том что никаких на момент сдачи вметен не было. Диск еще не забирал. Заменять отказываются. Как бороться с этим безпределом?
- спойлер
-
-
AK_47
Member
- Звідки: Запорожье
Повідомлення
02.03.2019 12:38
Caesar
начал записывать на новый hdd игру,переносить блоки кошелька litecoin на него…(до этого он был пустой)
смарт изменился,все ок?
- спойлер
-
пожалел что взял опять 1тб…почему-то даже не рассматривал 2тб..думал пластин больше,больше шум,время и тд мне и 1тб хватит…тут уже одна гта5 и лайткоин блоки — 150гб
-
Rex
Member
Повідомлення
02.03.2019 13:38
AK_47:смарт изменился,все ок?
Да, все ОК. Этот вопрос обсуждался миллион раз. Атрибуты 01, 07, С3 у дисков Сигейт (в отличии от остальных производителей) показывают космические цифры. Это нормально.
-
Caesar
Member
- Звідки: Горішні Плавні — Одеса
Повідомлення
02.03.2019 15:17
AK_47, я розумію, що після того, що сталось із старим, усе видається підозрілим. Але, справді, усе гаразд.
А варіантів вибору завжди більше, ніж один! Навіть, якщо вибір тільки один, варіантів два — так і ні.
AlekseeyyyПо телефону… можна казати все, що завгодно.
Документ, що диск прийняли (отримали), у Вас є? В ньому який стан на момент прийняття, ушкодження вказані?
-
Alekseeyyy
Junior
Повідомлення
02.03.2019 17:29
В пн пойду забирать. При отправке в квитанции на прием была только такая фраза: Зовнішній вигляд: Следы использывания
-
Caesar
Member
- Звідки: Горішні Плавні — Одеса
Повідомлення
02.03.2019 18:59
Alekseeyyy, вживаний (зношений), сліди вживання і ушкоджений не одне і те саме. Виходить, ніяких ушкоджень не було.
Зробіть собі копію квитанції.
Спробуйте так: обовязково перевіряйте номер, чи не підмінили і не ушкодили його, коли щось не так — доставайте камеру і знімайте. Поки Вам не повернуть Ваш жорсткий диск, у тому ж стані, якому був і офіційний папір, з підписом і печаткою про відмову з вказанням причини відмови — не віддавайте оригінал.
-
DarkJoney
Member
- Звідки: Одеса-Відень
Повідомлення
02.03.2019 20:05
Alekseeyyy
Могу только посочувствовать. Вообще, нужно аккуратно с квитанциями, плюс их сроками и как они принимают, и давить на своем. Когда будете забирать, давите на то,что написано в квитанции приема. Следы удара должны быть на корпусе видны, плюс те внешники, что я сам ронял, у них атрибут G-Shock рос.
-
SaShaDelas
Junior
- Звідки: Черновцы
Повідомлення
05.03.2019 22:17
Добрый вечер
подскажите есть винт Seagate ST2000VM003
в биосе определяется как 0гб в системе 3.9Гб по разному раньше 137гб
Запускается и через пару секунд шпиндель останавливается
Винт не падал, чистил конктакты ластиком
Отправлено спустя 22 минуты 43 секунды:
Поправка, он не останавливает вал, а переодически щелкает и определяется как винт в системе диспечере устройств
Отправлено спустя 5 минут 31 секунду:
После пере подключения дальше останавливает вал Но в системе видно как 3.9Гб и неизвестно остальное смарт и т.д
-
Alekseeyyy
Junior
Повідомлення
06.03.2019 12:01
Был в магазине. На жестком диске оказалась малюсенькая выемка, которую еще нужно постараться найти, сам бы и никогда и не подумал что это след от удара. Доки прилагаю, печати нет, сам еще их не подписывал и не забирал винт. Пробовать отдать в другой сервисный центр или какие-либо другие варианты?
- спойлер
-
-
GDR
Member
- Звідки: Золотоноша
Повідомлення
06.03.2019 18:50
- спойлер
-
Чому S.M.A.R.T показує що з диском все ok, при тому що вже три тижні спостерігаю явні проблеми в роботі HDD: торренти зупиняються і диск D навантажується в 100%, при перенесенні відеофайлів зі смартфона на ПК процес взагалі зупинився і знов пішло навантаж. 100%, при цьому чути регулярний м’який стук? Якщо до HDD не звертатись — він тихенький і навантаження 0. Системний розділ на SSD. Потім протягом двох днів тестив його HDDScan-ом. В перший день бедів не було, на другий день 48%процесу теж були без бедів але з великими відгуками, а потім на 49% пішла навала бедів (див. під спойлер). Кінця тесту я так і не діждався бо 49% показувало 3год.
-
Caesar
Member
- Звідки: Горішні Плавні — Одеса
Повідомлення
07.03.2019 20:50
GDR, не зовсім.
Погляньте уважніше на 199 (С7) UltraDMA CRC Error Count — ростуть помилки обміну по інтерфейсному кабелю SATA:
Неякісний або пошкоджений кабель — тонкий і вузький без засувки (защелки) одразу замініть на товстий широкий з засувкою (защелкою);
Пил, бруд, сміття (волосся ) у роз’ємах, почистіть пензликом, ластиком та протріть контакти спиртом;
Перевірте, чи кінці кабелю вставлені у роз’єми до кінця і щільно — можливо, послаблені та хитаються, або вивернуті від сильного з(пере)гіну.
Розгін шин PCI / PCI-E, частота обміну привязана до одної з цих шин (в залежності від чипсету) — скиньте розгін шини.