Udma crc error rate

Информация о состоянии диска доступна благодаря комплексу технологий, называемых общим именем S.M.A.R.T. Этот комплекс довольно обширен, но мы поговорим о тех его аспектах, которые позволяют посмотреть на атрибуты S.M.A.R.T., отображаемые в какой-либо программе по тестированию винчестера, и понять, что творится с диском.

Современный жёсткий диск — уникальный компонент компьютера. Он уникален тем, что хранит в себе служебную информацию, изучая которую, можно оценить «здоровье» диска. Эта информация содержит в себе историю изменения множества параметров, отслеживаемых винчестером в процессе функционирования. Больше ни один компонент системного блока не предоставляет владельцу статистику своей работы! Вкупе с тем, что HDD является одним из самых ненадёжных компонентов компьютера, такая статистика может быть весьма полезной и помочь его владельцу избежать нервотрёпки и потери денег и времени.

Информация о состоянии диска доступна благодаря комплексу технологий, называемых общим именем S.M.A.R.T. (Self-Monitoring, Analisys and Reporting Technology, т. е. технология самомониторинга, анализа и отчёта). Этот комплекс довольно обширен, но мы поговорим о тех его аспектах, которые позволяют посмотреть на атрибуты S.M.A.R.T., отображаемые в какой-либо программе по тестированию винчестера, и понять, что творится с диском.

Отмечу, что нижесказанное относится к дискам с интерфейсами SATA и РАТА. У дисков SAS, SCSI и других серверных дисков тоже есть S.M.A.R.T., но его представление сильно отличается от SATA/PATA. Да и мониторит серверные диски обычно не человек, а RAID-контроллер, потому про них мы говорить не будем.

Итак, если мы откроем S.M.A.R.T. в какой-либо из многочисленных программ, то увидим приблизительно следующую картину (на скриншоте приведён S.M.A.R.T. диска Hitachi Deskstar 7К1000.С HDS721010CLA332 в HDDScan 3.3):

S.M.A.R.T. в HDDScan 3.3

S.M.A.R.T. в HDDScan 3.3

В каждой строке отображается отдельный атрибут S.M.A.R.T. Атрибуты имеют более-менее стандартизованные названия и определённый номер, которые не зависят от модели и производителя диска.

Каждый атрибут S.M.A.R.T. имеет несколько полей. Каждое поле относится к определённому классу из следующих: ID, Value, Worst, Threshold и RAW. Рассмотрим каждый из классов.

  • ID (может также именоваться Number) — идентификатор, номер атрибута в технологии S.M.A.R.T. Название одного и того же атрибута программами может выдаваться по-разному, а вот идентификатор всегда однозначно определяет атрибут. Особенно это полезно в случае программ, которые переводят общепринятое название атрибута с английского языка на русский. Иногда получается такая белиберда, что понять, что же это за параметр, можно только по его идентификатору.
  • Value (Current) — текущее значение атрибута в попугаях (т. е. в величинах неизвестной размерности). В процессе работы винчестера оно может уменьшаться, увеличиваться и оставаться неизменным. По показателю Value нельзя судить о «здоровье» атрибута, не сравнивая его со значением Threshold этого же атрибута. Как правило, чем меньше Value, тем хуже состояние атрибута (изначально все классы значений, кроме RAW, на новом диске имеют максимальное из возможных значение, например 100).
  • Worst — наихудшее значение, которого достигало значение Value за всю жизнь винчестера. Измеряется тоже в «попугаях». В процессе работы оно может уменьшаться либо оставаться неизменным. По нему тоже нельзя однозначно судить о здоровье атрибута, нужно сравнивать его с Threshold.
  • Threshold — значение в «попугаях», которого должен достигнуть Value этого же атрибута, чтобы состояние атрибута было признано критическим. Проще говоря, Threshold — это порог: если Value больше Threshold — атрибут в порядке; если меньше либо равен — с атрибутом проблемы. Именно по такому критерию утилиты, читающие S.M.A.R.T., выдают отчёт о состоянии диска либо отдельного атрибута вроде «Good» или «Bad». При этом они не учитывают, что даже при Value, большем Threshold, диск на самом деле уже может быть умирающим с точки зрения пользователя, а то и вовсе ходячим мертвецом, поэтому при оценке здоровья диска смотреть стоит всё-таки на другой класс атрибута, а именно — RAW. Однако именно значение Value, опустившееся ниже Threshold, может стать легитимным поводом для замены диска по гарантии (для самих гарантийщиков, конечно же) — кто же яснее скажет о здоровье диска, как не он сам, демонстрируя текущее значение атрибута хуже критического порога? Т. е. при значении Value, большем Threshold, сам диск считает, что атрибут здоров, а при меньшем либо равном — что болен. Очевидно, что при Threshold=0 состояние атрибута не будет признано критическим никогда. Threshold — постоянный параметр, зашитый производителем в диске.
  • RAW (Data) — самый интересный, важный и нужный для оценки показатель. В большинстве случаев он содержит в себе не «попугаи», а реальные значения, выражаемые в различных единицах измерения, напрямую говорящие о текущем состоянии диска. Основываясь именно на этом показателе, формируется значение Value (а вот по какому алгоритму оно формируется — это уже тайна производителя, покрытая мраком). Именно умение читать и анализировать поле RAW даёт возможность объективно оценить состояние винчестера.

Этим мы сейчас и займёмся — разберём все наиболее используемые атрибуты S.M.A.R.T., посмотрим, о чём они говорят и что нужно делать, если они не в порядке.

Аттрибуты S.M.A.R.T.
  01 02 03 04 05 07 08 09 10 11 12 183 184 187 188 189 190
0x 01 02 03 04 05 07 08 09 0A 0B 0C B7 B8 BB BC BD BE
 
  191 192 193 194 195 196 197 198 199 200 201 202 203 220 240 254  
0x BF С0 С1 С2 С3 С4 С5 С6 С7 С8 С9 СА CB DC F0 FE  

Перед тем как описывать атрибуты и допустимые значения их поля RAW, уточню, что атрибуты могут иметь поле RAW разного типа: текущее и накапливающее. Текущее поле содержит значение атрибута в настоящий момент, для него свойственно периодическое изменение (для одних атрибутов — изредка, для других — много раз за секунду; другое дело, что в программах чтения S.M.A.R.T. такое быстрое изменение не отображается). Накапливающее поле — содержит статистику, обычно в нём содержится количество возникновений конкретного события со времени первого запуска диска.

Текущий тип характерен для атрибутов, для которых нет смысла суммировать их предыдущие показания. Например, показатель температуры диска является текущим: его цель — в демонстрации температуры в настоящий момент, а не суммы всех предыдущих температур. Накапливающий тип свойственен атрибутам, для которых весь их смысл заключается в предоставлении информации за весь период «жизни» винчестера. Например, атрибут, характеризующий время работы диска, является накапливающим, т. е. содержит количество единиц времени, отработанных накопителем за всю его историю.

Приступим к рассмотрению атрибутов и их RAW-полей.

Атрибут: 01 Raw Read Error Rate

Тип текущий, может быть накапливающим для WD и старых Hitachi
Описание содержит частоту возникновения ошибок при чтении с пластин

Для всех дисков Seagate, Samsung (начиная с семейства SpinPoint F1 (включительно)) и Fujitsu 2,5″ характерны огромные числа в этих полях.

Для остальных дисков Samsung и всех дисков WD в этом поле характерен 0.

Для дисков Hitachi в этом поле характерен 0 либо периодическое изменение поля в пределах от 0 до нескольких единиц.

Такие отличия обусловлены тем, что все жёсткие диски Seagate, некоторые Samsung и Fujitsu считают значения этих параметров не так, как WD, Hitachi и другие Samsung. При работе любого винчестера всегда возникают ошибки такого рода, и он преодолевает их самостоятельно, это нормально, просто на дисках, которые в этом поле содержат 0 или небольшое число, производитель не счёл нужным указывать истинное количество этих ошибок.

Таким образом, ненулевой параметр на дисках WD и Samsung до SpinPoint F1 (не включительно) и большое значение параметра на дисках Hitachi могут указывать на аппаратные проблемы с диском. Необходимо учитывать, что утилиты могут отображать несколько значений, содержащихся в поле RAW этого атрибута, как одно, и оно будет выглядеть весьма большим, хоть это и будет неверно (подробности см. ниже).

На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания.

Атрибут: 02 Throughput Performance

Тип текущий
Описание содержит значение средней производительности диска и измеряется в каких-то «попугаях». Обычно его ненулевое значение отмечается на винчестерах Hitachi. На них он может изменяться после изменения параметров ААМ, а может и сам по себе по неизвестному алгоритму

Параметр не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.

Атрибут: 03 Spin-Up Time

Тип текущий
Описание содержит время, за которое шпиндель диска в последний раз разогнался из состояния покоя до номинальной скорости. Может содержать два значения — последнее и, например, минимальное время раскрутки. Может измеряться в миллисекундах, десятках миллисекунд и т. п. — это зависит от производителя и модели диска

Время разгона может различаться у разных дисков (причём у дисков одного производителя тоже) в зависимости от тока раскрутки, массы блинов, номинальной скорости шпинделя и т. п.

Кстати, винчестеры Fujitsu всегда имеют единицу в этом поле в случае отсутствия проблем с раскруткой шпинделя.

Практически ничего не говорит о здоровье диска, поэтому при оценке состояния винчестера на параметр можно не обращать внимания.

Атрибут: 04 Number of Spin-Up Times (Start/Stop Count)

Тип накапливающий
Описание содержит количество раз включения диска. Бывает ненулевым на только что купленном диске, находившемся в запаянной упаковке, что может говорить о тестировании диска на заводе. Или ещё о чём-то, мне не известном :)

При оценке здоровья не обращайте на атрибут внимания.

Атрибут: 05 Reallocated Sector Count

Тип накапливающий
Описание содержит количество секторов, переназначенных винчестером в резервную область. Практически ключевой параметр в оценке состояния

Поясним, что вообще такое «переназначенный сектор». Когда диск в процессе работы натыкается на нечитаемый/плохо читаемый/незаписываемый/плохо записываемый сектор, он может посчитать его невосполнимо повреждённым. Специально для таких случаев производитель предусматривает на каждом диске (на каких-то моделях — в центре (логическом конце) диска, на каких-то — в конце каждого трека и т. д.) резервную область. При наличии повреждённого сектора диск помечает его как нечитаемый и использует вместо него сектор в резервной области, сделав соответствующие пометки в специальном списке дефектов поверхности — G-list. Такая операция по назначению нового сектора на роль старого называется remap (ремап) либо переназначение, а используемый вместо повреждённого сектор — переназначенным. Новый сектор получает логический номер LBA старого, и теперь при обращении ПО к сектору с этим номером (программы же не знают ни о каких переназначениях!) запрос будет перенаправляться в резервную область.

Таким образом, хоть сектор и вышел из строя, объём диска не изменяется. Понятно, что не изменяется он до поры до времени, т. к. объём резервной области не бесконечен. Однако резервная область вполне может содержать несколько тысяч секторов, и допустить, чтобы она закончилась, будет весьма безответственно — диск нужно будет заменить задолго до этого.

Кстати, ремонтники говорят, что диски Samsung очень часто ни в какую не хотят выполнять переназначение секторов.

На счёт этого атрибута мнения разнятся. Лично я считаю, что если он достиг 10, диск нужно обязательно менять — ведь это означает прогрессирующий процесс деградации состояния поверхности либо блинов, либо головок, либо чего-то ещё аппаратного, и остановить этот процесс возможности уже нет. Кстати, по сведениям лиц, приближенных к Hitachi, сама Hitachi считает диск подлежащим замене, когда на нём находится уже 5 переназначенных секторов. Другой вопрос, официальная ли эта информация, и следуют ли этому мнению сервис-центры. Что-то мне подсказывает, что нет :)

Другое дело, что сотрудники сервис-центров могут отказываться признавать диск неисправным, если фирменная утилита производителя диска пишет что-то вроде «S.M.A.R.T. Status: Good» или значения Value либо Worst атрибута будут больше Threshold (собственно, по такому критерию может оценивать и сама утилита производителя). И формально они будут правы. Но кому нужен диск с постоянным ухудшением его аппаратных компонентов, даже если такое ухудшение соответствует природе винчестера, а технология производства жёстких дисков старается минимизировать его последствия, выделяя, например, резервную область?

Атрибут: 07 Seek Error Rate

Тип текущий
Описание содержит частоту возникновения ошибок при позиционировании блока магнитных головок (БМГ)

Описание формирования этого атрибута почти полностью совпадает с описанием для атрибута 01 Raw Read Error Rate, за исключением того, что для винчестеров Hitachi нормальным значением поля RAW является только 0.

Таким образом, на атрибут на дисках Seagate, Samsung SpinPoint F1 и новее и Fujitsu 2,5″ не обращайте внимания, на остальных моделях Samsung, а также на всех WD и Hitachi ненулевое значение свидетельствует о проблемах, например, с подшипником и т. п.

Атрибут: 08 Seek Time Performance

Тип текущий
Описание содержит среднюю производительность операций позиционирования головок, измеряется в «попугаях». Как и параметр 02 Throughput Performance, ненулевое значение обычно отмечается на дисках Hitachi и может изменяться после изменения параметров ААМ, а может и само по себе по неизвестному алгоритму

Не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.

Атрибут: 09 Power On Hours Count (Power-on Time)

Тип накапливающий
Описание содержит количество часов, в течение которых винчестер был включён

Ничего не говорит о здоровье диска.

Атрибут: 10 (0А — в шестнадцатеричной системе счисления) Spin Retry Count

Тип накапливающий
Описание содержит количество повторов запуска шпинделя, если первая попытка оказалась неудачной

О здоровье диска чаще всего не говорит.

Основные причины увеличения параметра — плохой контакт диска с БП или невозможность БП выдать нужный ток в линию питания диска.

В идеале должен быть равен 0. При значении атрибута, равном 1-2, внимания можно не обращать. Если значение больше, в первую очередь следует обратить пристальное внимание на состояние блока питания, его качество, нагрузку на него, проверить контакт винчестера с кабелем питания, проверить сам кабель питания.

Наверняка диск может стартовать не сразу из-за проблем с ним самим, но такое бывает очень редко, и такую возможность нужно рассматривать в последнюю очередь.

Атрибут: 11 (0B) Calibration Retry Count (Recalibration Retries)

Тип накапливающий
Описание содержит количество повторных попыток сброса накопителя (установки БМГ на нулевую дорожку) при неудачной первой попытке

Ненулевое, а особенно растущее значение параметра может означать проблемы с диском.

Атрибут: 12 (0C) Power Cycle Count

Тип накапливающий
Описание содержит количество полных циклов «включение-отключение» диска

Не связан с состоянием диска.

Атрибут: 183 (B7) SATA Downshift Error Count

Тип накапливающий
Описание содержит количество неудачных попыток понижения режима SATA. Суть в том, что винчестер, работающий в режимах SATA 3 Гбит/с или 6 Гбит/с (и что там дальше будет в будущем), по какой-то причине (например, из-за ошибок) может попытаться «договориться» с дисковым контроллером о менее скоростном режиме (например, SATA 1,5 Гбит/с или 3 Гбит/с соответственно). В случае «отказа» контроллера изменять режим диск увеличивает значение атрибута

Не говорит о здоровье накопителя.

Атрибут: 184 (B8) End-to-End Error

Тип накапливающий
Описание содержит количество ошибок, возникших при передаче данных через кэш винчестера

Ненулевое значение указывает на проблемы с диском.

Атрибут: 187 (BB) Reported Uncorrected Sector Count (UNC Error)

Тип накапливающий
Описание содержит количество секторов, которые были признаны кандидатами на переназначение (см. атрибут 197) за всю историю жизни диска. Причём если сектор становится кандидатом повторно, значение атрибута тоже увеличивается

Ненулевое значение атрибута явно указывает на ненормальное состояние диска (в сочетании с ненулевым значением атрибута 197) или на то, что оно было таковым ранее (в сочетании с нулевым значением 197).

Атрибут: 188 (BC) Command Timeout

Тип накапливающий
Описание содержит количество операций, выполнение которых было отменено из-за превышения максимально допустимого времени ожидания отклика

Такие ошибки могут возникать из-за плохого качества кабелей, контактов, используемых переходников, удлинителей и т. д., а также из-за несовместимости диска с конкретным контроллером SATA/РАТА на материнской плате (либо дискретным). Из-за ошибок такого рода возможны BSOD в Windows.

Ненулевое значение атрибута говорит о потенциальной «болезни» диска.

Атрибут: 189 (BD) High Fly Writes

Тип накапливающий
Описание содержит количество зафиксированных случаев записи при высоте полета головки выше рассчитанной — скорее всего, из-за внешних воздействий, например вибрации

Для того чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи S.M.A.R.T., которые содержат специфичную для каждого производителя информацию, что на сегодняшний день не реализовано в общедоступном ПО — следовательно, на атрибут можно не обращать внимания.

Атрибут: 190 (BE) Airflow Temperature

Тип текущий
Описание содержит температуру винчестера для дисков Hitachi, Samsung, WD и значение «100 − [RAW-значение атрибута 194]» для Seagate

Не говорит о состоянии диска.

Атрибут: 191 (BF) G-Sensor Shock Count (Mechanical Shock)

Тип накапливающий
Описание содержит количество критических ускорений, зафиксированных электроникой диска, которым подвергался накопитель и которые превышали допустимые. Обычно это происходит при ударах, падениях и т. п.

Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т. к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухи.

Вообще срабатывание датчика не является признаком удара. Может расти даже от позиционирования БМГ самим диском, особенно если его не закрепить. Основное назначение датчика — прекратить операцию записи при вибрациях, чтобы избежать ошибок.

Не говорит о здоровье диска.

Атрибут: 192 (С0) Power Off Retract Count (Emergency Retry Count)

Тип накапливающий
Описание для разных винчестеров может содержать одну из следующих двух характеристик: либо суммарное количество парковок БМГ диска в аварийных ситуациях (по сигналу от вибродатчика, обрыву/понижению питания и т. п.), либо суммарное количество циклов включения/выключения питания диска (характерно для современных WD и Hitachi)

Не позволяет судить о состоянии диска.

Атрибут: 193 (С1) Load/Unload Cycle Count

Тип накапливающий
Описание содержит количество полных циклов парковки/распарковки БМГ. Анализ этого атрибута — один из способов определить, включена ли на диске функция автоматической парковки (столь любимая, например, компанией Western Digital): если его содержимое превосходит (обычно — многократно) содержимое атрибута 09 — счётчик отработанных часов, — то парковка включена

Не говорит о здоровье диска.

Атрибут: 194 (С2) Temperature (HDA Temperature, HDD Temperature)

Тип текущий/накапливающий
Описание содержит текущую температуру диска. Температура считывается с датчика, который на разных моделях может располагаться в разных местах. Поле вместе с текущей также может содержать максимальную и минимальную температуры, зафиксированные за всё время эксплуатации винчестера

О состоянии диска атрибут не говорит, но позволяет контролировать один из важнейших параметров. Моё мнение: при работе старайтесь не допускать повышения температуры винчестера выше 50 градусов, хоть производителем обычно и декларируется максимальный предел температуры в 55-60 градусов.

Атрибут: 195 (С3) Hardware ECC Recovered

Тип накапливающий
Описание содержит количество ошибок, которые были скорректированы аппаратными средствами ECC диска

Особенности, присущие этому атрибуту на разных дисках, полностью соответствуют таковым атрибутов 01 и 07.

Атрибут: 196 (С4) Reallocated Event Count

Тип накапливающий
Описание содержит количество операций переназначения секторов

Косвенно говорит о здоровье диска. Чем больше значение — тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты.

Этот атрибут непосредственно связан с атрибутом 05. При росте 196 чаще всего растёт и 05. Если при росте атрибута 196 атрибут 05 не растёт, значит, при попытке ремапа кандидат в бэд-блоки оказался софт-бэдом (подробности см. ниже), и диск исправил его, так что сектор был признан здоровым, и в переназначении не было необходимости.

Если атрибут 196 меньше атрибута 05, значит, во время некоторых операций переназначения выполнялся перенос нескольких повреждённых секторов за один приём.

Если атрибут 196 больше атрибута 05, значит, при некоторых операциях переназначения были обнаружены исправленные впоследствии софт-бэды.

Атрибут: 197 (С5) Current Pending Sector Count

Тип текущий
Описание содержит количество секторов-кандидатов на переназначение в резервную область

Натыкаясь в процессе работы на «нехороший» сектор (например, контрольная сумма сектора не соответствует данным в нём), диск помечает его как кандидат на переназначение, заносит его в специальный внутренний список и увеличивает параметр 197. Из этого следует, что на диске могут быть повреждённые секторы, о которых он ещё не знает — ведь на пластинах вполне могут быть области, которые винчестер какое-то время не использует.

При попытке записи в сектор диск сначала проверяет, не находится ли этот сектор в списке кандидатов. Если сектор там не найден, запись проходит обычным порядком. Если же найден, проводится тестирование этого сектора записью-чтением. Если все тестовые операции проходят нормально, то диск считает, что сектор исправен. (Т. е. был т. н. «софт-бэд» — ошибочный сектор возник не по вине диска, а по иным причинам: например, в момент записи информации отключилось электричество, и диск прервал запись, запарковав БМГ. В итоге данные в секторе окажутся недописанными, а контрольная сумма сектора, зависящая от данных в нём, вообще останется старой. Налицо будет расхождение между нею и данными в секторе.) В таком случае диск проводит изначально запрошенную запись и удаляет сектор из списка кандидатов. При этом атрибут 197 уменьшается, также возможно увеличение атрибута 196.

Если же тестирование заканчивается неудачей, диск выполняет операцию переназначения, уменьшая атрибут 197, увеличивая 196 и 05, а также делает пометки в G-list.

Итак, ненулевое значение параметра говорит о неполадках (правда, не может сказать о том, в само́м ли диске проблема).

При ненулевом значении нужно обязательно запустить в программах Victoria или MHDD последовательное чтение всей поверхности с опцией remap. Тогда при сканировании диск обязательно наткнётся на плохой сектор и попытается произвести запись в него (в случае Victoria 3.5 и опции Advanced remap — диск будет пытаться записать сектор до 10 раз). Таким образом программа спровоцирует «лечение» сектора, и в итоге сектор будет либо исправлен, либо переназначен.

Идёт последовательное чтение с ремапом в Victoria 4.46b

Идёт последовательное чтение с ремапом в Victoria 4.46b

В случае неудачи чтения как с remap, так и с Advanced remap, стоит попробовать запустить последовательную запись в тех же Victoria или MHDD. Учитывайте, что операция записи стирает данные, поэтому перед её применением обязательно делайте бэкап!

Запуск последовательной записи в Victoria 4.46b

Запуск последовательной записи в Victoria 4.46b

Иногда от невыполнения ремапа могут помочь следующие манипуляции: снимите плату электроники диска и почистите контакты гермоблока винчестера, соединяющие его с платой — они могут быть окислены. Будь аккуратны при выполнении этой процедуры — из-за неё можно лишиться гарантии!

Невозможность ремапа может быть обусловлена ещё одной причиной — диск исчерпал резервную область, и ему просто некуда переназначать секторы.

Если же значение атрибута 197 никакими манипуляциями не снижается до 0, следует думать о замене диска.

Атрибут: 198 (С6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)

Тип текущий
Описание означает то же самое, что и атрибут 197, но отличие в том, что данный атрибут содержит количество секторов-кандидатов, обнаруженных при одном из видов самотестирования диска — оффлайн-тестировании, которое диск запускает в простое в соответствии с параметрами, заданными прошивкой

Параметр этот изменяется только под воздействием оффлайн-тестирования, никакие сканирования программами на него не влияют. При операциях во время самотестирования поведение атрибута такое же, как и атрибута 197.

Ненулевое значение говорит о неполадках на диске (точно так же, как и 197, не конкретизируя, кто виноват).

Атрибут: 199 (С7) UltraDMA CRC Error Count

Тип накапливающий
Описание содержит количество ошибок, возникших при передаче по интерфейсному кабелю в режиме UltraDMA (или его эмуляции винчестерами SATA) от материнской платы или дискретного контроллера контроллеру диска

В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E компьютера либо плохой контакт в SATA-разъёме на диске или на материнской плате/контроллере.

Ошибки при передаче по интерфейсу и, как следствие, растущее значение атрибута могут приводить к переключению операционной системой режима работы канала, на котором находится накопитель, в режим PIO, что влечёт резкое падение скорости чтения/записи при работе с ним и загрузку процессора до 100% (видно в Диспетчере задач Windows).

В случае винчестеров Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в режим SATA 3 Гбит/с.

Моё мнение: при наличии ошибок — переподключите кабель с обоих концов; если их количество растёт и оно больше 10 — выбрасывайте шлейф и ставьте вместо него новый или снимайте разгон.

Можно считать, что о здоровье диска атрибут не говорит.

Атрибут: 200 (С8) Write Error Rate (MultiZone Error Rate)

Тип текущий
Описание содержит частоту возникновения ошибок при записи

Ненулевое значение говорит о проблемах с диском — в частности, у дисков WD большие цифры могут означать «умирающие» головки.

Атрибут: 201 (С9) Soft Read Error Rate

Тип текущий
Описание содержит частоту возникновения ошибок чтения, произошедших по вине программного обеспечения

Влияние на здоровье неизвестно.

Атрибут: 202 (СА) Data Address Mark Error

Тип неизвестно
Описание содержание атрибута — загадка, но проанализировав различные диски, могу констатировать, что ненулевое значение — это плохо

Атрибут: 203 (CB) Run Out Cancel

Тип текущий
Описание содержит количество ошибок ECC

Влияние на здоровье неизвестно.

Атрибут: 220 (DC) Disk Shift

Тип текущий
Описание содержит измеренный в неизвестных единицах сдвиг пластин диска относительно оси шпинделя

Влияние на здоровье неизвестно.

Атрибут: 240 (F0) Head Flying Hours

Тип накапливающий
Описание содержит время, затраченное на позиционирование БМГ. Счётчик может содержать несколько значений в одном поле

Влияние на здоровье неизвестно.

Атрибут: 254 (FE) Free Fall Event Count

Тип накапливающий
Описание содержит зафиксированное электроникой количество ускорений свободного падения диска, которым он подвергался, т. е., проще говоря, показывает, сколько раз диск падал

Влияние на здоровье неизвестно.

Подытожим описание атрибутов. Ненулевые значения:

  • атрибутов 01, 07, 195 — вызывают подозрения в «болезни» у некоторых моделей дисков;
  • атрибутов 10, 11, 188, 196, 199, 202 — вызывают подозрения у всех дисков;
  • и, наконец, атрибутов 05, 184, 187, 197, 198, 200 — прямо говорят о неполадках.

При анализе атрибутов учитывайте, что в некоторых параметрах S.M.A.R.T. могут храниться несколько значений этого параметра: например, для предпоследнего запуска диска и для последнего. Такие параметры длиной в несколько байт логически состоят из нескольких значений длиной в меньшее количество байт — например, параметр, хранящий два значения для двух последних запусков, под каждый из которых отводится 2 байта, будет иметь длину 4 байта. Программы, интерпретирующие S.M.A.R.T., часто не знают об этом, и показывают этот параметр как одно число, а не два, что иногда приводит к путанице и волнению владельца диска. Например, «Raw Read Error Rate», хранящий предпоследнее значение «1» и последнее значение «0», будет выглядеть как 65536.

Надо отметить, что не все программы умеют правильно отображать такие атрибуты. Многие как раз и переводят атрибут с несколькими значениями в десятичную систему счисления как одно огромное число. Правильно же отображать такое содержимое — либо с разбиением по значениям (тогда атрибут будет состоять из нескольких отдельных чисел), либо в шестнадцатеричной системе счисления (тогда атрибут будет выглядеть как одно число, но его составляющие будут легко различимы с первого взгляда), либо и то, и другое одновременно. Примерами правильных программ служат HDDScan, CrystalDiskInfo, Hard Disk Sentinel.

Продемонстрируем отличия на практике. Вот так выглядит мгновенное значение атрибута 01 на одном из моих Hitachi HDS721010CLA332 в неучитывающей особенности этого атрибута Victoria 4.46b:

Атрибут 01 в Victoria 4.46b

Атрибут 01 в Victoria 4.46b

А так выглядит он же в «правильной» HDDScan 3.3:

Атрибут 01 в HDDScan 3.3

Атрибут 01 в HDDScan 3.3

Плюсы HDDScan в данном контексте очевидны, не правда ли?

Если анализировать S.M.A.R.T. на разных дисках, то можно заметить, что одни и те же атрибуты могут вести себя по-разному. Например, некоторые параметры S.M.A.R.T. винчестеров Hitachi после определённого периода неактивности диска обнуляются; параметр 01 имеет особенности на дисках Hitachi, Seagate, Samsung и Fujitsu, 03 — на Fujitsu. Также известно, что после перепрошивки диска некоторые параметры могут установиться в 0 (например, 199). Однако подобное принудительное обнуление атрибута ни в коем случае не будет говорить о том, что проблемы с диском решены (если таковые были). Ведь растущий критичный атрибут — это следствие неполадок, а не причина.

При анализе множества массивов данных S.M.A.R.T. становится очевидным, что набор атрибутов у дисков разных производителей и даже у разных моделей одного производителя может отличаться. Связано это с так называемыми специфичными для конкретного вендора (vendor specific) атрибутами (т. е. атрибутами, используемыми для мониторинга своих дисков определённым производителем) и не должно являться поводом для волнения. Если ПО мониторинга умеет читать такие атрибуты (например, Victoria 4.46b), то на дисках, для которых они не предназначены, они могут иметь «страшные» (огромные) значения, и на них просто не нужно обращать внимания. Вот так, например, Victoria 4.46b отображает RAW-значения атрибутов, не предназначенных для мониторинга у Hitachi HDS721010CLA332:

«Страшные» значения в Victoria 4.46b

«Страшные» значения в Victoria 4.46b

Нередко встречается проблема, когда программы не могут считать S.M.A.R.T. диска. В случае исправного винчестера это может быть вызвано несколькими факторами. Например, очень часто не отображается S.M.A.R.T. при подключении диска в режиме AHCI. В таких случаях стоит попробовать разные программы, в частности HDD Scan, которая обладает умением работать в таком режиме, хоть у неё и не всегда это получается, либо же стоит временно переключить диск в режим совместимости с IDE, если есть такая возможность. Далее, на многих материнских платах контроллеры, к которым подключаются винчестеры, бывают не встроенными в чипсет или южный мост, а реализованы отдельными микросхемами. В таком случае DOS-версия Victoria, например, не увидит подключённый к контроллеру жёсткий диск, и ей нужно будет принудительно указывать его, нажав клавишу [Р] и введя номер канала с диском. Часто не читаются S.M.A.R.T. у USB-дисков, что объясняется тем, что USB-контроллер просто не пропускает команды для чтения S.M.A.R.T. Практически никогда не читается S.M.A.R.T. у дисков, функционирующих в составе RAID-массива. Здесь тоже есть смысл попробовать разные программы, но в случае аппаратных RAID-контроллеров это бесполезно.

Если после покупки и установки нового винчестера какие-либо программы (HDD Life, Hard Drive Inspector и иже с ними) показывают, что: диску осталось жить 2 часа; его производительность — 27%; здоровье — 19,155% (выберите по вкусу) — то паниковать не стоит. Поймите следующее. Во-первых, нужно смотреть на показатели S.M.A.R.T., а не на непонятно откуда взявшиеся числа здоровья и производительности (впрочем, принцип их подсчёта понятен: берётся наихудший показатель). Во-вторых, любая программа при оценке параметров S.M.A.R.T. смотрит на отклонение значений разных атрибутов от предыдущих показаний. При первых запусках нового диска параметры непостоянны, необходимо некоторое время на их стабилизацию. Программа, оценивающая S.M.A.R.T., видит, что атрибуты изменяются, производит расчёты, у неё получается, что при их изменении такими темпами накопитель скоро выйдет из строя, и она начинает сигнализировать: «Спасайте данные!» Пройдёт некоторое время (до пары месяцев), атрибуты стабилизируются (если с диском действительно всё в порядке), утилита наберёт данных для статистики, и сроки кончины диска по мере стабилизации S.M.A.R.T. будут переноситься всё дальше и дальше в будущее. Оценка программами дисков Seagate и Samsung — вообще отдельный разговор. Из-за особенностей атрибутов 1, 7, 195 программы даже для абсолютно здорового диска обычно выдают заключение, что он завернулся в простыню и ползёт на кладбище.

Обратите внимание, что возможна следующая ситуация: все атрибуты S.M.A.R.T. — в норме, однако на самом деле диск — с проблемами, хоть этого пока ни по чему не заметно. Объясняется это тем, что технология S.M.A.R.T. работает только «по факту», т. е. атрибуты меняются только тогда, когда диск в процессе работы встречает проблемные места. А пока он на них не наткнулся, то и не знает о них и, следовательно, в S.M.A.R.T. ему фиксировать нечего.

Таким образом, S.M.A.R.T. — это полезная технология, но пользоваться ею нужно с умом. Кроме того, даже если S.M.A.R.T. вашего диска идеален, и вы постоянно устраиваете диску проверки — не полагайтесь на то, что ваш диск будет «жить» ещё долгие годы. Винчестерам свойственно ломаться так быстро, что S.M.A.R.T. просто не успевает отобразить его изменившееся состояние, а бывает и так, что с диском — явные нелады, но в S.M.A.R.T. — всё в порядке. Можно сказать, что хороший S.M.A.R.T. не гарантирует, что с накопителем всё хорошо, но плохой S.M.A.R.T. гарантированно свидетельствует о проблемах. При этом даже с плохим S.M.A.R.T. утилиты могут показывать, что состояние диска — «здоров», из-за того, что критичными атрибутами не достигнуты пороговые значения. Поэтому очень важно анализировать S.M.A.R.T. самому, не полагаясь на «словесную» оценку программ.

Хоть технология S.M.A.R.T. и работает, винчестеры и понятие «надёжность» настолько несовместимы, что принято считать их просто расходным материалом. Ну, как картриджи в принтере. Поэтому во избежание потери ценных данных делайте их периодическое резервное копирование на другой носитель (например, другой винчестер). Оптимально делать две резервные копии на двух разных носителях, не считая винчестера с оригинальными данными. Да, это ведёт к дополнительным затратам, но поверьте: затраты на восстановление информации со сломавшегося HDD обойдутся вам в разы — если не на порядок-другой — дороже. А ведь данные далеко не всегда могут восстановить даже профессионалы. Т. е. единственная возможность обеспечить надёжное хранение ваших данных — это делать их бэкап.

Напоследок упомяну некоторые программы, которые хорошо подходят для анализа S.M.A.R.T. и тестирования винчестеров: HDDScan (работает в Windows, бесплатная), CrystalDiskInfo (Windows, бесплатная), Hard Disk Sentinel (платная для Windows, бесплатная для DOS), HD Tune (Windows, платная, есть бесплатная старая версия).

И наконец, мощнейшие программы для тестирования: Victoria (Windows, DOS, бесплатная), MHDD (DOS, бесплатная).

Привет. Столкнулся с проблемой на своем компьютере. Он у меня начал постоянно зависать, либо самопроизвольно перезагружаться. Хочу рассказать вам в чем была причина.

Работал себе, работал компьютер, и тут бац — и начались какие-то чудеса – очень часто стал намертво виснуть или самопроизвольно перезагружаться.

Я очень быстро выявил закономерность – зависания происходят в момент интенсивного чтения или записи на жесткий диск. Кроме того, я несколько раз замечал, что при копировании больших файлов, скорость копирования на несколько секунд падает на ноль.

Открыв логи, я обнаружил, целый ворох предупреждений, связанных с жестким диском, что подтвердило мои предположения, что виновником не стабильной работы был жесткий диск.

Предупреждения в логах

Посмотрев SMART, обнаружилась ошибка Ultra DMA CRC. Эта ошибка говорит о том, что контрольная сумма CRC не подтверждается контроллером, т.е. данные искажаются. Причин этому может быть несколько. Самая распространенная – повреждение SATA провода, либо отошедший от разъема провод на жестком диске или материнской плате. Менее распространенные, но всё же часто встречающиеся – неисправный контроллер на диске или материнке.

Ultra DMA CRC Error в SMART

Как вам должно быть понятно из вышенаписанного – в этой ситуации нужно первым делом проверить провод и соединения, и желательно провод заменить.

В моем случае помогла простая замена SATA кабеля.

Как известно SMART не сбрасывается, без перепрошивки, поэтому в показаниях SMART ошибка осталась, но диск начал работать заметно быстрее, стабильнее и главное компьютер больше не виснет и не перезагружается, ни при каких нагрузках на диск.

Если вам не поможет замена кабеля, то можно попробовать подключить винчестер к другому контроллеру. На современных материнских платах, довольно часто производитель ставит дополнительный SATA контроллер, например, какой-нибудь Marvell.

Как правило SATA порты которые управляются дополнительным контроллером покрашены другим цветом, например – 6 черных разъемов и 2 серых, черные будут на другом контроллере.

Sata разъемы

Соответственно, вы можете попробовать подключить диск к другому набору разъемов и проверить его работоспособность.

Если и это не поможет, то нужно проверять диск на другом компьютере, но практически наверняка – конец контроллеру на диске, и диск нужно менять, ну или менять на нем контроллер.

Вышенаписанное – очевидные вещи, но написать о них меня побудило то, что из-за ошибок чтения и записи на НЕ системный диск – Windows зависал, что меня изначально ввело в заблуждение. Я думал, что что-то случилось с материнкой или блоком питания. Но оказалось все гораздо проще.

Этот материал написан посетителем сайта, и за него начислено вознаграждение.

          На моем десктопном компьютере установлен SSD Crucial MX-200  500Gb, на котором установлена операционная система  и игры. 

       Где-то месяц назад игры стали  ужасно лагать, зависали до 5 секунд, играть стало не возможно, компьютер иногда зависал намертво и сам перезапускался. Я начал искать причину, логично, что в первую очередь решил  проверить состояние  SSD Crucial MX-200 по его  SMART. 

рекомендации

-17% на RTX 4070 Ti в Ситилинке

3080 дешевле 70 тр — цены снова пошли вниз

Ищем PHP-программиста для апгрейда конфы

3070 Gainward Phantom дешевле 50 тр

13700K дешевле 40 тр в Регарде

16 видов <b>4070 Ti</b> в Ситилинке — все до 100 тр

3070 Ti дешевле 60 тр в Ситилинке

3070 Gigabyte Gaming за 50 тр с началом

Компьютеры от 10 тр в Ситилинке

3070 дешевле 50 тр в Ситилинке

MSI 3050 за 25 тр в Ситилинке

3060 Gigabyte Gaming за 30 тр с началом

13600K дешевле 30 тр в Регарде

4080 почти за 100тр — дешевле чем по курсу 60

-19% на 13900KF — цены рухнули

12900K за 40тр с началом в Ситилинке

RTX 4090 за 140 тр в Регарде

3060 Ti Gigabyte за 42 тр в Регарде

      И обнаружил, что атрибут SMART-a  199 UltraDMA CRC Error Count (количество ошибок, возникших во время передачи данных по кабелю  от материнской платы до дискретного контроллера диска) буквально за два дня вырос более чем на 2000 ошибок. 

  Спустя два дня

       Это вполне объясняло подобное поведение компьютера. 

       Естественно, что в первую очередь под подозрение попал кабель SATA, но нет, если бы это было так, то я не стал бы писать статью.

       Были перепробованы все кабеля SATA которые у меня только есть, для проверки также поменян кабель SATA  с HDD, который у меня стоит на компьютере в качестве хранилища, кстати на нем этот атрибут равен нулю, то есть не возникло ни одной ошибки. Переподключал кабель SATA в разные порты на материнской плате, но и это ничего не дало. 

      После этого SSD был установлен в ноутбук, где при тех же играх и нагрузке данный атрибут SMART-a  не увеличился ни на  единицу, и ноутбук работал отлично. 

      Контроллер материнской платы компьютера я тоже исключил, так как  установив на  HDD стоящий в компьютере операционную систему и  игры, и   погоняв его с теми же нагрузками, увидел, что атрибут UltraDMA CRC Error Count не увеличился, так и остался равным нулю.

     Что же тогда еще остается?

    Отступление:

     При замене кабелей SATA на SSD, один кабель  SATA  я приобрел в магазине, на всякий случай, так как думать уже не знал на что. Когда я его покупал, оговорился о данной проблеме. И от продавцов  узнал для себя удивительную вещь: они авторитетно заявили, что возможно у меня стоит кабель SATA 2 и не обеспечивает необходимую пропускную способность, и нужно купить у них кабель SATA 3, и даже показали кабель на котором стоит клеймо SATA 3 (может  я этого не знаю). Я возразил, сказал, что такого быть не может, что у них у всех  7 pin , и одинаковые медные проводники, и электрический сигнал распространяется одинаково. пропускная способность зависит от  контроллера материнской платы и от контролера жесткого диска, а не от 7 медных проводников, которыми они соединены. И на вопрос чем они физически отличаются, внятно объяснить  мне не смогли. 

    Что думаете вы по этому поводу напишите в комментариях. 

    Но я все-таки купил у них этот кабель SATA 3. Ну  как вы и подумали проблему это не решило.

   Дальше я принялся ковырять блок питания. По замерам мультиметра, и по данным проги «AIDA» все напряжения были в норме. Но при измерении осциллографом пульсаций по питанию, в большей мере меня интересовало питание 5 В. которым питался SSD , было выявлено наличие провалов в осциллограмме с 5 до 4,5 В. 

https://disk.yandex.ru/i/v3nlN_OmffD_hw

       Расположение их по шкале времени имело случайный характер. Но казалось бы, и 4,5 В.  достаточно, так как в SSD стоят свои преобразователи в более низкие напряжения. Но я все же в качестве диагностики   попытался уменьшить эти пульсации и  подключил прямо к разъему MOLEX к шине 5 в. электролитический конденсатор на 4000 мкФ. 

       И наконец это решило проблему, осциллограмма выровнялась, провалы пропали, атрибут   199 UltraDMA CRC Error Count больше не увеличивается, компьютер летает, игры не лагают. Теперь выберу время, разберу блок питания и займусь им.

      Надеюсь, мой случай окажется вам интересен и полезен.

Этот материал написан посетителем сайта, и за него начислено вознаграждение.

Некоторые пользователи Windows сообщают, что они всегда видят предупреждение (Ultra DMA CRC Error Count) при анализе жесткого диска с помощью утилиты HD Tune. В то время как некоторые затронутые пользователи видят это с использованными жесткими драйверами, другие сообщают об этой проблеме с новыми жесткими дисками.

Счетчик ошибок CRC интерфейса внутри HD Tune

Что такое счетчик ошибок CRC Ultra DMA?

Это параметр SMART (технология самоконтроля, анализа и отчетности), который указывает общее количество ошибок CRC в режиме UltraDMA. Необработанное значение этого атрибута указывает количество ошибок, обнаруженных ICRC (интерфейс CRC) во время передачи данных в режиме UltraDMA.

Но имейте в виду, что этот параметр считается информационным у большинства производителей оборудования. Хотя ухудшение этого параметра можно рассматривать как индикатор устаревания привода с потенциальными электромеханическими проблемами, оно НЕ указывает напрямую на неизбежный отказ драйвера.

Чтобы получить полную картину состояния вашего жесткого диска, вам нужно обратить внимание на другие параметры и общее состояние накопителя.

После тщательного изучения этой проблемы выясняется, что существует несколько различных основных причин, которые могут привести к возникновению этого конкретного кода ошибки:

  • Общий ложноположительный результат — имейте в виду, что предупреждение, выдаваемое утилитой HD Tune, не обязательно означает, что ваш жесткий диск выходит из строя. Эта утилита использует обобщенные данные от каждого производителя, поэтому данные от одного производителя могут не иметь значения для другого. Чтобы получить более точный результат, вам нужно будет запустить диагностический инструмент для конкретной марки и посмотреть, появляется ли такое же предупреждение.
  • Несовместимость между SSD Samsung и контроллером SATA. Если вы столкнулись с этой проблемой с SSD, скорее всего, это связано с конфликтом между твердотельным накопителем и драйвером контроллера SATA Microsoft или AMD. Чтобы исправить эту несовместимость, вам нужно использовать редактор реестра, чтобы отключить NCQ (собственная очередь команд).
  • Неисправный кабель SATA или порт SATA. Как оказалось, вы также можете ожидать столкнуться с проблемой этого типа, если имеете дело с неисправным портом SATA или несовместимым кабелем SATA. В этом случае вы можете определить виновника, протестировав жесткий диск на другом компьютере и заменив текущий кабель SATA.
  • Отказ жесткого диска или твердотельного накопителя — при определенных обстоятельствах вы можете ожидать увидеть это предупреждение об ошибке на ранних стадиях отказа диска. В этом случае единственное, что вы можете сделать, — это создать резервную копию данных до того, как диск выйдет из строя навсегда, и начать поиск замены.

Теперь, когда вы знаете очень потенциальный сценарий, который может вызвать этот код ошибки, вот список методов, которые помогут вам определить и устранить ошибку счетчика ошибок CRC Ultra DMA:

Метод 1. Запуск диагностического инструмента для конкретной марки

Имейте в виду, что HD Tune Utility — это сторонний инструмент, который будет «оценивать» состояние жесткого диска исключительно путем сравнения их с набором общих значений.

Из-за этого настоятельно рекомендуется избегать принятия решений, основанных только на HD Tune Utility, и вместо этого запускать диагностический инструмент для конкретной марки — официальные инструменты тестирования специально разработаны для продуктов их брендов.

В зависимости от производителя жесткого диска установите и просканируйте жесткий диск с помощью специальной диагностической утилиты. Чтобы упростить вам задачу, мы составили список самых популярных инструментов диагностики для конкретных брендов:

Примечание. Если производитель вашего жесткого диска не включен в список выше, поищите в Интернете конкретные шаги с помощью диагностического инструмента для вашего бренда, затем установите и запустите его, чтобы проверить, не отключен ли счетчик ошибок CRC Ultra DMA.

Если диагностический инструмент, специфичный для производителя, не вызывает никаких опасений в отношении значения Ultra DMA CRC Error Count, вы можете спокойно игнорировать предупреждение, выдаваемое HD Tune.

Однако, если предупреждение также отображается в инструменте анализа, зависящем от производителя, перейдите к следующему потенциальному исправлению ниже.

Метод 2: устранение несовместимости между SSD Samsung и контроллером SATA (если применимо)

Как оказалось, ошибка Ultra DMA CRC Error Count не ограничивается жестким диском и также может возникать, если вы используете SSD.

Но если вы видите эту ошибку с SSD Samsung, высока вероятность, что проблема не связана с плохим кабелем или работоспособностью твердотельного накопителя — скорее всего, это связано с несовместимостью между вашим SSD Samsung и контроллером Sata вашего чипсета. .

Если вы оказались в этом конкретном сценарии, вы можете решить проблему и предотвратить появление этого предупреждения, отключив NCQ (собственная очередь команд) в драйвере SATA.

Примечание. Это не повлияет на работу вашего диска SATA.

Если этот сценарий применим, приведенные ниже инструкции по устранению несовместимости между твердотельным накопителем Samsung и контроллером Sata:

  1. Нажмите клавишу Windows + R, чтобы открыть диалоговое окно «Выполнить». Затем в текстовом поле введите «regedit», затем нажмите Ctrl + Shift + Enter, чтобы открыть редактор реестра с правами администратора. Когда вам будет предложено UAC (Контроль учетных записей пользователей), нажмите Да, чтобы предоставить административный доступ.Открытие Regedit
  2. Как только вы войдете в редактор реестра, используйте левое меню для перехода к следующим местоположениям, в зависимости от того, используете ли вы драйвер контроллера Microsoft SATA или драйвер контроллера AMD SATA: Расположение контроллера Microsoft SATA: HKEY_LOCAL_MACHINE SYSTEM CurrentControlSet Services storahci Parameters Device Расположение драйвера контроллера AMD SATA:[HKEY_LOCAL_MACHINE SYSTEM CurrentControlSet services amd_sata Parameters Device
    [HKEY_LOCAL_MACHINESYSTEMCurrentControlSetservicesamd_sataParametersDevice

    Примечание. Вы можете перейти сюда вручную или вставить местоположение прямо в панель навигации.

  3. Как только вы окажетесь в нужном месте, щелкните правой кнопкой мыши «Устройство», затем выберите «Создать»> «Значение Dword (32-бит)» в появившемся контекстном меню.Создание нового значения Dword в меню устройства
  4. Затем назовите вновь созданный DWORD NcqDisabled, если вы используете драйвер Microsoft SATA Controller, или назовите его AmdSataNCQDisabled, если вы используете драйвер AMD SATA Controller.
  5. Наконец, дважды щелкните DWORD, который вы только что создали, затем установите для Base значение Hexadecimal и значение 1, чтобы отключить NCQ и предотвратить такую ​​же несовместимость с созданием ошибки Ultra DMA CRC Error Count.

Если та же проблема все еще возникает даже после выполнения приведенных выше инструкций или этот сценарий неприменим, перейдите к следующему потенциальному исправлению ниже.

Способ 3. Замените кабель питания и SATA.

Как подтвердили несколько затронутых пользователей, эта конкретная проблема также может быть связана с неисправным кабелем SATA или неисправным портом SATA. Из-за этого ошибка счетчика ошибок CRC Ultra DMA также может быть признаком несовместимого кабеля.

Чтобы проверить эту теорию, вы можете подключить свой жесткий диск к другому компьютеру (или, по крайней мере, использовать другой порт SATA + кабель), если у вас нет второй машины для тестирования.

Пример порта SATA на материнской плате

После замены порта SATA повторите сканирование внутри утилиты HD Tune и посмотрите, возникает ли ошибка счетчика ошибок CRC Ultra DMA. Если проблема перестала возникать, подумайте о том, чтобы обратиться к ИТ-специалисту с материнской платой для исследования на предмет ослабленных контактов.

С другой стороны, если проблема не возникает, когда вы используете другой кабель SATA, вам просто удалось идентифицировать виновника.

Если вы исключили и кабель SATA, и порт SATA из списка виновных, перейдите к следующему потенциальному исправлению ниже, поскольку проблема определенно возникает из-за неисправного диска.

Метод 4: сделайте резервную копию данных жесткого диска

Если вы ранее убедились, что были правы, обеспокоившись ошибкой Ultra DMA CRC Error Count, первое, что вам следует сделать, это сделать резервную копию своих данных, чтобы убедиться, что вы ничего не потеряете в случае выхода диска из строя.

Если вы хотите создать резервную копию данных жесткого диска, пока решаете, какую замену получить, имейте в виду, что у вас есть два пути вперед: вы можете сделать резервную копию жесткого диска с помощью встроенной функции или использовать стороннюю утилиту. .

A. Резервное копирование файлов на жестком диске через командную строку

Если вам удобно использовать терминал CMD с повышенными правами, вы можете создать резервную копию и сохранить ее на внешнем хранилище без необходимости установки стороннего программного обеспечения.

Но имейте в виду, что в зависимости от вашего предпочтительного подхода вам может потребоваться вставить установочный носитель, совместимый с плагинами.

Если вас устраивает такой подход, вот инструкции по резервному копированию файлов из командной строки с повышенными правами.

Б. Резервное копирование файлов на жестком диске с помощью стороннего программного обеспечения для обработки изображений.

С другой стороны, если вам удобно доверять стороннюю утилиту для резервного копирования жесткого диска, у вас будет много дополнительных функций, которые просто недоступны при создании регулярной резервной копии через командную строку.

Вы можете использовать стороннее программное обеспечение для резервного копирования, чтобы клонировать или создать образ жесткого диска и сохранить его на внешнем сервере или в облаке. Вот список лучших программ для клонирования и обработки изображений, которые вам следует рассмотреть.

Метод 5: отправьте жесткий диск на замену или закажите замену

Если вы убедились, что предупреждение Ultra DMA CRC Error Count, которое вы видите, является подлинным, и заранее успешно создали резервную копию данных жесткого диска, единственное, что вы можете сделать прямо сейчас, — это поискать замену.

Конечно, если на ваш жесткий диск по-прежнему распространяется гарантия, вам следует сразу же отправить его в ремонт.

Но если срок гарантии истек или у вас есть возможность вернуть его, мы рекомендуем держаться подальше от устаревшего жесткого диска (жесткого диска) и вместо этого выбрать SSD (твердотельный накопитель).

Хотя SSD по-прежнему дороже традиционных жестких дисков, они гораздо менее подвержены поломкам, а скорость несопоставима с SSD (в 10 раз больше скорости записи и чтения).

Если вы ищете твердотельный накопитель, вот наше расширенное руководство по покупке лучшего твердотельного накопителя для ваших нужд.

Первую часть этого материала можно прочитать здесь.

Технология S.M.A.R.T. родилась в далеком 1995 году, так что возраст у нее почтенный. Предполагалось, что атрибуты SMART (давайте для простоты писать аббревиатуру без точек), формируемые микропрограммой жесткого диска, позволят программно оценивать состояние накопителя, а также дадут механизм для предсказания выхода его из строя. Последнее в те времена было достаточно актуально: срок жизни дисков в серверах, например, исчислялся годом-полутора, и знать, когда готовить замену, было нелишним.

Со временем многое поменялось: что-то отмерло, какие-то стороны развились сильнее (например, контроль механики диска). Первоначальный набор из десятка простейших атрибутов усложнился и разросся в несколько раз, порой менялся их смысл, многие производители ввели собственные атрибуты с не всегда ясным функционалом. Появилась масса программ для анализа SMART (как правило, невысокого качества, но с эффектным интерфейсом, да еще и за деньги) и т.п.

Так что не мешает описать современное состояние SMART. Начнем с критически важных атрибутов, ухудшение которых почти всегда свидетельствует о проблемах с накопителем. Именно их первым делом смотрят ремонтники при диагностике HDD.

  • #01 Raw Read Error Rate — частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска. Для всех дисков Seagate, Samsung (семейства F1 и более новые) и Fujitsu 2,5″ это — число внутренних коррекций данных, проведенных ДО выдачи в интерфейс; на пугающе огромные цифры можно не обращать внимания.
  • #03 Spin-Up Time — время раскрутки пакета пластин из состояния покоя до рабочей скорости. Растет при износе механики (повышенное трение в подшипнике и т.п.), также может свидетельствовать о некачественном питании (например, просадке напряжения при старте диска).
  • #05 Reallocated Sectors Count — число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор переназначенным и переносит данные в резервную область. Вот почему на современных HDD нельзя увидеть bad-блоки — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, на жаргоне — ремап. Поле Raw Value атрибута содержит общее количество переназначенных секторов. Чем оно больше, тем хуже состояние поверхности диска.
  • #07 Seek Error Rate — частота ошибок при позиционировании блока магнитных головок (БМГ). Рост этого атрибута свидетельствует о низком качестве поверхности или о поврежденной механике накопителя. Также может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине).
  • #10 Spin-Up Retry Count — число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута растет, то велика вероятность проблем с механикой.
  • #196 Reallocation Event Count — число операций переназначения. В поле Raw Value атрибута хранится общее число попыток переноса информации со сбойных секторов в резервную область диска (она, как правило, не слишком велика — несколько тысяч секторов). Учитываются как успешные, так и неудачные операции.
  • #197 Current Pending Sector Count — текущее число нестабильных секторов. Здесь хранится число секторов, являющихся кандидатами на замену. Они не были еще определены как плохие, но считывание с них происходит с затруднениями (например, не с первого раза). Если «подозрительный» сектор будет в дальнейшем считываться успешно, то он исключается из числа кандидатов. В случае же повторных ошибочных чтений накопитель попытается восстановить его и выполнить ремап.
  • #198 Uncorrectable Sector Count — число секторов, при чтении которых возникают неисправимые (внутренними средствами) ошибки. Рост этого атрибута указывает на серьезные дефекты поверхности или на проблемы с механикой накопителя.
  • #220 Disk Shift — сдвиг пакета пластин относительно оси шпинделя. В основном возникает из-за сильного удара или падения диска. Единица измерения неизвестна, но при сильном росте атрибута диск не жилец.

    Также следует принимать во внимание и информационные атрибуты, способные много чего поведать об «истории» диска.

  • #02 Throughput Performance — средняя производительность диска. Если значение атрибута уменьшается, то велика вероятность, что у накопителя есть проблемы.
  • #04 Start/Stop Count — число циклов запуск-остановка шпинделя. У дисков некоторых производителей (например, Seagate) — счетчик включения режима энергосбережения.
  • #08 Seek Time Performance — средняя производительность операции позиционирования головок. Снижение значения этого атрибута свидетельствует о неполадках в механике привода головок (в первую очередь о замедленном позиционировании).
  • #09 Power-On Hours (POH) — время, проведённое во включенном состоянии. Показывает общее время работы диска, единица измерения зависит от модели (не только 1 час, но и 30 мин, и даже 1 минута).
  • #11 Recalibration Retries — число повторов рекалибровки в случае, если первая попытка была неудачной. Рост этого атрибута указывает на проблемы с механикой диска.
  • #12 Device Power Cycle Count — число полных циклов включения-выключения диска.
  • #13 Soft Read Error Rate — частота появления «программных» ошибок при чтении данных. Сюда можно отнести ошибки программного обеспечения, драйверов, файловой системы, неверную разметку диска — в общем, почти все, что не относится к аппаратной части.
  • #190 Airflow Temperature — температура воздуха внутри корпуса HDD. Для дисков Seagate атрибут выдается в нормировке 100º минус температура (тем самым критический нагрев соответствует значению 45), а модели Western Digital используют нормировку 125º минус температура.
  • #191 Gsense error rate — число ошибок, возникших из-за внешних нагрузок. Атрибут хранит показания встроенного акселерометра, который фиксирует все удары, толчки, падения и даже неаккуратную установку диска в корпус компьютера.
  • #192 Poweroff retract count — число зафиксированных повторов включения/выключения питания накопителя.
  • #193 Load/Unload Cycle Count — число циклов перемещения БМГ в специальную парковочную зону/в рабочее положение.
  • #194 HDA temperature — температура механической части диска, в просторечии банки (HDA — Hard Disk Assembly). Информация снимается со встроенного термодатчика, которым служит одна из магнитных головок, обычно нижняя в банке. В битовых полях атрибута фиксируются текущая, минимальная и максимальная температура. Не все программы, работающие со SMART, правильно разбирают эти поля, так что к их показаниям стоит относиться критично.
  • #195 Hardware ECC Recovered — число ошибок, скорректированных аппаратной частью диска. Сюда входят ошибки чтения, ошибки позиционирования, ошибки передачи по внешнему интерфейсу. На дисках с SATA-интерфейсом значение нередко ухудшается при повышении частоты системной шины — SATA очень чувствителен к разгону.
  • #199 UltraDMA (Ultra ATA) CRC Error Count — число ошибок, возникающих при передаче данных по внешнему интерфейсу в режиме UltraDMA (нарушения целостности пакетов и т.п.). Рост этого атрибута свидетельствует о плохом (мятом, перекрученном) кабеле и плохих контактах. Также подобные ошибки появляются при разгоне шины PCI, сбоях питания, сильных электромагнитных наводках, а иногда и по вине драйвера.
  • #200 Write Error Rate/ Multi-Zone Error Rate — частота появления ошибок при записи данных. Показывает общее число ошибок записи на диск. Чем больше значение атрибута, тем хуже состояние поверхности и механики накопителя.

Как видим, большинство «интересных» атрибутов отражает функционирование механики накопителя. Технология SMART действительно позволяет предсказывать выход диска из строя в результате механических неисправностей, что, по статистике, составляет около 60% всех отказов. Полезен и мониторинг температур: перегрев головок резко ускоряет их деградацию, так что превышение опасного порога (45-55º в зависимости от модели) — сигнал срочно улучшить охлаждение диска.

Вместе с тем не следует переоценивать возможности SMART. Современные диски нередко «дохнут» на фоне отличных атрибутов, что связано с тонкими процессами дефект-менеджмента в условиях высокой плотности записи и не всегда, мягко говоря, качественных компонентов (разнобой в отдаче головок сегодня — обычное дело). Тем более SMART не способен предсказать последствия таких «форс-мажоров», как скачок напряжения, перегрев платы электроники или повреждение накопителя от удара.

Практически у всех атрибутов наибольший интерес представляет поле Raw Value: «сырые» значения наиболее информативны. Их нормировка (степень приближения к абстрактному порогу) часто ничего не дает и только запутывает дело. Поэтому и программы, полагающиеся на эти проценты, нельзя считать вполне надежными. Типичный случай для них — ложные тревоги. Программа сообщает, что новый, недавно установленный накопитель того и гляди «склеит ласты». А все дело в том, что в начале эксплуатации некоторые атрибуты SMART быстро меняются и примитивная экстраполяция приводит к пугающим пользователя прогнозам.

Я советую бесплатную программу HDDScan — она корректно понимает все атрибуты, в том числе и новые, правильно разбирает температурные показатели. Отчет выводится в виде аккуратной xml-таблицы с цветовой индикацией, которую можно сохранить или распечатать.

SMART диска WD пятилетнего возраста. О его близкой кончине свидетельствуют ненулевые значения атрибутов 1 и 200 (для WD они особенно чреваты), а также тот факт, что после ремапа атрибут 197 снова растет. Это значит, что возможности исправления дефектов исчерпаны

Крайне полезна у HDDScan возможность считывать SMART у внешних накопителей, столь распространенных сегодня. Практически ни одна другая программа этого не умеет, ведь на пути данных стоит контроллер, преобразующий интерфейс PATA/SATA в USB или FireWire. Автор целенаправленно работал в этом направлении, и ему удалось охватить широкий спектр контроллеров. Не забыты и диски с интерфейсом SCSI, до сих пор широко применяемые в серверах (атрибуты у них особые — например, выводится общее число записанных или считанных байтов за всю жизнь накопителя).

Функционал HDDScan полностью отвечает потребностям ремонтника. Когда первичную диагностику принесенного внешнего диска можно провести, не разбирая корпус, — это удобно, экономит время, а порой и сохраняет гарантию.

SMART, снятый со SCSI-диска. Здесь исторически сложились совсем другие атрибуты

⇡#Барьеры HDD

Механика давно стала ахиллесовой пятой HDD, и даже не столько из-за чувствительности к ударам и вибрации (это еще можно компенсировать), сколько из-за медлительности. Самые быстрые «дерганья» блоком магнитных головок (2-3 мс у лучших серверных моделей) в тысячи раз уступают скоростям электроники.

И принципиально ничего тут не улучшишь. Поднимать скорость вращения пакета дисков некуда, 15000 об./мин уже предел. Японцы несколько лет назад подступались к 20000 об./мин (вполне гироскопная скорость), но в итоге отказались — не выдерживают материалы, конструкция получается слишком дорогая и для массового производства слабо пригодная. В малых же сериях винчестеры выйдут золотыми, такие никто не купит — это не гироскопы, которые заменить нечем.

Выходит, уткнулись в барьер. Механику на кривой козе не объедешь. Единственный выход — поднимать плотность записи, поперечную и продольную. Продольная плотность (вдоль дорожки) влияет на производительность накопителя, т.е. на поток данных к остальным узлам компьютера. Но все равно, даже достигнутые 100-130 Мбайт/с — это для нынешних компьютеров слишком мало. Например, рядовая оперативная память (DRAM) имеет реальную производительность около 3 Гбайт/с, а кеш процессора — еще больше. Разница на порядки, и она сильно сказывается на общем быстродействии. Конечно, никто не требует от энергонезависимого накопителя, емкость которого в сотни раз превышает DRAM, такой же производительности. Но даже простое удвоение было бы заметно любому пользователю.

Поперечная плотность записи — это густота дорожек на пластине, в современных HDD она превышает 10000 на 1 миллиметр. Получается, что сама дорожка имеет ширину менее 100 нм (между прочим, нанотехнологии в чистом виде). Это позволяет резко поднять емкость в расчете на одну поверхность, а также ускоряет позиционирование за счет изощренных алгоритмов (их разработка потянула бы на пару докторских диссертаций).

Как итог, за последние годы емкость и производительность HDD значительно выросли. Все это стало возможным благодаря технологии перпендикулярной записи, которая существует уже более 20 лет, но до массового внедрения дозрела только в 2007 году. Причем емкость тогда выросла даже сильнее, чем требуется: первые терабайтные диски встретили вялый отклик пользователей. Народ просто не понимал, куда приспособить таких монстров, тем более что они поначалу строились на пяти пластинах, были капризными, шумными и горячими (речь о тогдашних флагманах Hitachi).

Потом, конечно, люди разобрались, торренты заработали в полную силу, да и количество пластин поуменьшилось. В то же время плотность записи выросла до 500-750 Гбайт на пластину (имеются в виду диски настольного сегмента с форм-фактором 3,5″). Вот-вот в массовое производство пойдут терабайтные пластины, что даст возможность выпустить винчестеры объемом до 4 Тбайт (больше четырех пластин в стандартном корпусе высотой 26,1 мм не уместить; хитачевские пятипластинные первенцы большого развития не получили).

Трехтерабайтный диск WD Caviar Green WD30EZRX, наиболее емкий на сегодня. Имеет четырехпластинный дизайн, выпускается ровно год (с 20 октября 2010 г.). Как полагается, весной и летом дешевел, но в последние дни резко подорожал из-за наводнения в Таиланде (там расположены сборочные заводы WD, и стихия блокировала подвоз комплектующих)

Увы, скорость позиционирования выросла, мягко говоря, несильно, а у массовых моделей так вообще осталась на прежнем уровне, а то и упала в угоду… тишине. Маркетологи доказали, что потребитель голосует кошельком за гигабайты в расчете на один доллар, а не за миллисекунды доступа. Поэтому и небыстры дешевые диски по сравнению с породистыми серверными собратьями. Медлительность хорошо проявляется в скорости загрузки ОС, когда надо читать с диска большое количество мелких файлов, разбросанных по пластинам. Здесь главную роль играет скорость вращения шпинделя и мощный привод БМГ, дающий возможность больших ускорений.

Между прочим, «быстрые» диски легко отличить даже на вес — они заметно тяжелее «медленных». Полноразмерная банка с утолщенными стенками, способствующая геометрической стабильности и подавлению вибраций, скоростной шпиндельный двигатель, мощные магниты позиционера, двухслойная крышка повышенной жесткости — все это прибавляет такому накопителю десятки и сотни граммов. Еще больше отрыв в серверных моделях на 15000 об./мин, где пластины уменьшенного размера окружены внушительным объемом литого алюминия, а общий вес «харда» доходит до килограмма.

Высокопроизводительный диск WD Raptor со скоростью вращения шпинделя 10 000 об./мин. При емкости 150 Гбайт весит 740 г (массовые модели той же емкости — 400-500 г). Обратите внимание на размер магнитов и толщину стенок

С удешевлением твердотельных SSD, использующихся, в первую очередь, под операционную систему, нужда в высокопроизводительных HDD стала снижаться, а сами они постепенно выделяются в особый сегмент рынка (такова, например, «черная» серия у WD). Подобными дисками комплектуются профессиональные рабочие станции с ресурсоемкими приложениями, критичными к скорости доступа. Рядовые же пользователи брать достаточно дорогие накопители не торопятся, предпочитая объем производительности.

На другом конце спектра — популярные «зеленые» модели с намеренно замедленным вращением шпинделя (5400-5900 об./мин вместо 7200) и небыстрым позиционированием головок. Дешевые, тихие, холодные и достаточно надежные, эти винчестеры идеально подходят для хранения мультимедийных данных в домашних компьютерах, внешних корпусах и сетевых хранилищах. На наших прилавках все эти Green и LP сильно потеснили другие линейки, так что в мелких «точках» порой ничего больше и не найдешь.

⇡#Расточительность магнитной записи

Намагниченность доменов жесткого диска, как и в середине двадцатого века, меняют с помощью магнитной головки, поле которой возбуждается переменным электрическим током и действует на магнитный слой через зазор. Также эта технология требует быстрого вращения пластин, прецизионного контроля положения головки и т.д. Двигатель и позиционер жесткого диска, а также управляющая ими электроника потребляют заметную мощность, да и стоят немало. Но главное — на само возбуждение магнитного поля тратится очень много энергии.

Расточительность стандартного метода магнитной записи трудно оценить, работая на персональном компьютере. Жесткие диски массовых серий даже при активной работе потребляют менее 10 Вт, что на фоне прочих комплектующих (100 Вт и более) почти незаметно. Но ваши взгляды сразу переменятся после посещения серверной комнаты какого-нибудь крупного банка, а чтобы получить впечатлений на всю оставшуюся жизнь, достаточно подойти к дисковой стойке суперкомпьютера. В шуме сотен и тысяч жестких дисков, обдувающих их вентиляторов и прецизионных кондиционеров становится понятно, сколько энергии в глобальном масштабе тратится на такую работу.

Недаром для систем хранения данных энергоэффективность в списке характеристик выходит на первый план. Вот уже и Google переводит свои дата-центры на баржи в море (вот где настоящие офшоры!). Оказывается, охлаждение СХД забортной водой радикально сокращает операционные затраты, в первую очередь за счет экономии на кондиционерах.

⇡#О питании жестких дисков

Будет ли работать обычная 220-вольтовая лампочка от 230 В? Конечно, будет. А от 240 В? Тоже. Вопрос — сколько она протянет? Понятно, что меньше или существенно меньше — это зависит от конкретной лампочки. Ей суждена яркая, но короткая жизнь.

Примерно та же ситуация и с жесткими дисками. Наивные производители проектировали их, полагаясь на стандартные +5 В и +12 В. Однако в типичном компьютерном блоке питания (БП) стабилизируется лишь линия 5 В. К чему же это приводит?

При высокой нагрузке на процессор (а современные «камни» потребляют немало) и недостаточной мощности БП линия 5 В проседает, и система стабилизации отрабатывает это дело, повышая напряжение до номинального значения. Одновременно повышается и напряжение 12 В (из-за отсутствия стабилизации по нему). В результате и так нестойкий к нагреву HDD работает еще и при повышенном напряжении, которое подается на самые греющиеся узлы — микросхему управления двигателем (на жаргоне ремонтников — «крутилка») и привод головок (т.н. «звуковая катушка»). Итог — смотри рассуждение о лампочке.

Сгоревшая «крутилка» на плате как результат повышенного напряжения и плохого охлаждения. Нередко микросхема сгорает в буквальном смысле, с пиротехническими эффектами и выгоранием дорожек на плате. Такое ремонту не подлежит

Отсюда советы по блоку питания. Чем больше его мощность, тем лучше (в разумных пределах: запас более 30-35% по отношению к реальному потреблению снижает КПД блока, так что вы будете греть комнату). Менее мощный, но фирменный БП лучше более мощного, но безродно-китайского. Помните — разгоняют не только процессоры. В первом приближении, 420 «китайских» ватт эквивалентны 300 «правильным».

По-хорошему, надо бы еще учитывать возраст БП: после 2-3 лет эксплуатации его реальная мощность заметно снижается, а выходные напряжения дрейфуют. Разумеется, в некачественных изделиях, работающих на честном китайском слове, процессы старения выражены гораздо резче. Хорошо еще, если подобный блок тихо умрет сам, а не утащит за собой в агонии половину системного блока!

Максимально допустимым считается 12,6 В (+5% от номинала). Однако у многих дисков c ростом напряжения наблюдается нелинейно-резкий нагрев упомянутых выше узлов — «крутилки» и «катушки». Поэтому я рекомендую строже контролировать БП с помощью внешнего вольтметра (датчики на материнской плате, измеряющие напряжение для BIOS и программ типа AIDA, могут быть весьма неточны).

Измерять напряжение лучше всего на разъемах Molex и обязательно под полной нагрузкой: процессор занят вычислениями с плавающей точкой, видеокарта — выводом динамичной трехмерной графики, а диск — дефрагментацией. При 12,2-12,4 В стоит призадуматься, 12,4-12,6 В — поволноваться, 12,6-13 В — бить тревогу, а в случае 13 В и выше — копить деньги на новый диск или положить гарантийный талон на видное место…

Конденсаторы (2200 мкФ, 25 В), напаянные на цепи питания HDD (желтый провод — +12 В, красный — +5 В, черный — земля). В данном случае они уменьшают пульсации напряжения, от которых блок питания издает раздражающий высокочастотный писк

Если напряжение по линии 12 В сильно завышено, а вы не боитесь паяльника и способны отличить транзистор от диода, то можете включить последний в разрыв питания HDD (напомню, линии 12 В соответствует желтый провод). Диод сыграет роль ограничителя — на его p-n переходе упадут «лишние» 0,2-0,7 В (в зависимости от типа диода), и диску станет полегче. Только диод надо брать достаточно мощный, чтобы он выдерживал пусковой ток в 2-3 А.

И без фанатизма: результирующее напряжение не должно опускаться ниже 11,7 В. В противном случае возможна неустойчивая работа диска (множественные рестарты) и даже порча данных. А некоторые модели (в частности, Seagate 7200.10 и 7200.11) могут вообще не запуститься.

⇡#Миграция с флеш

Память NAND Flash появилась много позднее, чем HDD, и переняла ряд его технологий — взять хотя бы коды ECC. Далее оба направления развивались параллельно и сравнительно независимо. Но в последнее время наметился и обратный процесс: миграция технологий с флеш-памяти на жесткие диски. Конкретно речь идет о выравнивании износа.

Как известно, любой флеш-чип имеет ограниченный ресурс по числу стираний-записей в одну ячейку. В какой-то момент стереть ее уже не удается, и она навсегда застывает с последним записанным значением. Поэтому контроллер считает количество записей в каждую страницу и в случае превышения копирует ее на менее изношенное место. В дальнейшем вся работа ведется с новым участком (этим заведует транслятор), а старая страница остается как есть и не используется. Данная технология получила название Wear Leveling. Так вот, износ есть и в жестких дисках, но там он механический и температурный. Если магнитная головка все время висит над одной дорожкой (скажем, постоянно изменяется тот или иной файл), то растет вероятность повреждения дорожки при случайных толчках или вибрации диска (например, от соседних накопителей в корзине). Головка может коснуться пластины и повредить магнитный слой со всеми вытекающими печальными последствиями. Даже если вредного контакта нет, неподвижная головка локально нагревается и пусть обратимо, но деградирует. Запись в данное место происходит менее надежно, растет вероятность последующего неустойчивого считывания (а при современных огромных плотностях записи любое отклонение параметров губительно).

Эти соображения достаточно очевидны, и прошивка серверных дисков с интерфейсом SCSI/SAS (а они весьма горячи) давно научилась перемещать головки в простое, дабы они не перегревались. Но еще лучше вместе с головкой «перебрасывать» и информацию по пластине — в этом случае описанные эффекты подавляются максимально, а надежность накопителя растет. Вот Western Digital и ввел подобный механизм в новых моделях VelociRaptor. Это дорогие высокопроизводительные диски со скоростью вращения шпинделя 10000 об./мин и пятилетней гарантией, так что Wear Leveling там уместен.

VelociRaptor снаружи и внутри. Привлекает внимание мощный радиатор. Пластины же имеют уменьшенный диаметр — это характерно для современных скоростных дисков.

Кроме того, вся линейка VelociRaptor нацелена на использование в высоконагруженных системах, в первую очередь серверах, где запись на диск ведется очень интенсивно и зачастую в одни и те же файлы (типичный пример — логи транзакций). Массовым «ширпотребным» дискам высокие нагрузки не грозят, греются они тоже умеренно, так что подобный изыск там вряд ли появится. Впрочем, поживем — увидим.

⇡#Аdvanced Format и его применение

Вот уже более 20 лет все жесткие диски имеют одинаковый размер физического сектора: 512 байт. Это минимальная порция записи на диск, позволяющая гибко управлять распределением дискового пространства. Однако с ростом объема HDD все сильнее стали проявляться недостатки такого подхода — в первую очередь неэффективное использование емкости магнитной пластины, а также высокие накладные расходы при организации потока данных.

Поэтому диски большой емкости (терабайт и выше) стали производиться по технологии Advanced Format, которая оперирует «длинными» физическими секторами в 4096 байт. Разметка магнитных пластин под AF весьма выгодна для производителя: меньше межсекторных промежутков, выше полезная емкость дорожки и всей пластины (а это, наряду с магнитными головками, самый дорогой компонент HDD). Именно Advanced Format позволил выпустить на рынок недорогие винчестеры, столь популярные ныне у потребителей аудио- и видеоконтента. AF-дисками емкостью 1-3 Тбайт комплектуются не только компьютеры, но и масса внешних накопителей, сетевых хранилищ и медиаплееров.

Один из первых дисков 3,5″ с Advanced Format, выпущенный в 2009 г

Но даром ничего не дается, новые диски уже начинают приносить в ремонт. Похоже, надежность все-таки просела. Ведь единичный сбой диска или дефект поверхности портит теперь в 8 раз больше данных пользователя, чем обычно. При физическом секторе в 4 Кбайт и эмуляции «коротких» секторов в 512 байт не будет читаться от 1 до 8 секторов. Операционная система на это реагирует понятно как: авария, все пропало! В итоге мелкая проблема на пластинах вырастает для пользователя в зависание или чего еще хуже.

Я считаю, на дисках с AF не стоит держать ОС, прикладные программы и базы данных со множеством мелких файлов. Пока что их удел — мультимедийные данные, некритичные к выпадениям.

⇡#Что стоит почитать о жестких дисках

В первую очередь рекомендую заглянуть на форум HARDW.net. Его раздел «Накопители информации» посещает множество профессиональных ремонтников и энтузиастов (почти 40 тыс. участников). Там можно найти ответы практически по любой теме, связанной с HDD, за исключением самых новых «нераскопанных» моделей. Начните с подраздела «Песочница»: на простые (в понимании профессионалов) вопросы там отвечают подробно и содержательно, а не отшивают, как в других местах, — «несите к ремонтнику».

Еще больше информации, правда, на английском языке, можно найти на портале HDDGURU. Помимо ремонтно-диагностического ПО и статей по отдельным вопросам (например, как поменять головки у диска), там есть международный форум ремонтников, а также огромный архив ресурсов по HDD (firmware, документация, фото и т.п.). Портал прививает широкий взгляд на вещи, он будет интересен подготовленным и мотивированным людям. Во всяком случае, в закрытых конференциях ремонтников ссылки на него пробегают постоянно.

Сошлюсь и на свою статью «Как продлить жизнь жестким дискам» в трех частях. Она дает начальные сведения по обращению с HDD, и хотя написана более трех лет назад, устарела мало — диски за это время принципиально не изменились, разве что стали еще менее надежными из-за свирепой экономии. Производители, застигнутые мировым кризисом, снижали свои затраты по всем направлениям, что и послужило причиной ряда громких провалов 2008-2009 гг. Об одном из них речь пойдет в продолжении этого материала, которое выйдет в ближайшее время.

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

New disk was installed last week, I began the preclear and it was a very slow process. Way slower than even a PCI controlled disk should be. Today I began moving some data to the array. Since the new disk has the most room, data went straight to it. SLOW. Like 3000 kb/s max transfer rate. I use Total Commander, but tried Windows Explorer with no noticeable improvement.

2u3vzvd.png

I replaced the sata cable today, despite transfer rates reaching 35,000 kb/s with the previous 1TB FALS disk that was replaced. No increase in transfer speed.

Am I looking at another RMA?

S.M.A.R.T. report:

smartctl -a -d ata /dev/sdn (disk12)


=== START OF INFORMATION SECTION ===


Device Model:    WDC WD20EARS-00MVWB0


Serial Number:    WD-WCAZA8262273


Firmware Version: 51.0AB51


User Capacity:    2,000,398,934,016 bytes


Device is:        Not in smartctl database [for details use: -P showall]


ATA Version is:  8


ATA Standard is:  Exact ATA specification draft version not indicated


Local Time is:    Mon Oct 31 15:18:28 2011 PDT


SMART support is: Available — device has SMART capability.


SMART support is: Enabled


=== START OF READ SMART DATA SECTION ===


SMART overall-health self-assessment test result: PASSED


General SMART Values:


Offline data collection status:  (0x80) Offline data collection activity


was never started.


Auto Offline Data Collection: Enabled.


Self-test execution status:      (  0) The previous self-test routine completed


without error or no self-test has ever


been run.


Total time to complete Offline


data collection: (36780) seconds.


Offline data collection


capabilities: (0x7b) SMART execute Offline immediate.


Auto Offline data collection on/off support.


Suspend Offline collection upon new


command.


Offline surface scan supported.


Self-test supported.


Conveyance Self-test supported.


Selective Self-test supported.


SMART capabilities:            (0x0003) Saves SMART data before entering


power-saving mode.


Supports SMART auto save timer.


Error logging capability:        (0x01) Error logging supported.


General Purpose Logging supported.


Short self-test routine


recommended polling time: (  2) minutes.


Extended self-test routine


recommended polling time: ( 255) minutes.


Conveyance self-test routine


recommended polling time: (  5) minutes.


SCT capabilities:       (0x3035) SCT Status supported.


SCT Feature Control supported.


SCT Data Table supported.


SMART Attributes Data Structure revision number: 16


Vendor Specific SMART Attributes with Thresholds:


ID# ATTRIBUTE_NAME          FLAG    VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE


  1 Raw_Read_Error_Rate    0x002f  200  200  051    Pre-fail  Always      —      2


  3 Spin_Up_Time            0x0027  166  166  021    Pre-fail  Always      —      6683


  4 Start_Stop_Count        0x0032  100  100  000    Old_age  Always      —      15


  5 Reallocated_Sector_Ct  0x0033  200  200  140    Pre-fail  Always      —      0


  7 Seek_Error_Rate        0x002e  200  200  000    Old_age  Always      —      0


  9 Power_On_Hours          0x0032  100  100  000    Old_age  Always      —      165


10 Spin_Retry_Count        0x0032  100  253  000    Old_age  Always      —      0


11 Calibration_Retry_Count 0x0032  100  253  000    Old_age  Always      —      0


12 Power_Cycle_Count      0x0032  100  100  000    Old_age  Always      —      10


192 Power-Off_Retract_Count 0x0032  200  200  000    Old_age  Always      —      8


193 Load_Cycle_Count        0x0032  200  200  000    Old_age  Always      —      78


194 Temperature_Celsius    0x0022  125  120  000    Old_age  Always      —      25


196 Reallocated_Event_Count 0x0032  200  200  000    Old_age  Always      —      0


197 Current_Pending_Sector  0x0032  200  200  000    Old_age  Always      —      0


198 Offline_Uncorrectable  0x0030  100  253  000    Old_age  Offline      —      0


199 UDMA_CRC_Error_Count    0x0032  196  196  000    Old_age  Always      —      881355


200 Multi_Zone_Error_Rate  0x0008  100  253  000    Old_age  Offline      —      0


SMART Error Log Version: 1


No Errors Logged


SMART Self-test log structure revision number 1


No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1


SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS


    1        0        0  Not_testing


    2        0        0  Not_testing


    3        0        0  Not_testing


    4        0        0  Not_testing


    5        0        0  Not_testing


Selective self-test flags (0x0):


  After scanning selected spans, do NOT read-scan remainder of disk.


If Selective self-test is pending on power-up, resume after 0 minute delay.

Now at udma_crc_error_count=881579

syslog-2011-10-31.zip

10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

1

09.10.2013, 12:18. Показов 177951. Ответов 38


Всем привет вот и я стал счастливым обладателем этой ошибки. Начну по-порядку: Была система asrock h55 core i3-540 оперативы 2гига жесткий Вестерн на 500 гб 7200 об винда хр сп 3. Начала винда капризничать постоянно пытается проверить чек диск в итоге перезагрузка и опять чек и так до бесконечности, зашел в биос поставил по умолчанию загрузилась винда. Какое-то время работает, потом ни с того ни с сего в ребут и опять ошибка ввода вывода. Когда загрузил с надцатого раза проверил hdd scan smart показал желтый кружочек в Ultra dma crc error count. При попытке сделать образ системы акронис виснет. Скопировал все данные на другой диск. Пытался менять провода без толку, какое-то время работает и вылетает система с одной и той же ошибкой. Поставил диск с другой системы форматнул предварительно проверил в hdd scan smart все зеленое. Поставил другой блок питания мощнее заменил оперативу, установил виндовс 7. Проработал комп месяц- опять сбой операции ввода вывода, проверил диск hdd scan желтый кружок на Ultra dma crc error count. Вот вопрос, это уже материнке кранты или у меня лыжи не едут. Буду признателен за ответ в чем может быть проблема?

__________________
Помощь в написании контрольных, курсовых и дипломных работ, диссертаций здесь



0



Эксперт HardwareЭксперт Windows

21297 / 12107 / 653

Регистрация: 11.04.2010

Сообщений: 53,466

09.10.2013, 14:22

2

199 (C7) UltraDMA CRC Error Count — содержит количество ошибок, возникших по передаче по интерфейсному кабелю в режиме UltraDMA (или его эмуляции винчестерами SATA) от материнской платы или дискретного контроллера контроллеру диска.
В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E компьютера, либо плохой контакт в SATA-разъёме на диске либо материнской плате/контроллере.
Ошибки при передаче по интерфейсу и, как следствие, растущее значение атрибута могут приводить к переключению операционной системой режима работы канала, на котором находится накопитель, в режим PIO, что влечёт резкое падение скорости чтения/записи при работе с ним и загрузку процессора до 100%.
В случае винчестеров Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в более медленный режим, например SATA3 переключить в SATA2 соответствующими джамперами на нем.

источник Расшифровка параметров S.M.A.R.T



1



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

09.10.2013, 14:41

 [ТС]

3

да это все уже прочитано и опробовано, жесткий старый western по-новее seagate, кабели менялись переподключал к разным разъемам на мамке, единственное не чистил ластиком контакты, по-сути их надо на обоих дисках чистить, может быть проблема в материнке? да и ничего не перегревалось чисто офисный вариант. Могла как то это ошибка где то прописаться и заколбаситься в другой винт, биос по дефолту ставил ничего не разгонялось.



0



Эксперт HardwareЭксперт Windows

21297 / 12107 / 653

Регистрация: 11.04.2010

Сообщений: 53,466

09.10.2013, 14:49

4

Цитата
Сообщение от vadymyan
Посмотреть сообщение

Могла как то это ошибка где то прописаться и заколбаситься в другой винт

нет конечно
может контроллер на материнке глючит. биос обновите, что ли



0



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

09.10.2013, 15:27

 [ТС]

5

а как узнать поточнее контроллер на материнке или нет? у меня подозрение именно в сторону материнки.



0



Эксперт HardwareЭксперт Windows

21297 / 12107 / 653

Регистрация: 11.04.2010

Сообщений: 53,466

09.10.2013, 15:40

6

тут только хрустальный шар вам поможет. Если вы все перепробовали, то остается материнка, логично?



1



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

09.10.2013, 15:44

 [ТС]

7

Понял, спасибо за ответ, буду пробовать обновлять биос- не поможет найду мать другую, еще раз спасибо огромное.
Отпишусь только завтра.



0



Эксперт HardwareЭксперт Windows

21297 / 12107 / 653

Регистрация: 11.04.2010

Сообщений: 53,466

09.10.2013, 15:46

8

и вам не кашлять Удачи



1



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

09.10.2013, 16:30

 [ТС]

9

Спасибо, да, а можно вам задать еще один вопрос, у меня на другой системе биос отображается не влезая в окно экрана по ширине-раньше этого не было, после чего стало сложно сказать. может конечо это не в той теме, но все же спасибо.



0



Эксперт HardwareЭксперт Windows

21297 / 12107 / 653

Регистрация: 11.04.2010

Сообщений: 53,466

09.10.2013, 16:39

10

на мониторе есть кнопочка AUTO



1



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

09.10.2013, 16:47

 [ТС]

11

н-да, вторые сутки не сплю сори торможу, пора краситься в белый цвет. Спасибо.



0



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

10.10.2013, 22:44

 [ТС]

12

Вот блин не везет, сегодня хотел протереть резинкой контакты на диске- не нашел соотв. отвертку. Буду искать.



0



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

14.10.2013, 08:36

 [ТС]

13

Вот опять я с вопросами, скажите кто знает, ошибка Ultra dma crc error count должна сама уйти сразу или она уже никогда не уйдет и надо только флеш чистить или может есть еще какие способы. Попытался сделать образ диска на другом компе прога парагон из под доса зависла а потом выдала ошибка ввода вывода. Т.е. по всей сути все-таки диску *прощай* контакты на диске почистил.



0



Эксперт HardwareЭксперт Windows

21297 / 12107 / 653

Регистрация: 11.04.2010

Сообщений: 53,466

14.10.2013, 12:53

14

Цитата
Сообщение от vadymyan
Посмотреть сообщение

Ultra dma crc error count должна сама уйти

нет конечно, она останется

Цитата
Сообщение от vadymyan
Посмотреть сообщение

Т.е. по всей сути все-таки диску *прощай*

возможно…



0



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

14.10.2013, 16:28

 [ТС]

15

спасибо



0



684 / 510 / 36

Регистрация: 23.08.2013

Сообщений: 1,243

14.10.2013, 19:41

16

Цитата
Сообщение от vadymyan
Посмотреть сообщение

Когда загрузил с надцатого раза проверил hdd scan smart показал желтый кружочек в Ultra dma crc error count.

SMART надо показывать, а не рассказывать.
Ты же не сильно хорошо разбираешься в атрибутах смарта? Другие участники могут увидеть нелады в том, на что ты не подумаешь.

Цитата
Сообщение от vadymyan
Посмотреть сообщение

Вот блин не везет, сегодня хотел протереть резинкой контакты на диске- не нашел соотв. отвертку.

Ищи TORX-9. Контактики под платой у WD иногда подводят — окисляются.



0



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

15.10.2013, 08:50

 [ТС]

17

вот где то так

Миниатюры

SMART - 199 (C7) Ultra DMA CRC Error Count - что с диском?
 



0



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

15.10.2013, 09:46

 [ТС]

18

Цитата
Сообщение от vadymyan
Посмотреть сообщение

вот где то так

спасибо за подсказку смарт выложил, отвертки нашел, протер.

Добавлено через 45 минут



0



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

15.10.2013, 09:49

 [ТС]

19

а вот что показывает фирменная утилита от вестерн дижитал

Миниатюры

SMART - 199 (C7) Ultra DMA CRC Error Count - что с диском?
 



0



10 / 10 / 1

Регистрация: 09.10.2013

Сообщений: 466

15.10.2013, 09:58

 [ТС]

20

Какие будут советы?



0




   Сидит программист за компьютером. Звонок в дверь.
   Открывает, а там маленькая Смерть с отверткой.

   — Мне рано умирать, я еще молод!
   — Не бойся, парень, я за винтом пришла…
   Анекдот


   Жесткий диск — зверь очень хитрый. Так и норовит куда-то упасть, рассыпать таблицы разделов, забыть пару кластеров, а то и рухнуть всеми 32-мя битами FAT’а на голову несчастному пользователю. В один миг вы можете лишиться всей бесценной, накопленной за долгие годы работы информации. Конечно, можно проклинать судьбу и тщательно затирать свое горе спиртом — но не разумнее ли будет предупредить возможный сбой, нежели надеяться на его величество случай!?

   Что такое S.M.A.R.T?


   Впервые над этим задумались в 1995 году. Именно тогда инженеры IBM предложили систему предсказания надежности Predictive Failure Analysis. Вся соль технологии состояла в попытке предсказания того самого дня X и времени Ч, когда наш друг-винчестер решит отойти в мир иной. Немногим позже корпорация Compaq в коалиции с Seagate, Quantum и Conner разработали собственную технологию мониторинга состояния жесткого диска. Проект получил название IntelliSafe. Новоиспеченная технология отслеживала ряд критических характеристик диска, сравнивала полученные значения с допустимыми и рапортовала системе в случае опасности.

67 Kb
— DTemp — грамотно, просто и со вкусом

Еще некоторое время спустя при участии большинства крупных производителей жестких дисков появилась технология S.M.A.R.T. Self Monitoring Analysing and Reporting Technology (от англ. «технология самодиагностики, анализа и отчета»), в основе которой лежали наработки как IntelliSafe, так и PFA.
   Вкратце, технология работает следующим образом. Устройство — дисковый накопитель, в котором реализованы функции S.M.A.R.T., — ведет статистику своих рабочих параметров (количество наработанных часов, время разгона шпинделя, обнаруженные/исправленные ошибки и т.п.). Показания S.M.A.R.T. накапливаются в служебных зонах или в энергонезависимой памяти носителя. На основе этой информации можно судить о состоянии механики, условиях эксплуатации, а также своевременно заметить предаварийное состояние диска. Между тем, необходимо понимать, что технология S.M.A.R.T. не в силах устранить возникшую проблему. Она лишь способна предупредить о возможном крушении диска и последующей за этим потере информации.
   В своем развитии технология S.M.A.R.T. прошла три этапа. В первом поколении было реализовано наблюдение лишь за небольшим количеством параметров диска. Никаких самостоятельных действий со стороны накопителя не предусматривалось. Все функции управления ложились на внешние программные утилиты. Строгих спецификаций, четко описывающих стандарт, не было. Как следствие, каждый производитель самостоятельно решал, какие именно показатели надлежит мониторить в каждой конкретной модели дискового накопителя. Только в следующем воплощении S.M.A.R.T. появилась фоновая проверка поверхности в автоматическом режиме и ведение журналов ошибок. Значительно расширился список контролируемых параметров и появилось нечто вроде спецификации, определяющей, какие из этих параметров
являются обязательными и критически важными, а какие можно причислить к вспомогательным и необязательным.   
   Разумно сделать небольшое лирическое отступление и вкратце поведать о такой неотъемлемой части технологии, как «журнал ошибок диска». По спецификации, винчестер сохраняет историю пяти последних ошибок (это число может варьироваться).
Кроме того, запоминаются последние пять команд, за которыми, собственно, и последовала каждая из ошибок. Зачем это надо? Дело в том, что журналы ошибок S.M.A.R.T. помогают в деталях воссоздать картину крушения диска. Другой вопрос — кому это надо. Ясное дело — рядовой пользователь слыхом не слыхивал ни об ATA-командах, ни о кодах и расшифровках сбойных ситуаций. Потому расшифровать журнал могут только высококвалифицированные специалисты, которым по гарантии возвращается диск.

Воля случая

Как известно, жесткий диск — устройство очень хрупкое. Порой падение винчестера даже с небольшой высоты может вызвать внутренние повреждения или клиническую смерть. Такова жизнь, и никто в этом мире не застрахован от роковой случайности…
   Самым распространенным последствием удара является «шлепок головок». Он происходит, когда энергия удара направлена вертикально или под некоторым углом к горизонтальной плоскости диска.
Проще говоря, подобного эффекта можно добиться, если как следует — резко и энергично — потрясти диск вверх-вниз. При особо сильных пертурбациях происходит отрыв магнитной головки от поверхности накопителя, а затем резкий удар о поверхность магнитного диска. Результаты подобных коллизий довольно плачевны. На месте соприкосновения головки с диском появляются поврежденные сектора, и как следствие — теряется бесценная информация.

Это могут быть как лаборанты на мощностях вендора/дилера/продавца, так и инженеры с завода самого производителя.
   Современный этап развития представлен технологией третьего поколения — S.M.A.R.T III. Конечно, спецификация еще далека от совершенства, однако в сравнении с предыдущими версиями она стала значительным шагом вперед. Наглядный пример тому — неумолимая статистика, которая утверждает, что число правильно и своевременно предсказанных сбоев достигло 80%! Важно отметить, что в третьей модификации S.M.A.R.T. появилась функция обнаружения дефектов поверхностии возможность их последующего «прозрачного» восстановления. Выражаясь простыми словами, жесткий диск неспешно сканирует поверхность и при наличии испорченных секторов замещает их на запасные из резервной области. Причем пользователь даже не заметит каких-либо действий со стороны винчестера. Меньше знаешь — крепче спишь!

   Атрибуты «умного» диска


   Нам уже известно, что S.M.A.R.T. производит наблюдение за основными характеристиками или, как их еще называют, атрибутами винчестера. Каждый атрибут имеет вполне определенное значение — value, которое характеризует собой степень надежности. Обычно эта величина изменяется в диапазоне от 1 до 100. Реже встречаются значения от 1 до 253. Чем выше значение value, тем лучше. Исправный жесткий диск должен выдавать максимум по всем параметрам, а изменяющиеся во времени или уверенно убывающие значения не сулят ничего хорошего. Это в теории. На практике же нужно учитывать, что спецификация универсальна и адаптирована для огромного спектра дисковых накопителей, имеющих разное механическое устройство и электронику. То есть конкретное устройство вполне может иметь средние показатели надежности по всем атрибутам, работая при этом исправно много лет. Поэтому для каждого атрибута принято выбирать минимальное значение (это делает сам производитель), при котором гарантируется безотказная работа данной конкретной модели жесткого диска. Эта величина именуется пороговым значением — threshold.
   В настоящий момент официальная документация и подробные описания технологии S.M.A.R.T. журналистам недоступны. В связи с этим отыскать исчерпывающую информацию по всем параметрам S.M.A.R.T. достаточно трудно. Тем не менее мы собрали и систематизировали те из них, которые тем или иным способом стали известны широкой общественности. Полагаю, начать следует с наиболее важных и повсеместно наблюдаемых атрибутов.
   * Raw Read Error Rate — частота ошибок при чтении данных с диска.
   Частота ошибок чтения информации с диска, происхождение которых обусловлено аппаратной частью жесткого диска.
   * Read Channel Margin — запас канала чтения.
   Увы, назначение этого атрибута покрыто завесой тайны.

218 Kb
— DriveHealth сочетает в себе массу полезных возможностей. Огорчает лишь то, что за полноценное использование программы разработчик требует пеню

Доподлинно известно лишь одно — он используется в накопителях производства Maxtor.
   * Reallocated
Sector Count — число переназначенных секторов.   
   Когда жесткий диск встречает ошибку чтения/записи, он пытается переместить поврежденные данные в специальную резервную область и, в случае успеха, помечает сектор как переназначенный. Благодаря этой возможности современные жесткие диски способны скрывать незначительное число плохих секторов. Однако при большом количестве переназначенных секторов (до 10% от общего количества секторов и более) наблюдается резкое падение скорости чтения.
   * Reallocation Event Count — количество операций переназначения сбойных секторов.
   Показывает общее число попыток переназначения сбойных секторов в резервную область диска. При этом учитываются как успешные, так и неудачные операции.
   * Seek Error Rate — ошибки позиционирования блока головок.

   Ошибки позиционирования возникают при повреждении сервометок, перегреве носителя или в случае сбоя механической системы позиционирования. Большое количество ошибок позиционирования свидетельствует о низком качестве поверхности или поврежденной механике головок носителя.
   * Spin Up Time — время раскрутки диска из состояния покоя до рабочей скорости.
   Среднее время раскрутки шпинделя диска до рабочей скорости. Предположительно, в поле «value» содержится время в миллисекундах/секундах.
   * Spin Retry Count — число повторных попыток раскрутки дисков до рабочей скорости.
   Данный атрибут характеризует число попыток раскрутки шпинделя до рабочей скорости, при условии что первая попытка была неудачной. Напомним, что атрибут имеет не прямое значение, а отражает лишь некий сборный параметр надежности по отдельно взятой характеристике. Соответственно, большое значение — значит «хорошо», а маленькое говорит о неполадках в механике привода.

   Разобравшись с критически важными атрибутами, поговорим об информационных значениях S.M.A.R.T.
   * Current Pending Sector Count — текущее число нестабильных секторов.
   Здесь хранится число претендентов на переназначение в резервную область диска. Судьба отдельно взятого сектора, попавшего в этот список, решается следующим образом. Если сектор будет считываться успешно, то он исключается из списка. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить и перенести информацию в резервную область, а сам сектор пометит как переназначенный. Постоянно ненулевое значение этого атрибута говорит о низком качестве поверхности диска.
   * Drive Temperature — температура.
   Отображает показания встроенного термодатчика.

Анатомия жесткого диска

 Все знают, что такое винчестер. Однако немногие знают, что у него внутри. Позволю себе приоткрыть завесу тайны. Любой винчестер состоит из гермоблока и платы электроники. В гермоблоке размещена вся механика, то есть сами диски, двигатель и магнитные головки по одной на каждый диск. Между тем, дисков, также называемых «блинами», в устройстве может быть несколько. На один блин вмещается до 80 гигабайт (в последних моделях) информации. К примеру, 120-гигабайтный винчестер может состоять из трех дисков по 40 Гб или двух по 60 Гб. В свою очередь, диски собраны в так называемый дисковый пакет. Оный пакет дисков закрепляется на оси шпинделя, в котором, собственно, и находится движок винчестера.
   Что касается электронной части винчестера… На самом деле, плата электроники современного жесткого диска — это настоящий микрокомпьютер с собственным процессором, памятью, внешними интерфейсами, устройствами ввода/вывода и прочими неотъемлемыми компонентами. Нетрудно догадаться, что основные задачи электроники — это управление механикой диска, а также преобразование магнитных сигналов в цифровые и наоборот.

Температура имеет огромное влияние на срок службы диска. По непонятным причинам этот атрибут отсутствует у Western Digital.
   * Device (Drive) Power Cycle Count — число полных циклов включения-выключения винчестера.
   По этому атрибуту можно оценить, как часто использовался диск.

   * Power-On Hours — количество наработанных часов.

   Поле «value» этого параметра показывает общее время работы диска. В качестве порогового значения выбирается паспортное время наработки на отказ (MTBF — Mean Time Between Failures). Принимая во внимание заоблачно высокие паспортные значения MTBF, маловероятно, что атрибут может достигнуть критического порога.
   * Start/Stop Count — число циклов запуск-остановка шпинделя.
   Моторчик жесткого диска может пережить определенное — гарантированное производителем — число старт-стопов. Это значение и выбирается в качестве критического порога. Важно сказать, что первые модели дисков со скоростью вращения 7200 оборотов в минуту имели не самый надежный двигатель и, как следствие, частенько выходили из строя.
   * G-Sense Error Rate — частота появления ошибок в результате ударных
нагрузок.   
   Хранит показания ударочувствительного сенсора. Точнее, выводит общее количество ошибок, возникших в результате удара, падения или неаккуратной установки диска в корпус компьютера.

   * Load-in Friction (HoursTime) — общее время работы головки под влиянием нагрузок.
   Предположительно, данный атрибут показывает общее время работы блока головок под воздействием центробежных сил. Не углубляясь в туманные просторы физики, попробую объяснить сей факт на пальцах. На высокой скорости вращения дисков (5000-10000 оборотов в минуту) в накопителе неизбежно возникают центробежные силы. Очевидно, что головка при перемещении по диску также испытывает воздействие этих сил.

   * GMR Head Amplitude — амплитуда дрожания головок в рабочем состоянии.
   Воздействие центробежной силы приводит к дрожанию головок над поверхностью диска. Высокая амплитуда дрожания может вызвать соприкосновение блока головок с поверхностью. Как следствие — появление поврежденных секторов. Чем меньше амплитуда, тем лучше. Тем не менее, касательно значения, данного атрибутом, все в точности наоборот. Больше — лучше!
   * Recalibration Retries — количество повторов рекалибровки.
   Характеризует количество попыток установки головок на нулевую дорожку, при условии что первая попытка была неудачной. Значение этого атрибута, меньшее порогового threshold, говорит о неполадках в механике жесткого диска.
   * Soft Read Error Rate — частота появления «программных» ошибок при чтении данных с диска.
   В переводе на общедоступ
ный язык — параметр информирует нас о программных ошибках чтения данных. К таковым можно отнести ошибки программного обеспечения, драйверов, файловой системы и неверную разметку диска. Словом, почти все, что не относится к аппаратной части винчестера.
   * Throughput Performance — средняя производительность диска.
   Предположительно, параметр показывает среднюю пропускную способность жесткого диска. Уменьшение значения с некоторой вероятностью указывает на проблемы в накопителе.
   * UltraDMA CRC Error Count — общее количество ошибок CRC в режиме UltraDMA.
   Выражаясь простым русским языком, атрибут отображает число ошибок контрольной суммы CRC. На практике подобные ошибки появляются при разгоне системы, сильно перекрученном шлейфе, а также по вине драйверов нерадивого Windows.

   * Uncorrectable Sector Count — число нескорректированных ошибок.
   Этот атрибут информирует нас об ошибках чтения/записи, которые не удалось исправить. Возможной причиной возникновения ошибок подобного рода может быть повреждение поверхности диска.
   * Write Error Rate (Multi Zone Error Rate) — частота появления ошибок при записи данных.
   Показывает общее число ошибок записи на диск. Чем больше значение, тем хуже состояние поверхности или механики винчестера.
   Все происходящие ошибки и изменения параметров заносятся в журналы S.M.A.R.T. При значении атрибута ниже величины порога threshold жесткий диск сиюминутно рапортует о неполадке напрямую в BIOS системы. Затем информация по цепочке передается драйверам Windows, которые и сообщают пользователю о возникшей проблеме.

   Защити данные с умом!

   Жаль, но встроенными — зачастую скромными — функциями BIOS и операционной системы не отделаешься. Системный драйвер на пару с БИОСом не покажут вам текущую температуру жесткого диска, не сообщат об очередной ошибке чтения и не поведают о количестве переназначенных секторов. Поэтому имеет смысл установить специальные утилиты для чтения показаний атрибутов и содержимого журналов S.M.A.R.T.
   Одна из самых простых и несложных программок — DTemp (ищите на нашем диске). Весит она не
больше 100 кб, но пользы способна принести на целый гигабайт!
   Как и любая другая программа подобного рода, DTemp выводит таблицу со значениями каждого атрибута, величинами критического порога, а также, кроме всего прочего, показывает приблизительную дату того самого «дня X«.
   В общем и целом табличный вывод программы расшифровывается следующим образом.


   Attribute

   Value

   Threshold

   RAW

   Attribute Flags

   Spin Up Time

   102

   21

   000000001612h

   PR SP CR OC


   * Attribute — имя атрибута;
   * ID — номер атрибута;
   * Value — значение атрибута (чем оно больше — тем супер);
   * Threshold — пороговое значение атрибута (если value меньше, чем threshold, готовьтесь к неприятностям);
   * Raw — текущее значение атрибута в шестнадцатеричной системе исчисления;
   * Type (Flags) — тип атрибута.
   Стоит ли говорить, что DTemp следит за температурой вашего диска и в случае перегрева незамедлительно бьет тревогу. Плюс ко всему, эта чудо-программка бесплатна! То бишь, не мудрствуя лукаво, достаем компакт-диск «Игромании», лезем в раздел «По журналу», устанавливаем и наслаждаемся.
   По сути дела, возможностей DTemp должно хватить за глаза. Тем не менее, существуют и другие утилиты, достойные нашего пристального внимания. Как вариант, на страже здоровья вашего диска встанет DriveHealth, который по своим возможностям даже несколько превосходит расхваленный выше DTemp. В частности, DriveHealth выводит краткую аннотацию к каждому атрибуту, фиксирует любое изменение состояния диска, следит за температурой винчестера. Словом, целая корзина вкусностей и полезностей. Свежую версию программы можно скачать с сайта разработчика — www.drivehealth.com — или взять с нашего компакта.
   Закончить сегодняшнюю статью хочется словами одного небезызвестного телеведущего: «В наши дни надежность ценится все больше. Покупая автомобиль, мы непременно хотим приобрести надежный. Приятно иметь надежных друзей, а директор счастлив, если его работники отличаются надежностью«… Чего уж говорить про жесткие диски?

 Терминология

333 Kb
— Похожий проигрыватель грампластинок был у меня в далеком детстве

 Блок головок — или, попросту, головка жесткого диска. Данные с поверхности диска считываются непосредственно магнитной головкой. Принцип действия головок жесткого диска мало чем отличается от принципа действия головки обычного магнитофона. Действительно, при записи головка создает магнитное поле, за счет чего участок диска намагничивается. При считывании же — наоборот, поле диска возбуждает сигнал в головке.
   Носитель — он же дисковый накопитель, винчестер, и по совместительству жесткий диск.
   Контрольная сумма (CRC) — служебный блок информации, сформированный с помощью специального алгоритма на основе информации, содержащейся в секторе. Каждому сектору на диске соответствует своя контрольная сумма. С помощью CRC можно определить, не произошло ли несанкционированное изменение/повреждение информации.
   Разметка жесткого диска — разбиение поверхности винчестера на загрузочную и служебную области, кластеры, сектора, сервометки и т.п.
   Сервометки — специальная разметка магнитной поверхности дисков HDD. Используется для точного попадания головок на дорожки, получения номеров дорожек и стабилизации частоты вращения двигателя. В случае порчи подлежит восстановлению только на заводе.

Одним из самых узких мест в компьютере до сих пор остается жесткий диск. Я не говорю о твердотельных накопителях SSD, у них тоже есть свои плюсы и минусы. Сегодня речь пойдет о жестких дисках, принцип работы которых был разработан еще в прошлом веке.

Принцип до сих пор остался прежним, изменяется только технология изготовления  пластин и электроники, которая  контролирует все процессы, происходящие на жестком диске.Показателем здоровья жесткого диска является таблица SMART.

S.M.A.R.T. (от английского self-monitoring, analysis and reporting technology ) — технология самоконтроля, анализа и отчётности) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.

Жесткий диск я купил 1,5 года назад. Хотелось поменять свой тихоходный системный диск Hitachi 500Gb, на что-то пошустрей.  Выбор был невелик  — Western Digital Caviar Black 1Tb SATAIII или Seagate Barracuda  (ST1000DM003) 1Tb SATAIII. Выбор пал в пользу последнего. Это был первый жесткий диск на рынке с терабайтной пластиной, что сразу снимало несколько проблем:  нагрев, шум, энергопотребление. Максимальная скорость чтения в HD Tune переваливала за 200 Мб/сек, когда Hitachi показывал максимум 85. Вдобавок, Seagate был в полтора раза тоньше своих собратьев!

Все работало хорошо до последнего дня. Компьютер начал грузиться дольше, чем обычно. Перед загрузкой Windows  каждый раз начинал запускать ScanDisk, проверяя жесткий диск на ошибки. Меня насторожило странное поведение компьютера и я решил проверить его на вирусы, загрузившись с LiveCD. Вирусов не было, поэтому я решил посмотреть на SMART дисков,  чтобы удостовериться, что там все в порядке. Оказалось это не так. Напротив строки (C7) Ultra DMA CRC Error Count  подсвечивалось предупреждение желтым цветом и счетчик показывал значение 1234.

Таблица SMART жесткого диска Seagate

В моей практике было несколько случаев, связанным с увеличением этого счетчика, но все решалось элементарной заменой интерфейсного кабеля. В данном случае это не помогло. В интернете описано много возможных путей решения этой проблемы, которые сводятся к следующему:

  1. Замена интерфейсного кабеля SATA (желательно с защелками);
  2. Возможный разгон шины PCI/PCI-E компьютера (сброс на заводские установки);
  3. Обновление BIOS материнской платы;
  4. Плохой контакт на разъеме жесткого диска или материнской платы (очистка контактов от окисления с помощью спирта или ластика);
  5. Переключение SATA кабеля на другой разъем;
  6. Нестабильное питание жесткого диска (замена блока питания);
  7. Перегрев южного моста материнской платы (замена термопасты);
  8. Деградация чипсета материнской платы;
  9. Несовместимость чипсета и контроллера жесткого диска;
  10. Смена режима работы контроллера (установка перемычек на жестком диске и переключение  в режим SATA I)
  11. Обновление драйверов чипсета материнской платы   

(C7) Ultra DMA CRC Error Count — содержит количество ошибок, возникших по передаче по интерфейсному кабелю в режиме Ultra DMA (или его эмуляции винчестерами SATA) от материнской платы или дискретного контроллера контроллеру диска.

Счётчик каждый раз увеличивался, когда я начинал на него записывать крупные массивы данных. Но самое интересное, что на этом компьютере у меня стоит второй жесткий диск — Western Digital Green 2Tb и когда я начинаю на него сбрасывать огромные файлы — никаких ошибок нет! Я решил поставить  свой старый жесткий диск Hitachi с теми же кабелями и в тот же разъем, где были проблемы у Seagate — никаких ошибок нет!!!

Дальше я начал проверять все методом исключения и первое что я сделал – проверил Seagate на другом компьютере. О Чудо!!! Ни одной ошибки при записи! Значит, проблема с материнской платой и она все-таки деградировала за время работы?

Пока решил не делать поспешных выводов, а вытянуть материнскую плату из корпуса и хорошо все просмотреть. Внешний осмотр ничего не дал, никаких изменений я не заметил в плане вздувшихся конденсаторов или механических повреждений. Решил не отчаиваться, а попробовать прозвонить конденсаторы прибором, который я купил для ремонтов БП:

Прибор для проверки конденсаторов

Прибор позволяет проверять электролитические конденсаторы на синусоидальном переменном токе без выпаивания из схемы. Это экономит уйму времени при ремонтах.

И мне повезло. Я нашел два конденсатора 1000mkF x 10v в районе  чипсета, которые показывали обрыв.  Стоят они в фильтрах стабилизаторов питания 5V.  Поставил новые конденсаторы, подключил жесткий диск к материнской плате и попробовал запись на диск. Счетчик ошибок замер на значении 1340 и больше не увеличивался при любой нагрузке.

Можно сделать вывод, что по линии 5V шли сильные искажения питания, которые не давали нормально работать паре южный мост – контроллер винчестера. В свою очередь котроллер Seagate оказался очень чувствителен к таким искажениям и не мог правильно сравнивать контрольные суммы. Это привело к увеличению счетчика Ultra DMA CRC Error Count.

Если вы уже все испробовали не сдавайтесь, возможно у вас на материнской плате найдется тоже конденсатор подлежащий замене.

Удачи!

Понравилась статья? Поделить с друзьями:
  • Ubuntu server 500 internal server error
  • Ubuntu repository gpg error
  • Ubuntu read only file system как исправить
  • Ubuntu phpmyadmin error 1045
  • Ubuntu permission denied как исправить