Print reg error i o error dev sda sector

При старте ПК наблюдаю множество ошибок в dmesg: Если же прочитать любой отдельный сектор вручную получаю иногда Но иногда это просто succeeded, то есть сектора читаются. Я проверил SMART - пишет что ошибок на диске нет.
  • Печать

Страницы: [1] 2  Все   Вниз

Тема: Ошибка диска: I/O error, dev sda, sector XXXXX  (Прочитано 10009 раз)

0 Пользователей и 2 Гостей просматривают эту тему.

Оффлайн
p4sh

При старте ПК наблюдаю множество ошибок в dmesg:

https://paste.ubuntu.com/p/YKY74JTwsD/

Если же прочитать любой отдельный сектор вручную получаю иногда

root@mail:~# hdparm --read-sector 25523880 /dev/sda

/dev/sda:
reading sector 25523880: SG_IO: bad/missing sense data, sb[]:  70 00 03 00 00 00 00 0a 40 51 e1 01 11 04 00 00 00 a8 00 00 00 00 00 00 00 00 00 00 00 00 00 00
succeeded


Но иногда это просто succeeded, то есть сектора читаются.
Я проверил SMART — пишет что ошибок на диске нет.

Проблема в том, что по истечении некоторого времени одна из файловых систем (/var) становится в read-only и перестаёт работает множество программ.
Что посоветуете сделать?


ТС не появлялся на Форуме более полугода по состоянию на 22/07/2019 (последняя явка: 23/11/2018). Модератором раздела принято решение закрыть тему.
—zg_nico

« Последнее редактирование: 22 Июля 2019, 15:23:03 от zg_nico »


Онлайн
ALiEN175

« Последнее редактирование: 13 Августа 2018, 13:11:14 от ALiEN175 »

ASUS P5K-C :: Intel Xeon E5450 @ 3.00GHz :: 8 GB DDR2 :: Radeon R7 260X :: XFCE
ACER 5750G :: Intel Core i5-2450M @ 2.50GHz :: 6 GB DDR3 :: GeForce GT 630M :: XFCE


Оффлайн
p4sh


Оффлайн
bearpuh

Я проверил SMART — пишет что ошибок на диске нет.

А это ни о чем не говорит?

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%     20772         25523880
# 2  Short offline       Completed: read failure       90%     20677         1057345043
# 3  Short offline       Completed: read failure       90%     20677         1057345043
# 4  Short offline       Completed: read failure       90%     20677         1057345043
# 5  Short offline       Completed: read failure       90%     20677         1057345043

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%     29074         24928270

На дисках присутствуют нечитаемые сектора.
Бэкап в первую очередь, потом проверка с помощью виктории или badblocks

sudo /usr/sbin/badblocks -o /path/to/file/badblocks.list -b 4096 -s -v -t random /dev/sdX


Оффлайн
p4sh

В том и дело, сектора читаются (или я ошибаюсь, прошу поправить):

root@mail:~# hdparm --read-sector 1873032872 /dev/sda
/dev/sda:
reading sector 1873032872: succeeded
0000 0000 f40f 0c01 4442 4537 4136 3534
3937 3335 6857 5806 1400 0c01 4433 3639
.......

root@mail:~# hdparm --read-sector 148453280 /dev/sda

/dev/sda:
reading sector 148453280: succeeded
bb10 5600 0c00 0102 2e00 0000 ba10 5600
3000 0202 2e2e 0000 bc10 5600 2400 1c01

root@mail:~# hdparm --read-sector 1285929908 /dev/sda

/dev/sda:
reading sector 1285929908: SG_IO: bad/missing sense data, sb[]:  70 00 03 00 00 00 00 0a 40 51 e0 01 11 04 00 00 a0 b4 00 00 00 00 00 00 00 00 00 00 00 00 00 00
succeeded
0000 0000 0000 0000 0000 0000 0000 0000


Спасибо!


Оффлайн
bearpuh

В том и дело, сектора читаются

Чтобы в этом убедиться, необходимо проверить.
Как, я уже написал.
Я бы еще подключил к другому контроллеру/компу для проверки.


Оффлайн
Sly_tom_cat

Беды в SMART заменой контроллера не решить.

Контроллер это обычно вылезает в :

199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0Но тут чисто.


Оффлайн
bearpuh

Беды в SMART заменой контроллера не решить.

Согласен. Смутило просто.

SG_IO: bad/missing sense data


Оффлайн
snowin

В том и дело, сектора читаются (или я ошибаюсь, прошу поправить)

ты ошибаешься


Оффлайн
ReNzRv

Проверять и лечить лучше с загрузочного образа Seagate Tools for DOS
командами Zero All (затирает все сектора) и Long Test (DST) — полная проверка всех секторов с переопределением бэдов на уровне контроллера диска.


Оффлайн
p4sh

Z

man hdparm

       --read-sector
              Reads from the specified sector number, and dumps the contents in hex to standard output.  The sector number must be given (base10) after this option.  hdparm will issue a
              low-level  read (completely bypassing the usual block layer read/write mechanisms) for the specified sector.  This can be used to definitively check whether a given sector
              is bad (media error) or not (doing so through the usual mechanisms can sometimes give false positives).

ты ошибаешься

Мне не понятно, могли бы объяснить подробнее, почему при чтении hdparm получаем «SUCCESS», но сектора «не читаемые»? Это негожий софт?

« Последнее редактирование: 15 Августа 2018, 09:49:18 от p4sh »


Оффлайн
bearpuh

hdparm получаем «SUCCESS», но сектора «не читаемые»?

А сколько времени затрачивается на чтение этого сектора?
По какому принципу та же victoria hdd определяет статус сектора — «bad»?
Прочтите это сектор викторией, возможно станет понятней.
Хотите теории, вот она, от автора smartmontools — https://www.smartmontools.org/wiki/BadBlockHowto#ext2ext3secondexample


Пользователь добавил сообщение 15 Августа 2018, 10:13:40:


Вот еще обратите внимание.
У вас несколько секторов на обоих дисках кандидаты на перемещение.

197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       2
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       4


Пользователь добавил сообщение 15 Августа 2018, 10:15:17:


Им можно «дать пинка» — force rellocation.
Инфа есть в вышеуказанной ссылке по smartmontools.

« Последнее редактирование: 15 Августа 2018, 10:15:17 от bearpuh »


Оффлайн
snowin

Им можно «дать пинка» — force rellocation.

достаточно просто записать в них и заново считать, можно несколько раз
если это бэды, винч сам их переместит, в противном случае это просто так называемые «софтовые бэды» и они должны будут исчезнуть из смарта


Оффлайн
p4sh

Что я сделал:
загрузился с live usb, собрал массив и проверил ФС:
e2fsck -ct /dev/…
Прогнал тесты еще раз.
Перезагрузился и мониторю состояние ФС.
Также обновился smart:
Изменился Multi_Zone_Error_Rate
Остался на sda 1 сектор на перемещение: Current_Pending_Sector 1

/dev/sda

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  1 Raw_Read_Error_Rate     POSR-K   200   200   051    -    24
  3 Spin_Up_Time            POS--K   179   172   021    -    4033
  4 Start_Stop_Count        -O--CK   099   099   000    -    1401
  5 Reallocated_Sector_Ct   PO--CK   200   200   140    -    0
  7 Seek_Error_Rate         -OSR-K   200   200   000    -    0
  9 Power_On_Hours          -O--CK   072   072   000    -    20819
 10 Spin_Retry_Count        -O--CK   100   100   000    -    0
 11 Calibration_Retry_Count -O--CK   100   100   000    -    0
 12 Power_Cycle_Count       -O--CK   100   100   000    -    876
192 Power-Off_Retract_Count -O--CK   199   199   000    -    758
193 Load_Cycle_Count        -O--CK   200   200   000    -    642
194 Temperature_Celsius     -O---K   102   081   000    -    45
196 Reallocated_Event_Count -O--CK   200   200   000    -    0
197 Current_Pending_Sector  -O--CK   200   200   000    -    1
198 Offline_Uncorrectable   ----CK   200   200   000    -    1
199 UDMA_CRC_Error_Count    -O--CK   200   200   000    -    0
200 Multi_Zone_Error_Rate   ---R--   200   200   000    -    1

/dev/sdb

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  1 Raw_Read_Error_Rate     POSR-K   200   200   051    -    209
  3 Spin_Up_Time            POS--K   191   173   021    -    3416
  4 Start_Stop_Count        -O--CK   099   099   000    -    1680
  5 Reallocated_Sector_Ct   PO--CK   200   200   140    -    0
  7 Seek_Error_Rate         -OSR-K   100   253   000    -    0
  9 Power_On_Hours          -O--CK   060   060   000    -    29215
 10 Spin_Retry_Count        -O--CK   100   100   000    -    0
 11 Calibration_Retry_Count -O--CK   100   100   000    -    0
 12 Power_Cycle_Count       -O--CK   100   100   000    -    773
192 Power-Off_Retract_Count -O--CK   200   200   000    -    650
193 Load_Cycle_Count        -O--CK   200   200   000    -    1029
194 Temperature_Celsius     -O---K   103   091   000    -    44
196 Reallocated_Event_Count -O--CK   200   200   000    -    0
197 Current_Pending_Sector  -O--CK   200   200   000    -    0
198 Offline_Uncorrectable   ----CK   200   200   000    -    4
199 UDMA_CRC_Error_Count    -O--CK   200   200   000    -    0
200 Multi_Zone_Error_Rate   ---R--   200   200   000    -    3


Сейчас проверю с помощью Victoria (она же делала авторемап вроде).
Спасибо всем за ответы — очень полезный топ для меня!


Оффлайн
snowin

Сейчас проверю с помощью Victoria (она же делала авторемап вроде).

ремап тебе не нужен
кабель, для начало, поменяй
на обоих винтах
по поводу

В том и дело, сектора читаются (или я ошибаюсь, прошу поправить):

кажется, что ты совсем не понимаешь, что делаешь и для чего
ты берешь случайный сектор на диске и проверяешь его утилитой hdparm на чтение и утверждаешь что он читается
в то время как проблемные сектора ты не проверяешь
тем не менее твои случайные, безрассудные действия (переборка рейда) привели к более хорошим результатам
но это топорный метод

« Последнее редактирование: 16 Августа 2018, 15:17:24 от snowin »


  • Печать

Страницы: [1] 2  Все   Вверх

Здравствуйте. Подскажите пожалуйста, что можно сделать с этим диском?(кроме как поменять)
Критичны ли эти ошибки?

[531787.817056] ata4.00: configured for UDMA/133
[531787.817074] sd 3:0:0:0: [sdd] tag#4 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[531787.817078] sd 3:0:0:0: [sdd] tag#4 Sense Key : Medium Error [current]
[531787.817081] sd 3:0:0:0: [sdd] tag#4 Add. Sense: Unrecovered read error
[531787.817085] sd 3:0:0:0: [sdd] tag#4 CDB: Read(10) 28 00 05 a8 c0 80 00 04 00 00
[531787.817088] print_req_error: I/O error, dev sdd, sector 94945457
[531787.817844] ata4: EH complete

Вывод smartctl -a /dev/sdd

smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.15.18-15-pve] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Re
Device Model:     WDC WD2004FBYZ-01YCBB1
Serial Number:    WD-WMC6N0D0Y4MT
LU WWN Device Id: 5 0014ee 05994de88
Firmware Version: RR04
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Tue Jun 11 15:10:59 2019 +07
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (    0) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 220) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   199   051    Pre-fail  Always       -       1
  3 Spin_Up_Time            0x0027   188   182   021    Pre-fail  Always       -       3583
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       229
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   073   073   000    Old_age   Always       -       20394
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       227
 16 Unknown_Attribute       0x0022   003   197   000    Old_age   Always       -       191014087496
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       182
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       111
194 Temperature_Celsius     0x0022   117   107   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       4
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     19429         -
# 2  Short offline       Completed without error       00%     19379         -
# 3  Short offline       Completed without error       00%     19330         -
# 4  Short offline       Completed without error       00%     19280         -
# 5  Short offline       Completed without error       00%     19230         -
# 6  Short offline       Completed without error       00%     19180         -
# 7  Short offline       Completed without error       00%      9228         -
# 8  Short offline       Completed without error       00%      9205         -
# 9  Short offline       Completed without error       00%      9181         -
#10  Short offline       Completed without error       00%      9157         -
#11  Short offline       Completed without error       00%      9133         -
#12  Short offline       Completed without error       00%      9109         -
#13  Short offline       Completed without error       00%      9085         -
#14  Short offline       Completed without error       00%      9061         -
#15  Short offline       Completed without error       00%      9037         -
#16  Short offline       Completed without error       00%      9013         -
#17  Short offline       Completed without error       00%      8989         -
#18  Short offline       Completed without error       00%      8965         -
#19  Short offline       Completed without error       00%      8941         -
#20  Short offline       Completed without error       00%      8917         -
#21  Short offline       Completed without error       00%      8893         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

  • Вопрос задан

    более трёх лет назад

  • 1960 просмотров

Диск вроде как нормальный.
Для начала проверьте сам кабель и разъемы.
Хотя довольно странно что он указывает конкретный sector. Попробуйте забэкапить важное и провести тест викторией.

Если диск рабочий, делайте копию диска а сам диск тестируйте MHDD

Ну, сбой при чтении. Данные слить, если есть ценное и не в рейде, диск вытащить, на стендовую машину и тестить MHDD. Если ошибка исчезнет при форматировании сектора в MHDD — ну, живы будем, не помрем. Иначе можно через MHDD же перемапить сектор, если получится конечно.
Если же все ухищрения все равно будут приводить к сбою при чтении — ну тогда R.I.P.

Пригласить эксперта

Это похоже на софтбэд. При потере питания сектор не записался полностью, от чего контрольная сумма в нем не правильная.

Нужно принудительно записать в этот сектор что-нибудь. Например нули с помощью hdparm


  • Показать ещё
    Загружается…

10 февр. 2023, в 02:20

3000 руб./за проект

10 февр. 2023, в 01:33

1500 руб./за проект

10 февр. 2023, в 00:54

2000 руб./в час

Минуточку внимания

Здравствуйте! Знаю что тема HDD не раз поднималась. Но, за две недели поисков решения проблемы не нашел. Короче имеется комп «собранный с миру по нитке». Два жд 500 и 250 гб соответственно. На 500 гб поставили Win7 на 250 гб Mint19. После установки (да и во время установки) Mint не видит диск 500гб и соответственно Win7. Вернее при загрузке Mint, диск иногда появляется, но при попытке его примонтировать, выводится сообщение «Не удалось примонтировать диск 500гб. Операция отменена» и диск пропадает. В те удачные моменты когда диск виден я натравил на него fdisk. Вот вывод команды sudo fdisk -l

vladimir@vladimir-PC:~$ sudo fdisk -l

[sudo] пароль для vladimir:

Диск /dev/sda: 465,8 GiB, 500107862016 байт, 976773168 секторов

Единицы: секторов по 1 * 512 = 512 байт

Размер сектора (логический/физический): 512 байт / 4096 байт

Размер I/O (минимальный/оптимальный): 4096 байт / 4096 байт

Тип метки диска: dos

Идентификатор диска: 0x11a6c81a

Устр-во Загрузочный начало Конец Секторы Размер
Идентификатор Тип

/dev/sda1 * 2048 206847 204800 100M
7 HPFS/NTFS

/dev/sda2 206848 976771071 976564224 465,7G
7 HPFS/NTFS

Диск /dev/sdb: 232,9 GiB, 250059350016 байт, 488397168 секторов

Единицы: секторов по 1 * 512 = 512 байт

Размер сектора (логический/физический): 512 байт / 512 байт

Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Тип метки диска: dos

Идентификатор диска: 0x6e4283a3

Устр-во Загрузочный начало Конец Секторы Размер
Идентификатор Тип

/dev/sdb1 * 2048 195311615 195309568 93,1G
83 Linux

/dev/sdb2 195313662 210935807 15622146 7,5G
5 Расшир

/dev/sdb3 210935808 488396799 277460992 132,3G
83 Linux

/dev/sdb5 195313664 210935807 15622144 7,5G
82 Linux

Элементы таблицы разделов упорядочены не так, как на диске.
vladimir@vladimir-PC:~$

Gparted (когда диск виден) долго думает, а потом сообщает что-то вроде «ошибка сохранения файлов или синхронизации на /dev/sda».
Однажды Gparted увидел диск 500гб, но ничего подозрительного я не узрел, кроме раздела NTFS 100 мб в начале диска и маленького 18мб не размеченного раздела в конце диска.

Что я предпринимал:

в Win7 запретил гибридный режим сна.

пробовал в BIOS менять режимы контроллера дисков.

Прогнал диск через chkdisk на
Win7

Я предполагаю,что диск был когда-то в RAIDмассиве и хранит об этом теплые воспоминания по сей день. Но не уверен.

Подскажите пожалуйста в какую сторону смотреть и как?

EDIT: . The members of this forum just helped me fix and repair a nasty hard disk error. I had run file system checks before, but what I never knew was that the default check does not update the bad block inode list.

p.H wrote:e2fsck detects and marks bad blocks only when run with the -c option.

With that one sentence, p.H saved my computer. And the advice that he and L_V gave me in this thread was priceless.

What ultimately worked for me was checking both my / (root) and /home partitions with the non-destructive read-write option, -cc from a Live CD:

Code: Select all

e2fsck -f -y -cc -C0 /dev/sda5
e2fsck -f -y -cc -C0 /dev/sda7

That check identified and repaired the affected inodes. It also wrote over the damaged files. Keep a list of those files. You will have to replace them (as explained below).

Next, I ran the checks again with the read-only option -c:

Code: Select all

e2fsck -f -y -c -C0 /dev/sda5
e2fsck -f -y -c -C0 /dev/sda7

Running the check a second time was an important step because it added a few more blocks to the bad blocks list.

Having repaired the file system, the next step was to repair the affected files:

p.H wrote:Note that e2fsck can remap bad blocks but cannot restore the unreadable contents of the affected files, so these files must be reinstalled from their respective packages.

In my case, I had a fresh install of Debian Buster and a Debian Buster Live CD, so I just copied them from the Live CD:

Code: Select all

mkdir /media/inspiron
mount /dev/sda5 /media/inspiron
cp /usr/bin/$FILE01  /media/inspiron/usr/bin/$FILE01
cp /usr/bin/$FILE02  /media/inspiron/usr/bin/$FILE02
...
umount /dev/sda5

After that, the computer booted like a charm. Importantly, it shutdown like a charm too. There were no priority 0 or 1 messages in my journalctl.

Thank you to p.H and L_V for helping me rescue this old machine! . :D

—————————————-

ORIGINAL POST:

After a fresh installation of Debian Buster on an old machine, the partition that contains my /home partition does not unmount at shutdown. The problem seems to be caused by an I/O error. At first glance, smartctl does not show any errors, but a deeper looks shows that the disk experienced a few errors on the / (root) partition a few years ago.

If I followed Linux Admins’ «Fixing disk problems» guide would that resolve the issue?

Thanks in advance,
— Soul

Code: Select all

$ journalctl -r -b -1 -p3

-- Logs begin at Sun 2019-05-19 13:22:05 EDT, end at Sun 2019-05-19 15:26:53 EDT. --
May 19 14:51:02 inspiron systemd[1]: Failed unmounting /home.
May 19 14:51:02 inspiron kernel: print_req_error: I/O error, dev sda, sector 162964427
May 19 14:51:02 inspiron kernel: ata1.00: error: { UNC }
May 19 14:51:02 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 14:51:02 inspiron kernel: ata1.00: cmd 60/08:88:c8:a3:b6/00:00:09:00:00/40 tag 17 ncq dma 4096 in
                                          res 41/40:08:cb:a3:b6/00:00:09:00:00/00 Emask 0x409 (media error) <F>
May 19 14:51:02 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 14:51:02 inspiron kernel: ata1.00: irq_stat 0x40000008
May 19 14:51:02 inspiron kernel: ata1.00: exception Emask 0x0 SAct 0x20000 SErr 0x0 action 0x0
May 19 14:50:59 inspiron kernel: print_req_error: I/O error, dev sda, sector 162964427
May 19 14:50:59 inspiron kernel: ata1.00: error: { UNC }
May 19 14:50:59 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 14:50:59 inspiron kernel: ata1.00: cmd 60/20:a8:c0:a3:b6/00:00:09:00:00/40 tag 21 ncq dma 16384 in
                                          res 41/40:20:cb:a3:b6/00:00:09:00:00/00 Emask 0x409 (media error) <F>
May 19 14:50:59 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 14:50:59 inspiron kernel: ata1.00: irq_stat 0x40000008
May 19 14:50:59 inspiron kernel: ata1.00: exception Emask 0x0 SAct 0x200000 SErr 0x0 action 0x0
May 19 14:50:43 inspiron wpa_supplicant[509]: dbus: wpa_dbus_property_changed: no property SessionLength in object /fi/w1/wpa_supplicant1/Interfaces/1
May 19 14:47:06 inspiron root[7585]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 14:40:19 inspiron root[7277]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 14:34:55 inspiron root[7129]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 14:27:20 inspiron root[6970]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 14:19:26 inspiron root[6425]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 14:13:30 inspiron root[6164]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 14:07:00 inspiron root[4631]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 14:01:11 inspiron root[3004]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 13:53:40 inspiron root[2451]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 13:46:29 inspiron root[2355]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 13:41:26 inspiron root[2260]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 13:33:31 inspiron root[1803]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 13:28:13 inspiron root[1633]: /etc/dhcp/dhclient-exit-hooks.d/zzz_avahi-autoipd returned non-zero exit status 1
May 19 13:26:48 inspiron kernel: print_req_error: I/O error, dev sda, sector 201851126
May 19 13:26:48 inspiron kernel: ata1.00: error: { UNC }
May 19 13:26:48 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:48 inspiron kernel: ata1.00: cmd 60/08:c8:f0:00:08/00:00:0c:00:00/40 tag 25 ncq dma 4096 in
                                          res 41/40:08:f6:00:08/00:00:0c:00:00/00 Emask 0x409 (media error) <F>
May 19 13:26:48 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:48 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:48 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:48 inspiron kernel: ata1.00: cmd 60/08:98:90:f6:3c/00:00:0a:00:00/40 tag 19 ncq dma 4096 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:48 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:48 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:48 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:48 inspiron kernel: ata1.00: cmd 60/08:90:08:3e:d1/00:00:30:00:00/40 tag 18 ncq dma 4096 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:48 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:48 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:48 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:48 inspiron kernel: ata1.00: cmd 60/08:88:08:2d:8d/00:00:15:00:00/40 tag 17 ncq dma 4096 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:48 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:48 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:48 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:48 inspiron kernel: ata1.00: cmd 60/08:80:c0:3e:59/00:00:09:00:00/40 tag 16 ncq dma 4096 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:48 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:48 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:48 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:48 inspiron kernel: ata1.00: cmd 61/18:30:18:7f:c5/00:00:2f:00:00/40 tag 6 ncq dma 12288 out
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:48 inspiron kernel: ata1.00: failed command: WRITE FPDMA QUEUED
May 19 13:26:48 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:48 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:48 inspiron kernel: ata1.00: cmd 60/08:28:c8:6a:71/00:00:15:00:00/40 tag 5 ncq dma 4096 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:48 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:48 inspiron kernel: ata1.00: irq_stat 0x40000001
May 19 13:26:48 inspiron kernel: ata1.00: exception Emask 0x0 SAct 0x20f0060 SErr 0x0 action 0x0
May 19 13:26:45 inspiron kernel: print_req_error: I/O error, dev sda, sector 361573512
May 19 13:26:45 inspiron kernel: print_req_error: I/O error, dev sda, sector 156843584
May 19 13:26:45 inspiron kernel: print_req_error: I/O error, dev sda, sector 201851126
May 19 13:26:45 inspiron kernel: print_req_error: I/O error, dev sda, sector 359754432
May 19 13:26:45 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:45 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:45 inspiron kernel: ata1.00: cmd 60/d0:f0:88:2c:8d/00:00:15:00:00/40 tag 30 ncq dma 106496 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:45 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:45 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:45 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:45 inspiron kernel: ata1.00: cmd 60/00:e8:40:3e:59/01:00:09:00:00/40 tag 29 ncq dma 131072 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:45 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:45 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:45 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:45 inspiron kernel: ata1.00: cmd 60/08:58:08:3e:d1/00:00:30:00:00/40 tag 11 ncq dma 4096 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:45 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:45 inspiron kernel: ata1.00: error: { UNC }
May 19 13:26:45 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:45 inspiron kernel: ata1.00: cmd 60/08:48:f0:00:08/00:00:0c:00:00/40 tag 9 ncq dma 4096 in
                                          res 41/40:08:f6:00:08/00:00:0c:00:00/00 Emask 0x409 (media error) <F>
May 19 13:26:45 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:45 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:45 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:45 inspiron kernel: ata1.00: cmd 60/08:18:90:f6:3c/00:00:0a:00:00/40 tag 3 ncq dma 4096 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:45 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:45 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:45 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:45 inspiron kernel: ata1.00: cmd 60/40:10:c0:6a:71/00:00:15:00:00/40 tag 2 ncq dma 32768 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:45 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:45 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:45 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:45 inspiron kernel: ata1.00: cmd 61/08:00:00:70:cc/00:00:31:00:00/40 tag 0 ncq dma 4096 out
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:45 inspiron kernel: ata1.00: failed command: WRITE FPDMA QUEUED
May 19 13:26:45 inspiron kernel: ata1.00: irq_stat 0x40000001
May 19 13:26:45 inspiron kernel: ata1.00: exception Emask 0x0 SAct 0x60000a0d SErr 0x0 action 0x0
May 19 13:26:40 inspiron kernel: print_req_error: I/O error, dev sda, sector 804169080
May 19 13:26:40 inspiron kernel: print_req_error: I/O error, dev sda, sector 361572440
May 19 13:26:40 inspiron kernel: print_req_error: I/O error, dev sda, sector 201851904
May 19 13:26:40 inspiron kernel: print_req_error: I/O error, dev sda, sector 201851126
May 19 13:26:40 inspiron kernel: print_req_error: I/O error, dev sda, sector 813441024
May 19 13:26:40 inspiron kernel: print_req_error: I/O error, dev sda, sector 201848320
May 19 13:26:39 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:39 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:39 inspiron kernel: ata1.00: cmd 60/40:e0:78:a5:ee/00:00:2f:00:00/40 tag 28 ncq dma 32768 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:39 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:39 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:39 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:39 inspiron kernel: ata1.00: cmd 60/08:c8:30:59:d1/00:00:30:00:00/40 tag 25 ncq dma 4096 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:39 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:39 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:39 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:39 inspiron kernel: ata1.00: cmd 60/08:c0:58:60:92/00:00:31:00:00/40 tag 24 ncq dma 4096 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:39 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:39 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:39 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:39 inspiron kernel: ata1.00: cmd 60/58:60:58:28:8d/00:00:15:00:00/40 tag 12 ncq dma 45056 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:39 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:39 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:39 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:39 inspiron kernel: ata1.00: cmd 60/d8:58:00:04:08/06:00:0c:00:00/40 tag 11 ncq dma 897024 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:39 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:39 inspiron kernel: ata1.00: error: { UNC }
May 19 13:26:39 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:39 inspiron kernel: ata1.00: cmd 60/00:50:00:00:08/04:00:0c:00:00/40 tag 10 ncq dma 524288 in
                                          res 41/40:00:f6:00:08/00:04:0c:00:00/00 Emask 0x409 (media error) <F>
May 19 13:26:39 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:39 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:39 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:39 inspiron kernel: ata1.00: cmd 60/40:48:00:20:7c/00:00:30:00:00/40 tag 9 ncq dma 32768 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:39 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:39 inspiron kernel: ata1.00: error: { ABRT }
May 19 13:26:39 inspiron kernel: ata1.00: status: { DRDY ERR }
May 19 13:26:39 inspiron kernel: ata1.00: cmd 60/00:40:00:f6:07/06:00:0c:00:00/40 tag 8 ncq dma 786432 in
                                          res 41/04:00:f6:00:08/00:00:0c:00:00/00 Emask 0x1 (device error)
May 19 13:26:39 inspiron kernel: ata1.00: failed command: READ FPDMA QUEUED
May 19 13:26:39 inspiron kernel: ata1.00: irq_stat 0x40000001
May 19 13:26:39 inspiron kernel: ata1.00: exception Emask 0x0 SAct 0x13001f00 SErr 0x0 action 0x0
May 19 13:22:09 inspiron kernel: mei mei::55213584-9a29-4916-badf-0fb7ed682aeb:01: FW version command failed -5
May 19 13:22:09 inspiron kernel: mei mei::55213584-9a29-4916-badf-0fb7ed682aeb:01: Could not read FW version
May 19 13:22:05 inspiron kernel: ACPI: SPCR: Unexpected SPCR Access Width.  Defaulting to byte size

Code: Select all

# fdisk -l

Disk /dev/sda: 465.8 GiB, 500107862016 bytes, 976773168 sectors
Disk model: ST9500325AS     
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: dos
Disk identifier: 0x07f2837e

Device     Boot     Start       End   Sectors   Size Id Type
/dev/sda1              63    208844    208782   102M de Dell Utility
/dev/sda2  *       208845  30928844  30720000  14.7G  7 HPFS/NTFS/exFAT
/dev/sda3        30928845 155775023 124846179  59.5G  7 HPFS/NTFS/exFAT
/dev/sda4       155782305 976768064 820985760 391.5G  5 Extended
/dev/sda5  *    155782368 177305599  21523232  10.3G 83 Linux
/dev/sda6       177307648 199903231  22595584  10.8G 82 Linux swap / Solaris
/dev/sda7       199905280 976766975 776861696 370.4G 83 Linux

Code: Select all

# smartctl -l selftest /dev/sda

smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-5-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%         0         -

Code: Select all

# smartctl -a /dev/sda

smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-5-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Momentus 5400.6
Device Model:     ST9500325AS
Serial Number:    6VEGMVRP
LU WWN Device Id: 5 000c50 03067dd6f
Firmware Version: D005DEM1
User Capacity:    500,107,862,016 bytes [500 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Sun May 19 15:05:07 2019 EDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(    0) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 139) minutes.
Conveyance self-test routine
recommended polling time: 	 (   3) minutes.
SCT capabilities: 	       (0x103f)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   101   089   006    Pre-fail  Always       -       29958806
  3 Spin_Up_Time            0x0003   099   099   085    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   091   091   020    Old_age   Always       -       9917
  5 Reallocated_Sector_Ct   0x0033   088   088   036    Pre-fail  Always       -       246
  7 Seek_Error_Rate         0x000f   083   060   030    Pre-fail  Always       -       207791365
  9 Power_On_Hours          0x0032   073   073   000    Old_age   Always       -       23876
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   094   094   020    Old_age   Always       -       6861
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   001   001   000    Old_age   Always       -       1097
188 Command_Timeout         0x0032   100   096   000    Old_age   Always       -       3759
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   051   036   045    Old_age   Always   In_the_past 49 (Min/Max 49/49 #998)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       20
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       78
193 Load_Cycle_Count        0x0032   001   001   000    Old_age   Always       -       578157
194 Temperature_Celsius     0x0022   049   064   000    Old_age   Always       -       49 (0 18 0 0 0)
195 Hardware_ECC_Recovered  0x001a   053   045   000    Old_age   Always       -       29958806
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       4
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       4
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       22868 (153 213 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       3790333358
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       1937597633
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 987 (device log contains only the most recent five errors)
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 987 occurred at disk power-on lifetime: 23876 hours (994 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 cb a3 b6 09  Error: UNC at LBA = 0x09b6a3cb = 162964427

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 c8 a3 b6 49 00      05:50:04.649  READ FPDMA QUEUED
  60 00 28 e0 a3 b6 49 00      05:50:04.617  READ FPDMA QUEUED
  60 00 08 c0 a3 b6 49 00      05:50:04.515  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00      05:50:04.513  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00      05:50:04.512  IDENTIFY DEVICE

Error 986 occurred at disk power-on lifetime: 23876 hours (994 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 cb a3 b6 09  Error: UNC at LBA = 0x09b6a3cb = 162964427

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 20 c0 a3 b6 49 00      05:50:02.009  READ FPDMA QUEUED
  60 00 08 10 50 bb 49 00      05:50:01.961  READ FPDMA QUEUED
  ea 00 00 00 00 00 a0 00      05:49:55.547  FLUSH CACHE EXT
  61 00 08 a0 33 4a 49 00      05:49:55.547  WRITE FPDMA QUEUED
  ea 00 00 00 00 00 a0 00      05:49:55.538  FLUSH CACHE EXT

Error 985 occurred at disk power-on lifetime: 23874 hours (994 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 f6 00 08 0c  Error: UNC at LBA = 0x0c0800f6 = 201851126

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00      04:25:50.279  READ FPDMA QUEUED
  60 00 08 f0 00 08 4c 00      04:25:50.257  READ FPDMA QUEUED
  61 00 08 ff ff ff 4f 00      04:25:50.256  WRITE FPDMA QUEUED
  60 00 08 90 f6 3c 4a 00      04:25:50.256  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      04:25:50.256  READ FPDMA QUEUED

Error 984 occurred at disk power-on lifetime: 23874 hours (994 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 f6 00 08 0c  Error: UNC at LBA = 0x0c0800f6 = 201851126

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 40 ff ff ff 4f 00      04:25:47.981  READ FPDMA QUEUED
  60 00 80 28 9e 57 49 00      04:25:47.954  READ FPDMA QUEUED
  60 00 40 ff ff ff 4f 00      04:25:47.953  READ FPDMA QUEUED
  60 00 40 ff ff ff 4f 00      04:25:47.945  READ FPDMA QUEUED
  60 00 40 ff ff ff 4f 00      04:25:47.941  READ FPDMA QUEUED

Error 983 occurred at disk power-on lifetime: 23874 hours (994 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 f6 00 08 0c  Error: UNC at LBA = 0x0c0800f6 = 201851126

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00      04:25:42.214  READ FPDMA QUEUED
  60 00 d8 00 04 08 4c 00      04:25:42.209  READ FPDMA QUEUED
  60 00 00 00 00 08 4c 00      04:25:42.207  READ FPDMA QUEUED
  60 00 00 00 f6 07 4c 00      04:25:42.207  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      04:25:42.163  READ FPDMA QUEUED

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%         0         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Hello,

I am setting up nextcloudpi on a Raspberry pi 4 4GB. Unfortunately, after a few minutes/hours the mounted external SSD drive, plugged on a USB 3 port, fails.

returns

Code: Select all

[  114.481827] usb 2-1: USB disconnect, device number 2
[  114.487346] print_req_error: I/O error, dev sda, sector 1951951376
[  114.487377] EXT4-fs warning (device sda1): ext4_end_bio:323: I/O error 10 writing to inode 60950252 (offset 0 size 520192 starting block 243994049)
[  114.487392] Buffer I/O error on device sda1, logical block 243993666
[  114.487417] Buffer I/O error on device sda1, logical block 243993667
[  114.487440] Buffer I/O error on device sda1, logical block 243993668
[  114.487459] Buffer I/O error on device sda1, logical block 243993669
[  114.487475] Buffer I/O error on device sda1, logical block 243993670
[  114.487491] Buffer I/O error on device sda1, logical block 243993671
[  114.487507] Buffer I/O error on device sda1, logical block 243993672
[  114.487522] Buffer I/O error on device sda1, logical block 243993673
[  114.487538] Buffer I/O error on device sda1, logical block 243993674
[  114.487554] Buffer I/O error on device sda1, logical block 243993675
[  114.490420] print_req_error: I/O error, dev sda, sector 1950870336
[  114.490444] EXT4-fs warning (device sda1): ext4_end_bio:323: I/O error 10 writing to inode 60950253 (offset 0 size 40960 starting block 243858802)
[  114.490549] print_req_error: I/O error, dev sda, sector 1951952392
[  114.490573] EXT4-fs warning (device sda1): ext4_end_bio:323: I/O error 10 writing to inode 60950254 (offset 0 size 724992 starting block 243994226)
[  114.500871] print_req_error: I/O error, dev sda, sector 1946159120
[  114.500890] Buffer I/O error on dev sda1, logical block 243269634, lost async page write
[  114.500933] print_req_error: I/O error, dev sda, sector 1946160184
[  114.500946] Buffer I/O error on dev sda1, logical block 243269767, lost async page write
[  114.501030] JBD2: Detected IO errors while flushing file data on sda1-8
[  114.501057] print_req_error: I/O error, dev sda, sector 973346008
[  114.501091] Aborting journal on device sda1-8.
[  114.501152] print_req_error: I/O error, dev sda, sector 973342720
[  114.501166] print_req_error: I/O error, dev sda, sector 973342720
[  114.501179] Buffer I/O error on dev sda1, logical block 121667584, lost sync page write
[  114.501203] JBD2: Error -5 detected when updating journal superblock for sda1-8.
[  114.501243] print_req_error: I/O error, dev sda, sector 1946636536
[  114.501257] Buffer I/O error on dev sda1, logical block 243329311, lost async page write
[  114.501287] print_req_error: I/O error, dev sda, sector 1950353440
[  114.501299] Buffer I/O error on dev sda1, logical block 243793924, lost async page write

I tried to fix the error by running fsck from another computer, and the disk seems to be fine:

Code: Select all

$ sudo fsck /dev/sdc1
fsck from util-linux 2.35.1
e2fsck 1.45.6 (20-Mar-2020)
NEXTCLOUD: clean, 3691/61054976 files, 4856017/244190385 blocks

After running fsck, plugging the external SSD back to the pi and rebooting the pi, the drive behaves normally for some time before failing (sometimes a few minutes, sometimes a few hours).

I thought it was a power issue so I tried 3 different connectors:

  • 1 powered usb 3 to sata HDD enclosure (Orico)
  • 1 powered usb3 to sata adapter (Unitek)
  • 1 unpowered usb3 to sata hdd enclosure (Orico)

The problem same problem occur every time.

I also tried to plug some another drive:

  • the SSD : Crucial MX500 1TB 2.5″ SSD
  • an HDD : a toshiba drive I salvaged from another laptop

The problem happened to the HDD after a longer period of time. I was using the HDD as a backup of the SSD and I noticed that it failed only after a few days.

At that point, my guesses are:

  • either there was a power issue that corrupted the drives and they are now unusable (but then how comes fsck mention it «clean»? I’m not an expert I might be reading it wrong)
  • either all my cheap enclosures are not working at all
  • either the usb ports of the pi are failing

I’d like to test those guesses but I’m lost trying to figure out how.
Thank you for your help.

  • #1

Everything works fine, but when executing shutdown, I see I/O errors (see attached screenshot):

print_req_error: I/O error, dev sda (sdb) sector … sda and sdb are in rpool

root@telemachus:~# zpool status rpool
pool: rpool
state: ONLINE
scan: none requested
config:

NAME STATE READ WRITE CKSUM
rpool ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
wwn-0x50000398c84b19ad-part2 ONLINE 0 0 0
wwn-0x50000398c84b12e9-part2 ONLINE 0 0 0

errors: No known data errors
root@telemachus:~#

Why do I get this errors?

Attachments

  • 20181115_152802-s.jpg

    20181115_152802-s.jpg

    247.3 KB

    · Views: 11

rhonda

rhonda

Proxmox Retired Staff

Retired Staff


  • #2

That sounds like that you might have an hardware issue related to your sda and sdb disk. Look at the output of «lsblk» what this might affect, and related to what partitions/file systems you have on there you might want to look into repair tools for potentially finding out if it’s just some fallen bits or real hardware related issues.

  • #3

Hi.
So in what there was a problem?

Содержание

  1. RAID array says «critical medium error» but smartctl says disk is healthy — what to do next?
  2. HDD error: print_req_error: critical medium error, dev sdb, sector 16128
  3. 1 Answer 1
  4. I/O error, dev sda, sector xxxxxxxxxx
  5. 3 Answers 3
  6. Linked
  7. Related
  8. Hot Network Questions
  9. Subscribe to RSS
  10. [жж] словил сбойные сектора на nvme ssd
  11. Transmission: Ошибка Unable to save resume file: Operation not supported
  12. Вопрос
  13. Виктор Илюхин
  14. Виктор Илюхин

RAID array says «critical medium error» but smartctl says disk is healthy — what to do next?

I have a RAID-1 array of SSDs (Samsung 970 EVO Plus), and errors are showing up in /var/log/syslog , but smartctl reports that the drive is healthy. I’ve done a bunch of diagnosis (below) and I’m wondering if there’s anything else I can do. Is there a problem happening or not, and if so, what’s the best course of action? (On Kubuntu 18.04.6 LTS.)

Here’s the array:

It appears healthy, according to mdadm :

However, some read errors have started appearing in /var/log/syslog , in triples:

sometimes followed by:

I ran smartctl to look for problems. It indicates that errors have happened in the past, but it also says «SMART overall-health self-assessment test result: PASSED

The two drives do not appear to support self-tests ( smartctl -c does not list any self tests at all).

Updating my question:

Some of the errors appear to be attributable to the checkarray script that runs once a month, because the errors begin «on the first Sunday of each month, at 01:06 in the morning». «man md» adds:

[On] RAID1 it is possible for software issues to cause a mismatch to be reported [between the two disks]. This does not necessarily mean that the data on the array is corrupted. It could simply be that the system does not care what is stored on that part of the array — it is unused space. The most likely cause for an unexpected mismatch on RAID1 or RAID10 occurs if a swap partition or swap file is stored on the array.

What should I do next? Thank you very much.

Источник

HDD error: print_req_error: critical medium error, dev sdb, sector 16128

I believe I have a USB hard drive that’s damaged. When I run dmesg , it shows:

I read this article that says you can forcibly reallocate bad sectors:

I’m lost with what to try next to access the data from this drive. Can anyone help?

SMART information below:

1 Answer 1

You have one or more bad sectors on your HDD, as seen by:

You need to fsck to check your file system, and then bad block your HDD.

fsck

  • boot to a Ubuntu Live DVD/USB in “Try Ubuntu” mode
  • open a terminal window by pressing Ctrl + Alt + T
  • type sudo fdisk -l
  • identify the /dev/sdXX device name for your «Linux Filesystem»
  • type sudo fsck -f /dev/sdXX , replacing sdXX with the number you found earlier
  • repeat the fsck command if there were errors

bad block

Note: do NOT abort a bad block scan!

Note: do NOT bad block a SSD

Note: backup your important files FIRST!

Note: this will take many hours

Note: you may have a pending HDD failure

Boot to a Ubuntu Live DVD/USB.

sudo fdisk -l # identify all «Linux Filesystem» partitions

sudo e2fsck -fcky /dev/sdXX # read-only test

sudo e2fsck -fccky /dev/sdXX # non-destructive read/write test (recommended)

The -k is important, because it saves the previous bad block table, and adds any new bad blocks to that table. Without -k, you loose all of the prior bad block information.

Источник

I/O error, dev sda, sector xxxxxxxxxx

My machine has crashed couple of times this week. Ran smartmontools test and got this result:

Can someone please let me know what this means? Should I replace my hard drive immediately?

Update: As landroni suggested, I ran short and extended self-tests using gsmartcontrol. Short self-test ran without throwing any errors. Extended test got aborted at 40% because of errors. Here is the the paste from self-test logs:

Update Ran badblocks using sudo badblocks -v /dev/sda > bad-blocks-result Result: Pass completed, 25 bad blocks found. (25/0/0 errors) What do I do now?

Output file indicates the following block numbers: 105877868 105877869 105877870 105877871 105877872 105877873 105877880 105877881 105877882 105877883 105877892 105877893 105877894 105877900 105877901 105877902 105877903 105877908 105877909 105877910 105877911 105877916 105877917 105877918 105877919

$ sudo dd if=/dev/sda of=/dev/null count=1 skip=201724230 [sudo] password for xxxxx: 1+0 records in 1+0 records out 512 bytes (512 B) copied, 1.64439 s, 0.3 kB/s xxxx@xxxx-yyyy:

$ sudo dd if=dev/sda of=/dev/null count=1 skip=201724230 dd: opening `dev/sda’: No such file or directory

3 Answers 3

Download gsmartcontrol (Hard disk drive and SSD health inspection tool) by typing in sudo apt install gsmartcontrol .

GSmartControl is a graphical user interface for smartctl (from smartmontools package), which is a tool for querying and controlling SMART (Self-Monitoring, Analysis, and Reporting Technology) data on modern hard disk and solid-state drives. It allows you to inspect the drive’s SMART data to determine its health, as well as run various tests on it.

  • run a short self-test ;
  • if it completes with no error, then run an extended self-test .

If this one is fine, too, then there is probably no reason to panic. If however, the tests detect some bad blocks, then you’ll possibly need to make a backup using ddrescue ASAP, and then attempt to understand what is wrong with your hard-drive. It may be failing, or there may be just a handful of irrelevant bad sectors.

Update: Given that only a handful of bad sectors seem to be present, you could try to tell the FS which ones it should avoid using fsck.ext3 -c . But do read man fsck.ext3 (assuming that this is your FS) before using it.

Looks like you disk is failing bad, I would backup my data as soon as possible and replace the failing disk.

I had a similar problem recently and smart reported 9 bad blocks. I booted from live media and then I repaired the ext4 filesystem with e2fsck -c /dev/SDx where SDx was the drive in question (sda in my case). which resulted in several short reads which I ignored and forced rewrites on and found and repaired 5 inodes with multiply-claimed blocks.

If the drive contains critical data you should of course utilize the correct strategy to back up the data before doing anything else. If not as in my case, read on. dmesg reported almost twice as many bad sectors as were found by SMART, so I then ran e2fsck -cc /dev/SDx where SDx was the drive in question in order to perform a non-destructive read/write test. This was a clearly time consuming process, however as my goal was just to squeeze a few more hours out of what is for all intents and purposes a «scratch drive» used for experimentation with no critical data on it, while I waited for the replacement drive to be delivered, I felt it might be worth the time. An hour later at 15% complete on a terabyte drive I wasn’t so certain but as the replacement was 3 days away, I persevered. In the end all the bad sectors were added to the bad block inode list which prevents them from being allocated to a file or directory.

Linked

Hot Network Questions

To subscribe to this RSS feed, copy and paste this URL into your RSS reader.

Site design / logo © 2023 Stack Exchange Inc; user contributions licensed under CC BY-SA . rev 2023.1.14.43159

By clicking “Accept all cookies”, you agree Stack Exchange can store cookies on your device and disclose information in accordance with our Cookie Policy.

Источник

[жж] словил сбойные сектора на nvme ssd

Дорогой Уважаемый ЛОР,

Я словил первое в своей жизни проявление сбойных секторов на SSD. Пациент — Samsung SSD 970 EVO 2TB с прошивкой 2B2QEXE7, в эксплуатации примерно год. Пару-тройку дней назад мне почему-то захотелось сделать копию вообще всех данных из домашней директории, включая файлы, которые легко скачать из сети при надобности. Некоторые из этих файлов лежали там с момента миграции на накопитель, без обращений. И при копировании одного из таких файлов программа сказала: «А я, кажись, чот не могу». После того, как потихоньку пришло осознание произошедшего, я глянул в лог и увидел там:

Что интересно, во второй раз файл успешно скопировался. Не знаю, прочитались там настоящие данные или мусор. К сожалению, вот этот конкретный файл повторно скачать оказалось неоткуда. Чтение данных с nvme0n1 по тому адресу выдало какие-то данные, не нули. Тут я решил, что SSD умный, что он понял, что страница не читается стабильно, и увёл её в чулан, на её место подставил новую, а данные всё-таки скопировал. Но на всякий случай решил запустить холостое чтение с блочного устройства. Сбойных блоков оказалось больше. Пробовал читать конкретные места. Зачастую чтение было успешным, но через много чтений всё же происходили ошибки. Попробовал перезаписать место с ошибками чтения теми же данными. Ошибки там прекратились.

В итоге сделал дамп через ddrescue, а потом записал этот дамп обратно. Последующие попытки прочитать накопитель целиком уже никаких ошибок не давали. Сижу вот теперь как на пороховой бочке. Пользоваться дальше немного боязно, но и выбрасывать накопитель, который вроде работает, как-то жалко.

За время тестов в логи свалилось 546 строк с «blk_update_request: critical medium error», но ошибки иногда сыпались так часто, что в сумме набралось 888 «callbacks suppressed». В статусе накопителя написано, что ошибок доступа к носителю было 1484. Так как в логи основной системы не попало происходившее на LiveUSB, можно считать, что числа сходятся. К сожалению, не помню, были ли там ошибки до недавних событий. Всего различных сбойных секторов было 167 штук.

В данных из плохих секторов нашлись обрывки Packages из Debian. Судя по версиям пакетов, эти куски из очень старых Packages, возможно ещё из 2016. Если это так, они приехали во время миграции на накопитель, и с тех пор не перезаписывались и не читались. Один кусок оказался очень похож на файл переводов и нашёлся в /usr/share/locale/gl/LC_MESSAGES/coreutils.mo , который конечно же ни разу не читался с момента последней переустановки пакета coreutils в начале августа 2019.

Терабайт тридцать-сорок я добавил чтением накопителя во время тестов.

Думаю, из произошедшего можно сделать, как минимум, следующие выводы:

  • полгода без чтения страницы на SSD достаточно для последующих ошибок чтения;
  • чтение такой страницы не заставляет SSD подменять страницу на новую, он с радостью выдаёт ошибку чтения на одном и том же месте много раз подряд;
  • trim не означает очистку всех неиспользуемых блоков ФС, они же меньше страницы. Некоторые данные могут жить в закоулках годами;
  • SSD желательно периодически прочёсывать чтением, чтобы словить сюрпризы пораньше;
  • если такое происходит на TLC 3D V-NAND, страшно подумать, что будет на QLC.

Upd.
Узнал, что в NVMe есть фича 0x10, которая управляет температурами, при которых SSD должен начать тормозить для снижения нагрева. Правда для 970 EVO эти температуры дожны быть в диапазоне 80–82 °C, а попытка установить любые значения кроме 0 для фичи 0x10 завершаются неудачай.

Upd. 11 мая 2021, то есть примерно через год и два месяца после первого раза, появились новые ошибки чтения. При повторном чтении тех же мест ошибки повторялись, но через некоторое время пропали.

Upd. 5 июня 2021. Аккумулятор оказался вздут в той секции, что прилегает к SSD. Видимо, предупреждение о температурном лимите в 65°C на аккумуляторе написано не просто так.

Upd. 20 февраля 2022. Накопитель отправился на пенсию.

Источник

Transmission: Ошибка Unable to save resume file: Operation not supported

Спросил Виктор Илюхин,
11 марта, 2020

Вопрос

Виктор Илюхин

Виктор Илюхин

Доброго времени суток! Через некоторое время после добавления торрента выпадает ошибка — Unable to save resume file: Operation not supported, причем конкретной зависимости по времени выпадения ошибки, настроек клиента и интернет-центра не выявил. С чем это может быть связано?

Сохранение идет на внешний хард.

Transmission Версия:2.94. KeeneticOS: 3.3.12.

Изменено 11 марта, 2020 пользователем Виктор Илюхин

Источник

Понравилась статья? Поделить с друзьями:
  • Print mode error kyocera km 2050
  • Primary internal battery error code 601
  • Print mode error kyocera km 1650
  • Primary internal battery 601 как исправить
  • Print invalid syntax python ошибка