Error information log entries растет - Исправление ошибок и поиск оптимальных решений проблем

2

3

Купил новый SSD, и при каждом ребуте он прибавляет ровно 1 ошибку

Error Information (NVMe Log 0x01, 16 of 64 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS
  0         11     0  0x100f  0x4004      -            0     0     -

полный лог

sudo smartctl -a /dev/nvme0n1
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-5.18.0-3-amd64] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       SAMSUNG MZVLB256HBHQ-00000
Serial Number:                      S4GGNX0RC91284
Firmware Version:                   EXH7201Q
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Total NVM Capacity:                 256,060,514,304 [256 GB]
Unallocated NVM Capacity:           0
Controller ID:                      4
NVMe Version:                       1.3
Number of Namespaces:               1
Namespace 1 Size/Capacity:          256,060,514,304 [256 GB]
Namespace 1 Utilization:            88,786,948,096 [88.7 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            002538 8c11c5d479
Local Time is:                      Wed Aug  3 16:59:34 2022 MSK
Firmware Updates (0x16):            3 Slots, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Log Page Attributes (0x03):         S/H_per_NS Cmd_Eff_Lg
Maximum Data Transfer Size:         512 Pages
Warning  Comp. Temp. Threshold:     84 Celsius
Critical Comp. Temp. Threshold:     85 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     8.00W       -        -    0  0  0  0        0       0
 1 +     6.30W       -        -    1  1  1  1        0       0
 2 +     3.50W       -        -    2  2  2  2        0       0
 3 -   0.0760W       -        -    3  3  3  3      210    1200
 4 -   0.0050W       -        -    4  4  4  4     2000    8000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        34 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    425,685 [217 GB]
Data Units Written:                 279,397 [143 GB]
Host Read Commands:                 13,091,553
Host Write Commands:                1,869,139
Controller Busy Time:               11
Power Cycles:                       3
Power On Hours:                     3
Unsafe Shutdowns:                   1
Media and Data Integrity Errors:    0
Error Information Log Entries:      11
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               34 Celsius
Temperature Sensor 2:               41 Celsius

Error Information (NVMe Log 0x01, 16 of 64 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS
  0         11     0  0x100f  0x4004      -            0     0     -

Погуглил, нашёл похожие темы, но не нашёл решение. Как исправить, кто знает? Говорят это что-то то ли с прошивкой SSD, то ли с версией kernel, то ли ещё что…

Источник

Содержание

[жж] словил сбойные сектора на nvme ssd
176 error information log entries ssd
176 error information log entries ssd
176 error information log entries ssd
Number of error information log entries
Context Navigation
Table of Contents
About NVMe
Smartmontools NVMe support
NVMe support in the different OS
NVMe pass-through support of USB to NVMe br >
Sample smartctl output
Development notes
Great people share their wisdom without asking for anything in return…
Share this:
Like this:
Related
26 thoughts on “ Apple NVMe SMART Monitor Under Control… ”

[жж] словил сбойные сектора на nvme ssd

Дорогой Уважаемый ЛОР,

Я словил первое в своей жизни проявление сбойных секторов на SSD. Пациент — Samsung SSD 970 EVO 2TB с прошивкой 2B2QEXE7, в эксплуатации примерно год. Пару-тройку дней назад мне почему-то захотелось сделать копию вообще всех данных из домашней директории, включая файлы, которые легко скачать из сети при надобности. Некоторые из этих файлов лежали там с момента миграции на накопитель, без обращений. И при копировании одного из таких файлов программа сказала: «А я, кажись, чот не могу». После того, как потихоньку пришло осознание произошедшего, я глянул в лог и увидел там:

Что интересно, во второй раз файл успешно скопировался. Не знаю, прочитались там настоящие данные или мусор. К сожалению, вот этот конкретный файл повторно скачать оказалось неоткуда. Чтение данных с nvme0n1 по тому адресу выдало какие-то данные, не нули. Тут я решил, что SSD умный, что он понял, что страница не читается стабильно, и увёл её в чулан, на её место подставил новую, а данные всё-таки скопировал. Но на всякий случай решил запустить холостое чтение с блочного устройства. Сбойных блоков оказалось больше. Пробовал читать конкретные места. Зачастую чтение было успешным, но через много чтений всё же происходили ошибки. Попробовал перезаписать место с ошибками чтения теми же данными. Ошибки там прекратились.

В итоге сделал дамп через ddrescue, а потом записал этот дамп обратно. Последующие попытки прочитать накопитель целиком уже никаких ошибок не давали. Сижу вот теперь как на пороховой бочке. Пользоваться дальше немного боязно, но и выбрасывать накопитель, который вроде работает, как-то жалко.

За время тестов в логи свалилось 546 строк с «blk_update_request: critical medium error», но ошибки иногда сыпались так часто, что в сумме набралось 888 «callbacks suppressed». В статусе накопителя написано, что ошибок доступа к носителю было 1484. Так как в логи основной системы не попало происходившее на LiveUSB, можно считать, что числа сходятся. К сожалению, не помню, были ли там ошибки до недавних событий. Всего различных сбойных секторов было 167 штук.

В данных из плохих секторов нашлись обрывки Packages из Debian. Судя по версиям пакетов, эти куски из очень старых Packages, возможно ещё из 2016. Если это так, они приехали во время миграции на накопитель, и с тех пор не перезаписывались и не читались. Один кусок оказался очень похож на файл переводов и нашёлся в /usr/share/locale/gl/LC_MESSAGES/coreutils.mo , который конечно же ни разу не читался с момента последней переустановки пакета coreutils в начале августа 2019.

Терабайт тридцать-сорок я добавил чтением накопителя во время тестов.

Думаю, из произошедшего можно сделать, как минимум, следующие выводы:

полгода без чтения страницы на SSD достаточно для последующих ошибок чтения;
чтение такой страницы не заставляет SSD подменять страницу на новую, он с радостью выдаёт ошибку чтения на одном и том же месте много раз подряд;
trim не означает очистку всех неиспользуемых блоков ФС, они же меньше страницы. Некоторые данные могут жить в закоулках годами;
SSD желательно периодически прочёсывать чтением, чтобы словить сюрпризы пораньше;
если такое происходит на TLC 3D V-NAND, страшно подумать, что будет на QLC.

Upd.
Узнал, что в NVMe есть фича 0x10, которая управляет температурами, при которых SSD должен начать тормозить для снижения нагрева. Правда для 970 EVO эти температуры дожны быть в диапазоне 80–82 °C, а попытка установить любые значения кроме 0 для фичи 0x10 завершаются неудачай.

Upd. 11 мая 2021, то есть примерно через год и два месяца после первого раза, появились новые ошибки чтения. При повторном чтении тех же мест ошибки повторялись, но через некоторое время пропали.

Upd. 5 июня 2021. Аккумулятор оказался вздут в той секции, что прилегает к SSD. Видимо, предупреждение о температурном лимите в 65°C на аккумуляторе написано не просто так.

Upd. 20 февраля 2022. Накопитель отправился на пенсию.

Источник

176 error information log entries ssd

Сообщения: 234
Благодарности: 29

Профиль | Отправить PM | Цитировать

Добрый день.
Использую три Кингстона М.2: один SKC2500 (500 гигов) и два SNVS (250 и 500 гигов).
С первым (SKC) проблем нет. Оба SNVS валят ошибки 14 в лог смарта:
2022-03-20_17-16-09.jpg

При этом, никаких других симптомов нет, все тесты на обоих SNVS проходят без сбоев.
Найти информацию, что это за ошибки, мне не удалось нигде. В сервис-центре тоже внятного ничего не сказали, только посоветовали их радиаторами снабдить. Ну и прошивку обновить (правда, обновлений нет).

Один из них у меня штатно в Линуксе стоит, так там каждое утро валится вот такое:

The following warning/error was logged by the smartd daemon:

Device: /dev/nvme0, number of Error Log entries increased from 1750 to 1758

Device info:
KINGSTON SNVS250G, S/N:50026B768519FAB0, FW:EDFK9NO2, 250 GB

Собственно, вопрос к знатокам: обращать внимание на эти ошибки или забить на них?
Гарантия на эти диски у меня ещё несколько лет.

Источник

176 error information log entries ssd

Сообщения: 234
Благодарности: 29

Профиль | Отправить PM | Цитировать

Один из них у меня штатно в Линуксе стоит, так там каждое утро валится вот такое:

The following warning/error was logged by the smartd daemon:

Device: /dev/nvme0, number of Error Log entries increased from 1750 to 1758

Device info:
KINGSTON SNVS250G, S/N:50026B768519FAB0, FW:EDFK9NO2, 250 GB

Источник

176 error information log entries ssd

Условия фирменного гарантийного обслуживания у брендов
(c) I.N.

Абсолютно точно гарантийные обязательства в РФ обеспечивают только четыре компании:
— Corsair (отправка за границу);
— Kingston (представительство в Москве, по договорённости);
— OCZ (полноценный сервис RMA, расположенный в Химках, Московская область);
— SmartBuy (представительство в Москве, по договорённости).

Полный список в алфавитном порядке:

ADATA — только через магазин, где осуществлялась покупка.

AMD — накопители произведённые OCZ (серия Radeon R7) — см. OCZ. Накопители, произведённые Galt (серия Radeon R3) — статус неясен.

Corsair — есть фирменная гарантийная поддержка, необходимо написать на почту компании, затем потребуется отправка накопителя за границу (не так дорого).

Сфотографировать все документы с чеком, сам диск и макросъемкой сохранность пломбы, наделать скринов с Corsair SSD Toolbox (если это SSD).
Регистрируемся на САЙТЕ Необходимо четко заполнять профиль: в имени вводить свое имя и отчество (требования нашей почты), фамилию и все адресные данные.
Создаем билет (Ticket) в котором заполняем всю форму с описанием проблемы (на англиском, хоть с помощью онлайн-переводчика вроде Google.Translate). По заполнению форм там понятно, туда же пристегиваете фотографии (можно позже, в билет в любой момент можно что-то добавить).
Когда администрация ответит, придет письмо на вашу почту с оповещением, что гарантийный случай одобрен. Справа вверху будет активная Return Instructions, ее необходимо распечатать и вложить в посылку с неисправным изделием, на ней же и адрес Нидерландов. Корсар советует этот листок клеить на лицевую сторону посылки, но это не для Почты России.
В общем то и все.
Спасибо Axel_F

Crucial — статус неясен, судя по всему, только магазин.

G.Skill — статус неясен, судя по всему, только магазин.

Galt Advanced Technology — только магазин.

GK — китайский бренд, в РФ не поставляется, только продавец.

GoodRAM (Wilk Elektronik SA) — польский бренд, в РФ не поставляется, статус неясен, судя по всему, только магазин.

HP (Hewlett-Packard) — нет данных.

Intel — по имеющейся информации только магазин.

Kingmax — только магазин.

KingFast — только магазин.

Kingston — есть представительство в Москве (территориально — м. Павелецкая), возможен обмен напрямую.

Micron — только магазин.

OCZ — собственный сервис RMA в РФ. Потребуется отправка накопителя в МО, Химки. Подробнее — в FAQ соответствующей темы.

Patriot — статус неясен, судя по всему, только магазин.

Plextor — в РФ представительские функции выполняет компания «Трилоджик» (3logic), гарантийные обязательства не несёт, только магазин (это официальная информация, данная представителем).

PQI — только магазин.

PNY — статус неясен, судя по всему, только магазин.

QUMO — статус неясен, судя по всему, только магазин (вроде бы есть представительство в Москве, но SSD они занимаются «постолько-поскольку»).

SanDisk — необходима регистрация на официальном сайте компании, если накопитель удалось зарегестрировать, есть шансы получить замену через отправку за границу, иначе — только магазин.

Samsung — серии 840Pro/840EVO в РФ официально не поставлялись, обмену не подлежат, серии 850***/750EVO/650 — противоречивая информация, якобы при наличии некоего специально заполненного магазином гарантийного талона в комплекте, лучше обратиться в Samsung — там объяснят точно.

Seagate — статус неясен, судя по всему, только магазин.

Silicon Power — только магазин.

SmartBuy — есть возможность обмена через головной офис компании «ТОП-Медиа» (владелец марки SmartBuy) в Москве (территориально — м. Полежаевская), возможен обмен через почтовую отправку, необходимо обратиться через сайт SmartBuy.

TEAM Group — в РФ не поставляются, статус неясен, судя по всему, только магазин.

Toshiba — статус неясен, судя по всему, только магазин.

Transcend — статус неясен, судя по всему, только магазин.

Zotac — статус неясен, но, судя по тому, что видеокарты они меняют, здесь также возможна отсылка за границу через RMA подобно Corsair.

Источник

Number of error information log entries

На примере твердотельного NVMe PCIe накопителя Intel SSD 600p (SSDPEKKW256G7X1) рассмотрим команды SMART.
S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.
Смотрим с помощью утилиты CrystalDiskInfo:
Всего хост-чтений/записей: это объем данных, записанных операционной системой.

Critical Warning — критические ошибки в работе накопителя (от отображаемого значения определяется характер сбоя).
Composite Temperature — текущая температура твердотельного накопителя.
Available Spare — текущий оставшийся объем резервной области, используемой для подмены вышедших из строя ячеек памяти (обычно это значение: 64).
Available Spare Threshold — это значение параметра Available Spare, по достижении которого состояние накопителя считается критическим.
Percentage Used — уровень износа накопителя в процентах (%).
Data Units Read — количество прочитанных с массива флеш-памяти блоков данных (один блок соответствует 512 байт данных).
Data Units Written — количество записанных на массив флеш-памяти блоков данных (один блок соответствует 512 байт данных).
Host Read Commands — количество выполненных по интерфейсу операций чтения данных (изменение на единицу соответствует 1 Мбайт данных).
Host Write Commands — количество выполненных по интерфейсу операций записи данных (изменение на единицу соответствует 1 Мбайт данных).
Controller Busy Time — время в минутах, в течение которого контроллер был занят обслуживанием запросов со стороны системы.
Power Cicles (0B) — количества циклов включения/выключения: 35.
Power On Hours (0C) — учет наработанного времени, в нашем случае это 15 часов.
Unsafe Shutdowns (0D) — количество небезопасных отключений питания: 22.
Media and Data Integrity Errors (0E) — количество ошибок целостности данных.
Number of Error Information Log Entries (0F) — количество ошибок целостности данных.

А в AIDA64 Extreme > Хранение данных > SMART добавлены еще два атрибута, которые связаны с температурой накопителя:
Warning Composite Temperature — время работы (в минутах) при высокой температуре.
Critical Composite Temperature — время работы (в минутах) при критической температуре.

Context Navigation

About NVMe

VM Express, NVMe, or Non-Volatile Memory Host Controller Interface Specification (NVMHCI), is a logical device interface specification for accessing non-volatile storage media attached via PCI Express (PCIe) bus. Some links related to the standard and vendor-specific implementations provided below:

Smartmontools supports NVMe starting from version 6.5. Please note, that currently NVMe support is considered as experimental. Currently implemented features:

Basic information about controller name, firmware, capacity ( smartctl -i )
Controller and namespace capabilities ( smartctl -c )
SMART overall-health self-assessment test result and warnings ( smartctl -H )
NVMe SMART attributes ( smartctl -A )
NVMe error log ( smartctl -l error[,NUM] )
Ability to fetch any nvme log ( smartctl -l nvmelog,N,SIZE )
The smartd daemon tracks health ( -H ), error count ( -l error ) and temperature ( -W DIFF,INFO,CRIT )

Currently NVMe support is implemented on Linux, FreeBSD, NetBSD, Windows and OSX. Details about supported version/driver combinations are provided in the next section.

NVMe support in the different OS

OS and driver	Supported by OS	Supported by Smartmontools	Native management tools	Notes
Linux 3.3 or later	✓	✓	nvme-cli, nvme-user
FreeBSD 9.2 or later	✓	✓	nvmecontrol
NetBSD 8.0 or later	✓	✓	nvmectl	Smartmontools supports this since 6.6 (r4343).
OpenBSD 6.0 or later	✓	—	??	Does the OpenBSD NVMe driver provide NVMe pass-through functionality?
OSX 10.10.3+ native NVMe support	✓	✓	Before release 10.13 only Apple-branded NVMe devices were supported, monitoring API is implemented (NVMeSMARTClient) but not documented. Limited NVMe support added in the DriveDx app (commercial, closed source) and in the smartmontools since 6.6 (r4438).
OSX with MacVidCards NVMe driver	✓	—	nvme-cli tool distributed with the driver	IOCTL format is not documented, driver is closed source and seems to be abandoned
Oracle Solaris 11.2+	✓	—	nvmeadm	Interface is not documented
IllumOS NVMe driver	✓	—	nvmeadm	NVME_IOC ioctl
Windows with driver supporting NVME_PASS_THROUGH	✓	✓	Various vendor specific tools	Successfully tested with NVMe drivers from Intel, OCZ/Toshiba and Samsung. Does not work with Intel RST drivers or Microsoft NVMe drivers.
Windows with Intel RST driver	✓	—	See ticket #1223.
Windows 7 to 2012.R2 with Microsoft NVMe driver	(✓)	—	??	Older Microsoft NVMe drivers do not provide a NVMe pass-through I/O-control.
Windows 10 with Microsoft NVMe driver (stornvme.sys)	✓	✓	??	Access via enhanced version of IOCTL_STORAGE_QUERY_PROPERTY is supported since smartmontools 6.6 (r4348).

NVMe pass-through support of USB to NVMe br >

USB bridge USB-Id Has NVMe pass-through Supported by Smartmontools Notes ASMedia ASM2362 0x174c:0x2362 ✓ — See ticket #1221. JMicron JMS583 0x152d:0x0583 ✓ ✓ smartctl -d sntjmicron (since 7.0)

Sample smartctl output

Sample smartctl -x output:

Development notes

Development and debugging could be performed using QEMU fork which can emulates NVMe device with most of the features supported, including SMART log pages, namespaces, etc. Tested with Linux and FreeBSD, full list of the options could be found in the source code. The NVMe emulation in the upstream version of QEMU (2.7.0) is still more limited (single namespace, no log pages).

VirtualBox 5.1.0 or later also provides basic NVMe emulation.

See list of the NVMe related tickets if you want to improve smartmontools NVMe support.

Apple isn’t sharing any information about their SMART API’s so I had to dig a little and this is the first result (spoiler alert) from my hack:

——————————————
Smart Log for NVME device. disk0
NamespaceID. 1
Critical Warning. 0
Temperature. 37 °Celsius
Available Spare. 100%
Available Spare Threshold. 10%
Percentage Used. 1%
Data Units Read. 4,292,043,776,000 [4.29 TB]
Data Units Written. 2,145,884,672,000 [2.14 TB]
Host Read Commands. 151780827
Host Write Commands. 50512740
Controller Busy Time. 248 minutes
Power Cycles. 1541
Power On Hours. 1156 hours
Unsafe Shutdowns. 784
Media and Data Integrity Errors. 0
Number of Error Information Log Entries.: 34

Here is an older one from my MacBook Pro:

——————————————
Smart Log for NVME device. disk0
NamespaceID. 1
Critical Warning. 0
Temperature. 22 °Celsius
Available Spare. 100%
Available Spare Threshold. 10%
Percentage Used. 0%
Data Units Read. 7086678
Data Units Written. 4943651
Host Read Commands. 11389069
Host Write Commands. 7246825
Controller Busy Time. 44 minutes
Power Cycles. 431
Power On Hours. 9 hours
Unsafe Shutdowns. 15
Media and Data Integrity Errors. 0
Number of Error Information Log Entries.: 0

The temperature on my MacBook Pro is lower. Only 22 °Celsius. I was also unpleasantly surprised by the fifteen ‘Unsafe Shutdowns’ on it. This has to be a driver issue. Never had a single freeze, lockdown or sudden reboot.

The high number of ‘Unsafe Shutdowns’ on the hack is easily explainable. As you know, I do a lot of testing and then things can go wrong. And they do go wrong with a couple of beta kernel drivers.

Like this:

26 thoughts on “ Apple NVMe SMART Monitor Under Control… ”

I have SMART status unavailable for my disks in system information, although I’ve set it in BIOS and can access is via third party software (HWMonitor).

What could be the reason? Is there a patch for it (DSDT or kext)?

No idea what this may be. Never seen it myself. Anyway. It should work in Windows. The problem is OS X. Are all your drives NVMe?

What model of MacBook Pro 2016 do you have? And what Apple SSD model?

We have two, but the one that I use is the 2.7GHz MacBookPro13,3 with 512GB Samsung (APPLE SSD SM0512L) with CXS6AA0Q firmware and AMD with 4GB.

It looks like Samsung-based NVMe SSDs in MacBook’s have better NVMe SMART support, because my APPLE AP0256J SSD doesn’t support Error Log for example, also it has different “available spare threshold”.
BTW IMHO some values from your first listing look strange – Data Units Written = 214 TB? Hm…

The durability goes up with the capacity and I believe that all Apple SSD’s support error logs, but nobody knows how to read it.

Ah right. I see. The thousands separators are were missing. Thanks for pointing that out.

Model Number: APPLE SSD AP0256J
Firmware Version: 12.93.01
Total NVM Capacity: 0
Unallocated NVM Capacity: 0
Controller ID: 0
Number of Namespaces: 2
Namespace 1 Size: 251,000,193,024 [251 GB]
Namespace 1 Capacity: 251,000,193,024 [251 GB]
Namespace 1 Utilization: 251,000,193,024 [251 GB]
Namespace 1 Formatted LBA Size: 4096
Firmware Updates: 1 Slot
Maximum Data Transfer Size: 256 Pages
Warning Comp. Temp. Threshold: 0
Critical Comp. Temp. Threshold: 0
Namespace 1 Features (0x00): 0
Log Page Attributes: 0
Error Log Page Entries (max): 0

Critical Warning: 0x00
Temperature: 39 Celsius
Available Spare: 86%
Available Spare Threshold: 2%
Percentage Used: 0%
Data Units Read: 3,229,653 [1.65 TB]
Data Units Written: 2,959,248 [1.51 TB]
Host Read Commands: 19,595,617
Host Write Commands: 13,087,280
Controller Busy Time: 0
Power Cycles: 279
Power On Hours: 10
Unsafe Shutdowns: 1
Media and Data Integrity Errors: 0
Error Information Log Entries: 0
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0

—-
1 unsafe shutdown was real unsafe shutdown

@supersonic, I am curious about your readings above. You have (had) only 10 hours of power-on, yet 1.5TB of data written and only 86% remaining lifespan of the SSD.
I have a MacBook Pro (2017) 13 that is one week old, with the following readings:

Available Spare: 82%
Available Spare Threshold: 2%
Percentage Used: 0%
Data Units Read: 16,036,595 [8.21 TB]
Data Units Written: 8,295,510 [4.24 TB]
Host Read Commands: 15,443,859
Host Write Commands: 12.508,631
Controller Busy Time: 0
Power Cycles: 319
Power On Hours: 5

My drive is 4x bigger than yours (I have 1TB) and so I think my readings are in the same ballpark.

Here’s my question: Are these for real? I am certain I have not done stuff in one week of ownership that amounts to this much SSD use! How old was your MacBook when you made these readings? Which model do you have?

Thanks a lot in advance.

@pejx72
Sorry for the delay with response.

> Are these for real?
Yes, this was the real report from DriveDx app (1.6.0 alpha) – https://binaryfruit.com/drivedx.

> How old was your MacBook when you made these readings?
About 2 weeks.

> Which model do you have?
MacBook Pro 13″ 2016 (w/o TouchBar), purchased Jan 20, 2017

Current data (2017-08-29):

Critical Warning: …………………………. 0x00
Temperature: ……………………………… 36 Celsius
Available Spare: …………………………..86%
Available Spare Threshold: ……………2%
Percentage Used:……………………….. 3%
Data Units Read: ………………………….56,423,021 [26.3 TB]
Data Units Written: ……………………….56,180,466 [26.2 TB]
Host Read Commands: …………………256,763,077
Host Write Commands: …………………216,424,066
Controller Busy Time:…………………… 0
Power Cycles: ……………………………..897
Power On Hours: …………………………180
Unsafe Shutdowns: ………………………11
Media and Data Integrity Errors: ……..0
Error Information Log Entries:………… 0
Warning Comp. Temperature Time:… 0
Critical Comp. Temperature Time:….. 0

Wow, how you’ve got all this data? Can you share the hack, please?

Источник

So now I had this in my drive log:

May 28 11:33:25 unRAID emhttpd: shcmd (471): mkfs.xfs -m crc=1,finobt=1 -f /dev/mapper/nvme0n1p1
May 28 11:33:25 unRAID kernel: print_req_error: I/O error, dev nvme0n1, sector 4160
May 28 11:33:25 unRAID kernel: print_req_error: I/O error, dev nvme0n1, sector 8392767
May 28 11:33:25 unRAID kernel: print_req_error: I/O error, dev nvme0n1, sector 16781374
May 28 11:33:25 unRAID kernel: print_req_error: I/O error, dev nvme0n1, sector 25169981
May 28 11:33:26 unRAID kernel: print_req_error: I/O error, dev nvme0n1, sector 33558588
May 28 11:33:26 unRAID kernel: print_req_error: I/O error, dev nvme0n1, sector 41947195
May 28 11:33:26 unRAID kernel: print_req_error: I/O error, dev nvme0n1, sector 50335802
May 28 11:33:26 unRAID kernel: print_req_error: I/O error, dev nvme0n1, sector 58724409
May 28 11:33:26 unRAID kernel: print_req_error: I/O error, dev nvme0n1, sector 67113016
May 28 11:33:26 unRAID kernel: print_req_error: I/O error, dev nvme0n1, sector 75501623
May 28 11:33:26 unRAID root: meta-data=/dev/mapper/nvme0n1p1 isize=512 agcount=4, agsize=58605652 blks
May 28 11:33:26 unRAID emhttpd: shcmd (473): mount -t xfs -o noatime,nodiratime /dev/mapper/nvme0n1p1 /mnt/cache

and I will also add my full SMART report here.

The device is a Corsair Force MP510 960GB

Force_MP510_1.txt

Источник

Доброго
LM 20.2 cinamon x64
на буке стоит один ссд

Диск /dev/loop0: 4 KiB, 4096 байт, 8 секторов
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Диск /dev/loop1: 61,79 MiB, 64770048 байт, 126504 секторов
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Диск /dev/loop2: 61,85 MiB, 64835584 байт, 126632 секторов
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Диск /dev/loop3: 32,32 MiB, 33878016 байт, 66168 секторов
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Диск /dev/loop4: 65,22 MiB, 68378624 байт, 133552 секторов
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Диск /dev/loop5: 307,46 MiB, 322387968 байт, 629664 секторов
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Диск /dev/loop6: 308,35 MiB, 323321856 байт, 631488 секторов
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Диск /dev/loop7: 32,42 MiB, 33980416 байт, 66368 секторов
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Диск /dev/nvme0n1: 238,49 GiB, 256060514304 байт, 500118192 секторов
Disk model: KINGSTON RBUSNS8154P3256GJ1
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт
Тип метки диска: gpt
Идентификатор диска: 2DE22DAF-3520-4534-9B00-040167D620FC

Устр-во начало Конец Секторы Размер Тип
/dev/nvme0n1p1 2048 1050875 1048828 512,1M EFI
/dev/nvme0n1p2 1052672 197382143 196329472 93,6G Файловая система Linux
/dev/nvme0n1p3 197382144 201381887 3999744 1,9G Linux своп
/dev/nvme0n1p4 201381888 500117503 298735616 142,5G Файловая система Linux

Диск /dev/sda: 28,9 GiB, 31004295168 байт, 60555264 секторов
Disk model: DataTraveler 3.0
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт
Тип метки диска: dos
Идентификатор диска: 0x2af71e68

Устр-во Загрузочный начало Конец Секторы Размер Идентификатор Тип
/dev/sda1 2048 60555263 60553216 28,9G c W95 FAT32 (

Диск /dev/loop8: 55,45 MiB, 58130432 байт, 113536 секторов
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Диск /dev/loop9: 450,25 MiB, 472117248 байт, 922104 секторов
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Диск /dev/loop10: 450,25 MiB, 472113152 байт, 922096 секторов
Единицы: секторов по 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 512 байт
Размер I/O (минимальный/оптимальный): 512 байт / 512 байт

Не счего начала появляться эта ошибка Device: /dev/nvme0, number of Error Log entries increased from 1344 to 1345
Что это и как исправить подскжите.
вот еще smartctl -a /dev/nvme0 :

martctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-88-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke,

www.smartmontools.org

Smartctl open device: /dev/nvme0 failed: Permission denied

seregka@MyAcer ~ [0:55:22]
> $ sudo smartctl -a /dev/nvme0
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-88-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke,

www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number: KINGSTON RBUSNS8154P3256GJ1
Serial Number: 50026B76842E424A
Firmware Version: E8FK12.3
PCI Vendor/Subsystem ID: 0x2646
IEEE OUI Identifier: 0x0026b7
Total NVM Capacity: 256 060 514 304 [256 GB]
Unallocated NVM Capacity: 0
Controller ID: 0
Number of Namespaces: 1
Namespace 1 Size/Capacity: 256 060 514 304 [256 GB]
Namespace 1 Formatted LBA Size: 512
Namespace 1 IEEE EUI-64: 0026b7 6842e424a5
Local Time is: Fri Oct 15 00:55:32 2021 +05
Firmware Updates (0x12): 1 Slot, no Reset required
Optional Admin Commands (0x0007): Security Format Frmw_DL
Optional NVM Commands (0x001e): Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Maximum Data Transfer Size: 512 Pages
Warning Comp. Temp. Threshold: 84 Celsius
Critical Comp. Temp. Threshold: 88 Celsius

Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 7.90W 0.0790W — 0 0 0 0 600 600
1 + 7.90W 0.0790W — 0 0 0 0 600 600
2 + 7.90W 0.0790W — 0 0 0 0 600 600
3 — 0.1000W 0.0790W — 3 3 3 3 1000 1000
4 — 0.0050W 0.0790W — 4 4 4 4 400000 90000

Supported LBA Sizes (NSID 0x1)
Id Fmt Data Metadt Rel_Perf
0 + 512 0 1
1 — 4096 0 0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 32 Celsius
Available Spare: 100%
Available Spare Threshold: 100%
Percentage Used: 1%
Data Units Read: 6 776 670 [3,46 TB]
Data Units Written: 8 127 362 [4,16 TB]
Host Read Commands: 96 096 107
Host Write Commands: 71 074 113
Controller Busy Time: 124
Power Cycles: 1 628
Power On Hours: 277
Unsafe Shutdowns: 40
Media and Data Integrity Errors: 0
Error Information Log Entries: 1 345
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 2: 32 Celsius

Error Information (NVMe Log 0x01, max 16 entries)
Num ErrCount SQId CmdId Status PELoc LBA NSID VS
0 1345 0 0x000a 0x0004 — 4009754624 1 —
1 1344 0 0x000a 0x0004 — 4009754624 1 —
2 1343 0 0x000a 0x0004 — 4009754624 1 —
3 1342 0 0x000a 0x0004 — 4009754624 1 —
4 1341 0 0x000a 0x0004 — 4009754624 1 —
5 1340 0 0x000a 0x0004 — 4009754624 1 —
6 1339 0 0x000a 0x0004 — 4009754624 1 —
7 1338 0 0x000a 0x0004 — 4009754624 1 —
8 1337 0 0x000a 0x0004 — 4009754624 1 —
9 1336 0 0x000a 0x0004 — 4009754624 1 —
10 1335 0 0x000a 0x0004 — 4009754624 1 —
11 1334 0 0x000a 0x0004 — 4009754624 1 —
12 1333 0 0x000a 0x0004 — 4009754624 1 —
13 1332 0 0x000a 0x0004 — 4009754624 1 —
14 1331 0 0x000a 0x0004 — 4009754624 1 —
15 1330 0 0x000a 0x0004 — 4009754624 1 —

Последний раз редактировалось пользователем 1 seregka; всего редактировалось раз: 14

Будьте добрее к этому миру, даже если мир не добр к вам.

Источник

Печать

Страницы: [1] Вниз

Тема: Ошибка Device: /dev/nvme0, number of Error Log entries increased from 1344 to 13 (Прочитано 1161 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Seregka74

Собственно появилась в журнале такая ошибка и счетчик постоянно растет.
вот выхлоп:

После знакомства с Ubuntu, заколотил все форточки в доме!

c47

На форумах посмотрел, вроде ничего критичного, Трансценды тоже пишут не парься

Попробуй поставь nvme-cli, может она как-то по другому инфу преподнесёт

Seregka74

Ла меня само присутствие данного сообщения напрягает, с мыслью ведь раньше же нормально было, почему сейчас так ))))
sudo nvme error-log /dev/nvme0

После знакомства с Ubuntu, заколотил все форточки в доме!

Печать

Страницы: [1] Вверх

Источник

Add bookmark
#1

Hello.

I’ve finally purchased a new Samsung 960 PRO NVME SSD.
It’s working wonders, read/write speeds are off the charts, the official Samsung Magician software reports zero issues, firmware up-to-date, but I’m seeing this weird value under its SMART information and it’s worrying me:

Error Information Log Entries: 40

Does anyone have experience with reading SMART data off NVMEs? If so, could this reflect a potential fault in the device or is this harmless / firmware junk readings?

The drive has only been running for 20+ hours. It’s probably nothing, but I guess it can’t hurt to ask.

Thanks!

Add bookmark
#2

SMART is pretty meaningless as far as I can tell on NVMe. I have a 950Pro, an ADATA SX8000 and one of those OEM Samsung NVMe jobs, and they all give pretty random SMART readings.

Add bookmark
#3

Welcome to Ars.

Install the nvme cli pkg, get the error log and print it in a human readable format. For example: # nvme error-log /dev/nvme0

Add bookmark
#5

The answer is «no».

The detailed explanation is that «Error Information Log» is an internal function the firmware uses to log errors it has reported back to the host OS. Protocol errors, transmission failures, temperature throttle warnings, even informational stuff the firmware writes out; That sort of thing. Two per hour is fairly benign.

It is not important (it’s informational) and not considered by the drive to be indicative of any fault or failure condition.

Add bookmark
#6

Thanks for dispelling the mystery.
I guess I’ll be a little less paranoid now.

Источник

[жж] словил сбойные сектора на nvme ssd

176 error information log entries ssd

176 error information log entries ssd

176 error information log entries ssd

Number of error information log entries

Context Navigation

Table of Contents

About NVMe

NVMe support in the different OS

NVMe pass-through support of USB to NVMe br >

Sample smartctl output

Development notes

Like this:

26 thoughts on “ Apple NVMe SMART Monitor Under Control… ”

<img decoding="async" onError="javascript: wp_broken_images = window.wp_broken_images || function(){}; wp_broken_images(this);" src="https://forum.ubuntu.ru/Themes/ubuntu-portal/images/png/useroff.png" alt="Оффлайн" /> Seregka74

<img decoding="async" onError="javascript: wp_broken_images = window.wp_broken_images || function(){}; wp_broken_images(this);" src="https://forum.ubuntu.ru/Themes/ubuntu-portal/images/png/useroff.png" alt="Оффлайн" /> c47

<img decoding="async" onError="javascript: wp_broken_images = window.wp_broken_images || function(){}; wp_broken_images(this);" src="https://forum.ubuntu.ru/Themes/ubuntu-portal/images/png/useroff.png" alt="Оффлайн" /> Seregka74

Читайте также:

Seregka74

c47

Seregka74