-
#1
Поговорим с Вами про GPU MEMORY ERRORS.
Очень много было разговоров, теперь обсудим, что же это такое!
GPU MEMORY ERRORS — одиночные ошибки памяти, которые были исправлены в ходе их нахождения самой видеокартой.
Принцип работы и исправления ошибок памяти.
1. Когда вы разгоняете видеокарту с прошитыми таймингами, чип работает нестабильно с данной частотой. (Каждый чип памяти индивидуальный).
2. В следствии этого появляются ошибки памяти. Они распознаются и исправляются следующим способом:
а) Когда данные передаются, каждый блок проходит проверку на контрольную сумму.
б) Если блок передал данные с неверной контрольной суммой, то видеокарта может исправить одну ошибку, чтобы вернуть контрольную сумму в соответствие.
I) Например есть блок 0101001, его контрольная сумма — 0xb96c5a3f — идеальный вариант
II) Но если тот же самый блок подвергся изменению, например 0100001, его контрольная сумма — 0x1d03d5a (так как на высоких частотах и с измененнымми таймингами чип работает не стабильно)
III) Видеокарта видит, что контрольная сумма не соответствует и исправляет одну ошибку, эта ошибка очевидна для видеокарты.
IV) После изменения блока данных, видеокарта записывает ошибку, которую мы видим в графе, как GPU MEMORY ERRORS.
в) Но если будут две ошибки в одном блоке, например 0101001 — идеал, а станет 0000001, то мы имеем две ошибки и видеокарта не сможет их исправить и уйдёт в BSOD.
3. Вывод — GPU MEMORY ERRORS считывает лишь одиночные ошибки памяти, которые были исправлены на ходу. Если же в одном блоке более одной ошибки — ожидайте синий экран.
Надеюсь понятно будет всем
-
#2
скиньте разгон/добавьте вольтажа и прекратите х.ней заниматься
-
#3
скиньте разгон/добавьте вольтажа и прекратите х.ней заниматься
человеку секса не хватает
-
#4
. Если же в одном блоке более одной ошибки — ожидайте синий экран.
реджекты будут, синьки не видел давно
-
#5
реджекты будут, синьки не видел давно
Вы не правы
-
#6
Поговорим с Вами про GPU MEMORY ERRORS.
Очень много было разговоров, теперь обсудим, что же это такое!
GPU MEMORY ERRORS — одиночные ошибки памяти, которые были исправлены в ходе их нахождения самой видеокартой.
Принцип работы и исправления ошибок памяти.
1. Когда вы разгоняете видеокарту с прошитыми таймингами, чип работает нестабильно с данной частотой. (Каждый чип памяти индивидуальный).
2. В следствии этого появляются ошибки памяти. Они распознаются и исправляются следующим способом:
а) Когда данные передаются, каждый блок проходит проверку на контрольную сумму.
б) Если блок передал данные с неверной контрольной суммой, то видеокарта может исправить одну ошибку, чтобы вернуть контрольную сумму в соответствие.
I) Например есть блок 0101001, его контрольная сумма — 0xb96c5a3f — идеальный вариант
II) Но если тот же самый блок подвергся изменению, например 0100001, его контрольная сумма — 0x1d03d5a (так как на высоких частотах и с измененнымми таймингами чип работает не стабильно)
III) Видеокарта видит, что контрольная сумма не соответствует и исправляет одну ошибку, эта ошибка очевидна для видеокарты.
IV) После изменения блока данных, видеокарта записывает ошибку, которую мы видим в графе, как GPU MEMORY ERRORS.
в) Но если будут две ошибки в одном блоке, например 0101001 — идеал, а станет 0000001, то мы имеем две ошибки и видеокарта не сможет их исправить и уйдёт в BSOD.
3. Вывод — GPU MEMORY ERRORS считывает лишь одиночные ошибки памяти, которые были исправлены на ходу. Если же в одном блоке более одной ошибки — ожидайте синий экран.
Надеюсь понятно будет всем
Это не совсем так, исправлять «на лету» вк как впрочем и другие чипы способны и несколько бит данных и даже байты данных(на определенном срезе данных). Уж, прости Господи, даже в инсте ещё исправляли на бумаге 2-3 бита, математика там элементарная.
Так и утверждение про БСОД не совсем корректное, его ловить из-за пару битов ошибок не получится, в вкратце не опишешь, но там кухня куда более сложная… в целом его можно получить например когда вк подала на выход целый пакет данных некорректно (к промеру все нули или типо того), но там размеры куда больше чем пару битов.
-
#7
Ошибки памяти появляются из за повышения частоты памяти и повышения температуры самих чипов. То есть, просто индикатор переразгона памяти.
Всегда стараюсь настроить карты, что бы ошибок не было вообще, или их было по минимуму. Раз в месяц проверяю, вдруг не посыпались где, если есть, то снижаю память на 5 мегагерц. Как я заметил, если забить на ошибки, то риг начнет зависать, или будут инкоррект шары в майнере. Но бывает, что и с ошибками карта работает без проблем, узнаешь случайно из хвинфо.
-
#8
А в чем собственно проблема?
-
#9
Это не совсем так, исправлять «на лету» вк как впрочем и другие чипы способны и несколько бит данных и даже байты данных(на определенном срезе данных). Уж, прости Господи, даже в инсте ещё исправляли на бумаге 2-3 бита, математика там элементарная.
Так и утверждение про БСОД не совсем корректное, его ловить из-за пару битов ошибок не получится, в вкратце не опишешь, но там кухня куда более сложная… в целом его можно получить например когда вк подала на выход целый пакет данных некорректно (к промеру все нули или типо того), но там размеры куда больше чем пару битов.
Да, я очень сильно упростил для понимания
-
#10
После прошивки таймингов, подбираю частоту памяти до начала ошибок, чуток снижаю и все. Через пол часа проверяю еще раз, потому что иногда ошибки начинают идти, когда прогреваются чипы, особенно если память не охлаждается радиатором. Через сутки работы без ошибок жму s в клейморе и смотрю инкоррект шары, если есть на какой то карте, то снижаю память еще на 3-5мгц. Если ошибок нет и инкорректов нет, питание хорошее, то риг будет работать неделями без перезагрузки.
-
#11
Поговорим с Вами про GPU MEMORY ERRORS.
Очень много было разговоров, теперь обсудим, что же это такое!
GPU MEMORY ERRORS — одиночные ошибки памяти, которые были исправлены в ходе их нахождения самой видеокартой.
Принцип работы и исправления ошибок памяти.
1. Когда вы разгоняете видеокарту с прошитыми таймингами, чип работает нестабильно с данной частотой. (Каждый чип памяти индивидуальный).
2. В следствии этого появляются ошибки памяти. Они распознаются и исправляются следующим способом:
а) Когда данные передаются, каждый блок проходит проверку на контрольную сумму.
б) Если блок передал данные с неверной контрольной суммой, то видеокарта может исправить одну ошибку, чтобы вернуть контрольную сумму в соответствие.
I) Например есть блок 0101001, его контрольная сумма — 0xb96c5a3f — идеальный вариант
II) Но если тот же самый блок подвергся изменению, например 0100001, его контрольная сумма — 0x1d03d5a (так как на высоких частотах и с измененнымми таймингами чип работает не стабильно)
III) Видеокарта видит, что контрольная сумма не соответствует и исправляет одну ошибку, эта ошибка очевидна для видеокарты.
IV) После изменения блока данных, видеокарта записывает ошибку, которую мы видим в графе, как GPU MEMORY ERRORS.
в) Но если будут две ошибки в одном блоке, например 0101001 — идеал, а станет 0000001, то мы имеем две ошибки и видеокарта не сможет их исправить и уйдёт в BSOD.
3. Вывод — GPU MEMORY ERRORS считывает лишь одиночные ошибки памяти, которые были исправлены на ходу. Если же в одном блоке более одной ошибки — ожидайте синий экран.
Надеюсь понятно будет всем
Ознакомьтесь как-нить как работает блокчейн и почему появляются режекты и сталы из-за ошибок видеокарт…
-
#12
Ознакомьтесь как-нить как работает блокчейн и почему появляются режекты и сталы из-за ошибок видеокарт…
Причем тут блокчейн? Тут про ошибки в памяти видеокарты написано, про майнинг и блокчейн ни слова не сказано. По поводу ошибок. Неужели в ВК не встроен механизм повторного вычисления блока? Т.е. если 1 блок из миллиона ошибочен, то какой смысл выпадать в синий экран?)
-
#13
Ознакомьтесь как-нить как работает блокчейн и почему появляются режекты и сталы из-за ошибок видеокарт…
Вы не про то говорите. Stale — запаздалая шара
Reject — шара, которая уже выполнена, но ВК её продолжала считать
-
#14
Причем тут блокчейн? Тут про ошибки в памяти видеокарты написано, про майнинг и блокчейн ни слова не сказано. По поводу ошибок. Неужели в ВК не встроен механизм повторного вычисления блока? Т.е. если 1 блок из миллиона ошибочен, то какой смысл выпадать в синий экран?)
Вы немного не поняли. ВК исправляет эту ошибку, но если в одном блоке две ошибки, то карта просто не знает, что с этими данными делать, или повтор, или синий экран
-
#15
Вы немного не поняли. ВК исправляет эту ошибку, но если в одном блоке две ошибки, то карта просто не знает, что с этими данными делать, или повтор, или синий экран
Вы так категорично писали про синий экран, что сложилось впечатление, будто бы альтернатив у вк совсем нет. И, честно сказать, сомнительно, если 1 ошибка может быть исправлена, то почему 2 уже не могут быть? Выше писали, что есть множество алгоритмов исправления ошибок, и, как правило, там и при 30% потерь нормально все отработает. Предполагаю с точки зрения не знающего человека, но по логике должно быть так.
-
#16
Вы так категорично писали про синий экран, что сложилось впечатление, будто бы альтернатив у вк совсем нет. И, честно сказать, сомнительно, если 1 ошибка может быть исправлена, то почему 2 уже не могут быть? Выше писали, что есть множество алгоритмов исправления ошибок, и, как правило, там и при 30% потерь нормально все отработает. Предполагаю с точки зрения не знающего человека, но по логике должно быть так.
2 ошибки могут быть исправлены в разных блоках. По одной ошибке на каждый блок. ВК видит, где нужно исправить ошибку. Если же взять блок с двумя ошибками, она просто запутается и не знает, в каком месте исправить одну, а затем и другую ошибку
-
#17
2 ошибки могут быть исправлены в разных блоках. По одной ошибке на каждый блок. ВК видит, где нужно исправить ошибку. Если же взять блок с двумя ошибками, она просто запутается и не знает, в каком месте исправить одну, а затем и другую ошибку
А откуда вы располагаете такой информацией, если не секрет?
-
#18
Поговорим с Вами про GPU MEMORY ERRORS.
Очень много было разговоров, теперь обсудим, что же это такое!
GPU MEMORY ERRORS — одиночные ошибки памяти, которые были исправлены в ходе их нахождения самой видеокартой.
Принцип работы и исправления ошибок памяти.
1. Когда вы разгоняете видеокарту с прошитыми таймингами, чип работает нестабильно с данной частотой. (Каждый чип памяти индивидуальный).
2. В следствии этого появляются ошибки памяти. Они распознаются и исправляются следующим способом:
а) Когда данные передаются, каждый блок проходит проверку на контрольную сумму.
б) Если блок передал данные с неверной контрольной суммой, то видеокарта может исправить одну ошибку, чтобы вернуть контрольную сумму в соответствие.
I) Например есть блок 0101001, его контрольная сумма — 0xb96c5a3f — идеальный вариант
II) Но если тот же самый блок подвергся изменению, например 0100001, его контрольная сумма — 0x1d03d5a (так как на высоких частотах и с измененнымми таймингами чип работает не стабильно)
III) Видеокарта видит, что контрольная сумма не соответствует и исправляет одну ошибку, эта ошибка очевидна для видеокарты.
IV) После изменения блока данных, видеокарта записывает ошибку, которую мы видим в графе, как GPU MEMORY ERRORS.
в) Но если будут две ошибки в одном блоке, например 0101001 — идеал, а станет 0000001, то мы имеем две ошибки и видеокарта не сможет их исправить и уйдёт в BSOD.
3. Вывод — GPU MEMORY ERRORS считывает лишь одиночные ошибки памяти, которые были исправлены на ходу. Если же в одном блоке более одной ошибки — ожидайте синий экран.
Надеюсь понятно будет всем
Садись! 5 ! Экзамен сдал!
-
#19
Причем тут блокчейн? Тут про ошибки в памяти видеокарты написано, про майнинг и блокчейн ни слова не сказано. По поводу ошибок. Неужели в ВК не встроен механизм повторного вычисления блока? Т.е. если 1 блок из миллиона ошибочен, то какой смысл выпадать в синий экран?)
Ты где бывал? Бывалый!)))
Речь только о работе видеокарт а не о блокчейне прочей х..
Я просто разгоняю карты для гейминга — сыпятся такие же ошибки при нагрузке, блокчейн тут не при делах))0
-
#20
А откуда вы располагаете такой информацией, если не секрет?
Да б…я, учился он….
Бросай ВК мучить, мамка устала за тебя свет оплачивать, хорош ей пи…ть что ты на компе рефераты делаешь круглосуточно, даже специальную ферму для рефераторв собрал)))
Содержание
- RX 500 Вылетает GPU 0
- Comancherro
- MadWorld
- Lolminer unrecoverable error by gpu
- Требования к драйверам
- Ошибки Видеокарты При Майнинге
- UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL
- UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000
- NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED
- NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?
- GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0
- Socket error. the remote host closed the connection, в майнере Nbminer
- Server not responded on share, на майнере Gminer
- DAG has been damaged check overclocking settings, в майнере Gminer
- ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6
- TREX: Can’t unlock GPU
- CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6
- ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА
- GPU driver error, no temps в HiveOS — что делать?
- GPU are lost, rebooting
- exitcode=3 в HiveOS
- exitcode=1 в HiveOS
- gpu fault detected 146
- Waiting interface to come up — не работает VPN на HiveOS
- Как узнать ip адрес воркера hive os
- Repository update failed в HiveOS
- Rave os не запускается. Boot aborted Rave os
- Failed to allocate memory Raveos
- gpu_driver_fault, GPU #0 fault в RaveOS
- Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS
- Miner restarted after error RaveOS
- Miner restart limit reached. Worker rebooting by flag auto в RaveOS
- Miner cannot be started, ОС RaveOS
- Overclock can’t be applied в RaveOS
- Error installing hive miners
- Warning: Nvidia settings applied with errors
- Nvtool error или Danger: nvtool error
- Перестал отображаться кулер видеокарты HiveOS
- ERROR: parsing JSON failed
- NVML: can’t get fan speed for GPU #5, error code 999 hive os
- Can’t get power for GPU #2
- GPU1 search error: unspecified launch failure
- Warning: Autofan: unable to set fan speed, rebooting
RX 500 Вылетает GPU 0
Comancherro
Пляшущий с бубном
Добрый день. Подскажите пожалуйста. вчера произошло обновление винды 10.
До все работало стабильно, никаких ошибок, вотч догов, перегрузов.
После обновление:
1. Слетели дрова — удалил через ДДУ, поставил Блокчейн версию, хешрейт вернулся.
2. При запуске тим вивера, вылетает GPU 0, сразу же. Пишет хешрейт 0, затем вылетает вотч дог.
Если запускать майнер через тим вивер, то даже DAG EPOCH не создастся на эту карту.
Пробовал добавить виртуальной памяти, сделалось только хуже, перестал открываться пуск.
КТо -нибудь сталкивался?
Система:
RX580 8gb и 4gb (4 и 2 шт)
ASUS PRIME Z270
Блок серверный, 1580ВТ
8gb памяти
MadWorld
Свой человек
Добрый день. Подскажите пожалуйста. вчера произошло обновление винды 10.
До все работало стабильно, никаких ошибок, вотч догов, перегрузов.
После обновление:
1. Слетели дрова — удалил через ДДУ, поставил Блокчейн версию, хешрейт вернулся.
2. При запуске тим вивера, вылетает GPU 0, сразу же. Пишет хешрейт 0, затем вылетает вотч дог.
Если запускать майнер через тим вивер, то даже DAG EPOCH не создастся на эту карту.
Пробовал добавить виртуальной памяти, сделалось только хуже, перестал открываться пуск.
КТо -нибудь сталкивался?
Система:
RX580 8gb и 4gb (4 и 2 шт)
ASUS PRIME Z270
Блок серверный, 1580ВТ
8gb памяти
Источник
Lolminer unrecoverable error by gpu
20.12.2022 144 Просмотры
Двойной майнинг — это процесс добычи двух конкретных монет на одной видеокарте (или майнинг ферме). Благодаря дуал майнингу вы можете увеличить свой доход. Можно добывать одновременно ETH/ETC/UBQHASH и Kaspa.
Нужно убедиться, чтобы в Windows или Linux (HiveOs, RaveOS) вы обновили программу до последней версии.
Перечислим команды, без которых майнинг, вообще, не запустится:
lolMiner.exe название программы;
- —algo — алгоритм майнинга;
- —pool — координаты сервера коллективного майнинга;
- —user — адрес кошелька;
Если появляется жёлтое сообщение “нажмите любую клавишу для продолжения” это говорит о баге или невозможности подключиться к пулу. Данная ошибка была частой на прошлой версии lolminer 1.43. В 1.44 пока не встречал. Разработчики уверили, что всё исправлено.
Ошибка майнера NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2)
Одна из самых распространённых ошибок на Windows – нехватка памяти, в данном случае на майнере Nbminer, но встречается и в майнере Nicehash. Чтобы ее исправить – надо увеличить файл подкачки. Файл подкачки должен быть равен сумме гб всех видеокарт в риге плюс 10% запаса. Как увеличить файл подкачки – читаем тут.
Требования к драйверам
Nvidia:
Cuda 10 or 11
AMD:
— Big Navi: amdgpu-pro 20.40 (Linux) / Adrenaline 20.11.2 (Windows) and newer.
— Navi: amdgpu-pro 19.30 (Linux) / Adrenaline 19.10.02 (Windows) and newer.
— Vega: amdgpu-pro 18.50 (Linux) / Adrenaline 18.10 (Windows) and newer.
— older cards: Blockchain drivers and newer.
Источник
Ошибки Видеокарты При Майнинге
Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.
UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL
UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000
NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED
NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?
GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0
Socket error. the remote host closed the connection, в майнере Nbminer
DAG has been damaged check overclocking settings, в майнере Gminer
ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6
Ошибки настройки памяти с кодом -6 обычно указывают на проблему с драйвером.
Если у вас Windows, используйте программу DDU (DisplayDriverUninstaller), чтобы полностью удалить все драйверы Nvidia.
Перезагрузите систему.
Установите новый драйвер прямо с сайта Nvidia.
Перезагрузите систему снова.
Если у вас HiveOS/RaveOS — накатите чистый образ системы. Чтобы наверняка. 🙂
TREX: Can’t unlock GPU
Полный текст ошибки:
TREX: Can’t unlock GPU [ID=1, GPU #1], error code 15
WARN: Miner is going to shutdown.
WARN: NVML: can’t get fan speed for GPU #1, error code 15
WARN: NVML: can’t get power for GPU #1, error code 15
WARN: NVML: can’t get mem/core clock for GPU #1, error code 17
Решение:
- Проверьте все кабельные соединения видеокарты и райзера, особенно кабеля питания.
- Если с первый пунктом все ок, попробуйте поменять райзер на точно рабочий.
- Если ошибка остается, вставьте видеокарту в разъем х16 напрямую в материнскую плату.
CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6
Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.
ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА
GPU driver error, no temps в HiveOS — что делать?
Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.
Если ошибка не уйдет — проверьте райзер.
GPU are lost, rebooting
Это не ошибка, а ее последствие. Что узнать какая ошибка приводит к перезагрузке карт, сделайте следующее:
Включите сохранение логов (по умолчанию они выключены) командой
И перезагрузите риг.
После того как ошибка повторится можно будет скачать логи командами ниже.
Вы можете использовать следующую команду, чтобы загрузить логи майнера прямо с панели мониторинга;
message file «miner.log» -f=/var/log/miner/minername/minername.log
Итак, скажем, например, мне нужны логи TeamRedMiner
message file «teamredminer.log» -f=/var/log/miner/teamredminer/teamredminer.log
Отправленная командная строка будет выделена синим цветом. Загружаемый файл будет отображаться белым цветом. Нажав на него, вы сможете его скачать.
Эта команда позволит скачать лог системы
message file «syslog» -f=/var/log/syslog
exitcode=3 в HiveOS
Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.
Если ошибка не уйдет — проверьте райзер.
exitcode=1 в HiveOS
Данная ошибка возникает когда есть проблема с датой в биосе материнской платы (сбитое время) и (или) есть проблема с интернетом.
Если сбито время, то удаленно вы не сможете подключиться.
Тем не менее, обновление драйверов Nvidia должно пройти командой:
gpu fault detected 146
Waiting interface to come up — не работает VPN на HiveOS
Как узнать ip адрес воркера hive os
Repository update failed в HiveOS
Rave os не запускается. Boot aborted Rave os
Перепроверьте все настройки ПК и БИОСа материнской платы:
— Установите загрузочное устройство HDD/SSD/M2/USB в зависимости от носителя с ОС.
— Включите 4G decoding.
— Установите поддержку PCIe на Auto.
— Включите встроенную графику.
— Установите предпочтительный режим загрузки Legacy mode.
— Отключите виртуализацию.
Если после данных настроек не определяется часть карт, то выполните следующие настройки в BIOS (после каждого пункта требуется полная перезагрузка):
— Отключите 4G decoding
— Перезагрузка
— Отключите CSM
— Перезагрузка
— Включите 4G decoding, установите PCI-E Gen2/3, а при отсутствии Gen2/3, можно выбрать Gen1
Failed to allocate memory Raveos
Эта же ошибка может называться как:
failed to allocate initramfs memory bailing out, failed to load idlinux c.32
или
failed to allocate memory for kernel boot parameter block
или
failed to allocate initramfs memory raveos bailing
Но решение у нее одно — вы должны правильно настроить БИОС материнской платы.
gpu_driver_fault, GPU #0 fault в RaveOS
gpu_driver_fault, GPU #0 fault в RaveOS
Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS
Miner restarted after error RaveOS
Miner restart limit reached. Worker rebooting by flag auto в RaveOS
Miner cannot be started, ОС RaveOS
Непосредственно перед этой ошибкой обычно пишется еще другая, которая и вызывает эту проблему. Но если ничего нет, то:
- Поставьте майнер на паузу, перезагрузите риг и в консоли выполните команды clear-miners clear-logs и fix-fs. Запустите майнинг.
- Если ошибка не ушла, перепишите образ RaveOS.
Overclock can’t be applied в RaveOS
Error installing hive miners
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.
Если ошибка не уйдет — физически перезапишите образ. Если у вас флешка, то скорее всего она умерла. Купите SSD. 🙂
Warning: Nvidia settings applied with errors
Перестал отображаться кулер видеокарты HiveOS
ERROR: parsing JSON failed
Необходимо выполнить на риге локально (с клавиатурой и монитором) следующую команду:
net-test
Данная команда покажет ваше текущее состояние подключения к разным зеркалам API серверов HiveOS.
Посмотрите, к какому API у вас наименьшая задержка (ping), и когда воркер снова появится в панели, измените стандартное зеркало на то, что ближе к вам.
После смены зеркала, в обязательном порядке перезагрузите ваш воркер.
Изменить сервер API вы можете командой nano /hive-config/rig.conf
После смены нажмите ctrl + o и ентер для того чтобы сохранить файл.
После этого выйдите в консоль командой ctrl + x, f10 и выполните команду hello
NVML: can’t get fan speed for GPU #5, error code 999 hive os
Can’t get power for GPU #2
Как правило эта ошибка встречается рядом вместе с другими:
Attribute ‘GPUGraphicsClockOffset’ was already set to 0
Attribute ‘GPUMemoryTransferRateOffset’ was already set to 2200
Attribute ‘GPUFanControlState’ (hive1660s_ETH:0[gpu:2]) assigned value
0.
20211029 12:40:50 WARN: NVML: can’t get fan speed for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get power for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get mem/core clock for GPU #2, error code 999
Решение:
Проверьте корректность установки драйвера на видеокарте.
Убедитесь что нет проблем с драйвером, если все в порядке, то попробуйте другой параметр разгона. Например уменьшить разгон по памяти.
GPU1 search error: unspecified launch failure
Warning: Autofan: unable to set fan speed, rebooting
Найдите логи майнера, посмотрите какие ошибки майнер пишет в логах. Например:
kernel: [12112.410046][ T7358] NVRM: GPU at PCI:0000:0c:00: GPU-236e3bef-2e03-6cdb-0518-7ac01eb8736d
kernel: [12112.410049][ T7358] NVRM: Xid (PCI:0000:0c:00): 62, pid=7317, 0000(0000) 00000000 00000000
kernel: [12112.433831][ T7358] NVRM: Xid (PCI:0000:0c:00): 45, pid=7317, Ch 00000010
CRON[21094]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Исходя из логов, мы видим что есть проблема с видеокартой на слоте PCIE 0c:00 (под номером Gpu пишется номер PCIE слота) с ошибками 45 и 62
Коды ошибок (других, которые также могут быть там) и что с ними делать:
• 13, 43, 45: ошибки памяти, снизить MEM
• 8, 31, 32, 61, 62: снизить CORE, возможно и MEM
• 79: снизить CORE, проверить райзер
Источник
Каждые 8-12 часов слетает майнер с ошибкой(на фото).Я уже за”бся автобёрнер юзать.Карты гиги memory clock 1000,pl 68-70)))Майнер пишет типа исправить по памяти и дать вольтаж,но и так карты кушают по 140Вт,куда уж больше)))Господа Шмайнеры что подскажите шаманить???
Для тех, у кого вылетает lolminer на винде на картах 3060 v1 ( у меня вылетает на % dag файла), попробуйте запустить майнер на стандартных настройках ( то есть на кошельках разработчика), если он у вас в таком виде работает – значит проблема в пуле ETH или TON’а.
Двойной майнинг — это процесс добычи двух конкретных монет на одной видеокарте (или майнинг ферме). Благодаря дуал майнингу вы можете увеличить свой доход. Можно добывать одновременно ETH/ETC/UBQHASH и Kaspa.
Нужно убедиться, чтобы в Windows или Linux (HiveOs, RaveOS) вы обновили программу до последней версии.
Перечислим команды, без которых майнинг, вообще, не запустится:
lolMiner.exe название программы;
- —algo — алгоритм майнинга;
- —pool — координаты сервера коллективного майнинга;
- —user — адрес кошелька;
Если появляется жёлтое сообщение “нажмите любую клавишу для продолжения” это говорит о баге или невозможности подключиться к пулу. Данная ошибка была частой на прошлой версии lolminer 1.43. В 1.44 пока не встречал. Разработчики уверили, что всё исправлено.
Ошибка майнера NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2)
Одна из самых распространённых ошибок на Windows – нехватка памяти, в данном случае на майнере Nbminer, но встречается и в майнере Nicehash. Чтобы ее исправить – надо увеличить файл подкачки. Файл подкачки должен быть равен сумме гб всех видеокарт в риге плюс 10% запаса. Как увеличить файл подкачки – читаем тут.
Требования к драйверам
Nvidia:
Cuda 10 or 11
AMD:
— Big Navi: amdgpu-pro 20.40 (Linux) / Adrenaline 20.11.2 (Windows) and newer.
— Navi: amdgpu-pro 19.30 (Linux) / Adrenaline 19.10.02 (Windows) and newer.
— Vega: amdgpu-pro 18.50 (Linux) / Adrenaline 18.10 (Windows) and newer.
— older cards: Blockchain drivers and newer.
>lolminer: Неисправимая ошибка памяти GPU 0. #1241
Часто появляется ошибка памяти видеокарты. улей ОС
Часто появляется ошибка памяти видеокарты. улей ОС
Просто уменьшите OC памяти этого графического процессора. Это совет, чтобы сказать, что вы превышаете пределы. Обычно это происходит с памятью Hynix на 3060TI… это должно быть около 1750. Или экстремальная ОС памяти в других Nvidia.
Память со временем и высоким OC деградирует.
Ошибки Видеокарты При Майнинге
Самое полное собрание ошибок в майнинге на Windows, HiveOS и RaveOS и их быстрых и спокойных решений
Can’t find nonce with device CUDA_ERROR_LAUNCH_FAILED
Ошибка майнера Can’t find nonce
Ошибка говорит о том, что майнер не может найти нонс и сразу же сам предлагает решение — уменьшить разгон. Особенно начинающие майнеры стараются выжать из видеокарты максимум — разгоняют слишком сильно по ядру или памяти. В таком разгоне видеокарта даже может запуститься, но потом выдавать ошибки как указано ниже. Помните, лучше — стабильная отправка шар на пул, чем гонка за цифрами в майнере.
Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.
Phoenixminer Connection to API server failed — что делать?
Ошибка Connection to API server failed
Такая ошибка встречается на PhoenixMiner на операционной систему HiveOS. Она говорит о том, что майнинг-ферма/риг не может подключиться к серверу статистики. Что делать для ее решения:
- Введите команду net-test и запомните/запишите сервер с низким пингом. После чего смените его в веб интерфейсе Hive (на воркере) и перезагрузите ваш риг.
- Если это не помогло, выполните команду dnscrypt -i && sreboot
Phoenixminer CUDA error in CudaProgram.cu:474 : the launch timed out and was terminated (702)
Ошибка майнера Phoenixminer CUDA error in CudaProgram
Эта ошибка, как и в первом случае, говорит о переразгоне карты. Откатите видеокарту до заводских настроек и постепенно поднимайте разгон до тех пор, пока не будет ошибки.
UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL
Ошибка майнера Unable to enum CUDA GPUs: invalid device ordinal
Проверяем драйвера видеокарты и саму видеокарту на работоспособность (как она отмечена в диспетчере устройств, нет ли восклицательных знаков).
Если все ок, то проверяем райзера. Часто бывает, что именно райзер бывает причиной такой ошибки.
UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000
Ошибка майнера Unable to enum CUDA GPUs: Insufficient CUDA driver: 5000
Аналогично предыдущей ошибке — проверяем драйвера видеокарты и саму видеокарту на работоспособность (как она отмечена в диспетчере устройств, нет ли восклицательных знаков).
NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED
Ошибка майнера NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED
Ошибка code 1073740791 nbminer возникает, если ваш риг/майнинг-ферма собраны из солянки Nvidia+AMD. В этом случае разделите майнинг на два .bat файла (или полетника, если вы на HiveOS). Один — с картами AMD, другой с картами Nvidia.
NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?
Ошибка майнера NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2)
Одна из самых распространённых ошибок на Windows — нехватка памяти, в данном случае на майнере Nbminer, но встречается и в майнере Nicehash. Чтобы ее исправить — надо увеличить файл подкачки. Файл подкачки должен быть равен сумме гб всех видеокарт в риге плюс 10% запаса. Как увеличить файл подкачки — читаем тут.
GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0
Ошибка майнера GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0
В данном случае скорее всего виноват не файл подкачки, а переразгон по видеокарте, которая идет под номером 0. Сбавьте разгон и ошибка должна пропасть.
Socket error. the remote host closed the connection, в майнере Nbminer
Socket error. the remote host closed the connection
Также может быть описана как «ERROR — Failed to establish connection to mining pool: Socket operation timed out».
Сетевой конфликт — проверьте соединение рига с интернетом. Перегрузите роутер.
Также может быть, что провайдер закрывает соединение с пулом. Смените пул, попробуйте VPN или измените адреса DNS на внешнего провайдера, например cloudflare 1.1.1.1, 1.0.0.1
Server not responded on share, на майнере Gminer
Server not responded on share
Такая ошибка говорит о том, что у вас что-то с подключением к интернету, что критично для Gminer. Попробуйте сделать рестарт роутера и отключить watchdog на майнере.
DAG has been damaged check overclocking settings, в майнере Gminer
Также в этой ошибке может быть указано Device not responding, check overclocking settings.
Ошибка говорит о переразгоне, попробуйте сначала убавить его.
Если это не помогло, смените майнер — Gminer никогда не славился работой с видеокартами AMD. Мы рекомендуем поменять майнер на Teamredminer, а если вам критична поддержка майнером одновременно Nvidia и AMD видеокарт, то используйте Lolminer.
Если смена майнера не поможет, переставьте видеодрайвер.
Если и это не поможет, то нужно тестировать эту карту отдельно в слоте X16.
ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6
Ошибки настройки памяти с кодом -6 обычно указывают на проблему с драйвером.
Если у вас Windows, используйте программу DDU (DisplayDriverUninstaller), чтобы полностью удалить все драйверы Nvidia.
Перезагрузите систему.
Установите новый драйвер прямо с сайта Nvidia.
Перезагрузите систему снова.
Если у вас HiveOS/RaveOS — накатите чистый образ системы. Чтобы наверняка.
TREX: Can’t unlock GPU
Полный текст ошибки:
TREX: Can’t unlock GPU [ID=1, GPU #1], error code 15
WARN: Miner is going to shutdown…
WARN: NVML: can’t get fan speed for GPU #1, error code 15
WARN: NVML: can’t get power for GPU #1, error code 15
WARN: NVML: can’t get mem/core clock for GPU #1, error code 17
Решение:
- Проверьте все кабельные соединения видеокарты и райзера, особенно кабеля питания.
- Если с первый пунктом все ок, попробуйте поменять райзер на точно рабочий.
- Если ошибка остается, вставьте видеокарту в разъем х16 напрямую в материнскую плату.
CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6
Ошибка майнера CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6
В конкретном случае была проблема в блоке питания, он не держал 3 видеокарты. После замены блока питания ошибка пропала.
Если вы уверены, что ваш мощности вашего блока питания достаточно, попробуйте сменить майнер.
Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.
ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА
Ошибка 511 градусов видеокарта
Ошибка 511 говорит о неисправности райзера или питания карты. Проверьте все соединения. Для выявления неисправности рекомендуется запустить систему с одной картой. Протестировать, и затем добавлять по одной карте.
GPU driver error, no temps в HiveOS — что делать?
Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.
Если ошибка не уйдет — проверьте райзер.
GPU are lost, rebooting
Это не ошибка, а ее последствие. Что узнать какая ошибка приводит к перезагрузке карт, сделайте следующее:
Включите сохранение логов (по умолчанию они выключены) командой
logs-on
И перезагрузите риг.
После того как ошибка повторится можно будет скачать логи командами ниже.
Вы можете использовать следующую команду, чтобы загрузить логи майнера прямо с панели мониторинга;
message file «miner.log» -f=/var/log/miner/minername/minername.log
Итак, скажем, например, мне нужны логи TeamRedMiner
message file «teamredminer.log» -f=/var/log/miner/teamredminer/teamredminer.log
Отправленная командная строка будет выделена синим цветом. Загружаемый файл будет отображаться белым цветом. Нажав на него, вы сможете его скачать.
Эта команда позволит скачать лог системы
message file «syslog» -f=/var/log/syslog
exitcode=3 в HiveOS
Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.
Если ошибка не уйдет — проверьте райзер.
exitcode=1 в HiveOS
Данная ошибка возникает когда есть проблема с датой в биосе материнской платы (сбитое время) и (или) есть проблема с интернетом.
Если сбито время, то удаленно вы не сможете подключиться.
Тем не менее, обновление драйверов Nvidia должно пройти командой:
nvidia-driver-update —list
gpu fault detected 146
Скорее всего вы пытаетесь майнить с помощью Phoenix miner. Решения два:
- Откатитесь на более старую версию, например на 5.4с
- (Рекомендуемый вариант) Используйте Trex для видеокарт Nvidia и TeamRedMiner для AMD.
Waiting interface to come up — не работает VPN на HiveOS
Waiting interface to come up
Начните с логов, чтобы понять какая именно ошибка вызывает эту проблему.
Команды для получения логов:
systemctl status openvpn@client
journalctl -u openvpn@client -e —no-pager -n 100
Как узнать ip адрес воркера hive os
Как узнать ip адрес воркера hive os
Самое простое — зайти в воркера и прокрутить страницу ниже видеокарт. Там будет указан Remote IP — это и есть внешний IP.
Альтернативный вариант — вы можете проверить ваш внешний айпи адрес hive через консоль Hive Shell:
Выполните одну из команд:
curl 2ip.ru
wget -qO- eth0.me
wget -qO- ipinfo.io/ip
wget -qO- ipecho.net/plain
wget -qO- icanhazip.com
wget -qO- ipecho.net
wget -qO- ident.me
Repository update failed в HiveOS
Иногда встречается на HiveOS. Полный текст ошибки:
Some index files failed to download. They have been ignored, or old ones used instead.
Repository update failed
------------------------------------------------------
> Restarting autofan and watchdog
> Starting miners
Miner screen is already running
Run miner or screen -r to resume screen
Upgrade failed
Решение:
- Выполнить команду apt update && selfupgrade -f
- Если не сработала и она, то 99.9%, что разработчики HiveOS уже знают об этой проблеме и решают ее. Попробуйте выполнить обновление через некоторое время.
Rave os не запускается. Boot aborted Rave os
Перепроверьте все настройки ПК и БИОСа материнской платы:
— Установите загрузочное устройство HDD/SSD/M2/USB в зависимости от носителя с ОС.
— Включите 4G decoding.
— Установите поддержку PCIe на Auto.
— Включите встроенную графику.
— Установите предпочтительный режим загрузки Legacy mode.
— Отключите виртуализацию.
Если после данных настроек не определяется часть карт, то выполните следующие настройки в BIOS (после каждого пункта требуется полная перезагрузка):
— Отключите 4G decoding
— Перезагрузка
— Отключите CSM
— Перезагрузка
— Включите 4G decoding, установите PCI-E Gen2/3, а при отсутствии Gen2/3, можно выбрать Gen1
Failed to allocate memory Raveos
Эта же ошибка может называться как:
failed to allocate initramfs memory bailing out, failed to load idlinux c.32
или
failed to allocate memory for kernel boot parameter block
или
failed to allocate initramfs memory raveos bailing
Но решение у нее одно — вы должны правильно настроить БИОС материнской платы.
gpu_driver_fault, GPU #0 fault в RaveOS
gpu_driver_fault, GPU #0 fault в RaveOS
В большинстве случаев эта проблема решается уменьшением разгона (особенно по памяти) на конкретной видеокарте (на скрине это карта номер 0).
Если уменьшение разгона не помогает, то попробуйте обновить драйвера.
Если обновление драйверов не привело к решению проблемы, то попробуйте поменять райзер на этой карте на точно работающий.
Если и это не помогает, перепроверьте все кабельные соединения и мощность блока питания, хватает ли его для вашей конфигурации.
Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS
Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes
Что приводит к появлению этой ошибки? Вероятно, вы переразогнали видеокарту (часто сильно гонят по памяти), сбавьте разгон. На скрине видно, что проблему дает именно GPU под номером 1 — начните с нее.
Вторая частая причина — нехватка питания БП на систему с видеокартами. Учтите, что сама система потребляет не менее 100 вт, каждый райзер еще закладывайте 50 вт. БП должно хватать с запасом в 20%.
Miner restarted after error RaveOS
Смотрите логи майнера, там будет указана конкретная ошибка, которая приводит к miner restarted. После этого найдите ее на этой странице и исправьте. Проблема уйдет.
Miner restart limit reached. Worker rebooting by flag auto в RaveOS
Аналогично предыдущему пункту — смотрите логи майнера, там будет указана конкретная ошибка, которая приводит к рестарту воркера. Пофиксите ту ошибку — уйдет и эта проблема.
Miner cannot be started, ОС RaveOS
Непосредственно перед этой ошибкой обычно пишется еще другая, которая и вызывает эту проблему. Но если ничего нет, то:
- Поставьте майнер на паузу, перезагрузите риг и в консоли выполните команды clear-miners clear-logs и fix-fs. Запустите майнинг.
- Если ошибка не ушла, перепишите образ RaveOS.
Overclock can’t be applied в RaveOS
Эта ошибка означает, что значения разгона между собой конфликтуют или выходят за пределы допустимых. Перепроверьте их. Скиньте разгон на стоковый и попробуйте еще раз.
В редких случаях причиной этой ошибки также становится райзер.
Error installing hive miners
Error installing hive miners
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.
Если ошибка не уйдет — физически перезапишите образ. Если у вас флешка, то скорее всего она умерла. Купите SSD.
Warning: Nvidia settings applied with errors
Переразгон. Снизьте значения частот ядра и памяти. После этого перезагрузите риг.
Nvtool error или Danger: nvtool error
Скорее всего при установке драйвера появилась проблема с модулем nvtool
Попробуйте переустановить драйвер Nvidia командой через Hive shell:
nvidia-driver-update версия_драйвера —force
Или попробуйте обновить систему полностью командой из Hive shell:
hive-replace -y —stable
nvtool error
Перестал отображаться кулер видеокарты HiveOS
0% скорости вращения кулера.
Это может произойти по нескольким причинам:
- кулер действительно не крутится
- датчик оборотов отключен или сломан
- видеокарта слишком агрессивно работает (высокий разгон)
- неисправен райзер или одно из его частей
ERROR: parsing JSON failed
Необходимо выполнить на риге локально (с клавиатурой и монитором) следующую команду:
net-test
Данная команда покажет ваше текущее состояние подключения к разным зеркалам API серверов HiveOS.
Посмотрите, к какому API у вас наименьшая задержка (ping), и когда воркер снова появится в панели, измените стандартное зеркало на то, что ближе к вам.
После смены зеркала, в обязательном порядке перезагрузите ваш воркер.
Изменить сервер API вы можете командой nano /hive-config/rig.conf
После смены нажмите ctrl + o и ентер для того чтобы сохранить файл.
После этого выйдите в консоль командой ctrl + x, f10 и выполните команду hello
NVML: can’t get fan speed for GPU #5, error code 999 hive os
Проблема с скоростью кулеров на GPU 5
0% скорости вращения кулера / ошибки в целом
Это может произойти по нескольким причинам:
— кулер действительно не крутится
— датчик оборотов отключен или сломан
— видеокарта слишком агрессивно работает (высокий разгон)
Начните с визуальной проверки карты и ее кулера.
Can’t get power for GPU #2
Как правило эта ошибка встречается рядом вместе с другими:
Attribute ‘GPUGraphicsClockOffset’ was already set to 0
Attribute ‘GPUMemoryTransferRateOffset’ was already set to 2200
Attribute ‘GPUFanControlState’ (hive1660s_ETH:0[gpu:2]) assigned value
0.
20211029 12:40:50 WARN: NVML: can’t get fan speed for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get power for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get mem/core clock for GPU #2, error code 999
Решение:
Проверьте корректность установки драйвера на видеокарте.
Убедитесь что нет проблем с драйвером, если все в порядке, то попробуйте другой параметр разгона. Например уменьшить разгон по памяти.
GPU1 search error: unspecified launch failure
Уменьшите разгон и проверьте контакты райзера
Warning: Autofan: unable to set fan speed, rebooting
Найдите логи майнера, посмотрите какие ошибки майнер пишет в логах. Например:
kernel: [12112.410046][ T7358] NVRM: GPU at PCI:0000:0c:00: GPU-236e3bef-2e03-6cdb-0518-7ac01eb8736d
kernel: [12112.410049][ T7358] NVRM: Xid (PCI:0000:0c:00): 62, pid=7317, 0000(0000) 00000000 00000000
kernel: [12112.433831][ T7358] NVRM: Xid (PCI:0000:0c:00): 45, pid=7317, Ch 00000010
CRON[21094]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Исходя из логов, мы видим что есть проблема с видеокартой на слоте PCIE 0c:00 (под номером Gpu пишется номер PCIE слота) с ошибками 45 и 62
Коды ошибок (других, которые также могут быть там) и что с ними делать:
• 13, 43, 45: ошибки памяти, снизить MEM
• 8, 31, 32, 61, 62: снизить CORE, возможно и MEM
• 79: снизить CORE, проверить райзер
Ошибка Kernel-Power код 41
Проверьте все провода (от БП до карт, от БП до райзеров), возможно где-то идёт оплавление. Если визуальный осмотр показал, что все ок, то ошибка программная и вам нужно переустановить Windows.
Danger: hive-replace -y —stable (failed, exitcode=137)
Очень редкая ошибка, которая вылезла в момент удаленного обновления образа HiveOS. Она не встречается в тематических майнинг группах и сайтах. Не поверите что произошло.
На балконе, где стоял риг, поселилась семья голубей. Они засрали риг, в прямом смысле, из-за этого он постоянно уходил в оффлайн. После полной продувки материнской платы и видеокарт проблема решилась сама.
MALFUNCTION HIVEOS
Malfunction — неисправность. Причин и решений может быть несколько:
- Вам следует переустановить видео драйвер;
- Если драйвер не помог, тогда отключайте все GPU и поочередно вставляйте по 1 шт, и смотрите вызовет ли какая-то видеокарта подобную ошибку или нет. Если да, то возможно это райзер.
- Неисправен носитель, на который записана Hive OS, запишите образ еще раз.
Не нашли своей ошибки? Помогите сделать мир майнинга лучше. Отправьте ее по этой форме и мы обновим наш гайд в самое ближайшее время.
Постоянная проблема c GPU 0
webkost
Пляшущий с бубном
Доброго времени суток.
Прошу помощи, т.к. бьюсь с проблемой уже очень долго.
(Риг — ASUS 6х1060-3GB, БП Corsair TX750M 2×750, Мать ASUS Prime Z270-P, ОП Kingston 4GB)
Идет постоянный сбой GPU 0, на винде при запуске клеймора, он видит 6 карточек, затем выдает ошибку, перезапускается и уже видит 5 карточек и работает нормально. Разгон пробовал разный ставить, и на стандарт скидывал, не помогло. Винда видит что все 6 карточек в порядке. Подумал сначала проблема в карте/разъеме/райзере, поковырялся и понял, что клеймор ругается именно на GPU 0, то есть я подключаю одну видеокарту, ни чего не работает, подключаю две — GPU 0 отваливается, вторая карточка работает нормально. И самое интересное в том, что это не зависит от разъема PCE и от видеокарты. Я менял их местами, подключал в разные разъемы, итог один, всегда проблема с GPU 0. Через время поставил Hive OS думал в винде косяк, проблема оказалась та же самая. Не важно какая карта, какое их количество подключено, или какой разъем PCE — всегда не работает GPU 0 а остальные работают в полном порядке и с разгоном и без. Вот что пишет hive os — >Claymore Reboot: WATCHDOG: GPU error, you need to restart miner (в логах — watchdog — thread 0 (gpu0), hb time 8171), я так понимаю ватчдог обращается к карточки и не получив ответа идет на ребут.
Очень прошу помощи, может кто сталкивался или знает как решить проблему, или кто советом поможет, буду очень благодарен.
Источник
GPU instability/bad performance during bakes in Toolbag/Painter after Windows Fall Creators Update
First off, I’m not sure if this is the best place to post this so mods feel free to move/close the thread.
Alright, so I’m having a bit of an issue with my GPU. After the Windows Fall Creators Update my GPU tends to hang quite a bit and it’s generally slower when using Toolbag 3 and Substance Painter. Toolbag loads projects super slowly, the baker takes a long time to initialize and baking a 4K AO map is a guaranteed crash.
In Marmoset, whenever I try baking a 4K AO map I always get a «Fatal GPU error». Then Toolbag crashes and I get a desktop notification saying toolbag «has been denied Graphics Device usage». This is the error message I see inside Toolbag:
I tried changing the «Baker GPU Priority» but none of the settings had an effect on the baker’s stability. The baker doesn’t just crash, it’s also very, very slow compared to what it was before the Windows update. Before I could easily crank out a 4K AO map in around a minute — now I can barely bake a 2K AO map without crashing the baker and the baking process takes forever. Normal map bakes are almost instant though, even at 16bit 4K + max AA, which is kinda weird.
In Painter loading a project is very slow. Painter’s baker doesn’t crash though, it’s just very slow compared to before the update. Then, after the update, I was greeted by this notification when booting up Painter. This never came up before the update.
I added the «TdrDelay» and «TdrDdiDelay» registry keys into the registry and set their values to 60 seconds. Now Painter doesn’t mention it on startup, but the baker is still very slow. Changing the TDR values didn’t have an effect on Toolbag’s baker’s stability either.
What’s worth mentioning is that I don’t have performance issues with games. I have no trouble running games on the usual, almost maxed out settings. The GPU’s instability is the most apparent when doing a long bake or loading a project.
So far I’ve:
— Uninstalled all graphics drivers using DDU, and reinstalled the most recent NVIDIA drivers manually from their site.
— Rolled back the GPU driver 6 versions to see if one of the drivers would be better suited for the new Windows version.
— Did a complete Windows reinstall, wiping my C: drive clean. The installation left me with the Fall Creators Update which is a little unfortunate.
— «sfc /scannow», with no unusual results.
— Disk cleanup including system files.
— Checked NVIDIA control panel for odd settings.
— Made sure Windows game mode was turned off.
— Changed the TDR registry values to 60.
— Updated all other components’ drivers to see if they’re conflicting with the GPU.
— Contacted NVIDIA support. They adviced me to reinstall the OS to eliminate the possibility of any corruption.
— Contacted Microsoft support twice. The first time wasn’t all that useful, the second time the support agent managed to mess up my computer during a remote session.
— I did several GPU benchmarks to see if the issue is hardware related, but nothing unusual came up. The GPU itself is fine.
— Reinstalled Toolbag 3 and Substance Painter.
— Done countless reboots and shutdowns.
Oh, and I can’t roll back to a previous version of Windows since my C: drive was completely wiped during the Windows reinstallation process.
Источник
Console: GPU error
When you see a «GPU error» on your 24h logs or worker’s latest activity there is a trouble with detecting information connected to your GPU — in some cases, you will also be able to see which GPUs are the problematic ones.
We suggest to double check if all devices are properly connected and detected and to re-check your overclocking settings and adjust them to make your GPUs more stable.
There are different groups of GPU errors that appear in the console and while they are all facing the same issues they report different events.
Not enough memory, failed to allocate memory — VRAM, BUFFER, or DAG
- If you are using Claymore, switch to some other mining client as Claymore is outdated at this point.
- If you have 3GB or 4GB GPUs and you are getting this error while mining ETH, you will need to switch to some other coin as DAG size already exceeded the space you have available in the memory. See DAG calculator to learn more about DAG size.
- If your GPUs have enough RAM and you are getting this error, you can check your overclocking settings as too intense or missing overclocking settings can be the reason for this error as well.
Unresponsive GPUs
To fix this error, we recommend you to check out overclocking settings and adjust them to make your GPUs more stable.
Temperature limit reached
You can try to fix this error by setting proper temprature triggers or auto-fan control in your overclocking settings.
OpenCL or CUDA crash and/or other unknown errors
One case when this error can appear is if you are using AMD GPUs but you have added worker as Nvidia on the minerstat dashboard or vice-versa. If this is the case, write to us, or delete your worker and re-add it.
Use minerstat software and improve your mining operation
Источник
Run lolminer 1.3 error report #652
Comments
wulong2020 commented Jul 6, 2021 •
After running for a few hours, if the following error message is reported, lolminer will restart:
Unrecoverable memory error by GPU 2.
Reset of all Cuda GPUs required.
Please check your (memory) OC & UV settings on this card.
New job received: 0x542ce7 Epoch: 425 Target: 000000016e80fe03
Device 0 detected as crashed.
Closing miner and trying to call external script: ./emergency.sh (—watchdog script)
After trying to reduce the video memory frequency from 2500 to 2400, the error will still occur
The text was updated successfully, but these errors were encountered:
jgonzis commented Jul 6, 2021
After running for a few hours, if the following error message is reported, lolminer will restart:
Unrecoverable memory error by GPU 2.
Reset of all Cuda GPUs required.
Please check your (memory) OC & UV settings on this card.
New job received: 0x542ce7 Epoch: 425 Target: 000000016e80fe03
Device 0 detected as crashed.
Closing miner and trying to call external script: ./emergency.sh (—watchdog script)
After trying to reduce the video memory frequency from 2500 to 2400, the error will still occur
Could you try to reduce Memory OC to 2200 for example. 2400 is quite up and could be the problem of the crash.
Источник