Gpu are lost rebooting как исправить

Разбираем какие ошибки могут выдавать майнинг программы и как их быстро и спокойно решить. Постоянное обновление!

Ошибки Видеокарты При Майнинге

Самое полное собрание ошибок в майнинге на Windows, HiveOS и RaveOS и их быстрых и спокойных решений

Can’t find nonce with device CUDA_ERROR_LAUNCH_FAILED

Ошибка майнера Can't find nonce

Ошибка майнера Can’t find nonce

Ошибка говорит о том, что майнер не может найти нонс и сразу же сам предлагает решение — уменьшить разгон. Особенно начинающие майнеры стараются выжать из видеокарты максимум — разгоняют слишком сильно по ядру или памяти. В таком разгоне видеокарта даже может запуститься, но потом выдавать ошибки как указано ниже. Помните, лучше — стабильная отправка шар на пул, чем гонка за цифрами в майнере.

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

Phoenixminer Connection to API server failed — что делать?

Ошибка Connection to API server failed

Ошибка Connection to API server failed

Такая ошибка встречается на PhoenixMiner на операционной систему HiveOS. Она говорит о том, что майнинг-ферма/риг не может подключиться к серверу статистики. Что делать для ее решения:

  • Введите команду net-test и запомните/запишите сервер с низким пингом. После чего смените его в веб интерфейсе Hive (на воркере) и перезагрузите ваш риг.
  • Если это не помогло, выполните команду dnscrypt -i && sreboot

Phoenixminer CUDA error in CudaProgram.cu:474 : the launch timed out and was terminated (702)

Ошибка майнера Phoenixminer CUDA error in CudaProgram

Ошибка майнера Phoenixminer CUDA error in CudaProgram

Эта ошибка, как и в первом случае, говорит о переразгоне карты. Откатите видеокарту до заводских настроек и постепенно поднимайте разгон до тех пор, пока не будет ошибки.

UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL

Ошибка майнера Unable to enum CUDA GPUs: invalid device ordinal

Ошибка майнера Unable to enum CUDA GPUs: invalid device ordinal

Проверяем драйвера видеокарты и саму видеокарту на работоспособность (как она отмечена в диспетчере устройств, нет ли восклицательных знаков).
Если все ок, то проверяем райзера. Часто бывает, что именно райзер бывает причиной такой ошибки.

UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000

Ошибка майнера Unable to enum CUDA GPUs: Insufficient CUDA driver: 5000

Ошибка майнера Unable to enum CUDA GPUs: Insufficient CUDA driver: 5000

Аналогично предыдущей ошибке — проверяем драйвера видеокарты и саму видеокарту на работоспособность (как она отмечена в диспетчере устройств, нет ли восклицательных знаков).

NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

Ошибка майнера NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

Ошибка майнера NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

Ошибка code 1073740791 nbminer возникает, если ваш риг/майнинг-ферма собраны из солянки Nvidia+AMD. В этом случае разделите майнинг на два .bat файла (или полетника, если вы на HiveOS). Один — с картами AMD, другой с картами Nvidia.

NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?

Ошибка майнера NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2)

Ошибка майнера NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2)

Одна из самых распространённых ошибок на Windows — нехватка памяти, в данном случае на майнере Nbminer, но встречается и в майнере Nicehash. Чтобы ее исправить — надо увеличить файл подкачки. Файл подкачки должен быть равен сумме гб всех видеокарт в риге плюс 10% запаса. Как увеличить файл подкачки — читаем тут.

GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

Ошибка майнера GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

Ошибка майнера GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

В данном случае скорее всего виноват не файл подкачки, а переразгон по видеокарте, которая идет под номером 0. Сбавьте разгон и ошибка должна пропасть.

Socket error. the remote host closed the connection, в майнере Nbminer

Socket error. the remote host closed the connection

Также может быть описана как «ERROR — Failed to establish connection to mining pool: Socket operation timed out».
Сетевой конфликт — проверьте соединение рига с интернетом. Перегрузите роутер.
Также может быть, что провайдер закрывает соединение с пулом. Смените пул, попробуйте VPN или измените адреса DNS на внешнего провайдера, например cloudflare 1.1.1.1, 1.0.0.1

Server not responded on share, на майнере Gminer

Server not responded on share

Такая ошибка говорит о том, что у вас что-то с подключением к интернету, что критично для Gminer. Попробуйте сделать рестарт роутера и отключить watchdog на майнере.

DAG has been damaged check overclocking settings, в майнере Gminer

Также в этой ошибке может быть указано Device not responding, check overclocking settings.
Ошибка говорит о переразгоне, попробуйте сначала убавить его.
Если это не помогло, смените майнер — Gminer никогда не славился работой с видеокартами AMD. Мы рекомендуем поменять майнер на Teamredminer, а если вам критична поддержка майнером одновременно Nvidia и AMD видеокарт, то используйте Lolminer.
Если смена майнера не поможет, переставьте видеодрайвер.
Если и это не поможет, то нужно тестировать эту карту отдельно в слоте X16.

ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6

Ошибки настройки памяти с кодом -6 обычно указывают на проблему с драйвером.

Если у вас Windows, используйте программу DDU (DisplayDriverUninstaller), чтобы полностью удалить все драйверы Nvidia.
Перезагрузите систему.
Установите новый драйвер прямо с сайта Nvidia.
Перезагрузите систему снова.
Если у вас HiveOS/RaveOS — накатите чистый образ системы. Чтобы наверняка. :)

TREX: Can’t unlock GPU

Полный текст ошибки:
TREX: Can’t unlock GPU [ID=1, GPU #1], error code 15
WARN: Miner is going to shutdown…
WARN: NVML: can’t get fan speed for GPU #1, error code 15
WARN: NVML: can’t get power for GPU #1, error code 15
WARN: NVML: can’t get mem/core clock for GPU #1, error code 17

Решение:

  1. Проверьте все кабельные соединения видеокарты и райзера, особенно кабеля питания.
  2. Если с первый пунктом все ок, попробуйте поменять райзер на точно рабочий.
  3. Если ошибка остается, вставьте видеокарту в разъем х16 напрямую в материнскую плату.

CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6

Ошибка майнера CAN'T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN'T GET BUSID, CODE -6

Ошибка майнера CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6

В конкретном случае была проблема в блоке питания, он не держал 3 видеокарты. После замены блока питания ошибка пропала.
Если вы уверены, что ваш мощности вашего блока питания достаточно, попробуйте сменить майнер.

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА

Ошибка 511 градусов видеокарта

Ошибка 511 градусов видеокарта

Ошибка 511 говорит о неисправности райзера или питания карты. Проверьте все соединения. Для выявления неисправности рекомендуется запустить систему с одной картой. Протестировать, и затем добавлять по одной карте.

GPU driver error, no temps в HiveOS — что делать?

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

GPU are lost, rebooting

Это не ошибка, а ее последствие. Что узнать какая ошибка приводит к перезагрузке карт, сделайте следующее:

Включите сохранение логов (по умолчанию они выключены) командой

logs-on

И перезагрузите риг.
После того как ошибка повторится можно будет скачать логи командами ниже.
Вы можете использовать следующую команду, чтобы загрузить логи майнера прямо с панели мониторинга;

message file «miner.log» -f=/var/log/miner/minername/minername.log

Итак, скажем, например, мне нужны логи TeamRedMiner
message file «teamredminer.log» -f=/var/log/miner/teamredminer/teamredminer.log

Отправленная командная строка будет выделена синим цветом. Загружаемый файл будет отображаться белым цветом. Нажав на него, вы сможете его скачать.
Эта команда позволит скачать лог системы

message file «syslog» -f=/var/log/syslog

exitcode=3 в HiveOS

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

exitcode=1 в HiveOS

Данная ошибка возникает когда есть проблема с датой в биосе материнской платы (сбитое время) и (или) есть проблема с интернетом.
Если сбито время, то удаленно вы не сможете подключиться.
Тем не менее, обновление драйверов Nvidia должно пройти командой:

nvidia-driver-update —list

gpu fault detected 146

Скорее всего вы пытаетесь майнить с помощью Phoenix miner. Решения два:

  1. Откатитесь на более старую версию, например на 5.4с
  2. (Рекомендуемый вариант) Используйте Trex для видеокарт Nvidia и TeamRedMiner для AMD.

Waiting interface to come up — не работает VPN на HiveOS

Waiting interface to come up

Начните с логов, чтобы понять какая именно ошибка вызывает эту проблему.
Команды для получения логов:
systemctl status openvpn@client
journalctl -u openvpn@client -e —no-pager -n 100

Как узнать ip адрес воркера hive os

Как узнать ip адрес воркера hive os

Самое простое — зайти в воркера и прокрутить страницу ниже видеокарт. Там будет указан Remote IP — это и есть внешний IP.
Альтернативный вариант — вы можете проверить ваш внешний айпи адрес hive через консоль Hive Shell:
Выполните одну из команд:
curl 2ip.ru
wget -qO- eth0.me
wget -qO- ipinfo.io/ip
wget -qO- ipecho.net/plain
wget -qO- icanhazip.com
wget -qO- ipecho.net
wget -qO- ident.me

Repository update failed в HiveOS

Иногда встречается на HiveOS. Полный текст ошибки:

Some index files failed to download. They have been ignored, or old ones used instead.
Repository update failed
------------------------------------------------------
> Restarting autofan and watchdog
> Starting miners
Miner screen is already running
Run miner or screen -r to resume screen
Upgrade failed

Решение:

  1. Выполнить команду apt update && selfupgrade -f
  2. Если не сработала и она, то 99.9%, что разработчики HiveOS уже знают об этой проблеме и решают ее. Попробуйте выполнить обновление через некоторое время.

Rave os не запускается. Boot aborted Rave os

Boot aborted Rave os

Перепроверьте все настройки ПК и БИОСа материнской платы:
— Установите загрузочное устройство HDD/SSD/M2/USB в зависимости от носителя с ОС.
— Включите 4G decoding.
— Установите поддержку PCIe на Auto.
— Включите встроенную графику.
— Установите предпочтительный режим загрузки Legacy mode.
— Отключите виртуализацию.

Если после данных настроек не определяется часть карт, то выполните следующие настройки в BIOS (после каждого пункта требуется полная перезагрузка):

— Отключите 4G decoding
— Перезагрузка
— Отключите CSM
— Перезагрузка
— Включите 4G decoding, установите PCI-E Gen2/3, а при отсутствии Gen2/3, можно выбрать Gen1

Failed to allocate memory Raveos

Эта же ошибка может называться как:
failed to allocate initramfs memory bailing out, failed to load idlinux c.32
или
failed to allocate memory for kernel boot parameter block
или
failed to allocate initramfs memory raveos bailing

Но решение у нее одно — вы должны правильно настроить БИОС материнской платы.

gpu_driver_fault, GPU #0 fault в RaveOS

gpu_driver_fault, GPU #0 fault в RaveOS

В большинстве случаев эта проблема решается уменьшением разгона (особенно по памяти) на конкретной видеокарте (на скрине это карта номер 0).
Если уменьшение разгона не помогает, то попробуйте обновить драйвера.
Если обновление драйверов не привело к решению проблемы, то попробуйте поменять райзер на этой карте на точно работающий.
Если и это не помогает, перепроверьте все кабельные соединения и мощность блока питания, хватает ли его для вашей конфигурации.

Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS

Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes

Что приводит к появлению этой ошибки? Вероятно, вы переразогнали видеокарту (часто сильно гонят по памяти), сбавьте разгон. На скрине видно, что проблему дает именно GPU под номером 1 — начните с нее.
Вторая частая причина — нехватка питания БП на систему с видеокартами. Учтите, что сама система потребляет не менее 100 вт, каждый райзер еще закладывайте 50 вт. БП должно хватать с запасом в 20%.

Miner restarted after error RaveOS

Смотрите логи майнера, там будет указана конкретная ошибка, которая приводит к miner restarted. После этого найдите ее на этой странице и исправьте. Проблема уйдет. :)

Miner restart limit reached. Worker rebooting by flag auto в RaveOS

Аналогично предыдущему пункту — смотрите логи майнера, там будет указана конкретная ошибка, которая приводит к рестарту воркера. Пофиксите ту ошибку — уйдет и эта проблема.

Miner cannot be started, ОС RaveOS

Непосредственно перед этой ошибкой обычно пишется еще другая, которая и вызывает эту проблему. Но если ничего нет, то:

  1. Поставьте майнер на паузу, перезагрузите риг и в консоли выполните команды clear-miners clear-logs и fix-fs. Запустите майнинг.
  2. Если ошибка не ушла, перепишите образ RaveOS.

Overclock can’t be applied в RaveOS

Эта ошибка означает, что значения разгона между собой конфликтуют или выходят за пределы допустимых. Перепроверьте их. Скиньте разгон на стоковый и попробуйте еще раз.
В редких случаях причиной этой ошибки также становится райзер.

Error installing hive miners

Error installing hive miners

Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — физически перезапишите образ. Если у вас флешка, то скорее всего она умерла. Купите SSD. :)

Warning: Nvidia settings applied with errors

Переразгон. Снизьте значения частот ядра и памяти. После этого перезагрузите риг.

Nvtool error или Danger: nvtool error

Скорее всего при установке драйвера появилась проблема с модулем nvtool
Попробуйте переустановить драйвер Nvidia командой через Hive shell:
nvidia-driver-update версия_драйвера —force
Или попробуйте обновить систему полностью командой из Hive shell:
hive-replace -y —stable

nvtool error

Перестал отображаться кулер видеокарты HiveOS

0% скорости вращения кулера.
Это может произойти по нескольким причинам:

  • кулер действительно не крутится
  • датчик оборотов отключен или сломан
  • видеокарта слишком агрессивно работает (высокий разгон)
  • неисправен райзер или одно из его частей

ERROR: parsing JSON failed

Необходимо выполнить на риге локально (с клавиатурой и монитором) следующую команду:
net-test

Данная команда покажет ваше текущее состояние подключения к разным зеркалам API серверов HiveOS.
Посмотрите, к какому API у вас наименьшая задержка (ping), и когда воркер снова появится в панели, измените стандартное зеркало на то, что ближе к вам.
После смены зеркала, в обязательном порядке перезагрузите ваш воркер.
Изменить сервер API вы можете командой nano /hive-config/rig.conf
После смены нажмите ctrl + o и ентер для того чтобы сохранить файл.
После этого выйдите в консоль командой ctrl + x, f10 и выполните команду hello

NVML: can’t get fan speed for GPU #5, error code 999 hive os

Проблема с скоростью кулеров на GPU 5
0% скорости вращения кулера / ошибки в целом
Это может произойти по нескольким причинам:
— кулер действительно не крутится
— датчик оборотов отключен или сломан
— видеокарта слишком агрессивно работает (высокий разгон)
Начните с визуальной проверки карты и ее кулера.

Can’t get power for GPU #2

Как правило эта ошибка встречается рядом вместе с другими:
Attribute ‘GPUGraphicsClockOffset’ was already set to 0
Attribute ‘GPUMemoryTransferRateOffset’ was already set to 2200
Attribute ‘GPUFanControlState’ (hive1660s_ETH:0[gpu:2]) assigned value
0.

20211029 12:40:50 WARN: NVML: can’t get fan speed for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get power for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get mem/core clock for GPU #2, error code 999

Решение:

Проверьте корректность установки драйвера на видеокарте.
Убедитесь что нет проблем с драйвером, если все в порядке, то попробуйте другой параметр разгона. Например уменьшить разгон по памяти.

GPU1 search error: unspecified launch failure

Уменьшите разгон и проверьте контакты райзера

Warning: Autofan: unable to set fan speed, rebooting

Найдите логи майнера, посмотрите какие ошибки майнер пишет в логах. Например:

kernel: [12112.410046][ T7358] NVRM: GPU at PCI:0000:0c:00: GPU-236e3bef-2e03-6cdb-0518-7ac01eb8736d
kernel: [12112.410049][ T7358] NVRM: Xid (PCI:0000:0c:00): 62, pid=7317, 0000(0000) 00000000 00000000
kernel: [12112.433831][ T7358] NVRM: Xid (PCI:0000:0c:00): 45, pid=7317, Ch 00000010
CRON[21094]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)

Исходя из логов, мы видим что есть проблема с видеокартой на слоте PCIE 0c:00 (под номером Gpu пишется номер PCIE слота) с ошибками 45 и 62
Коды ошибок (других, которые также могут быть там) и что с ними делать:

• 13, 43, 45: ошибки памяти, снизить MEM
• 8, 31, 32, 61, 62: снизить CORE, возможно и MEM
• 79: снизить CORE, проверить райзер

Ошибка Kernel-Power код 41

Проверьте все провода (от БП до карт, от БП до райзеров), возможно где-то идёт оплавление. Если визуальный осмотр показал, что все ок, то ошибка программная и вам нужно переустановить Windows.

Danger: hive-replace -y —stable (failed, exitcode=137)

Очень редкая ошибка, которая вылезла в момент удаленного обновления образа HiveOS. Она не встречается в тематических майнинг группах и сайтах. Не поверите что произошло.
На балконе, где стоял риг, поселилась семья голубей. Они засрали риг, в прямом смысле, из-за этого он постоянно уходил в оффлайн. После полной продувки материнской платы и видеокарт проблема решилась сама.

MALFUNCTION HIVEOS

Malfunction — неисправность. Причин и решений может быть несколько:

  • Вам следует переустановить видео драйвер;
  • Если драйвер не помог, тогда отключайте все GPU и поочередно вставляйте по 1 шт, и смотрите вызовет ли какая-то видеокарта подобную ошибку или нет. Если да, то возможно это райзер.
  • Неисправен носитель, на который записана Hive OS, запишите образ еще раз.

Не нашли своей ошибки? Помогите сделать мир майнинга лучше. Отправьте ее по этой форме и мы обновим наш гайд в самое ближайшее время.

Содержание

  1. Как устранить ошибку GPU driver error no temps в HIVE OS
  2. Что делать при появлении ошибки GPU driver error, no temps?
  3. Autofan: GPU temperature 511 is unreal, driver error
  4. Autofan: GPU temperature 511 is unreal, driver error ошибка в Hive OS.
  5. HiveOS Hive OS не запускается 5я карта
  6. mindikyo
  7. Обновление драйверов видеокарт в HIVE OS
  8. Общие замечания.
  9. Для AMD.
  10. Для NVIDIA.
  11. Ошибки Видеокарты При Майнинге
  12. UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL
  13. UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000
  14. NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED
  15. NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?
  16. GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0
  17. Socket error. the remote host closed the connection, в майнере Nbminer
  18. Server not responded on share, на майнере Gminer
  19. DAG has been damaged check overclocking settings, в майнере Gminer
  20. ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6
  21. TREX: Can’t unlock GPU
  22. CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6
  23. ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА
  24. GPU driver error, no temps в HiveOS — что делать?
  25. GPU are lost, rebooting
  26. exitcode=3 в HiveOS
  27. exitcode=1 в HiveOS
  28. gpu fault detected 146
  29. Waiting interface to come up — не работает VPN на HiveOS
  30. Как узнать ip адрес воркера hive os
  31. Repository update failed в HiveOS
  32. Rave os не запускается. Boot aborted Rave os
  33. Failed to allocate memory Raveos
  34. gpu_driver_fault, GPU #0 fault в RaveOS
  35. Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS
  36. Miner restarted after error RaveOS
  37. Miner restart limit reached. Worker rebooting by flag auto в RaveOS
  38. Miner cannot be started, ОС RaveOS
  39. Overclock can’t be applied в RaveOS
  40. Error installing hive miners
  41. Warning: Nvidia settings applied with errors
  42. Nvtool error или Danger: nvtool error
  43. Перестал отображаться кулер видеокарты HiveOS
  44. ERROR: parsing JSON failed
  45. NVML: can’t get fan speed for GPU #5, error code 999 hive os
  46. Can’t get power for GPU #2
  47. GPU1 search error: unspecified launch failure
  48. Warning: Autofan: unable to set fan speed, rebooting

Как устранить ошибку GPU driver error no temps в HIVE OS

Операционная система для майнинга HiveOS отличается высоким уровнем удобства и надежностью благодаря использованию ядра Linux.

Иногда при майнинге возникает ошибка, связанная с отсутствием информации об ошибках драйвера, невозможностью получить информацию о температуре видеокарты, а также проблемах с управлением вентиляторами. При этом работа рига нестабильна, сопровождается зависаниями и перезагрузками:

Она может возникать из-за различных причин, включая переразгон, перегрев, плохой контакт видеокарты с райзером/материнской платой, некорректная установка/»слетание» драйверов, программный/системный сбой и т.д.

Пример ошибки GPU driver error no temps, появляющейся на компьютере под управлением HiveOS при майнинге на видеокартах AMD Radeon RX6600:

Ошибка GPU driver error no temps часто бывает связана с некорректной работой драйвера. При этом в логах (доступны после нажатия на интерактивный текст ошибки в ) можно увидеть информацию о проблемной видеокарте (ее BUS ID, в приведенном ниже примере число 0000.04.00.0, которое соответствует GPU1 на скрине работы майнера выше):

Приведенная в качестве этого примера GPU driver, error no temps ошибка была «вылечена» путем повторной записи образа системы на USB-носитель. Из-за плохого качества флешек, которые подвергаются постоянной нагрузке (запись логов) со временем появляется все большее количество сбоев.

Еще один пример лога, приводящего к сбоям майнера с ошибкой GPU driver, error no temps:

В этом случае проблемы с работой видеокарт AMD Radeon RX580 были вылечены с помощью снижения их температуры (увеличена скорость вращения вентиляторов).

Что делать при появлении ошибки GPU driver error, no temps?

Чтобы точнее узнать причины проблемы, связанной с отсутствием данных о температуре видеокарты, следует ознакомиться с системными логами, а также полным отчетом о работе майнера.

Логи майнера (файл lastrun_noappend.log) обычно находятся в папке /var/log/miner/xxxx/*.log (ознакомиться с ними можно в программе mc), например:

Просмотр части отчета доступен по команде

где 100 — количество последних отображаемых строк отчета майнера о работе.

Главный отчет системы доступен по команде

При нажатии shift-f будет отображен конец отчета syslog.

Системные загрузочные логи можно просмотреть консольной командой

Чтобы посмотреть сообщения при загрузке системы, текущее состояние ядра или ошибки в драйверах, можно использовать команду

Изучение этого файла отчета может помочь устранению множества проблем и ошибок. Фрагмент лога, отображаемого по команде dmesg:

Устранению проблемы, связанной с ошибкой GPU driver, error no temps могут помочь следующие способы:

  • снижение разгона, в особенности по памяти;
  • уменьшение рабочей температуры видеокарты, в особенности в области VRAM. Для этого нужно регулярно проводить чистку карты, а при необходимости — смену термопасты и термопрокладок;
  • проверка/замена райзеров, кабелей подключения к материнской плате, обеспечение хорошего контакта с разъемом PCI-E (использование термоклея, специальных заглушек и т.д.);
  • проверка/замена кабелей питания и их разъемов на следы перегева, потемнения изоляции, ее расплавления ит.д.:

  • проверка файловой системы на ошибки, либо повторная запись образа HiveOS/замена флешки с системой;
  • обновление/откат драйверов, переход на более новую/стабильную версию HiveOS.

Источник

Autofan: GPU temperature 511 is unreal, driver error

Autofan: GPU temperature 511 is unreal, driver error ошибка в Hive OS.

Ошибка GPU temperature 511 is unreal, driver error, как правило возникает из-за проблем с питанием райзеров или видеокарт. Может возникать эпизодически или с нарастающей частотой, обычно на риге «отваливаются» видеокарты, как правило подключенные к одному и тому же блоку питания и ферма перезагружается. Непосредственная причина может быть в обгорающих контактах в разъемах цепей питания, некачественных переходниках питания райзеров и видеокарт, некачественных кабелях и неисправностях в схемотехнике блоков питания.

Совет: USB райзеры 006c с разъемами питания 6 pin и серверные блоки питания, оптимальны для построения ферм с количеством видеокарт от 6-и и выше.

Часто незафиксированный разъем переходника (см. фото) приводит к подгоранию контактов и проводов внутри разъема и появлению ошибки Autofan: GPU temperature 511 is unreal, driver error.

Совет: чем меньше переходников используется в ферме — тем лучше.

Проверяем в таком порядке: ревизируем и заменяем переходники питания и коннекторы; меняем райзера; меняем блоки питания. Промеряйте напряжения на всех разъемах, случается вместо 5 вольт или 12 блок питания подает повышенное или пониженное напряжение.

В ряде случаев ошибку можно наблюдать из-за некачественной внешней линии питания или пониженного или повышенного напряжения в ней. Здесь алгоритм действий следующий, проверяем: напряжение в линии питания вольтметром, кабели блоков питания, удлинители, сетевые фильтры и качество проводки. Промеряйте ваттметром энергопотребление фермы, повышенное потребление сигнал о некачественной проводке (может быть скрытый нагрев в стенах и распределительных коробках), неплотных и подгорающих контактах питания в цепи или выходе из строя одного из потребителей.

Иногда оправдано протянуть отдельную линию питания для фермы от щитка со своим автоматом или группой автоматов для каждого рига. Провода и разъемы, после монтажа, не должны нагреваться, используйте клемники и хорошие провода с толстым сечением и обязательно заземляйте блоки питания ферм и другое оборудование.

Совет: отдельная линия питания со своим автоматом на каждый риг и общим автоматом на группу ферм, наилучшее и профессиональное решение.

В случае если ферма работает на нескольких блоках питания, проблема GPU temperature 511 is unreal, driver error, приводит к полной остановке одного из блоков питания. Это сужает круг поиска проблемы, ревизируйте линии питания ведущие к этому блоку, вскройте (если блок не гарантийный) и проверьте сам блок (вздувшиеся и разорванные конденсаторы, поврежденные микросхемы, потемнения текстолита в районе дорожек и прогары) как вариант можно заменить блок питания. Иногда может помочь простая пересборка фермы, когда вы переподключите все коннекторы питания, устранив неплотный контакт в переходниках.

Откажитесь от использования дешевых китайских переходников 8 pin CPU на 2×6+2 pin VGA. Сечения провода используемого в таких переходниках явно недостаточно для продолжительной работы фермы под нагрузкой.

На фото видна разница в толщине медного провода используемого в проводах — левый провод на фото от блока питания Chieftec, правый провод на фото — это провод от дешевого китайского переходника 8 pin CPU на 2×6+2 pin VGA, цена которому 150-200 рублей. На левом фото провода сразу после снятия изоляции, на правом фото медные жилы скручены. Субъективно разница в сечении провода в три раза, при этом если учесть толщину провода с учетом изоляции, то по толщине провода примерно равны.

Если все вышеперечисленные мероприятия не помогли, поменяйте все блоки писания на которых работает ферма и помониторьте работу оборудования с новыми блоками питания. Не рекомендуем использовать блоки питания из недорогих линеек производителей Zalman, Aerocool, ACCORD и т.д. В случае с подобными блоками питания даже сертификат стандарта 80 PLUS BRONZE, не дает ни каких гарантий стабильной работы фермы.

В практике был случай когда блок питания AeroCool HIGGS Modular мощностью 850 Ватт, просаживался по линии питания +3.3 вольта, и эта линия питания даже не была задействована в работе фермы, райзера использовались с разъемами Molex, но ферма останавливалась. И сколько мы не измеряли напряжения под нагрузкой во время работы фермы, причину сбоев в работе понять не могли, ведь измеряли напряжения по линиями +12 вольт и +5 вольт. Заменили блок питания, ферма заработала стабильно и уже только после этого, в результате полной диагностики блока питания, неполадку удалось выявить и устранить.

Happy Mining — счастья всем и каждому, поменьше ошибок в подборе комплектующих, сборке ферм и майнинге!

Источник

HiveOS Hive OS не запускается 5я карта

mindikyo

Свой человек

Detected 5 NVIDIA cards
CLOCK =
MEM =
FAN = 70 70 70 70 70
PLIMIT = 0 0 0 0 0

Unable to determine the device handle for GPU 0000:03:00.0: GPU is lost. Reboot the system to recover this GPU

=== GPU 0, 01:00.0 GeForce GTX 1070 Ti, 8.33 W / 180.00 W (Default 180.00 W) === 12:24:19

ERROR: The GPU has fallen off the bus or has otherwise become inaccessible

Attribute ‘GPUPowerMizerMode’ (hive1337:0[gpu:0]) assigned value 1.
Attribute ‘GPUFanControlState’ (hive1337:0[gpu:0]) assigned value 1.
Attribute ‘GPUTargetFanSpeed’ (hive1337:0[fan:0]) assigned value 70.
Attribute ‘GPULogoBrightness’ (hive1337:0[gpu:0]) assigned value 0.
=== GPU 1, 02:00.0 GeForce GTX 1080, 13.78 W / 200.00 W (Default 200.00 W) === 12:24:23

ERROR: The GPU has fallen off the bus or has otherwise become inaccessible

Attribute ‘GPUPowerMizerMode’ (hive1337:0[gpu:1]) assigned value 1.
Attribute ‘GPUFanControlState’ (hive1337:0[gpu:1]) assigned value 1.
Attribute ‘GPUTargetFanSpeed’ (hive1337:0[fan:1]) assigned value 70.
Attribute ‘GPULogoBrightness’ (hive1337:0[gpu:1]) assigned value 0.
=== GPU 2, , / (Default ) === 12:24:24

ERROR: The GPU has fallen off the bus or has otherwise become inaccessible

Attribute ‘GPUPowerMizerMode’ (hive1337:0[gpu:2]) assigned value 1.
Attribute ‘GPUFanControlState’ (hive1337:0[gpu:2]) assigned value 1.
Attribute ‘GPUTargetFanSpeed’ (hive1337:0[fan:2]) assigned value 70.
Attribute ‘GPULogoBrightness’ (hive1337:0[gpu:2]) assigned value 0.
=== GPU 3, 04:00.0 GeForce GTX 1080, 38.81 W / 200.00 W (Default 200.00 W) === 12:24:24

ERROR: The GPU has fallen off the bus or has otherwise become inaccessible

Attribute ‘GPUPowerMizerMode’ (hive1337:0[gpu:3]) assigned value 1.
Attribute ‘GPUFanControlState’ (hive1337:0[gpu:3]) assigned value 1.
Attribute ‘GPUTargetFanSpeed’ (hive1337:0[fan:3]) assigned value 70.
Attribute ‘GPULogoBrightness’ (hive1337:0[gpu:3]) assigned value 0.
=== GPU 4, 05:00.0 GeForce GTX 1070 Ti, 27.42 W / 180.00 W (Default 180.00 W) === 12:24:24

ERROR: Error resolving target specification ‘gpu:4’ (No targets match
target specification), specified in assignment
‘[gpu:4]/GPUPowerMizerMode=1’.

Linux hive1337 4.10.17-hiveos #1 SMP Sun Dec 10 08:48:43 EET 2017 x86_64 x86_64 x86_64 GNU/Linux

Filesystem Size Used Avail Use% Mounted on
/dev/sda2 6.8G 4.1G 2.4G 63% /

12:24:25 up 3 min, 0 users, load average: 3.11, 1.51, 0.60

0 01:00.0 NVIDIA Corporation GP104 (rev a1)
1 02:00.0 NVIDIA Corporation GP104 [GeForce GTX 1080] (rev a1)
2 03:00.0 NVIDIA Corporation GP104 [GeForce GTX 1080] (rev ff)
3 04:00.0 NVIDIA Corporation GP104 [GeForce GTX 1080] (rev a1)
4 05:00.0 NVIDIA Corporation GP104 (rev a1)

Источник

Обновление драйверов видеокарт в HIVE OS

Если вы хотите попробовать использовать разные драйверы для ваших видеокарт, вот что вам надо будет сделать:

Начиная с версии 0.5-70 в системе HIVE OS встроена утилита для установки наиболее актуальных и стабильных драйверов Nvidia, которая может быть использована как через веб интерфейс HIVE OS, так и через SSH подключение.

Либо, вы можете указать полный адрес архива с драйверами:

На некоторых системах, возможен сброс настроек разгона, после обновления. Чтобы исправить, выполните следующую команду:

apt-get install —reinstall -y nvidia-settings

Общие замечания.

Вам необходимо SSH соединение, или Teleconsle, или физический доступ к ригу, для управления.

По умолчанию, директория для временных файлов (логов) находится в оперативной памяти, поэтому необходимо разрешить размещать логи на диске.

Перейдите в папку: /hive-drivers-pack

Если вам необходимы какие-то архивные драйверы, найти их можно тут: http://download.hiveos.farm/drivers/ 808
Или скачайте любые, какие вам хочется 🙂

Остановите X сервер командой: systemctl stop hivex or killall xinit
Остановите майнер командой: miner stop

Для AMD.

tar -Jxvf amdgpu-pro-XXXX.tar.xz
cd amdgpu-pro-XXXX
./amdgpu-pro-install -y
dpkg -l amdgpu-pro

Для установки новых драйверов AMD необходимо предварительно удалить предыдущие установленные драйверы.
Для этого выполните команду: amdgpu-pro-uninstall .
Распакуйте установленный драйвер tar.gz в папку /var/opt/amdgpu-pro-local после чего команда amdgpu-pro-uninstall сработает.
Драйверы будут удалены, для освобождения места на диске.

Для NVIDIA.

Просто выполните команду: NVIDIA-Linux-x86_64-3xx.yy.run
В редких случаях не удается скомпилировать модуль DKMS или что-то еще — перезагрузка и повторная попытка. Обычно, после второй попытки все срабатывает 🙂

Ползуйтесь HIVE OS — самой беспроблемной и удобной системой для майнинга!

Источник

Ошибки Видеокарты При Майнинге

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL

UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000

NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?

GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

Socket error. the remote host closed the connection, в майнере Nbminer

DAG has been damaged check overclocking settings, в майнере Gminer

ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6

Ошибки настройки памяти с кодом -6 обычно указывают на проблему с драйвером.

Если у вас Windows, используйте программу DDU (DisplayDriverUninstaller), чтобы полностью удалить все драйверы Nvidia.
Перезагрузите систему.
Установите новый драйвер прямо с сайта Nvidia.
Перезагрузите систему снова.
Если у вас HiveOS/RaveOS — накатите чистый образ системы. Чтобы наверняка. 🙂

TREX: Can’t unlock GPU

Полный текст ошибки:
TREX: Can’t unlock GPU [ID=1, GPU #1], error code 15
WARN: Miner is going to shutdown.
WARN: NVML: can’t get fan speed for GPU #1, error code 15
WARN: NVML: can’t get power for GPU #1, error code 15
WARN: NVML: can’t get mem/core clock for GPU #1, error code 17

Решение:

  1. Проверьте все кабельные соединения видеокарты и райзера, особенно кабеля питания.
  2. Если с первый пунктом все ок, попробуйте поменять райзер на точно рабочий.
  3. Если ошибка остается, вставьте видеокарту в разъем х16 напрямую в материнскую плату.

CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА

GPU driver error, no temps в HiveOS — что делать?

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

GPU are lost, rebooting

Это не ошибка, а ее последствие. Что узнать какая ошибка приводит к перезагрузке карт, сделайте следующее:

Включите сохранение логов (по умолчанию они выключены) командой

И перезагрузите риг.
После того как ошибка повторится можно будет скачать логи командами ниже.
Вы можете использовать следующую команду, чтобы загрузить логи майнера прямо с панели мониторинга;

message file «miner.log» -f=/var/log/miner/minername/minername.log

Итак, скажем, например, мне нужны логи TeamRedMiner
message file «teamredminer.log» -f=/var/log/miner/teamredminer/teamredminer.log

Отправленная командная строка будет выделена синим цветом. Загружаемый файл будет отображаться белым цветом. Нажав на него, вы сможете его скачать.
Эта команда позволит скачать лог системы

message file «syslog» -f=/var/log/syslog

exitcode=3 в HiveOS

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

exitcode=1 в HiveOS

Данная ошибка возникает когда есть проблема с датой в биосе материнской платы (сбитое время) и (или) есть проблема с интернетом.
Если сбито время, то удаленно вы не сможете подключиться.
Тем не менее, обновление драйверов Nvidia должно пройти командой:

gpu fault detected 146

Waiting interface to come up — не работает VPN на HiveOS

Как узнать ip адрес воркера hive os

Repository update failed в HiveOS

Rave os не запускается. Boot aborted Rave os

Перепроверьте все настройки ПК и БИОСа материнской платы:
— Установите загрузочное устройство HDD/SSD/M2/USB в зависимости от носителя с ОС.
— Включите 4G decoding.
— Установите поддержку PCIe на Auto.
— Включите встроенную графику.
— Установите предпочтительный режим загрузки Legacy mode.
— Отключите виртуализацию.

Если после данных настроек не определяется часть карт, то выполните следующие настройки в BIOS (после каждого пункта требуется полная перезагрузка):

— Отключите 4G decoding
— Перезагрузка
— Отключите CSM
— Перезагрузка
— Включите 4G decoding, установите PCI-E Gen2/3, а при отсутствии Gen2/3, можно выбрать Gen1

Failed to allocate memory Raveos

Эта же ошибка может называться как:
failed to allocate initramfs memory bailing out, failed to load idlinux c.32
или
failed to allocate memory for kernel boot parameter block
или
failed to allocate initramfs memory raveos bailing

Но решение у нее одно — вы должны правильно настроить БИОС материнской платы.

gpu_driver_fault, GPU #0 fault в RaveOS

gpu_driver_fault, GPU #0 fault в RaveOS

Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS

Miner restarted after error RaveOS

Miner restart limit reached. Worker rebooting by flag auto в RaveOS

Miner cannot be started, ОС RaveOS

Непосредственно перед этой ошибкой обычно пишется еще другая, которая и вызывает эту проблему. Но если ничего нет, то:

  1. Поставьте майнер на паузу, перезагрузите риг и в консоли выполните команды clear-miners clear-logs и fix-fs. Запустите майнинг.
  2. Если ошибка не ушла, перепишите образ RaveOS.

Overclock can’t be applied в RaveOS

Error installing hive miners

Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — физически перезапишите образ. Если у вас флешка, то скорее всего она умерла. Купите SSD. 🙂

Warning: Nvidia settings applied with errors

Перестал отображаться кулер видеокарты HiveOS

ERROR: parsing JSON failed

Необходимо выполнить на риге локально (с клавиатурой и монитором) следующую команду:
net-test

Данная команда покажет ваше текущее состояние подключения к разным зеркалам API серверов HiveOS.
Посмотрите, к какому API у вас наименьшая задержка (ping), и когда воркер снова появится в панели, измените стандартное зеркало на то, что ближе к вам.
После смены зеркала, в обязательном порядке перезагрузите ваш воркер.
Изменить сервер API вы можете командой nano /hive-config/rig.conf
После смены нажмите ctrl + o и ентер для того чтобы сохранить файл.
После этого выйдите в консоль командой ctrl + x, f10 и выполните команду hello

NVML: can’t get fan speed for GPU #5, error code 999 hive os

Can’t get power for GPU #2

Как правило эта ошибка встречается рядом вместе с другими:
Attribute ‘GPUGraphicsClockOffset’ was already set to 0
Attribute ‘GPUMemoryTransferRateOffset’ was already set to 2200
Attribute ‘GPUFanControlState’ (hive1660s_ETH:0[gpu:2]) assigned value
0.

20211029 12:40:50 WARN: NVML: can’t get fan speed for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get power for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get mem/core clock for GPU #2, error code 999

Решение:

Проверьте корректность установки драйвера на видеокарте.
Убедитесь что нет проблем с драйвером, если все в порядке, то попробуйте другой параметр разгона. Например уменьшить разгон по памяти.

GPU1 search error: unspecified launch failure

Warning: Autofan: unable to set fan speed, rebooting

Найдите логи майнера, посмотрите какие ошибки майнер пишет в логах. Например:

kernel: [12112.410046][ T7358] NVRM: GPU at PCI:0000:0c:00: GPU-236e3bef-2e03-6cdb-0518-7ac01eb8736d
kernel: [12112.410049][ T7358] NVRM: Xid (PCI:0000:0c:00): 62, pid=7317, 0000(0000) 00000000 00000000
kernel: [12112.433831][ T7358] NVRM: Xid (PCI:0000:0c:00): 45, pid=7317, Ch 00000010
CRON[21094]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)

Исходя из логов, мы видим что есть проблема с видеокартой на слоте PCIE 0c:00 (под номером Gpu пишется номер PCIE слота) с ошибками 45 и 62
Коды ошибок (других, которые также могут быть там) и что с ними делать:

• 13, 43, 45: ошибки памяти, снизить MEM
• 8, 31, 32, 61, 62: снизить CORE, возможно и MEM
• 79: снизить CORE, проверить райзер

Источник

Содержание

  1. Как устранить ошибку GPU driver error no temps в HIVE OS
  2. Что делать при появлении ошибки GPU driver error, no temps?
  3. Обновление драйверов видеокарт в HIVE OS
  4. Общие замечания.
  5. Для AMD.
  6. Для NVIDIA.
  7. Ошибки Видеокарты При Майнинге
  8. UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL
  9. UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000
  10. NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED
  11. NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?
  12. GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0
  13. Socket error. the remote host closed the connection, в майнере Nbminer
  14. Server not responded on share, на майнере Gminer
  15. DAG has been damaged check overclocking settings, в майнере Gminer
  16. ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6
  17. TREX: Can’t unlock GPU
  18. CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6
  19. ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА
  20. GPU driver error, no temps в HiveOS — что делать?
  21. GPU are lost, rebooting
  22. exitcode=3 в HiveOS
  23. exitcode=1 в HiveOS
  24. gpu fault detected 146
  25. Waiting interface to come up — не работает VPN на HiveOS
  26. Как узнать ip адрес воркера hive os
  27. Repository update failed в HiveOS
  28. Rave os не запускается. Boot aborted Rave os
  29. Failed to allocate memory Raveos
  30. gpu_driver_fault, GPU #0 fault в RaveOS
  31. Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS
  32. Miner restarted after error RaveOS
  33. Miner restart limit reached. Worker rebooting by flag auto в RaveOS
  34. Miner cannot be started, ОС RaveOS
  35. Overclock can’t be applied в RaveOS
  36. Error installing hive miners
  37. Warning: Nvidia settings applied with errors
  38. Nvtool error или Danger: nvtool error
  39. Перестал отображаться кулер видеокарты HiveOS
  40. ERROR: parsing JSON failed
  41. NVML: can’t get fan speed for GPU #5, error code 999 hive os
  42. Can’t get power for GPU #2
  43. GPU1 search error: unspecified launch failure
  44. Warning: Autofan: unable to set fan speed, rebooting

Как устранить ошибку GPU driver error no temps в HIVE OS

Операционная система для майнинга HiveOS отличается высоким уровнем удобства и надежностью благодаря использованию ядра Linux.

Иногда при майнинге возникает ошибка, связанная с отсутствием информации об ошибках драйвера, невозможностью получить информацию о температуре видеокарты, а также проблемах с управлением вентиляторами. При этом работа рига нестабильна, сопровождается зависаниями и перезагрузками:

Она может возникать из-за различных причин, включая переразгон, перегрев, плохой контакт видеокарты с райзером/материнской платой, некорректная установка/»слетание» драйверов, программный/системный сбой и т.д.

Пример ошибки GPU driver error no temps, появляющейся на компьютере под управлением HiveOS при майнинге на видеокартах AMD Radeon RX6600:

Ошибка GPU driver error no temps часто бывает связана с некорректной работой драйвера. При этом в логах (доступны после нажатия на интерактивный текст ошибки в ) можно увидеть информацию о проблемной видеокарте (ее BUS ID, в приведенном ниже примере число 0000.04.00.0, которое соответствует GPU1 на скрине работы майнера выше):

Приведенная в качестве этого примера GPU driver, error no temps ошибка была «вылечена» путем повторной записи образа системы на USB-носитель. Из-за плохого качества флешек, которые подвергаются постоянной нагрузке (запись логов) со временем появляется все большее количество сбоев.

Еще один пример лога, приводящего к сбоям майнера с ошибкой GPU driver, error no temps:

В этом случае проблемы с работой видеокарт AMD Radeon RX580 были вылечены с помощью снижения их температуры (увеличена скорость вращения вентиляторов).

Что делать при появлении ошибки GPU driver error, no temps?

Чтобы точнее узнать причины проблемы, связанной с отсутствием данных о температуре видеокарты, следует ознакомиться с системными логами, а также полным отчетом о работе майнера.

Логи майнера (файл lastrun_noappend.log) обычно находятся в папке /var/log/miner/xxxx/*.log (ознакомиться с ними можно в программе mc), например:

Просмотр части отчета доступен по команде

где 100 — количество последних отображаемых строк отчета майнера о работе.

Главный отчет системы доступен по команде

При нажатии shift-f будет отображен конец отчета syslog.

Системные загрузочные логи можно просмотреть консольной командой

Чтобы посмотреть сообщения при загрузке системы, текущее состояние ядра или ошибки в драйверах, можно использовать команду

Изучение этого файла отчета может помочь устранению множества проблем и ошибок. Фрагмент лога, отображаемого по команде dmesg:

Устранению проблемы, связанной с ошибкой GPU driver, error no temps могут помочь следующие способы:

  • снижение разгона, в особенности по памяти;
  • уменьшение рабочей температуры видеокарты, в особенности в области VRAM. Для этого нужно регулярно проводить чистку карты, а при необходимости — смену термопасты и термопрокладок;
  • проверка/замена райзеров, кабелей подключения к материнской плате, обеспечение хорошего контакта с разъемом PCI-E (использование термоклея, специальных заглушек и т.д.);
  • проверка/замена кабелей питания и их разъемов на следы перегева, потемнения изоляции, ее расплавления ит.д.:

  • проверка файловой системы на ошибки, либо повторная запись образа HiveOS/замена флешки с системой;
  • обновление/откат драйверов, переход на более новую/стабильную версию HiveOS.

Источник

Обновление драйверов видеокарт в HIVE OS

Если вы хотите попробовать использовать разные драйверы для ваших видеокарт, вот что вам надо будет сделать:

Начиная с версии 0.5-70 в системе HIVE OS встроена утилита для установки наиболее актуальных и стабильных драйверов Nvidia, которая может быть использована как через веб интерфейс HIVE OS, так и через SSH подключение.

Либо, вы можете указать полный адрес архива с драйверами:

На некоторых системах, возможен сброс настроек разгона, после обновления. Чтобы исправить, выполните следующую команду:

apt-get install —reinstall -y nvidia-settings

Общие замечания.

Вам необходимо SSH соединение, или Teleconsle, или физический доступ к ригу, для управления.

По умолчанию, директория для временных файлов (логов) находится в оперативной памяти, поэтому необходимо разрешить размещать логи на диске.

Перейдите в папку: /hive-drivers-pack

Если вам необходимы какие-то архивные драйверы, найти их можно тут: http://download.hiveos.farm/drivers/ 808
Или скачайте любые, какие вам хочется 🙂

Остановите X сервер командой: systemctl stop hivex or killall xinit
Остановите майнер командой: miner stop

Для AMD.

tar -Jxvf amdgpu-pro-XXXX.tar.xz
cd amdgpu-pro-XXXX
./amdgpu-pro-install -y
dpkg -l amdgpu-pro

Для установки новых драйверов AMD необходимо предварительно удалить предыдущие установленные драйверы.
Для этого выполните команду: amdgpu-pro-uninstall .
Распакуйте установленный драйвер tar.gz в папку /var/opt/amdgpu-pro-local после чего команда amdgpu-pro-uninstall сработает.
Драйверы будут удалены, для освобождения места на диске.

Для NVIDIA.

Просто выполните команду: NVIDIA-Linux-x86_64-3xx.yy.run
В редких случаях не удается скомпилировать модуль DKMS или что-то еще — перезагрузка и повторная попытка. Обычно, после второй попытки все срабатывает 🙂

Ползуйтесь HIVE OS — самой беспроблемной и удобной системой для майнинга!

Источник

Ошибки Видеокарты При Майнинге

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL

UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000

NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?

GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

Socket error. the remote host closed the connection, в майнере Nbminer

DAG has been damaged check overclocking settings, в майнере Gminer

ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6

Ошибки настройки памяти с кодом -6 обычно указывают на проблему с драйвером.

Если у вас Windows, используйте программу DDU (DisplayDriverUninstaller), чтобы полностью удалить все драйверы Nvidia.
Перезагрузите систему.
Установите новый драйвер прямо с сайта Nvidia.
Перезагрузите систему снова.
Если у вас HiveOS/RaveOS — накатите чистый образ системы. Чтобы наверняка. 🙂

TREX: Can’t unlock GPU

Полный текст ошибки:
TREX: Can’t unlock GPU [ID=1, GPU #1], error code 15
WARN: Miner is going to shutdown.
WARN: NVML: can’t get fan speed for GPU #1, error code 15
WARN: NVML: can’t get power for GPU #1, error code 15
WARN: NVML: can’t get mem/core clock for GPU #1, error code 17

Решение:

  1. Проверьте все кабельные соединения видеокарты и райзера, особенно кабеля питания.
  2. Если с первый пунктом все ок, попробуйте поменять райзер на точно рабочий.
  3. Если ошибка остается, вставьте видеокарту в разъем х16 напрямую в материнскую плату.

CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА

GPU driver error, no temps в HiveOS — что делать?

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

GPU are lost, rebooting

Это не ошибка, а ее последствие. Что узнать какая ошибка приводит к перезагрузке карт, сделайте следующее:

Включите сохранение логов (по умолчанию они выключены) командой

И перезагрузите риг.
После того как ошибка повторится можно будет скачать логи командами ниже.
Вы можете использовать следующую команду, чтобы загрузить логи майнера прямо с панели мониторинга;

message file «miner.log» -f=/var/log/miner/minername/minername.log

Итак, скажем, например, мне нужны логи TeamRedMiner
message file «teamredminer.log» -f=/var/log/miner/teamredminer/teamredminer.log

Отправленная командная строка будет выделена синим цветом. Загружаемый файл будет отображаться белым цветом. Нажав на него, вы сможете его скачать.
Эта команда позволит скачать лог системы

message file «syslog» -f=/var/log/syslog

exitcode=3 в HiveOS

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

exitcode=1 в HiveOS

Данная ошибка возникает когда есть проблема с датой в биосе материнской платы (сбитое время) и (или) есть проблема с интернетом.
Если сбито время, то удаленно вы не сможете подключиться.
Тем не менее, обновление драйверов Nvidia должно пройти командой:

gpu fault detected 146

Waiting interface to come up — не работает VPN на HiveOS

Как узнать ip адрес воркера hive os

Repository update failed в HiveOS

Rave os не запускается. Boot aborted Rave os

Перепроверьте все настройки ПК и БИОСа материнской платы:
— Установите загрузочное устройство HDD/SSD/M2/USB в зависимости от носителя с ОС.
— Включите 4G decoding.
— Установите поддержку PCIe на Auto.
— Включите встроенную графику.
— Установите предпочтительный режим загрузки Legacy mode.
— Отключите виртуализацию.

Если после данных настроек не определяется часть карт, то выполните следующие настройки в BIOS (после каждого пункта требуется полная перезагрузка):

— Отключите 4G decoding
— Перезагрузка
— Отключите CSM
— Перезагрузка
— Включите 4G decoding, установите PCI-E Gen2/3, а при отсутствии Gen2/3, можно выбрать Gen1

Failed to allocate memory Raveos

Эта же ошибка может называться как:
failed to allocate initramfs memory bailing out, failed to load idlinux c.32
или
failed to allocate memory for kernel boot parameter block
или
failed to allocate initramfs memory raveos bailing

Но решение у нее одно — вы должны правильно настроить БИОС материнской платы.

gpu_driver_fault, GPU #0 fault в RaveOS

gpu_driver_fault, GPU #0 fault в RaveOS

Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS

Miner restarted after error RaveOS

Miner restart limit reached. Worker rebooting by flag auto в RaveOS

Miner cannot be started, ОС RaveOS

Непосредственно перед этой ошибкой обычно пишется еще другая, которая и вызывает эту проблему. Но если ничего нет, то:

  1. Поставьте майнер на паузу, перезагрузите риг и в консоли выполните команды clear-miners clear-logs и fix-fs. Запустите майнинг.
  2. Если ошибка не ушла, перепишите образ RaveOS.

Overclock can’t be applied в RaveOS

Error installing hive miners

Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — физически перезапишите образ. Если у вас флешка, то скорее всего она умерла. Купите SSD. 🙂

Warning: Nvidia settings applied with errors

Перестал отображаться кулер видеокарты HiveOS

ERROR: parsing JSON failed

Необходимо выполнить на риге локально (с клавиатурой и монитором) следующую команду:
net-test

Данная команда покажет ваше текущее состояние подключения к разным зеркалам API серверов HiveOS.
Посмотрите, к какому API у вас наименьшая задержка (ping), и когда воркер снова появится в панели, измените стандартное зеркало на то, что ближе к вам.
После смены зеркала, в обязательном порядке перезагрузите ваш воркер.
Изменить сервер API вы можете командой nano /hive-config/rig.conf
После смены нажмите ctrl + o и ентер для того чтобы сохранить файл.
После этого выйдите в консоль командой ctrl + x, f10 и выполните команду hello

NVML: can’t get fan speed for GPU #5, error code 999 hive os

Can’t get power for GPU #2

Как правило эта ошибка встречается рядом вместе с другими:
Attribute ‘GPUGraphicsClockOffset’ was already set to 0
Attribute ‘GPUMemoryTransferRateOffset’ was already set to 2200
Attribute ‘GPUFanControlState’ (hive1660s_ETH:0[gpu:2]) assigned value
0.

20211029 12:40:50 WARN: NVML: can’t get fan speed for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get power for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get mem/core clock for GPU #2, error code 999

Решение:

Проверьте корректность установки драйвера на видеокарте.
Убедитесь что нет проблем с драйвером, если все в порядке, то попробуйте другой параметр разгона. Например уменьшить разгон по памяти.

GPU1 search error: unspecified launch failure

Warning: Autofan: unable to set fan speed, rebooting

Найдите логи майнера, посмотрите какие ошибки майнер пишет в логах. Например:

kernel: [12112.410046][ T7358] NVRM: GPU at PCI:0000:0c:00: GPU-236e3bef-2e03-6cdb-0518-7ac01eb8736d
kernel: [12112.410049][ T7358] NVRM: Xid (PCI:0000:0c:00): 62, pid=7317, 0000(0000) 00000000 00000000
kernel: [12112.433831][ T7358] NVRM: Xid (PCI:0000:0c:00): 45, pid=7317, Ch 00000010
CRON[21094]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)

Исходя из логов, мы видим что есть проблема с видеокартой на слоте PCIE 0c:00 (под номером Gpu пишется номер PCIE слота) с ошибками 45 и 62
Коды ошибок (других, которые также могут быть там) и что с ними делать:

• 13, 43, 45: ошибки памяти, снизить MEM
• 8, 31, 32, 61, 62: снизить CORE, возможно и MEM
• 79: снизить CORE, проверить райзер

Источник

Присоединяйся к бирже kucoin и получи скидку 20% на торговые комиссии
🤍🤍kucoin.com/r/af/QBSSSAY4

Ссылка на телеграмм канал
🤍t.me/usmfox_mining

Молчаливый Боб

2022-09-16 02:37:45

Ребята вот например, у меня есть GTX 1070, что мне сейчас лучше майнить, ведь эфир больше майнить нельзя? Монет столько много, а что выбрать лучшее не знаю.

Андрей Горячев

2022-09-12 11:59:40

Спасибо!

Коляныч Я

2022-09-09 12:05:48

респект

Jack Back

2022-09-09 11:38:06

Спасибо большое брат! 🙌 Очень ценная инфа👍 была такая же ошибка, но сейчас вроде все хорошо👌

Змей Горыныч

2022-09-09 10:18:17

Визаут драйверз, а не виваут

Misha Stepanov

2022-09-09 09:44:54

Просто снижаете разгон и перезагружаете риг

konstantin malakhov

2022-09-09 08:43:44

Красавчик

Николай Иванов

2022-09-09 08:22:52

Все дело в хайве и уже давно… У тебя карты исправные, железо исправное, если они до этого держали 2400 , то и в риге должны. Я ушел с хайва обратно в рейв еще давно, когда хайв стал неадекватить и ломаться постоянно. Вот уже с Апреля все риги висят на Рейве, никаких проблем вообще. Да нет некоторого функционала хайва, но стабильно и у рейва свои фишки есть. Ты кстати проверь драйвера в хайве, он мог по лхр карты подкинуть глючный драйвер, как уже у них бывало. И можно попробовать в ручном режиме снести дрова и накатить старые 510 стабильные.

Лавринчук Александр

2022-09-09 08:19:54

Жирный лайкос.только сегодня собрал проточный и посыпались ошибки

попробуй зафиксить частоту ядра

Александр Сапронов

2022-09-09 06:41:48

8 мин видео сводятся к двум словам .. понизь разгон

NormalMan

2022-09-09 06:25:10

Спасибо за видео. Полезно

mik rik

2022-09-09 06:04:10

Спасибо за труды!

Vladyslav Trifonov

2022-09-09 05:52:31

Как я погляжу, херня это Хайв. Юзаю Рейв ОС, есть риг солянка из 4 шт 1660, одной 1080 и RX 588. Разгоняй, меняй карты местами, удаляй из рига-работает как часики, без всяких заморочек

Алиик Иванов

2022-09-09 05:49:13

Почему просто не выключить риг и задать настройки?

Барабай

2022-09-09 05:48:49

Какая у вас материнская плата и процессор?

Kozsv

2022-09-09 05:33:02

Память 3100 проц 1150 103.8 их, нормально работают три карты

Да всё верно! Эта ошибка лечится удалением всего разгона в режиме обслуживания фермы, а возникает она в том случае когда ты меняешь карты местами или перетыкаешь. После включения режима обслуживания надо сделать ребут, удалить настройки разгона, выключить режим обслуживания, ребут. Было такое.

Александр Микуров

2022-09-09 05:24:14

Обзор на «Чёрного Оптимуса поайма в обвесах» будет?) БП снаружи что ли разместил?

Понравилась статья? Поделить с друзьями:
  • Gptzfsboot error 128
  • Gpt partition style как исправить
  • Gps test no fix как исправить
  • Gps data error dji phantom
  • Gprinter gp 2120t ошибка печати