Unknown error 999 hive os

Как исправить ошибку NVML cannot get fan speed При майнинге на видеокартах Nvidia иногда возникают досадные ошибки вида: Через несколько минут после появления таких ошибок обычно крашится майнер и зависает система. При этом в логах майнера перед зависанием можно найти строки, похожие на следующие: Рассмотрим подробнее причины появления ошибок NVML cannot get fan/temperature error […]

Содержание

  1. Как исправить ошибку NVML cannot get fan speed
  2. Причины появления ошибки NVML error 999 (an internal driver error occurred)
  3. Что нужно сделать, чтобы устранить ошибку NVML error 999 (an internal driver error occurred)
  4. GTX 1000 Unknown Error (999)
  5. OneOfMany
  6. PashoK
  7. Vlupidol80
  8. Vlupidol80
  9. rail812
  10. Stepan Sraka
  11. Ошибка error 17 и cannot get current temperature error 999 решение
  12. Разбираемся с ошибкой error 17 и cannot get current temperature error 999
  13. (Статья постоянно обновляется при нахождении дополнительных советов)
  14. Итак, сначала моё решение ошибки error 17 и сообщения cannot get current temperature error 999, а потом других пользователей
  15. Список того, что другим держателям ферм/шахт для майнинга помогло при ошибке error 17 и припиской cannot get current temperature error 999

Как исправить ошибку NVML cannot get fan speed

При майнинге на видеокартах Nvidia иногда возникают досадные ошибки вида:

Через несколько минут после появления таких ошибок обычно крашится майнер и зависает система.

При этом в логах майнера перед зависанием можно найти строки, похожие на следующие:

Рассмотрим подробнее причины появления ошибок NVML cannot get fan/temperature error 15 или 999 и чем их исправить.

Причины появления ошибки NVML error 999 (an internal driver error occurred)

Проблемы, связанные с появлением ошибок библиотеки NVIDIA Management Library (NVML) с разным кодом (обычно это 15, 17 или 999) приводят к потере контроля/управления температурой и вентиляторами видеокарты.

Они связаны с некорректной работой NVML API, входящего в состав драйверов NVidia. Согласно спецификации:

  • ошибка с кодом 15 свидетельствует о том, что GPU теряет связь с шиной PCI-E и затем становиться недоступной для управления (NVML_ERROR_GPU_IS_LOST);
  • ошибка с кодом 17 свидетельствует о том, что видеокарта заблокирована другим процессом (NVML_ERROR_OPERATING_SYSTEM = 17, GPU control device has been blocked by the operating system/cgroups);
  • error 999 свидетельствует о неизвестном сбое в работе драйверов (NVML_ERROR_UNKNOWN = 999 -an internal driver error occurred).

Основной причиной появления этих ошибок является наличие проблем в прохождении данных по каналу видеокарта-материнская плата.

Прохождение сигнала по шине PCI-E происходит с ошибками из-за таких неисправностей:

  • некорректная установка или повреждение файлов драйверов;
  • неверная установка в BIOS скорости передачи данных для устройств PCI-Express;
  • некорректная работа устройств PCI-E из-за включения энергосберегающего режима питания этой шины;
  • перегрев южного моста и вызванные этим нарушения обмена данными по линии PCI-Express;
  • перегрев видеокарты и появление, связанных с этим проблем в работе ее электронных компонентов;
  • неисправности райзеров (обычно это плохие контакты по линиям передачи данных и по питанию);
  • плохой контакт в разъемах кабелей питания/передачи данных;
  • некачественные блоки питания, слишком большая нагрузка на них;
  • наличие сильных электромагнитных помех, проникающих на риг из сети;
  • слишком большой разгон/даунвольтинг GPU.

Что нужно сделать, чтобы устранить ошибку NVML error 999 (an internal driver error occurred)

Для устранения ошибки NVML: cannot get fan speed, error 999 необходимо произвести следующие действия:

  • проверить/заменить райзера, кабеля питания, очистить контакты на разъемах видеокарты, райзерах и кабелях питания/USB-удлинителях;
  • увеличить размер файла подкачки до суммарного объема видеопамяти установленных в риге видеокарт;
  • уменьшить разгон по ядру и памяти, уменьшить даунвольтинг. В первую очередь нужно уменьшать разгон/даунвольтинг на карте, номер которой первым появляется в логах майнера перед зависанием. Если первой появляется строка GPU 1, GpuMiner cu_k1 failed 30, unknown error, то проблема, скорее всего, связана именно с первой видеокартой;
  • отключить опцию PCIe Power Saving в параметрах электропитания системы (меню настройки схемы электропитания – изменить дополнительные параметры питания – PCI Express – Управление состоянием связи – Откл.);
  • заново произвести установку драйверов с полной деинсталляцией предыдущей версии;
  • обеспечить хорошее охлаждение южного моста путем установки радиатора или вентилятора;
  • установить в BIOS скорость обмена по линии PCI-E в GEN 2 или 1;
  • обеспечить достаточную мощность блока питания и проверить качество выдаваемых им напряжений с помощью вольтметра;
  • поменять разъем PCI-E, в который включается видеокарта, попробовать включить ее в него без райзера.

При подозрении на неисправность разъема материнской платы нужно попробовать вставить в него другую видеокарту с заведомо исправным райзером. Если ошибка возникает снова, то, скорее всего неисправность возможно связана с материнской платой.

Небольшую помощь при запуске Claymore miner при наличии проблем, связанных с контролем вентиляторов видеокарт, может дать включение в батник параметров:

-tt 1 — отключение управления вентиляторами;

-tt 0 — отключение мониторинга температуры и вентиляторов;

-wd 0 – отключение программного watchdog, встроенного в майнер.

Отключение управления работой вентиляторов в майнере не будет проблемой при использовании MSI Afterburner или nvidiainspector по методике, описанной в статье «Оптимизация потребления видеокарт Nvidia при майнинге».

Использование такого «костыля» может увеличить время бесперебойной работы рига, но если в компьютере останется плохой контакт, то все равно работа рига будет нестабильной, и он будет периодически зависать.

В этом случае может помочь один из аппаратных сторожевых таймеров, некоторые из которых описаны в статье «Китайские сторожевые таймеры для майнинга».

О других ошибках, возникающих при майнинге и способах их устранения, можно почитать в статьях:

Источник

GTX 1000 Unknown Error (999)

Друг форума

Задрала такая вот ошибка, возникает на любой из карт 1063, но дальше все работает стабильно.

GPUХ: unable to get fan speed — Unknown Error (999)
Майнер PhoenixMiner
Мониторинг перестает видеть вентилятор, и есть подозрение, что он вращается с оборотами на момент ошибки постоянно.

Самое интересное, после появления ошибки на одной из карт, она не появляется на остальных.

Куда капать хз. гугл чот ничего вразумительного не дал. Появление ошибки от разгона не зависит.

OneOfMany

Бывалый

Задрала такая вот ошибка, возникает на любой из карт 1063, но дальше все работает стабильно.

GPUХ: unable to get fan speed — Unknown Error (999)
Майнер PhoenixMiner
Мониторинг перестает видеть вентилятор, и есть подозрение, что он вращается с оборотами на момент ошибки постоянно.

Самое интересное, после появления ошибки на одной из карт, она не появляется на остальных.

Куда капать хз. гугл чот ничего вразумительного не дал. Появление ошибки от разгона не зависит.

PashoK

Бывалый

Друг форума

Написал же, что от разгона не зависит.
Кстати вот сейчас впервые выбило на двух картах.

На всякий случай по 10 сбросил с карт мониторю.

Vlupidol80

Свой человек

Задрала такая вот ошибка, возникает на любой из карт 1063, но дальше все работает стабильно.

GPUХ: unable to get fan speed — Unknown Error (999)
Майнер PhoenixMiner
Мониторинг перестает видеть вентилятор, и есть подозрение, что он вращается с оборотами на момент ошибки постоянно.

Самое интересное, после появления ошибки на одной из карт, она не появляется на остальных.

Куда капать хз. гугл чот ничего вразумительного не дал. Появление ошибки от разгона не зависит.

Друг форума

Vlupidol80

Свой человек

rail812

Свой человек

Задрала такая вот ошибка, возникает на любой из карт 1063, но дальше все работает стабильно.

GPUХ: unable to get fan speed — Unknown Error (999)
Майнер PhoenixMiner
Мониторинг перестает видеть вентилятор, и есть подозрение, что он вращается с оборотами на момент ошибки постоянно.

Самое интересное, после появления ошибки на одной из карт, она не появляется на остальных.

Куда капать хз. гугл чот ничего вразумительного не дал. Появление ошибки от разгона не зависит.

Stepan Sraka

Друг форума

Ваш ник на биткоинталке случайно не «PhoenixMiner» ,потому что он пишет :

https://bitcointalk.org/index.php?topic=2647654.180
Экскьюз ми за не мой англицкий но переводчик выдает вот это (наверно неправильно переводит ) :

Это внутренняя ошибка NVML (библиотека мониторинга оборудования Nvidia). Мы видели подобные ошибки на нашем GTX1060s. Дополнительные симптомы включают высокую загрузку ЦП (либо майнером, либо MSI Afterburner). Те же проблемы наблюдались и с Шахтером Клеймора на той же буровой установке. Краткосрочное решение-перезапустить установку (не только майнер), но единственное долгосрочное решение-немного снизить разгон памяти. Мы обнаружили, что даже более низкие часы памяти на 20-30 МГц полностью решают проблему. Или вы можете продолжить добычу и игнорировать ошибки, но высокая загрузка ЦП может быть реальным Пита при попытке контролировать установку через VNC или TeamViewer.

А утверждать что ошибка не зависит от разгона , можно лишь тогда когда частота памяти будет равна 8000 (или 4000 если смотреть в бернере), а частота ядра максимум 1620

Источник

Ошибка error 17 и cannot get current temperature error 999 решение

Разбираемся с ошибкой error 17 и cannot get current temperature error 999

(Статья постоянно обновляется при нахождении дополнительных советов)

Во времена роста популярности майнинга ошибка error 17 и error 999 появляются ещё чаще, особенно на видеокартах nVidia GeForce GTX 1060 и вообще картах этой компании, но есть решение, потому что с ней сталкивались многие.

Итак, сначала моё решение ошибки error 17 и сообщения cannot get current temperature error 999, а потом других пользователей

  • Моя ферма состоит из таких комплектующих:

Вроде ничего особенного только 3 видеокарты, причём очень экономичные по энергопотреблению (до 120 Вт. На карту, по итогу майна на одном алгоритме у меня и того потребление выше 85 Вт. не поднималось). Но чтобы вы думали, ночью, после вполне успешного дневного пробега ферма отключилась с ошибкой error 17 и замечанием error 999, узнал я это утром по логам.

Судя по этому сообщению, в какой-то момент система не смогла получить некую текущую температуру, в результате чего ферма и вовсе отключилась. Запустив всё заново, посидев некоторое время и, понаблюдав за системой, в том числе температурой, не обнаружил ничего подозрительного.

Посмотрел в интернете, насчёт этой ошибки и, вроде она достаточно часто встречается на майнинг-фермах. В итоге наступила вторая ночь, днём опять всё проработало отлично, без каких-либо сбоев. В итоге проснувшись посреди ночи, я решил проверить свою шахту, но опять обнаружил, что она отключилась, включив её и, посмотрев логии клэймора, я опять обнаружил эту надоедливую ошибку error 17 и приписку cannot get current temperature error 999.

Более того, потом я ещё несколько раз вставал ночью и обнаруживал выключенной ферму. На следующий день я решил разобраться в ситуации, просмотрел несколько форумов и сайтов, где рассматривалась такая ошибка, я выписал несколько способов для её решения.

Не буду расписывать все, это сделаю во второй части статьи, а остановлюсь только на своём решении. В итоге мне помогло подсоединение монитора к системе

Я где-то видел, что без подключённого монитора видеокарты могут работать с ошибками. Для начала я на ночь подсоединил свой основной монитор с HDMI-выходом, ночью всё простояло отлично, а потом взял и подсоединил свой старый монитор-ящик 17-дюймов и всего делов для моей шахты.

Но, на форумах отписывались пользователи, которые отмечали, что им помогли другие способы избавиться от ошибки error 17 и error 999, вот их я сейчас и перечислю ниже.

Список того, что другим держателям ферм/шахт для майнинга помогло при ошибке error 17 и припиской cannot get current temperature error 999

  • Разгон видеокарт – убрать разгон или хотя бы снизить его
  • Перегрев видеокарт , поставить дополнительный кулер (ра), можно просто сбоку, чтобы дополнительно обдували
  • Установка Windows 10 , хотя многие говорят, что под 7-ку майнинг лучше и меньше проблем
  • Сбойные райзера , менять их местами или подсоединить на другие, первоначально лучше задействовать основные слоты материнки, а потом райзеры
  • Отключить управление питанием в PCI-E Link – в электропитание – настройка плана электропитания – изменить дополнительные параметры
  • В Биосе выставить параметр Gen 1 или другой попробовать
  • Ну, и, конечно, моё решение – подключить монитор, которое мне помогло, для этого даже продаются специальные затычки-переходники, которые имитируют монитор

Майнинг для чайников

С чего начать майнинг (новичкам основные вопросы)

Источник

  • #1

Коллеги подскажите куда копать, уж задолбала эта ошибка unable to get fan speed — Unknown Error (999) или GPU2 not responding (Thread(s) not responding. Restarting.)
Блок питание стоит 1600w китайский (из фермы) райзера вроде рабочие. Я к тому что если было бы проблема в АКБ или в райзерах то ошибку выбивало бы постоянно , но факт в том что ферма может уйти в перезагрузку и через 30 минут и через 5 часов а то и вовсе долбить 2 дня а потом ее выбьет :confused: :confused: :confused:

МП B150 PC MATE (MS-7971) MSI (C.E0 06/27/2018)
CPU 2 × Intel(R) Celeron(R) CPU G3900 @ 2.80GHz AES
Модель диска ATA WDC WD800JD-75MS 80.0GB

Замечал что когда версия Hive OS была старая таких ребутов не было, ну и конечно 4той карты тоже не было (1070) Хочу попробовать Rave OS

Лог

=== Last 50 lines of /var/log/miner/phoenixminer/phoenixminer.log === 2021.07.07:13:12:58.573: main CUDART error in CudaProgram.cu:247 : unknown error (30) 2021.07.07:13:12:58.573: main Unable to get CUDA device properties: unknown error 2021.07.07:13:12:58.725: main OpenCL driver version: 20.40-1147287 2021.07.07:13:12:58.726: main Available GPUs for mining: 2021.07.07:13:12:58.728: main GPU1: NVIDIA GeForce GTX 1070 (pcie 1), CUDA cap. 6.1, 7.9 GB VRAM, 15 CUs 2021.07.07:13:12:58.729: main GPU2: Radeon RX 580 Series (pcie 3), OpenCL 1.2, 8 GB VRAM, 36 CUs 2021.07.07:13:12:58.729: main GPU3: NVIDIA GeForce GTX 1060 6GB (pcie 4), CUDA cap. 6.1, 5.9 GB VRAM, 10 CUs 2021.07.07:13:12:58.729: main AMD sysfs monitor initialized 2021.07.07:13:12:58.730: main NVML library initialized 2021.07.07:13:12:58.735: main NVML error in CudaProgram.cu:216 : Unknown Error (999) 2021.07.07:13:12:58.736: main NVML error in CudaProgram.cu:219 : Invalid Argument (2) 2021.07.07:13:12:58.741: main Nvidia driver version: 465.31 2021.07.07:13:12:58.741: main Eth: Missing host or wallet for the main command-line pool 2021.07.07:13:12:58.741: main Eth: Loading pools from epools.txt 2021.07.07:13:12:58.741: main Eth: the pool list contains 5 pools (0 from command-line) 2021.07.07:13:12:58.741: main Eth: primary pool: ethash.poolbinance.com:1800 2021.07.07:13:12:58.742: main Starting GPU mining 2021.07.07:13:12:58.743: main GPU2: fan PWM control mode 2, min 0, max 255 2021.07.07:13:12:58.850: wdog Starting watchdog thread 2021.07.07:13:12:58.850: main Eth: Connecting to ethash pool ethash.poolbinance.com:1800 (proto: EthProxy) 2021.07.07:13:12:58.850: main GPU1: 39C 65% 35W, GPU2: 33C 63% 41W, GPU3: 43C 65% 32W GPUs power: 108.4 W 2021.07.07:13:12:58.927: eths Eth: Connected to ethash pool ethash.poolbinance.com:1800 (172.65.8.243) 2021.07.07:13:12:58.927: eths Eth: Send: {«id»:1,»jsonrpc»:»2.0″,»method»:»eth_submitLogin»,»worker»:»eth1.0″,»params»:[«linolium2021.Rig1″,»x»]} 2021.07.07:13:12:59.031: eths Eth: Received: {«id»:1,»jsonrpc»:»2.0″,»result»:true} 2021.07.07:13:12:59.031: eths Eth: Send: {«id»:5,»jsonrpc»:»2.0″,»method»:»eth_getWork»,»params»:[]} 2021.07.07:13:12:59.050: main Listening for CDM remote manager at port 3335 in read-only mode 2021.07.07:13:12:59.085: eths Eth: Received: {«id»:5,»jsonrpc»:»2.0″,»result»:[«0x905881208bc81e6a58b6d4f3738537ed08d25a84f3e24f2f609c5cc6020ff893″,»0xa832d784408bd1abd7e77cd91c5ef058b0eff2646b66cd6117c71be848704f7f»,»0x000000007a2aff5669842169f30725cf15d9f1f2a8bf75a8e4898997115bb2fd»]} 2021.07.07:13:12:59.086: eths Eth: New job #90588120 from ethash.poolbinance.com:1800; diff: 9000MH 2021.07.07:13:12:59.086: GPU1 GPU1: Starting up… (0) 2021.07.07:13:12:59.086: GPU1 GPU1: Generating ethash light cache for epoch #425 2021.07.07:13:12:59.086: GPU2 GPU2: Starting up… (0) 2021.07.07:13:12:59.086: GPU3 GPU3: Starting up… (0) 2021.07.07:13:13:02.710: GPU1 Light cache generated in 3.6 s (19.1 MB/s) 2021.07.07:13:13:02.958: GPU3 GPU3: Allocating DAG (4.34) GB; good for epoch up to #427 2021.07.07:13:13:02.959: GPU3 CUDA error in CudaProgram.cu:388 : out of memory (2) 2021.07.07:13:13:02.959: GPU3 GPU3: CUDA memory: 5.94 GB total, 1.46 GB free 2021.07.07:13:13:02.959: GPU3 GPU3 initMiner error: out of memory 2021.07.07:13:13:02.978: wdog Fatal error detected. Restarting. 2021.07.07:13:13:03.020: GPU1 GPU1: Allocating DAG (4.34) GB; good for epoch up to #427 2021.07.07:13:13:03.021: GPU1 CUDA error in CudaProgram.cu:388 : out of memory (2) 2021.07.07:13:13:03.022: GPU1 GPU1: CUDA memory: 7.93 GB total, 3.42 GB free 2021.07.07:13:13:03.022: GPU1 GPU1 initMiner error: out of memory 2021.07.07:13:13:03.502: GPU2 GPU2: Free VRAM: 7.957 GB; used: 0.019 GB 2021.07.07:13:13:03.502: GPU2 GPU2: Allocating DAG (4.34) GB; good for epoch up to #427 2021.07.07:13:13:03.517: GPU2 GPU2: Generating DAG for epoch #425 2021.07.07:13:13:03.855: main Eth speed: 0.000 MH/s, shares: 0/0/0, time: 0:00 2021.07.07:13:13:03.855: main GPUs: 1: 0.000 MH/s (0) 2: 0.000 MH/s (0) 3: 0.000 MH/s (0)

P.S буду признателен если что подскажите по разгону . Спасибо большое.

  • IMG_20210707_132945-min.jpg

    IMG_20210707_132945-min.jpg

    987,4 КБ · Просмотры: 91

  • #2

Скорее всего что-то уже с картой,снижай на ней разгоны.У меня уже 3 таких карты уехали,Асусы стриксы 1080ти.Снижал потихоньку разгоны,но потом одна карта при любой нагрузке начинает сыпать артефактами,а две уже с прогарами,причем на одном и том же месте.

  • #3

Скорее всего что-то уже с картой,снижай на ней разгоны.У меня уже 3 таких карты уехали,Асусы стриксы 1080ти.Снижал потихоньку разгоны,но потом одна карта при любой нагрузке начинает сыпать артефактами,а две уже с прогарами,причем на одном и том же месте.

не поверишь я убирал тупо у всех картах разгон, (кроме rx580 эта карта работает стабильно, проверял на Rave os все ок) по дефолту стояли и фиг )) все равно через пару часов а может через пол дня выбить ошибку

  • #4

не поверишь я убирал тупо у всех картах разгон, (кроме rx580 эта карта работает стабильно, проверял на Rave os все ок) по дефолту стояли и фиг )) все равно через пару часов а может через пол дня выбить ошибку

Думаю проблема в питании райзера, или в коннекторе в модульном блоке питания. Короче где то греется контакт и подгорает

  • #5

Думаю проблема в питании райзера, или в коннекторе в модульном блоке питания. Короче где то греется контакт и подгорает

а из за подгорание может выбивать ошибку ?
Эта ошибка может вылететь на любой из карт кстате ! и на GPU 1 и на GPU 2 итд…..

  • #6

Думаю попробовать поставить другой БП и проверить (правда 2 БП совмещенных, рабочие проверенные)

  • #7

а из за подгорание может выбивать ошибку ?
Эта ошибка может вылететь на любой из карт кстате ! и на GPU 1 и на GPU 2 итд…..

ты на саму ошибку нажми, там будет написано из за чего она. и сюда скинь, посмотрим на какую карту ругается

  • #8

Доп вентиляторы есть? У тебя воздушный поток сбивает скорость вентилятора на видеокарте

  • #9

GTX 1000 — Unknown Error (999)

Задрала такая вот ошибка, возникает на любой из карт 1063, но дальше все работает стабильно. GPUХ: unable to get fan speed — Unknown Error (999) Майнер PhoenixMiner Мониторинг перестает видеть вентилятор, и есть подозрение, что он вращается с оборотами на момент ошибки постоянно. Самое…

miningclub.info


miningclub.info

  • #10

Доп вентиляторы есть? У тебя воздушный поток сбивает скорость вентилятора на видеокарте

это критично ? она просто стоит у окна а там сквоздняк из за этого и ночью температура 45-47 * )

  • #11

ты на саму ошибку нажми, там будет написано из за чего она. и сюда скинь, посмотрим на какую карту ругается

повторюсь ошибка хаотичная (( по любой карте может выбить

GTX 1000 — Unknown Error (999)

Задрала такая вот ошибка, возникает на любой из карт 1063, но дальше все работает стабильно. GPUХ: unable to get fan speed — Unknown Error (999) Майнер PhoenixMiner Мониторинг перестает видеть вентилятор, и есть подозрение, что он вращается с оборотами на момент ошибки постоянно. Самое…

miningclub.info


miningclub.info

читал, но данный ответ так и не дан там (

  • #12

Вот думаю если тут бывалые которые решили эту проблему, может это в дровах проблема или косяк в самом майнере ((

  • #13

было такое колдунство, помогло; 1. кинуть 1070 на отдельный БП или 2. замена всех райзеров на другую модель, чёрная магия бля!

Последнее редактирование: 7 Июл 2021

  • #14

было такое колдунство, помогло; 1. кинуть 1070 на отдельный БП или 2. замена всех райзеров, чёрная магия бля!

и я вот думаю поменять БП попробовать (( ну я думаю врятли дело в 1070 она в отличном состояний так то

  • #15

Вот думаю если тут бывалые которые решили эту проблему, может это в дровах проблема или косяк в самом майнере ((

не, менял майнеры, операционки, драйверы, по фэн шую ставил во время полнолуния, не помогло

и я вот думаю поменять БП попробовать (( ну я думаю врятли дело в 1070 она в отличном состояний так то

ну так говоришь без неё работало, в питании дело, как подключено-то хоть?

  • #16

не, менял майнеры, операционки, драйверы, по фэн шую ставил во время полнолуния, не помогло

ну так говоришь без неё работало, в питании дело, как подключено-то хотьу

Щас стоит БП 1600w китайский

  • #17

Было на 1660s ,помогла замена райзеров.

  • #18

не поверишь я убирал тупо у всех картах разгон, (кроме rx580 эта карта работает стабильно, проверял на Rave os все ок) по дефолту стояли и фиг )) все равно через пару часов а может через пол дня выбить ошибку

А кто сказал что если в сток ее скинуть по разгону,она начнет нормально пахать.снимай частоты уже ниже стока,и смотри сколько будет тянуть без выпадания ошибки,и ищи нужное значение.Если с картой нелады-она уже и в минусовых от стока значениях может выпадать в ошибку.Я все снижал и снижал,пока не пришёл кирдык.

  • #19

Переразгон. Не хватает питания карте. Добавить вольтажа и всё будет нормально. Проверено. Например, вольтаж по курве был 750, ставь 825 и будет норм. Проблема уйдет. Я по крайней мере так это решил.

  • #20

Было на 1060 6gb.

Вначале вычислил карту. Потом пробовал скинуть разгон на ней — не помогло. Погонял в тестах — еле заметные артефакты.

В итоге отдал в ремонт. Заменили 1 банку памяти с вердиктом: ужаренная и остальные банки примерно такие-же. Т.е. не долго осталось…

После ремонта карта тесты проходит. Артефактов нет. Без разгона майнит отлично, но если разгонять, то снова эта ошибка. Прошло уже 2 месяца.

Oshibka error 17 i cannot get current temperature error 999 reshenie

Разбираемся с ошибкой error 17 и cannot get current temperature error 999

(Статья постоянно обновляется при нахождении дополнительных советов)

Во времена роста популярности майнинга ошибка error 17 и error 999 появляются ещё чаще, особенно на видеокартах nVidia GeForce GTX 1060 и вообще картах этой компании, но есть решение, потому что с ней сталкивались многие.

Ошибка error 17 и cannot get current temperature error 999 решение

Итак, сначала моё решение ошибки error 17 и сообщения cannot get current temperature error 999, а потом других пользователей

  • Моя ферма состоит из таких комплектующих:

Моя ферма

Вроде ничего особенного только 3 видеокарты, причём очень экономичные по энергопотреблению (до 120 Вт. На карту, по итогу майна на одном алгоритме у меня и того потребление выше 85 Вт. не поднималось). Но чтобы вы думали, ночью, после вполне успешного дневного пробега ферма отключилась с ошибкой error 17 и замечанием error 999, узнал я это утром по логам.

Судя по этому сообщению, в какой-то момент система не смогла получить некую текущую температуру, в результате чего ферма и вовсе отключилась. Запустив всё заново, посидев некоторое время и, понаблюдав за системой, в том числе температурой, не обнаружил ничего подозрительного.

Посмотрел в интернете, насчёт этой ошибки и, вроде она достаточно часто встречается на майнинг-фермах. В итоге наступила вторая ночь, днём опять всё проработало отлично, без каких-либо сбоев. В итоге проснувшись посреди ночи, я решил проверить свою шахту, но опять обнаружил, что она отключилась, включив её и, посмотрев логии клэймора, я опять обнаружил эту надоедливую ошибку error 17 и приписку cannot get current temperature error 999.

Более того, потом я ещё несколько раз вставал ночью и обнаруживал выключенной ферму. На следующий день я решил разобраться в ситуации, просмотрел несколько форумов и сайтов, где рассматривалась такая ошибка, я выписал несколько способов для её решения.

Не буду расписывать все, это сделаю во второй части статьи, а остановлюсь только на своём решении. В итоге мне помогло подсоединение монитора к системе

Я где-то видел, что без подключённого монитора видеокарты могут работать с ошибками. Для начала я на ночь подсоединил свой основной монитор с HDMI-выходом, ночью всё простояло отлично, а потом взял и подсоединил свой старый монитор-ящик 17-дюймов и всего делов для моей шахты.

Но, на форумах отписывались пользователи, которые отмечали, что им помогли другие способы избавиться от ошибки error 17 и error 999, вот их я сейчас и перечислю ниже.

Список того, что другим держателям ферм/шахт для майнинга помогло при ошибке error 17 и припиской cannot get current temperature error 999

  • Разгон видеокарт – убрать разгон или хотя бы снизить его
  • Перегрев видеокарт, поставить дополнительный кулер (ра), можно просто сбоку, чтобы дополнительно обдували
  • Установка Windows 10, хотя многие говорят, что под 7-ку майнинг лучше и меньше проблем  
  • Сбойные райзера, менять их местами или подсоединить на другие, первоначально лучше задействовать основные слоты материнки, а потом райзеры
  • Отключить управление питанием в PCI-E Link – в электропитание – настройка плана электропитания – изменить дополнительные параметры
  • В Биосе выставить параметр Gen 1 или другой попробовать
  • Ну, и, конечно, моё решение – подключить монитор, которое мне помогло, для этого даже продаются специальные затычки-переходники, которые имитируют монитор

С чего начать майнинг (новичкам основные вопросы)

Майнинг для начинающих. С нуля на одной видеокарте и процессоре

Рекомендуем статьи:

  • Как настроить майнинг в Windows 7 или 10

Rempc.by

  • 8

    Мне понравилось

  • 0

    Мне непонравилось

  • 11 Июля 2017
  • Жительница Тобольска потеряла 5.6 млн рублей при попытке заработать на криптовалюте


    Прокуратура Тюменской области сообщила о пострадавшей местной жительнице, которая перечисляла деньги на счета, указанные мошенниками.

    Жительница Тобольска пыталась инвестировать в криптовалюты, но доверилась неизвестным и потеряла 5.6 млн рублей. Женщина не подозревала, что на самом деле средства идут не на покупку цифровых активов, а на счета преступников. Возбуждено уголовное дело о мошенничестве в крупном размере.
     
    Итого с 30 января по 5 февраля подобные мошенники получили от жи

    7 Feb 2023, 12:49

    в Новости криптовалют

    • babooosya

    • babooosya

    • 8 Feb 2023, 04:12

  • Житель Майкопа лишился 1 млн рублей при попытке заработать на криптовалютах


    В дежурную часть органов внутренних дел города Майкопа поступило заявление о мошенничестве на сумму 1 млн рублей — россиянин лишился денег в попытке заработать на криптовалютах.
    По словам потерпевшего, он решил инвестировать в криптовалюты в начале этого года. 41-летний житель Майкопа связался с неизвестными «инвестиционными консультантами», которые пообещали ему легкий заработок, после чего он зарегистрировался на некой «торговой платформе».
     
    При этом, чтобы инвестировать в криптов

    4 Feb 2023, 10:28

    в Новости криптовалют

    • Igemon221

    • Igemon221

    • 5 Feb 2023, 16:29

  • Джастин Сан: «При принятии криптовалют нельзя ориентироваться лишь на США»


    Основатель Tron Джастин Сан убежден, что криптовалюты должны быть признаны законным платежным средством во всем мире, без ориентации на мнение американских регуляторов.
    В серии твитов Джастин Сан (Justin Sun) написал, что команда Tron уже работает над легализацией TRX в качестве средства платежа. Он отметил, что регуляторы США считаются ключевыми участниками индустрии цифровых активов, однако Соединенные Штаты — не единственная страна в мире, поэтому криптовалютные компании должны сосредото

    30 Jan 2023, 06:58

    в Новости криптовалют

    • News Bot

    • News Bot

    • 30 Jan 2023, 06:58

  • BlockFi потерял $1.2 млрд при банкротстве FTX и Alameda Research


    Судя по опубликованным документам, криптовалютный кредитор BlockFi потерял $1.2 млрд в активах, вложенных в биржу FTX и компанию Alameda Research.
    Как сообщает канал CNBC, похоже, что заявления BlockFi о блокировке свыше $1 млрд в FTX и Alameda оказались правдивыми. Согласно новой информации, компания инвестировала в биржу FTX активы на сумму $415.9 млн, а в Alameda Research — $831.3 млн. Данная информация была случайно опубликована компанией M3 Partners, которая выступает советником по бан

    25 Jan 2023, 09:04

    в Новости криптовалют

    • News Bot

    • News Bot

    • 25 Jan 2023, 09:04

  • Платформа QuickNode привлекла $60 млн при рыночной оценке в $800 млн


    Платформа блокчейн-разработок QuickNode завершила раунд финансирования на $60 млн для расширения бизнеса. Компания намерена привлечь на площадку больше разработчиков Web3 и пользователей.
    Раунд проводила венчурная компания 10T Fund, а участниками стали такие компании как Tiger Global, QED и Seven Six. Сейчас QuickNode оценивается в $800 млн. 
     
    Представители компании заявили, что полученное финансирование направят на глобальное расширение и предоставят разработчикам новые возможности

    24 Jan 2023, 17:42

    в Новости криптовалют

    • News Bot

    • News Bot

    • 24 Jan 2023, 17:42

Ошибки Видеокарты При Майнинге

Самое полное собрание ошибок в майнинге на Windows, HiveOS и RaveOS и их быстрых и спокойных решений

Can’t find nonce with device CUDA_ERROR_LAUNCH_FAILED

Ошибка майнера Can't find nonce

Ошибка майнера Can’t find nonce

Ошибка говорит о том, что майнер не может найти нонс и сразу же сам предлагает решение — уменьшить разгон. Особенно начинающие майнеры стараются выжать из видеокарты максимум — разгоняют слишком сильно по ядру или памяти. В таком разгоне видеокарта даже может запуститься, но потом выдавать ошибки как указано ниже. Помните, лучше — стабильная отправка шар на пул, чем гонка за цифрами в майнере.

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

Phoenixminer Connection to API server failed — что делать?

Ошибка Connection to API server failed

Ошибка Connection to API server failed

Такая ошибка встречается на PhoenixMiner на операционной систему HiveOS. Она говорит о том, что майнинг-ферма/риг не может подключиться к серверу статистики. Что делать для ее решения:

  • Введите команду net-test и запомните/запишите сервер с низким пингом. После чего смените его в веб интерфейсе Hive (на воркере) и перезагрузите ваш риг.
  • Если это не помогло, выполните команду dnscrypt -i && sreboot

Phoenixminer CUDA error in CudaProgram.cu:474 : the launch timed out and was terminated (702)

Ошибка майнера Phoenixminer CUDA error in CudaProgram

Ошибка майнера Phoenixminer CUDA error in CudaProgram

Эта ошибка, как и в первом случае, говорит о переразгоне карты. Откатите видеокарту до заводских настроек и постепенно поднимайте разгон до тех пор, пока не будет ошибки.

UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL

Ошибка майнера Unable to enum CUDA GPUs: invalid device ordinal

Ошибка майнера Unable to enum CUDA GPUs: invalid device ordinal

Проверяем драйвера видеокарты и саму видеокарту на работоспособность (как она отмечена в диспетчере устройств, нет ли восклицательных знаков).
Если все ок, то проверяем райзера. Часто бывает, что именно райзер бывает причиной такой ошибки.

UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000

Ошибка майнера Unable to enum CUDA GPUs: Insufficient CUDA driver: 5000

Ошибка майнера Unable to enum CUDA GPUs: Insufficient CUDA driver: 5000

Аналогично предыдущей ошибке — проверяем драйвера видеокарты и саму видеокарту на работоспособность (как она отмечена в диспетчере устройств, нет ли восклицательных знаков).

NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

Ошибка майнера NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

Ошибка майнера NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

Ошибка code 1073740791 nbminer возникает, если ваш риг/майнинг-ферма собраны из солянки Nvidia+AMD. В этом случае разделите майнинг на два .bat файла (или полетника, если вы на HiveOS). Один — с картами AMD, другой с картами Nvidia.

NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?

Ошибка майнера NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2)

Ошибка майнера NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2)

Одна из самых распространённых ошибок на Windows — нехватка памяти, в данном случае на майнере Nbminer, но встречается и в майнере Nicehash. Чтобы ее исправить — надо увеличить файл подкачки. Файл подкачки должен быть равен сумме гб всех видеокарт в риге плюс 10% запаса. Как увеличить файл подкачки — читаем тут.

GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

Ошибка майнера GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

Ошибка майнера GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

В данном случае скорее всего виноват не файл подкачки, а переразгон по видеокарте, которая идет под номером 0. Сбавьте разгон и ошибка должна пропасть.

Socket error. the remote host closed the connection, в майнере Nbminer

Socket error. the remote host closed the connection

Также может быть описана как «ERROR — Failed to establish connection to mining pool: Socket operation timed out».
Сетевой конфликт — проверьте соединение рига с интернетом. Перегрузите роутер.
Также может быть, что провайдер закрывает соединение с пулом. Смените пул, попробуйте VPN или измените адреса DNS на внешнего провайдера, например cloudflare 1.1.1.1, 1.0.0.1

Server not responded on share, на майнере Gminer

Server not responded on share

Такая ошибка говорит о том, что у вас что-то с подключением к интернету, что критично для Gminer. Попробуйте сделать рестарт роутера и отключить watchdog на майнере.

DAG has been damaged check overclocking settings, в майнере Gminer

Также в этой ошибке может быть указано Device not responding, check overclocking settings.
Ошибка говорит о переразгоне, попробуйте сначала убавить его.
Если это не помогло, смените майнер — Gminer никогда не славился работой с видеокартами AMD. Мы рекомендуем поменять майнер на Teamredminer, а если вам критична поддержка майнером одновременно Nvidia и AMD видеокарт, то используйте Lolminer.
Если смена майнера не поможет, переставьте видеодрайвер.
Если и это не поможет, то нужно тестировать эту карту отдельно в слоте X16.

ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6

Ошибки настройки памяти с кодом -6 обычно указывают на проблему с драйвером.

Если у вас Windows, используйте программу DDU (DisplayDriverUninstaller), чтобы полностью удалить все драйверы Nvidia.
Перезагрузите систему.
Установите новый драйвер прямо с сайта Nvidia.
Перезагрузите систему снова.
Если у вас HiveOS/RaveOS — накатите чистый образ системы. Чтобы наверняка. :)

TREX: Can’t unlock GPU

Полный текст ошибки:
TREX: Can’t unlock GPU [ID=1, GPU #1], error code 15
WARN: Miner is going to shutdown…
WARN: NVML: can’t get fan speed for GPU #1, error code 15
WARN: NVML: can’t get power for GPU #1, error code 15
WARN: NVML: can’t get mem/core clock for GPU #1, error code 17

Решение:

  1. Проверьте все кабельные соединения видеокарты и райзера, особенно кабеля питания.
  2. Если с первый пунктом все ок, попробуйте поменять райзер на точно рабочий.
  3. Если ошибка остается, вставьте видеокарту в разъем х16 напрямую в материнскую плату.

CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6

Ошибка майнера CAN'T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN'T GET BUSID, CODE -6

Ошибка майнера CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6

В конкретном случае была проблема в блоке питания, он не держал 3 видеокарты. После замены блока питания ошибка пропала.
Если вы уверены, что ваш мощности вашего блока питания достаточно, попробуйте сменить майнер.

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА

Ошибка 511 градусов видеокарта

Ошибка 511 градусов видеокарта

Ошибка 511 говорит о неисправности райзера или питания карты. Проверьте все соединения. Для выявления неисправности рекомендуется запустить систему с одной картой. Протестировать, и затем добавлять по одной карте.

GPU driver error, no temps в HiveOS — что делать?

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

GPU are lost, rebooting

Это не ошибка, а ее последствие. Что узнать какая ошибка приводит к перезагрузке карт, сделайте следующее:

Включите сохранение логов (по умолчанию они выключены) командой

logs-on

И перезагрузите риг.
После того как ошибка повторится можно будет скачать логи командами ниже.
Вы можете использовать следующую команду, чтобы загрузить логи майнера прямо с панели мониторинга;

message file «miner.log» -f=/var/log/miner/minername/minername.log

Итак, скажем, например, мне нужны логи TeamRedMiner
message file «teamredminer.log» -f=/var/log/miner/teamredminer/teamredminer.log

Отправленная командная строка будет выделена синим цветом. Загружаемый файл будет отображаться белым цветом. Нажав на него, вы сможете его скачать.
Эта команда позволит скачать лог системы

message file «syslog» -f=/var/log/syslog

exitcode=3 в HiveOS

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

exitcode=1 в HiveOS

Данная ошибка возникает когда есть проблема с датой в биосе материнской платы (сбитое время) и (или) есть проблема с интернетом.
Если сбито время, то удаленно вы не сможете подключиться.
Тем не менее, обновление драйверов Nvidia должно пройти командой:

nvidia-driver-update —list

gpu fault detected 146

Скорее всего вы пытаетесь майнить с помощью Phoenix miner. Решения два:

  1. Откатитесь на более старую версию, например на 5.4с
  2. (Рекомендуемый вариант) Используйте Trex для видеокарт Nvidia и TeamRedMiner для AMD.

Waiting interface to come up — не работает VPN на HiveOS

Waiting interface to come up

Начните с логов, чтобы понять какая именно ошибка вызывает эту проблему.
Команды для получения логов:
systemctl status openvpn@client
journalctl -u openvpn@client -e —no-pager -n 100

Как узнать ip адрес воркера hive os

Как узнать ip адрес воркера hive os

Самое простое — зайти в воркера и прокрутить страницу ниже видеокарт. Там будет указан Remote IP — это и есть внешний IP.
Альтернативный вариант — вы можете проверить ваш внешний айпи адрес hive через консоль Hive Shell:
Выполните одну из команд:
curl 2ip.ru
wget -qO- eth0.me
wget -qO- ipinfo.io/ip
wget -qO- ipecho.net/plain
wget -qO- icanhazip.com
wget -qO- ipecho.net
wget -qO- ident.me

Repository update failed в HiveOS

Иногда встречается на HiveOS. Полный текст ошибки:

Some index files failed to download. They have been ignored, or old ones used instead.
Repository update failed
------------------------------------------------------
> Restarting autofan and watchdog
> Starting miners
Miner screen is already running
Run miner or screen -r to resume screen
Upgrade failed

Решение:

  1. Выполнить команду apt update && selfupgrade -f
  2. Если не сработала и она, то 99.9%, что разработчики HiveOS уже знают об этой проблеме и решают ее. Попробуйте выполнить обновление через некоторое время.

Rave os не запускается. Boot aborted Rave os

Boot aborted Rave os

Перепроверьте все настройки ПК и БИОСа материнской платы:
— Установите загрузочное устройство HDD/SSD/M2/USB в зависимости от носителя с ОС.
— Включите 4G decoding.
— Установите поддержку PCIe на Auto.
— Включите встроенную графику.
— Установите предпочтительный режим загрузки Legacy mode.
— Отключите виртуализацию.

Если после данных настроек не определяется часть карт, то выполните следующие настройки в BIOS (после каждого пункта требуется полная перезагрузка):

— Отключите 4G decoding
— Перезагрузка
— Отключите CSM
— Перезагрузка
— Включите 4G decoding, установите PCI-E Gen2/3, а при отсутствии Gen2/3, можно выбрать Gen1

Failed to allocate memory Raveos

Эта же ошибка может называться как:
failed to allocate initramfs memory bailing out, failed to load idlinux c.32
или
failed to allocate memory for kernel boot parameter block
или
failed to allocate initramfs memory raveos bailing

Но решение у нее одно — вы должны правильно настроить БИОС материнской платы.

gpu_driver_fault, GPU #0 fault в RaveOS

gpu_driver_fault, GPU #0 fault в RaveOS

В большинстве случаев эта проблема решается уменьшением разгона (особенно по памяти) на конкретной видеокарте (на скрине это карта номер 0).
Если уменьшение разгона не помогает, то попробуйте обновить драйвера.
Если обновление драйверов не привело к решению проблемы, то попробуйте поменять райзер на этой карте на точно работающий.
Если и это не помогает, перепроверьте все кабельные соединения и мощность блока питания, хватает ли его для вашей конфигурации.

Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS

Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes

Что приводит к появлению этой ошибки? Вероятно, вы переразогнали видеокарту (часто сильно гонят по памяти), сбавьте разгон. На скрине видно, что проблему дает именно GPU под номером 1 — начните с нее.
Вторая частая причина — нехватка питания БП на систему с видеокартами. Учтите, что сама система потребляет не менее 100 вт, каждый райзер еще закладывайте 50 вт. БП должно хватать с запасом в 20%.

Miner restarted after error RaveOS

Смотрите логи майнера, там будет указана конкретная ошибка, которая приводит к miner restarted. После этого найдите ее на этой странице и исправьте. Проблема уйдет. :)

Miner restart limit reached. Worker rebooting by flag auto в RaveOS

Аналогично предыдущему пункту — смотрите логи майнера, там будет указана конкретная ошибка, которая приводит к рестарту воркера. Пофиксите ту ошибку — уйдет и эта проблема.

Miner cannot be started, ОС RaveOS

Непосредственно перед этой ошибкой обычно пишется еще другая, которая и вызывает эту проблему. Но если ничего нет, то:

  1. Поставьте майнер на паузу, перезагрузите риг и в консоли выполните команды clear-miners clear-logs и fix-fs. Запустите майнинг.
  2. Если ошибка не ушла, перепишите образ RaveOS.

Overclock can’t be applied в RaveOS

Эта ошибка означает, что значения разгона между собой конфликтуют или выходят за пределы допустимых. Перепроверьте их. Скиньте разгон на стоковый и попробуйте еще раз.
В редких случаях причиной этой ошибки также становится райзер.

Error installing hive miners

Error installing hive miners

Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — физически перезапишите образ. Если у вас флешка, то скорее всего она умерла. Купите SSD. :)

Warning: Nvidia settings applied with errors

Переразгон. Снизьте значения частот ядра и памяти. После этого перезагрузите риг.

Nvtool error или Danger: nvtool error

Скорее всего при установке драйвера появилась проблема с модулем nvtool
Попробуйте переустановить драйвер Nvidia командой через Hive shell:
nvidia-driver-update версия_драйвера —force
Или попробуйте обновить систему полностью командой из Hive shell:
hive-replace -y —stable

nvtool error

Перестал отображаться кулер видеокарты HiveOS

0% скорости вращения кулера.
Это может произойти по нескольким причинам:

  • кулер действительно не крутится
  • датчик оборотов отключен или сломан
  • видеокарта слишком агрессивно работает (высокий разгон)
  • неисправен райзер или одно из его частей

ERROR: parsing JSON failed

Необходимо выполнить на риге локально (с клавиатурой и монитором) следующую команду:
net-test

Данная команда покажет ваше текущее состояние подключения к разным зеркалам API серверов HiveOS.
Посмотрите, к какому API у вас наименьшая задержка (ping), и когда воркер снова появится в панели, измените стандартное зеркало на то, что ближе к вам.
После смены зеркала, в обязательном порядке перезагрузите ваш воркер.
Изменить сервер API вы можете командой nano /hive-config/rig.conf
После смены нажмите ctrl + o и ентер для того чтобы сохранить файл.
После этого выйдите в консоль командой ctrl + x, f10 и выполните команду hello

NVML: can’t get fan speed for GPU #5, error code 999 hive os

Проблема с скоростью кулеров на GPU 5
0% скорости вращения кулера / ошибки в целом
Это может произойти по нескольким причинам:
— кулер действительно не крутится
— датчик оборотов отключен или сломан
— видеокарта слишком агрессивно работает (высокий разгон)
Начните с визуальной проверки карты и ее кулера.

Can’t get power for GPU #2

Как правило эта ошибка встречается рядом вместе с другими:
Attribute ‘GPUGraphicsClockOffset’ was already set to 0
Attribute ‘GPUMemoryTransferRateOffset’ was already set to 2200
Attribute ‘GPUFanControlState’ (hive1660s_ETH:0[gpu:2]) assigned value
0.

20211029 12:40:50 WARN: NVML: can’t get fan speed for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get power for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get mem/core clock for GPU #2, error code 999

Решение:

Проверьте корректность установки драйвера на видеокарте.
Убедитесь что нет проблем с драйвером, если все в порядке, то попробуйте другой параметр разгона. Например уменьшить разгон по памяти.

GPU1 search error: unspecified launch failure

Уменьшите разгон и проверьте контакты райзера

Warning: Autofan: unable to set fan speed, rebooting

Найдите логи майнера, посмотрите какие ошибки майнер пишет в логах. Например:

kernel: [12112.410046][ T7358] NVRM: GPU at PCI:0000:0c:00: GPU-236e3bef-2e03-6cdb-0518-7ac01eb8736d
kernel: [12112.410049][ T7358] NVRM: Xid (PCI:0000:0c:00): 62, pid=7317, 0000(0000) 00000000 00000000
kernel: [12112.433831][ T7358] NVRM: Xid (PCI:0000:0c:00): 45, pid=7317, Ch 00000010
CRON[21094]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)

Исходя из логов, мы видим что есть проблема с видеокартой на слоте PCIE 0c:00 (под номером Gpu пишется номер PCIE слота) с ошибками 45 и 62
Коды ошибок (других, которые также могут быть там) и что с ними делать:

• 13, 43, 45: ошибки памяти, снизить MEM
• 8, 31, 32, 61, 62: снизить CORE, возможно и MEM
• 79: снизить CORE, проверить райзер

Ошибка Kernel-Power код 41

Проверьте все провода (от БП до карт, от БП до райзеров), возможно где-то идёт оплавление. Если визуальный осмотр показал, что все ок, то ошибка программная и вам нужно переустановить Windows.

Danger: hive-replace -y —stable (failed, exitcode=137)

Очень редкая ошибка, которая вылезла в момент удаленного обновления образа HiveOS. Она не встречается в тематических майнинг группах и сайтах. Не поверите что произошло.
На балконе, где стоял риг, поселилась семья голубей. Они засрали риг, в прямом смысле, из-за этого он постоянно уходил в оффлайн. После полной продувки материнской платы и видеокарт проблема решилась сама.

MALFUNCTION HIVEOS

Malfunction — неисправность. Причин и решений может быть несколько:

  • Вам следует переустановить видео драйвер;
  • Если драйвер не помог, тогда отключайте все GPU и поочередно вставляйте по 1 шт, и смотрите вызовет ли какая-то видеокарта подобную ошибку или нет. Если да, то возможно это райзер.
  • Неисправен носитель, на который записана Hive OS, запишите образ еще раз.

Не нашли своей ошибки? Помогите сделать мир майнинга лучше. Отправьте ее по этой форме и мы обновим наш гайд в самое ближайшее время.

Как исправить ошибку NVML cannot get fan speed

При майнинге на видеокартах Nvidia иногда возникают досадные ошибки вида:

Через несколько минут после появления таких ошибок обычно крашится майнер и зависает система.

При этом в логах майнера перед зависанием можно найти строки, похожие на следующие:

Рассмотрим подробнее причины появления ошибок NVML cannot get fan/temperature error 15 или 999 и чем их исправить.

Причины появления ошибки NVML error 999 (an internal driver error occurred)

Проблемы, связанные с появлением ошибок библиотеки NVIDIA Management Library (NVML) с разным кодом (обычно это 15, 17 или 999) приводят к потере контроля/управления температурой и вентиляторами видеокарты.

Они связаны с некорректной работой NVML API, входящего в состав драйверов NVidia. Согласно спецификации:

  • ошибка с кодом 15 свидетельствует о том, что GPU теряет связь с шиной PCI-E и затем становиться недоступной для управления (NVML_ERROR_GPU_IS_LOST);
  • ошибка с кодом 17 свидетельствует о том, что видеокарта заблокирована другим процессом (NVML_ERROR_OPERATING_SYSTEM = 17, GPU control device has been blocked by the operating system/cgroups);
  • error 999 свидетельствует о неизвестном сбое в работе драйверов (NVML_ERROR_UNKNOWN = 999 -an internal driver error occurred).

Основной причиной появления этих ошибок является наличие проблем в прохождении данных по каналу видеокарта-материнская плата.

Прохождение сигнала по шине PCI-E происходит с ошибками из-за таких неисправностей:

  • некорректная установка или повреждение файлов драйверов;
  • неверная установка в BIOS скорости передачи данных для устройств PCI-Express;
  • некорректная работа устройств PCI-E из-за включения энергосберегающего режима питания этой шины;
  • перегрев южного моста и вызванные этим нарушения обмена данными по линии PCI-Express;
  • перегрев видеокарты и появление, связанных с этим проблем в работе ее электронных компонентов;
  • неисправности райзеров (обычно это плохие контакты по линиям передачи данных и по питанию);
  • плохой контакт в разъемах кабелей питания/передачи данных;
  • некачественные блоки питания, слишком большая нагрузка на них;
  • наличие сильных электромагнитных помех, проникающих на риг из сети;
  • слишком большой разгон/даунвольтинг GPU.

Что нужно сделать, чтобы устранить ошибку NVML error 999 (an internal driver error occurred)

Для устранения ошибки NVML: cannot get fan speed, error 999 необходимо произвести следующие действия:

  • проверить/заменить райзера, кабеля питания, очистить контакты на разъемах видеокарты, райзерах и кабелях питания/USB-удлинителях;
  • увеличить размер файла подкачки до суммарного объема видеопамяти установленных в риге видеокарт;
  • уменьшить разгон по ядру и памяти, уменьшить даунвольтинг. В первую очередь нужно уменьшать разгон/даунвольтинг на карте, номер которой первым появляется в логах майнера перед зависанием. Если первой появляется строка GPU 1, GpuMiner cu_k1 failed 30, unknown error, то проблема, скорее всего, связана именно с первой видеокартой;
  • отключить опцию PCIe Power Saving в параметрах электропитания системы (меню настройки схемы электропитания – изменить дополнительные параметры питания – PCI Express – Управление состоянием связи – Откл.);
  • заново произвести установку драйверов с полной деинсталляцией предыдущей версии;
  • обеспечить хорошее охлаждение южного моста путем установки радиатора или вентилятора;
  • установить в BIOS скорость обмена по линии PCI-E в GEN 2 или 1;
  • обеспечить достаточную мощность блока питания и проверить качество выдаваемых им напряжений с помощью вольтметра;
  • поменять разъем PCI-E, в который включается видеокарта, попробовать включить ее в него без райзера.

При подозрении на неисправность разъема материнской платы нужно попробовать вставить в него другую видеокарту с заведомо исправным райзером. Если ошибка возникает снова, то, скорее всего неисправность возможно связана с материнской платой.

Небольшую помощь при запуске Claymore miner при наличии проблем, связанных с контролем вентиляторов видеокарт, может дать включение в батник параметров:

-tt 1 — отключение управления вентиляторами;

-tt 0 — отключение мониторинга температуры и вентиляторов;

-wd 0 – отключение программного watchdog, встроенного в майнер.

Отключение управления работой вентиляторов в майнере не будет проблемой при использовании MSI Afterburner или nvidiainspector по методике, описанной в статье «Оптимизация потребления видеокарт Nvidia при майнинге».

Использование такого «костыля» может увеличить время бесперебойной работы рига, но если в компьютере останется плохой контакт, то все равно работа рига будет нестабильной, и он будет периодически зависать.

В этом случае может помочь один из аппаратных сторожевых таймеров, некоторые из которых описаны в статье «Китайские сторожевые таймеры для майнинга».

О других ошибках, возникающих при майнинге и способах их устранения, можно почитать в статьях:

Источник

GTX 1000 Unknown Error (999)

Друг форума

Задрала такая вот ошибка, возникает на любой из карт 1063, но дальше все работает стабильно.

GPUХ: unable to get fan speed — Unknown Error (999)
Майнер PhoenixMiner
Мониторинг перестает видеть вентилятор, и есть подозрение, что он вращается с оборотами на момент ошибки постоянно.

Самое интересное, после появления ошибки на одной из карт, она не появляется на остальных.

Куда капать хз. гугл чот ничего вразумительного не дал. Появление ошибки от разгона не зависит.

OneOfMany

Бывалый

Задрала такая вот ошибка, возникает на любой из карт 1063, но дальше все работает стабильно.

GPUХ: unable to get fan speed — Unknown Error (999)
Майнер PhoenixMiner
Мониторинг перестает видеть вентилятор, и есть подозрение, что он вращается с оборотами на момент ошибки постоянно.

Самое интересное, после появления ошибки на одной из карт, она не появляется на остальных.

Куда капать хз. гугл чот ничего вразумительного не дал. Появление ошибки от разгона не зависит.

PashoK

Бывалый

Друг форума

Написал же, что от разгона не зависит.
Кстати вот сейчас впервые выбило на двух картах.

На всякий случай по 10 сбросил с карт мониторю.

Vlupidol80

Свой человек

Задрала такая вот ошибка, возникает на любой из карт 1063, но дальше все работает стабильно.

GPUХ: unable to get fan speed — Unknown Error (999)
Майнер PhoenixMiner
Мониторинг перестает видеть вентилятор, и есть подозрение, что он вращается с оборотами на момент ошибки постоянно.

Самое интересное, после появления ошибки на одной из карт, она не появляется на остальных.

Куда капать хз. гугл чот ничего вразумительного не дал. Появление ошибки от разгона не зависит.

Друг форума

Vlupidol80

Свой человек

rail812

Свой человек

Задрала такая вот ошибка, возникает на любой из карт 1063, но дальше все работает стабильно.

GPUХ: unable to get fan speed — Unknown Error (999)
Майнер PhoenixMiner
Мониторинг перестает видеть вентилятор, и есть подозрение, что он вращается с оборотами на момент ошибки постоянно.

Самое интересное, после появления ошибки на одной из карт, она не появляется на остальных.

Куда капать хз. гугл чот ничего вразумительного не дал. Появление ошибки от разгона не зависит.

Stepan Sraka

Друг форума

Ваш ник на биткоинталке случайно не «PhoenixMiner» ,потому что он пишет :

https://bitcointalk.org/index.php?topic=2647654.180
Экскьюз ми за не мой англицкий но переводчик выдает вот это (наверно неправильно переводит ) :

Это внутренняя ошибка NVML (библиотека мониторинга оборудования Nvidia). Мы видели подобные ошибки на нашем GTX1060s. Дополнительные симптомы включают высокую загрузку ЦП (либо майнером, либо MSI Afterburner). Те же проблемы наблюдались и с Шахтером Клеймора на той же буровой установке. Краткосрочное решение-перезапустить установку (не только майнер), но единственное долгосрочное решение-немного снизить разгон памяти. Мы обнаружили, что даже более низкие часы памяти на 20-30 МГц полностью решают проблему. Или вы можете продолжить добычу и игнорировать ошибки, но высокая загрузка ЦП может быть реальным Пита при попытке контролировать установку через VNC или TeamViewer.

А утверждать что ошибка не зависит от разгона , можно лишь тогда когда частота памяти будет равна 8000 (или 4000 если смотреть в бернере), а частота ядра максимум 1620

Источник

Ошибка error 17 и cannot get current temperature error 999 решение

Разбираемся с ошибкой error 17 и cannot get current temperature error 999

(Статья постоянно обновляется при нахождении дополнительных советов)

Во времена роста популярности майнинга ошибка error 17 и error 999 появляются ещё чаще, особенно на видеокартах nVidia GeForce GTX 1060 и вообще картах этой компании, но есть решение, потому что с ней сталкивались многие.

Итак, сначала моё решение ошибки error 17 и сообщения cannot get current temperature error 999, а потом других пользователей

  • Моя ферма состоит из таких комплектующих:

Вроде ничего особенного только 3 видеокарты, причём очень экономичные по энергопотреблению (до 120 Вт. На карту, по итогу майна на одном алгоритме у меня и того потребление выше 85 Вт. не поднималось). Но чтобы вы думали, ночью, после вполне успешного дневного пробега ферма отключилась с ошибкой error 17 и замечанием error 999, узнал я это утром по логам.

Судя по этому сообщению, в какой-то момент система не смогла получить некую текущую температуру, в результате чего ферма и вовсе отключилась. Запустив всё заново, посидев некоторое время и, понаблюдав за системой, в том числе температурой, не обнаружил ничего подозрительного.

Посмотрел в интернете, насчёт этой ошибки и, вроде она достаточно часто встречается на майнинг-фермах. В итоге наступила вторая ночь, днём опять всё проработало отлично, без каких-либо сбоев. В итоге проснувшись посреди ночи, я решил проверить свою шахту, но опять обнаружил, что она отключилась, включив её и, посмотрев логии клэймора, я опять обнаружил эту надоедливую ошибку error 17 и приписку cannot get current temperature error 999.

Более того, потом я ещё несколько раз вставал ночью и обнаруживал выключенной ферму. На следующий день я решил разобраться в ситуации, просмотрел несколько форумов и сайтов, где рассматривалась такая ошибка, я выписал несколько способов для её решения.

Не буду расписывать все, это сделаю во второй части статьи, а остановлюсь только на своём решении. В итоге мне помогло подсоединение монитора к системе

Я где-то видел, что без подключённого монитора видеокарты могут работать с ошибками. Для начала я на ночь подсоединил свой основной монитор с HDMI-выходом, ночью всё простояло отлично, а потом взял и подсоединил свой старый монитор-ящик 17-дюймов и всего делов для моей шахты.

Но, на форумах отписывались пользователи, которые отмечали, что им помогли другие способы избавиться от ошибки error 17 и error 999, вот их я сейчас и перечислю ниже.

Список того, что другим держателям ферм/шахт для майнинга помогло при ошибке error 17 и припиской cannot get current temperature error 999

  • Разгон видеокарт – убрать разгон или хотя бы снизить его
  • Перегрев видеокарт , поставить дополнительный кулер (ра), можно просто сбоку, чтобы дополнительно обдували
  • Установка Windows 10 , хотя многие говорят, что под 7-ку майнинг лучше и меньше проблем
  • Сбойные райзера , менять их местами или подсоединить на другие, первоначально лучше задействовать основные слоты материнки, а потом райзеры
  • Отключить управление питанием в PCI-E Link – в электропитание – настройка плана электропитания – изменить дополнительные параметры
  • В Биосе выставить параметр Gen 1 или другой попробовать
  • Ну, и, конечно, моё решение – подключить монитор, которое мне помогло, для этого даже продаются специальные затычки-переходники, которые имитируют монитор

Майнинг для чайников

С чего начать майнинг (новичкам основные вопросы)

Источник

Ошибка error 17 и error 999

vintoss

Пляшущий с бубном

teren5

Пляшущий с бубном

KoDer123

Новичок

Всем добрый день! Тоже столкнулся с такой проблемой на картах 1060 3gb. Работало не больше 10-15 минут и выдавал ошибку 999 cannot get current temperature.

После этих действий рига отработала в разгоне уже 14 часов без перезагрузки, полет пока нормальный.

Проблема вся в том, что эта ошибка возникает когда через железо идет слишком большая электромощность греется материнка, процессор, южный мост.

1) отрубаем в батнике Claymore мониторинг кулера и температуры командой -tt 0
2) Power limit в Afterburner выставляем на самое минимальное возможное значение при котором карты держат разгон +500 по памяти. У меня это 50-60 пунктов. Именно эта настройка понизила мне температуры на картах и нагрев материнки также снизился. По картам выставляем температурный диапазон на максимум. Все равно греться не будут, тк power limit маленький.
3) делаем скрипт программной перезагрузки компа на случай если все таки майнер тупанет и зависнет. У меня стоит хоть железный вочдог, но он не выручал, тк зависал майнер, тимвьювер и тд а вочдог спокойно посылал команду железу и комп не хотел перезагружаться. Для этого в батник пишем команду -r 1 . Далее в папке Claymore создаем файл reboot.bat и в нем пишем следующее: shutdown /r /t 5 /f

Итого: эти настройки снижают энергомощности проходящие через железо, изза чего все железо(карты и материнка) меньше греются. Выключение мониторинга температуры и кулера продляет время работы майнера. На случай если вдруг система зависнет — батник перезагрузки(про него написано также в Readme Claymore) перезагрузит комп.

Ну и для автоматического запуска майнера после перезагрузки не забудьте скопировать ярлык майнера в папку Автозагрузка Windows.

Такой вот костыль, но мне помог. Странно что такая ошибка вылезает на зеленых картах, с картами Rx 570, Rx 580 никогда таких проблем не возникало.

go1dfinger

Свой человек

Всем добрый день! Тоже столкнулся с такой проблемой на картах 1060 3gb. Работало не больше 10-15 минут и выдавал ошибку 999 cannot get current temperature.

После этих действий рига отработала в разгоне уже 14 часов без перезагрузки, полет пока нормальный.

Проблема вся в том, что эта ошибка возникает когда через железо идет слишком большая электромощность греется материнка, процессор, южный мост.

1) отрубаем в батнике Claymore мониторинг кулера и температуры командой -tt 0
2) Power limit в Afterburner выставляем на самое минимальное возможное значение при котором карты держат разгон +500 по памяти. У меня это 50-60 пунктов. Именно эта настройка понизила мне температуры на картах и нагрев материнки также снизился. По картам выставляем температурный диапазон на максимум. Все равно греться не будут, тк power limit маленький.
3) делаем скрипт программной перезагрузки компа на случай если все таки майнер тупанет и зависнет. У меня стоит хоть железный вочдог, но он не выручал, тк зависал майнер, тимвьювер и тд а вочдог спокойно посылал команду железу и комп не хотел перезагружаться. Для этого в батник пишем команду -r 1 . Далее в папке Claymore создаем файл reboot.bat и в нем пишем следующее: shutdown /r /t 5 /f

Итого: эти настройки снижают энергомощности проходящие через железо, изза чего все железо(карты и материнка) меньше греются. Выключение мониторинга температуры и кулера продляет время работы майнера. На случай если вдруг система зависнет — батник перезагрузки(про него написано также в Readme Claymore) перезагрузит комп.

Ну и для автоматического запуска майнера после перезагрузки не забудьте скопировать ярлык майнера в папку Автозагрузка Windows.

Такой вот костыль, но мне помог. Странно что такая ошибка вылезает на зеленых картах, с картами Rx 570, Rx 580 никогда таких проблем не возникало.

Источник

@mares992

Hello,

I have crash sometimes for fan speed, sometimes for temperature.

Rig:
GPU: 6 Gainward x 1060 6GB GTX
Motherboard: H81 Pro BTC
RAM: 4GB
Windows 10 Pro build 1073
nVidia last drivers

When start mining with or without overclock after few minutes receive message
NVML: cannot get fan speed, error 999 (an internal driver error occurred) or
NVML: cannot get temperature, error 999 (an internal driver error occurred)

I’m tried with 1 by 1 GPU but no success.

@pietervw

Same issue here. My log;

13:27:26:449	14ac	ETH: GPU0 19.617 Mh/s, GPU1 19.613 Mh/s, GPU2 19.621 Mh/s, GPU3 19.614 Mh/s
13:27:27:762	1778	NVML: cannot get fan speed, error 999 (an internal driver error occurred)
13:27:32:622	14ac	ETH: checking pool connection...
13:27:32:622	14ac	send: {"worker": "", "jsonrpc": "2.0", "params": [], "id": 3, "method": "eth_getWork"}

13:27:33:200	1778	NVML: cannot get fan speed, error 999 (an internal driver error occurred)
13:27:33:388	14ac	got 243 bytes

@lutsifer

The key here is that it happens «sometimes». Sometimes it might work long enough and no problem at all… If you reboot it there is a good chance it will work just fine. I am testing with the 10th version.

@lutsifer

@mares992

I’m resolve my problem with new GPU’s. Now I have Asus P106-6G with Samsung memory and have 25mh/s per GPU. @pietervw Check what is memory on your GPU.

@lutsifer

LOL I have 13 of those, they are awesome…

@lutsifer

Anyway, I believe this particular error is related to connection between riser and the GPU it self. It might be faulty riser or simply not good connection. It could be triggered if you play with the GPU while working (slightly push it left right — definitely not recommended :)
Reattach all of your riser/GPU connections. Sometimes switching GPU places might help as well. Reboot. It may never repeat again. At least this is my impression for this error. @mares992 Your old cards might be just OK.

@dwbfox

No riser involved with my GPU (980Ti), still get this error:
NVML: cannot get current temperature, error 999 (an internal driver error occurred)

I tried underclocking the memory but to no avail.

@klemm89

I am having this issue as well on my 980Ti no riser (its my desktops main GPU for games/work), but my 2x GTX 1070s which are on risers work fine. So Im currently only running the 1070s 24/7 but can’t ever get the 980Ti to run without crashing my monitors.

@Sinnige001

@kapaA

same here, i did some debug and removed and replaced some of the riseres, lets se if i get this error later on

@angryfullstackdev

tt -0 can solve this
This option prevents miner to load temp stats (risers not passing it)
tt -0 => disable
tt 70 => set temp target to 50°
tt -70 => set fan speed target to 50%
Hope it will solve problems

Понравилась статья? Поделить с друзьями:
  • Unknown error 80ff0003 canon dr 2010c
  • Unknown error 5402
  • Unknown error 400
  • Unknown error 302123 мегафон
  • Unknown error 234