Содержание
- Zabbix 5 — что не так с извещениями в Telegram?
- High Error Output on Trunk Interface — Help Troubleshooting
- linux-notes.org
- Настройка кеша
- Zabbix discoverer processes more than 75% busy
- Zabbix icmp pinger processes more than 75% busy
- Zabbix poller processes more than 75% busy
- Zabbix housekeeper processes more than 75% busy
- Zabbix busy timer processes, in %
- Zabbix busy escalator processes, in %
- Zabbix busy alerter processes, in %
- Zabbix busy configuration syncer processes, in %
- Zabbix busy db watchdog processes, in %
- Zabbix busy history syncer processes, in %
- Zabbix busy self-monitoring processes, in %
- Zabbix busy http poller processes, in %
- Zabbix busy java poller processes, in %
- 6 thoughts on “ Оптимизация настроек Zabbix ”
- Добавить комментарий Отменить ответ
- Русские Блоги
- Zabbix различные сообщения об ошибках и обнаруженные проблемы (постоянное обновление)
Zabbix 5 — что не так с извещениями в Telegram?
По руководству был настроен бот, тест сообщений в чат проходил, даже сообщения отправлялись. После этого была сделана попытка подкрутить шаблоны сообщений, в т.ч. вставить эмодзи. И всё сломалось. А сейчас даже тест сообщений не проходит.
Если убрать скобочки, тест проходит. Но в реальных сообщениях разных символов, в том числе ‘-‘ , ‘(‘ и т.п. дофига и все эти сообщения оседают в Action Log.
Ну, и чтоб 2 раза не вставать — как например в subject сообщения вставить эмодзи, например, SOS с кодом xF0x9Fx86x97 ? Маркдаун :sos: тоже не срабатывает. Если попытаться вставить сам символ, то ругается при уже сохранении страницы Media Type.
- Вопрос задан более двух лет назад
- 1981 просмотр
Эмоджи можно определять как Unicode Surrogates (вида `u01234uABCD` )
Тогда в JS-скрипте отправки сообщения в телеграм надо 29-ю строку вида
data = JSON.stringify(params);
заменить на
Суть в том, что JSON.stringify экранирует все слэши в Surrogates, получается два слэша. Поэтому, после того, как получили JSON с data для отправки надо вернуть один слэш и это изменение делаем только для Unicode Surrogates, а не вообще по тексту. Регулярка в помощь.
единственное, не все проходят, возможно, UTF16 не годятся.
У меня такие подошли ✅ ‼️ ⚠️
По умолчанию поле Parsemode пустое. Попробуйте очисти поле «Parsemode»
Я не просил перевести текст, это я отлично понимаю. Пару дней назад это проходило
Источник
High Error Output on Trunk Interface — Help Troubleshooting
Hello everyone, new to the forum here!
We have three switches in our company, one of them is the core switch, and the other two is where our client PCs are connected. The switch core also has an ESXi Server connected to it, where all of our services are hosted. Additionally, we have a Cisco ASA Firewall connected to it. In order to monitor our interfaces and other devices/servers, we use Zabbix 4.0.
Everything was working normally, we hired +35 people, and everything is practically the same, however, we are getting alerts on Zabbix about high error rate on output interface Gi 1/0/22, this is one of the trunk ports which is connected to one of our non-core switches where end users are connected to. Sometimes we also receive alerts for interface 1/1/2 which is where our outside interface on the Cisco ASA is connected to, this last one goes away after some minutes, and it only pops-up from time to time.
However, our Gi 1/0/22 alert stays there for over an hour, then it goes away, and re-appears. The cabling of these interfaces was changed two days ago on a schedule where no people was working. The alert still pops up however reducing from an hour to 25-30 minutes. So, that might be an improvement, but I am still concerned about the alert. What other options do we have in order to troubleshoot this issue? Should I post an image of our interface?
I’d be eternally thankful for the help! 🙂
Источник
linux-notes.org
Стандартные настройки в zabbix, не всегда хорошо работают и их необходимо тюнить под свои нужды. Я собрал в данной статье, основные параметры для оптимизации. Возможно, — это не все и вы знаете больше, но я постараюсь максимизировать.
Настройка кеша
Для оптимизации заббикс сервера, стоит увеличить размер кеша, для этого — открываем:
Находим строку «CacheSize» и увеличиваем его.
Я увеличил до 256M. При надобности, можно добавить.
Zabbix discoverer processes more than 75% busy
Недавно получил алерт в заббиксе:
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Ищем строку с опцией «StartDiscoverers» и увеличиваем данный параметр:
Я, опцию StartDiscoverers увеличил до 5. На этом настройка заканчивается, нужно сохранить конфиг и перезагрузить zabbix сервер:
Можно увидеть мой наглядный пример:
Если после добавления хостов ( с разными подсетями) вы увидите что снова сработал этот триггер, то нужно увеличить StartDiscoverers.
Zabbix icmp pinger processes more than 75% busy
Недавно получил алерт в заббиксе:
Данное сообщение, говорит — что процесс(ы) выполняющие ping по хостам, перегружены.
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Ищем строку с опцией «StartPingers» и увеличиваем данный параметр:
Я, опцию StartPingers увеличил до 5, тем самым — я увеличил количество процессов выполняющих ICMP Ping.
На этом настройка заканчивается, нужно сохранить конфиг и перезагрузить zabbix сервер:
Zabbix poller processes more than 75% busy
poller — это процесс который опрашивает агентов.
Данный параметр стоит увеличивать в 2- случаях:
- Большая сеть
- Есть много недоступных ресурсов и они мониторятся.
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Ищем строку с опцией «StartPollers» и увеличиваем данный параметр:
Я установил данный параметр в 5. Если очень будет худо, то увеличиваем его до 20. Ничто не приходит бесследно, увеличение процессов ведет к увеличение потребления ресурсов.
После этого, вы можете получить:
Если видите у себя данное сообщение ( алерт, сработанный триггер), открываем конфиг:
Ищем строку с опцией «StartPollersUnreachable» и увеличиваем данный параметр:
PS: У меня данный параметр используется по умолчанию и я его не трогал ( не было ошибок).
Имеется вероятность того, что перестанет хватать коннекщенов для БД, то надо увеличивать лимит подключений.
Zabbix housekeeper processes more than 75% busy
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
И приводим к виду:
Сохраняем файл и перезагружаем zabbix:
Zabbix busy timer processes, in %
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Переменную укажу позже (не знаю какая)!
Сохраняем файл и перезагружаем zabbix:
Zabbix busy escalator processes, in %
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Переменную укажу позже (не знаю какая)!
Сохраняем файл и перезагружаем zabbix:
Zabbix busy alerter processes, in %
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Переменную укажу позже (не знаю какая)!
Сохраняем файл и перезагружаем zabbix:
Zabbix busy configuration syncer processes, in %
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Находим и изменяем:
Сохраняем файл и перезагружаем zabbix:
Zabbix busy db watchdog processes, in %
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Переменную укажу позже (не знаю какая)!
Сохраняем файл и перезагружаем zabbix:
Zabbix busy history syncer processes, in %
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Находим и изменяем:
Сохраняем файл и перезагружаем zabbix:
Zabbix busy self-monitoring processes, in %
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Переменную укажу позже (не знаю какая)!
Сохраняем файл и перезагружаем zabbix:
Zabbix busy http poller processes, in %
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Находим и меняем параметр:
Сохраняем файл и перезагружаем zabbix:
Zabbix busy java poller processes, in %
Это можно исправить, откроем zabbix_server.conf конфиг-файл:
Находим и меняем параметр:
Сохраняем файл и перезагружаем zabbix:
А на этом, у меня все и статья «Оптимизация настроек Zabbix» завершена.
6 thoughts on “ Оптимизация настроек Zabbix ”
Спасибо больше за ресурс, за работу , за статью. .
Уже долго ковыряем маны с вашего великолепнейшего портала. За частую весьма помогают в работе, когда у тебя много сервантов, площадок и зверей. А у вас можно все оперативно найти пофиксить или что то настроить ) . Статьи понятные, местами с картинками, в общем как надо для даунов и инвалидов на голову.
Единственное — добавьте пожалуйста статейку либо поправку в статьях ( не знаю у вас или нет) к вопросу о предварительной разметки диска перед установкой оси. — Есть такой момент, что имея pve ноду и раздел бута ( к примеру 500 мб) в дебиане при обновлении оси в раздел бута срутся так же старые ядра и не самоуничтожаются .т.е. там в конце года мы имеем переполненный размер бута. соответственно дефолтный размер бута УЖЕ = 4 ГБ. что бы забыть о мелких траблах ….
первый раз пишу комент на сайте за лет 5 ))) аж не по себе ))
в общем респект и уважуха!
housekeeper processesMaxHousekeeperDelete=5000 поменял на 100
но не помогло, все ровно так же высвечивает Zabbix housekeeper processes more than 75% busy. Перезагружал железо не помогло. Что делать?
Нужно не уменьшать, а увеличивать!
Но нужно чтобы хватило ресурсов на сервере.
У меня тоже приходит след. сообщение »Problem: Zabbix discoverer processes more than 75% busy»
Заббикс у меня поднимается из docker и соот. файла zabbix_server.conf нет но есть .env_srv
я поменял след. переменные
ZBX_VALUECACHESIZE=256M
ZBX_CACHESIZE=256M
ZBX_STARTDISCOVERERS=5
Может RAM, CPU мало для Докер контейнера выделил. Так же, может стоит увеличить значения в 2-3 раза:
ZBX_VALUECACHESIZE=512M
ZBX_CACHESIZE=512M
ZBX_STARTDISCOVERERS=10
Благодарность за хороший Материал и Работу!
Столкнулся с сообщением вида:
Zabbix server is not running: the information displayed may not be current
Правка /etc/zabbix/zabbix_server.conf
Изменил значение параметра CacheSize=512M (было
и перезапустил zabbix
service zabbix-server restart
Добавить комментарий Отменить ответ
Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.
Источник
Русские Блоги
Zabbix различные сообщения об ошибках и обнаруженные проблемы (постоянное обновление)
1. Zabbix alarm icmp pinger обрабатывает более 75% занятости
2、zabbix unreachable poller processes more than 75 busy
Недостижимые процессы опроса были в состоянии занятости. Что это означает? Проверьте внутренние процессы zabbix и недоступный опросчик-опрос на наличие недоступных устройств для опроса недоступных устройств.
Возможная ситуация:
1. Устройство, которое собирает данные через Zabbix-агент, находится в состоянии мониторинга, но происходит сбой машины или другие причины, в результате чего агент zabbix умирает, и сервер не может получить данные, и в это время активируется недоступный опросчик .
2. Устройство, которое собирает данные через Zabbix-агент, находится в состоянии мониторинга, но серверу требуется слишком много времени для получения данных от агента, часто превышающее время ожидания, установленное сервером, и количество недоступных опросчиков увеличится в это время .
3. MySQL, поддерживающий Zabbix, зависает, может зависнуть ввод-вывод Zabbix сервера, и процесс Zabbix может быть выделен для недостаточной памяти.
Простой метод — увеличить количество процессов, инициализируемых при запуске Zabbix Server, что напрямую увеличивает нагрузку на опрос и пропорционально сокращает количество загруженных ситуаций.
3、Zabbix alerter processes more than 75% busy
Получены сотни предупреждений zabbix:
Zabbix alerter processes more than 75% busy
Возможные причины:
проблема с базой данных zabbix
IO загрузка сервера zabbix
У процесса zabbix недостаточно выделенной памяти
Сетевая задержка или сбой
Подходить:
4. Служба zabbix-server зависает, а после запуска автоматически останавливается, а в журнале ниже много ошибок
Zabbix value cache working in low memory mode
Less than 25% free in the configuration cache
5. Журнал zabbix-сервера сообщает об ошибке, в которой говорится, что соединение с базой данных ‘zabbix’ не удалось: [1040] Ошибка слишком большого количества подключений, mariadb в норме. Я думаю, это должна быть проблема максимального количества подключений MySQL.
Ссылка для изменения максимального количества подключений mysql: http://blog.51cto.com/net881004/2089198
6. Аварийный сигнал запрашивает более 100 элементов с отсутствующими данными более 10 минут, а опросчик Zabbix обрабатывает более 75% ошибок занятости.
Измените файл конфигурации, чтобы увеличить количество потоков и кеш
7. Есть много журналов сервера, первая сетевая ошибка, подождите 15 секунд, ошибка
В файле конфигурации сервера Timeout time был изменен на большее значение, я изменил его на 30s.
8. Zabbix alarms «Zabbix poller обрабатывает более 75% занятости»(Нетизены)
Причина предупреждения:
1. Процесс завис,
2. Слишком много сбоев в процессе зомби, что привело к замедлению
3. Сетевая задержка (можно игнорировать)
4. zabbix потребляет больше памяти
Предупреждение об опасности:
Общее предупреждение, на данный момент вреда нет (но лучше с ним разобраться)
Метод обработки:
Первое: просто и грубо (перезапуск zabbix-сервера может использоваться в сочетании с задачами синхронизации)
service zabbix-server restart
crontab -e вызывает план в редакторе Cron:
@daily service zabbix-server restart > /dev/null 2>&1
2: отредактируйте файл конфигурации Zabbix Server /etc/zabbix/zabbix_server.conf и найдите параграф, который настраивает StartPollers:
### Option: StartPollers
# Number of pre-forked instances of pollers.
#
# Mandatory: no
# Range: 0-1000
# Default:
# StartPollers=5
Раскомментируйте строку StartPollers = или добавьте ее напрямую:
StartPollers=10
Количество измененных StartPollers зависит от производительности сервера и количества наблюдений. После установки StartPollers на 12 аварийных сигналов не обнаружено. Если памяти достаточно, ее можно установить выше.
9. Утром я получил много сообщений о тревоге, официальный сайт был недоступен, и многие порты серверов были заблокированы. Тем не менее, вы можете получить доступ к официальному веб-сайту с вашего мобильного телефона.В электронном письме много сообщений о тревогах о том, что оповещатель Zabbix обрабатывает более 75% занятости, HTTP-опросчик Zabbix обрабатывает более 75% занятости и сбой порта.
Поскольку конфигурация zabbix была оптимизирована ранее, я думаю, что это не должно быть проблемой с конфигурацией zabbix. Это может быть вызвано отключением или задержкой сети, в которой в это время находится zabbix (после подтверждения сеть в компьютерном зале была отключена на 2 часа, и эти сообщения тревоги были отправлены после восстановления). Похоже, нам нужно контролировать сам сервер zabbix в удаленном месте, и успеть посмотреть на nagios.
Источник
Добрый вечер. Происходит перерегистрация без видимой причины ONU Gateray GR-EP-ONU1-1, версия ПО V1.2.5. С этими же ONU, но с ПО V1.2.4 такого не наблюдается.
OLT:
OLT:024#sh ver
BDCOM(tm) P3310D Software, Version 10.1.0F Build 74816
Copyright by Shanghai Baud Data Communication CO. LTD.
Compiled: 2020-6-28 15:17:13 by SYS, Image text-base: 0x80008000
ROM: System Bootstrap, Version 0.4.2, Serial num:0032500xxx8
System image file is «Switch.bin»
hardware version:H
(RISC) processor with 131072K bytes of memory, 32768K bytes of flash
Base ethernet MAC Address: 98:45:62:e9:xx:x2
PCB version:H
snmp info:
product_ID:441 system_ID:1.3.6.1.4.1.3320.1.441.0
OLT:024 uptime is 76:14:01:52, The current time: 2022-2-14 19:35:58
Конфиг ONU:
interface EPON0/3:4
switchport port-security dynamic maximum 4
switchport port-security mode dynamic
epon onu port 1 ctc vlan mode tag 127 priority 0
epon onu port 1 ctc loopback detect
epon onu port 1 ctc notify loopback
epon onu port 1 storm-control mode 1 threshold 256
——
Здесь было отключение питания ONU:
2022-01-26T10:09:14+03:00 172.17.0.24 OLT:024 Alarm DYING_GASP from ONU 70a5.6a1a.1718 port EPON0/3:4
2022-01-26T10:09:14+03:00 172.17.0.24 OLT:024 %OLT: Interface EPON0/3:4’s OAM Operational Status: Linkfault
2022-01-26T10:09:17+03:00 172.17.0.24 OLT:024 %EPON-ONUDEREG: ONU 70a5.6a1a.1718 is deregistered on EPON0/3:4.
2022-01-26T10:10:15+03:00 172.17.0.24 OLT:024 %EPON-ONUREG: ONU 70a5.6a1a.1718 is registered on EPON0/3:4.
2022-01-26T10:10:15+03:00 172.17.0.24 OLT:024 %EPON-ONUAUTHEN: ONU 70a5.6a1a.1718 is authenticated on EPON0/3:4.
2022-01-26T10:10:16+03:00 172.17.0.24 OLT:024 %OLT: Interface EPON0/3:4’s OAM Operational Status: Operational
2022-01-26T10:10:19+03:00 172.17.0.24 OLT:024 %OLT: Interface EPON0/3:4’s CTC OAM extension negotiated successfully!
всё норм.
А здесь не было отключения ни питания ни оптики:
2022-01-24T12:58:18+03:00 172.17.0.24 OLT:024 %EPON-ONUDEREG: ONU 70a5.6a1a.1718 is deregistered on EPON0/3:4.
2022-01-24T12:58:18+03:00 172.17.0.24 OLT:024 %EPON-ONUREG: ONU 70a5.6a1a.1718 is registered on EPON0/3:4.
2022-01-24T12:58:18+03:00 172.17.0.24 OLT:024 %OLT: Interface EPON0/3:4’s OAM Operational Status: Operational
2022-01-24T12:58:18+03:00 172.17.0.24 OLT:024 %EPON-ONUAUTHEN: ONU 70a5.6a1a.1718 is authenticated on EPON0/3:4.
2022-01-24T12:58:18+03:00 172.17.0.24 OLT:024 %OLT: Interface EPON0/3:4’s OAM Operational Status: Linkfault
2022-01-24T12:58:19+03:00 172.17.0.24 OLT:024 %OLT: Interface EPON0/3:4’s OAM Operational Status: Operational
2022-01-24T12:58:23+03:00 172.17.0.24 OLT:024 %OLT: Interface EPON0/3:4’s CTC OAM extension negotiated successfully!
2022-01-24T14:12:28+03:00 172.17.0.24 OLT:024 %EPON-ONUDEREG: ONU 70a5.6a1a.1712 is deregistered on EPON0/1:32.
2022-01-24T14:12:28+03:00 172.17.0.24 OLT:024 %EPON-ONUREG: ONU 70a5.6a1a.1712 is registered on EPON0/1:32.
2022-01-24T14:12:28+03:00 172.17.0.24 OLT:024 %OLT: Interface EPON0/1:32’s OAM Operational Status: Operational
2022-01-24T14:12:28+03:00 172.17.0.24 OLT:024 %EPON-ONUAUTHEN: ONU 70a5.6a1a.1712 is authenticated on EPON0/1:32.
2022-01-24T14:12:28+03:00 172.17.0.24 OLT:024 %OLT: Interface EPON0/1:32’s OAM Operational Status: Linkfault
2022-01-24T14:12:29+03:00 172.17.0.24 OLT:024 %OLT: Interface EPON0/1:32’s OAM Operational Status: Operational
2022-01-24T14:12:33+03:00 172.17.0.24 OLT:024 %OLT: Interface EPON0/1:32’s CTC OAM extension negotiated successfully!
——
Вот эта ONU может висеть на OLT месяц и более, пока абонент не отключит питание или что-то другое:
OLT:024#sh ep int ep0/3:5 onu ctc basic-info
ONU Vender ID : xPON
ONU MODEL ID : 110F
ONU EXT MODEL ID : GR-EP-ONU1-1
ONU ID : e0e8.e6d3.3431
Hardware Version : F300.1B
Software Version : V1.2.4
Firmware Version : 0x1002
Chipset Vendor ID :
Chipset MODEL ID : 0xf501
Chipset Revision : 15
Chipset Date : 20/06/20
Onu type : SFU
Support multillid : Not supported
Protection type : Not supported
Number of Pon : 1
Number of slot : 0
Support 1 types of port:
Number of GE port : 1
Bitmap of GE port : 1
Number of US Queues : 8
QueueMax per US Port: 8
Number of DS Queues : 8
QueueMax per DS Port: 8
Battery Backup : 0
А у этой ONU аптайм на OLT больше суток не бывает:
OLT:024#sh ep int ep0/3:4 onu ctc basic-info
ONU Vender ID : xPON
ONU MODEL ID : 110F
ONU EXT MODEL ID : GR-EP-ONU1-1
ONU ID : 70a5.6a1a.1718
Hardware Version : F300.1B
Software Version : V1.2.5
Firmware Version : 0x1002
Chipset Vendor ID :
Chipset MODEL ID : 0xf501
Chipset Revision : 15
Chipset Date : 20/06/20
Onu type : SFU
Support multillid : Not supported
Protection type : Not supported
Number of Pon : 1
Number of slot : 0
Support 1 types of port:
Number of GE port : 1
Bitmap of GE port : 1
Number of US Queues : 8
QueueMax per US Port: 8
Number of DS Queues : 8
QueueMax per DS Port: 8
Battery Backup : 0
Уровни оптической мощности:
OLT:024#sh ep optical-transceiver-diagnosis int ep0/3:4
interface RxPower(dBm)
———— —————
epon0/3:4 -20.9
OLT:024#sh ep int ep0/3:4 onu ctc optical-transceiver-diagnosis
operating temperature(degree): 28
supply voltage(V): 3.3
bias current(mA): 11.8
transmitted power(DBm): 1.4
received power(DBm): -18.7
——————————————————————————————
OLT:024#sh ep optical-transceiver-diagnosis int ep0/3:5
interface RxPower(dBm)
———— —————
epon0/3:5 -22.1
OLT:024#sh ep int ep0/3:5 onu ctc optical-transceiver-diagnosis
operating temperature(degree): 27
supply voltage(V): 3.3
bias current(mA): 16.4
transmitted power(DBm): 1.3
received power(DBm): -18.3
Прошивку V1.2.4 найти пока не удалось, производитель тоже пока молчит. Таких-же onu с прошивкой V1.2.4 поставили более 60 шт. на нескольких OLT, пока проблем нет. А с версией V1.2.5 вот эта без причинная перерегистрация на всех OLT, благо их пока мало. Может быть кто сталкивался с подобным? Или если есть прошивка V1.2.4, поделитесь пожалуйста! Заранее спасибо!
Изменено 15 февраля, 2022 пользователем MUY_68
-
#1
Interface wifi0: High error rate
Interface ath6: High error rate
Откуда берутся эти ошибки может кто подсказать?
-
#2
Что за устройство? Пожалуйста следуйте правилам оформления:
Подробнее составляйте «тему» обращения. Скриншот желателен.
Уважаемые форумчане, корректно составляйте тему вашего обращения. Тема вопроса. Максимально развернуто — до 200 символов. пример. ——————————————————————————————- ( НЕ правильно ) — > Не работает NanoStation. ( ПРАВИЛЬНО ) — > Нет…
www.ubnt.su
Правила форума
Общие правила форума 1. Обсуждайте только вопросы, касающиеся исключительно беспроводных сетей, а также их настройки и эксплуатации. 2. Прежде чем написать сообщение — загляните в FAQ и воспользуйтесь поиском: более чем вероятно, что такая тема уже обсуждалась. Старые темы автоматически…
www.ubnt.su
-
Автор темы
-
#3
Что за устройство? Пожалуйста следуйте правилам оформления:
Подробнее составляйте «тему» обращения. Скриншот желателен.
Уважаемые форумчане, корректно составляйте тему вашего обращения. Тема вопроса. Максимально развернуто — до 200 символов. пример. ——————————————————————————————- ( НЕ правильно ) — > Не работает NanoStation. ( ПРАВИЛЬНО ) — > Нет…
www.ubnt.su
Правила форума
Общие правила форума 1. Обсуждайте только вопросы, касающиеся исключительно беспроводных сетей, а также их настройки и эксплуатации. 2. Прежде чем написать сообщение — загляните в FAQ и воспользуйтесь поиском: более чем вероятно, что такая тема уже обсуждалась. Старые темы автоматически…
www.ubnt.su
UniFi AP-AC-Lite 6.2.35.14043
Данные ошибки были и на предыдущих версиях прошивки.
-
#4
Какой контроллер (версия) и на чем запущен?
Эти прошивки (UAp-lite v6) всё еще являются экспериментальными.
-
Автор темы
-
#5
Какой контроллер (версия) и на чем запущен?
Эти прошивки (UAp-lite v6) всё еще являются экспериментальными.
версия контролера 5.9.29 запущен на центосе.
Ссылка на исходный текстhttp://blog.51cto.com/net881004/2067677
1. Zabbix alarm icmp pinger обрабатывает более 75% занятости
[[email protected] zabbix]# vi /etc/zabbix/zabbix_server.conf
Установите для этого значения StartPingers = 5, а затем перезапустите службу zabbix-server.
2、zabbix unreachable poller processes more than 75 busy
Недостижимые процессы опроса были в состоянии занятости. Что это означает? Проверьте внутренние процессы zabbix и недоступный опросчик-опрос на наличие недоступных устройств для опроса недоступных устройств.
Возможная ситуация:
1. Устройство, которое собирает данные через Zabbix-агент, находится в состоянии мониторинга, но происходит сбой машины или другие причины, в результате чего агент zabbix умирает, и сервер не может получить данные, и в это время активируется недоступный опросчик .
2. Устройство, которое собирает данные через Zabbix-агент, находится в состоянии мониторинга, но серверу требуется слишком много времени для получения данных от агента, часто превышающее время ожидания, установленное сервером, и количество недоступных опросчиков увеличится в это время .
3. MySQL, поддерживающий Zabbix, зависает, может зависнуть ввод-вывод Zabbix сервера, и процесс Zabbix может быть выделен для недостаточной памяти.
Простой метод - увеличить количество процессов, инициализируемых при запуске Zabbix Server, что напрямую увеличивает нагрузку на опрос и пропорционально сокращает количество загруженных ситуаций.
[[email protected] zabbix]# vi /etc/zabbix/zabbix_server.conf
Установите для этого значения StartPollers = 500, а затем перезапустите службу zabbix-server. Вы также можете регулярно перезапускать службу zabbix.
3、Zabbix alerter processes more than 75% busy
Получены сотни предупреждений zabbix:
Zabbix alerter processes more than 75% busy
Возможные причины:
проблема с базой данных zabbix
IO загрузка сервера zabbix
У процесса zabbix недостаточно выделенной памяти
Сетевая задержка или сбой
Подходить:
[[email protected] zabbix] vim /etc/zabbix/zabbix_server.conf
Измените его значение по умолчанию с 5 на 20:
StartPollers=500
Измененное местоположение
# StartDiscoverers=1
StartDiscoverers=100
4. Служба zabbix-server зависает, а после запуска автоматически останавливается, а в журнале ниже много ошибок
Подсказка тревоги
Zabbix value cache working in low memory mode
Less than 25% free in the configuration cache
[[email protected] zabbix] cat /var/log/zabbix/zabbix_server.log
6278:20180320:190117.775 using configuration file: /etc/zabbix/zabbix_server.conf
6278:20180320:190117.807 current database version (mandatory/optional): 03020000/03020001
6278:20180320:190117.807 required mandatory version: 03020000
6278:20180320:190118.378 __mem_malloc: skipped 0 asked 136 skip_min 4294967295 skip_max 0
6278:20180320:190118.378 [file:dbconfig.c,line:653] zbx_mem_malloc(): out of memory (requested 136 bytes)
6278:20180320:190118.378 [file:dbconfig.c,line:653] zbx_mem_malloc(): please increase CacheSize configuration parameter
6354:20180320:190128.632 Starting Zabbix Server. Zabbix 3.2.10 (revision 74337).
[[email protected] zabbix] vi /etc/zabbix/zabbix_server.conf
### Option: CacheSize
# Size of configuration cache, in bytes.
# Shared memory size for storing host, item and trigger data.
#
# Mandatory: no
# Range: 128K-8G
# Default:
# CacheSize=8M
CacheSize=2048M
[[email protected] zabbix]# systemctl restart zabbix-server
Примечание. Сегодня было добавлено пакетно 700 хостов, что привело к переполнению памяти.
5. Журнал zabbix-сервера сообщает об ошибке, в которой говорится, что соединение с базой данных 'zabbix' не удалось: [1040] Ошибка слишком большого количества подключений, mariadb в норме. Я думаю, это должна быть проблема максимального количества подключений MySQL.
Ссылка для изменения максимального количества подключений mysql:
http://blog.51cto.com/net881004/2089198
6. Аварийный сигнал запрашивает более 100 элементов с отсутствующими данными более 10 минут, а опросчик Zabbix обрабатывает более 75% ошибок занятости.
Измените файл конфигурации, чтобы увеличить количество потоков и кеш
[[email protected] zabbix]# vim /usr/local/zabbix/etc/zabbix_server.conf
StartPollers=500
StartPollersUnreachable=50
StartTrappers=30
StartDiscoverers=6
CacheSize=1G
CacheUpdateFrequency=300
StartDBSyncers=20
HistoryCacheSize=512M
TrendCacheSize=256M
HistoryTextCacheSize=80M
ValueCacheSize=1G
7. Есть много журналов сервера, первая сетевая ошибка, подождите 15 секунд, ошибка
В файле конфигурации сервера Timeout time был изменен на большее значение, я изменил его на 30s.
8. Zabbix alarms «Zabbix poller обрабатывает более 75% занятости»(Нетизены)
Причина предупреждения:
1. Процесс завис,
2. Слишком много сбоев в процессе зомби, что привело к замедлению
3. Сетевая задержка (можно игнорировать)
4. zabbix потребляет больше памяти
Предупреждение об опасности:
Общее предупреждение, на данный момент вреда нет (но лучше с ним разобраться)
Метод обработки:
Первое: просто и грубо (перезапуск zabbix-сервера может использоваться в сочетании с задачами синхронизации)
service zabbix-server restart
crontab -e вызывает план в редакторе Cron:
@daily service zabbix-server restart > /dev/null 2>&1
2: отредактируйте файл конфигурации Zabbix Server /etc/zabbix/zabbix_server.conf и найдите параграф, который настраивает StartPollers:
### Option: StartPollers
# Number of pre-forked instances of pollers.
#
# Mandatory: no
# Range: 0-1000
# Default:
# StartPollers=5
Раскомментируйте строку StartPollers = или добавьте ее напрямую:
StartPollers=10
Количество измененных StartPollers зависит от производительности сервера и количества наблюдений. После установки StartPollers на 12 аварийных сигналов не обнаружено. Если памяти достаточно, ее можно установить выше.
9. Утром я получил много сообщений о тревоге, официальный сайт был недоступен, и многие порты серверов были заблокированы. Тем не менее, вы можете получить доступ к официальному веб-сайту с вашего мобильного телефона.В электронном письме много сообщений о тревогах о том, что оповещатель Zabbix обрабатывает более 75% занятости, HTTP-опросчик Zabbix обрабатывает более 75% занятости и сбой порта.
Поскольку конфигурация zabbix была оптимизирована ранее, я думаю, что это не должно быть проблемой с конфигурацией zabbix. Это может быть вызвано отключением или задержкой сети, в которой в это время находится zabbix (после подтверждения сеть в компьютерном зале была отключена на 2 часа, и эти сообщения тревоги были отправлены после восстановления). Похоже, нам нужно контролировать сам сервер zabbix в удаленном месте, и успеть посмотреть на nagios.