Description
-
Первое, с чем столкнулся при обновлении
(с версии mamonsu 3.4.0 до версии 3.5.2)
это то, что файл agent.conf просто ПЕРЕЗАТЕРСЯ новым. Нет ни agent.conf.rpmnew, ни каких-либо упомининай, просто втихаря был пристрелен мой старый агент с отстроенными мтериками и плагинами, и вонзен новый, дефлотный.
Это зачем так? Отличное поведение. Ну или хотя бы предложить сохранить старый конфиг? Или написать, явно, при установке, что конфиг заменен? Например, про то, что удален юнит-файл (кстати, зачем????) в процессе написали явно:
Removed /etc/systemd/system/multi-user.target.wants/mamonsu.service.
А про то, что конфиг подменился я догадался только когда в него заглянул, т.к. при запуске mamonsu ничего не писалось в ранее сконфигурированный в агенте лог-файл.
Это, считаю, прям баг. Причем довольно неприятный.
Я специально перечитал документацию, в ней так же никаких упоминаний такого поведения. Это очень неприятный сюрприз, пришлось ползать по конфигу и занового конфигурировать настройки, так как старый конфиг нигде не сохранился. Из чего плавно переходим ко второму вопросу. -
Комментарии к блокам, которые присутствуют в конфигурационном файле агента. К каким-то они есть. Но к большинству нету. Приходится сидеть и придумывать, а что значит вот этот блок и к чему это может относиться. Тоже так себе квест. В документации так же не дается никаких описаний блоков, или упоминаний, где это можно узнать. Где можно посмотреть, например, информацию по настройке блока
[checkpoint]
max_checkpoint_by_wal_in_hour = 12
и какие у него еще есть параметры для тюнинга? Или этолько вот этот параметр (помимо дефолтных interval, enabled)
В оф. документации на гите - нету.
В "дефолтном" конфиге агента, котоырй генерится при "обновлении" - нету.
В help утилиты mamonsu - нету.
А как узнавать и понимать, что именно и каким образом (праметры, значения) я могу конфигурировать в конфиге?
А еще есть такой момент, как переименование блоков настроек.
Например:
[pgstatstatement] - в старом конфиге, это то же самое, что в новом [statstatements]?
[pgwaitsampling] - старый, [waitsampling] - новый?
-
Было бы так же неплохо знать, какие нужны extensions в БД для работы отдельных модулей. Не из ошибок в лог-файле, а в официальной доке к модулю.
-
Сформировал новый шаблон с помощью mamonsu export template template.xml, импортирую его в Zabbix (поверх старого) и получаю задвоенные триггеры по метрикам
Пример:
Mamonsu health: nodata from {HOSTNAME}
Mamonsu nodata from {HOSTNAME}
PostgreSQL no ping from PostgreSQL for 3 minutes {HOSTNAME} - 2 шт.
И таких задвоений - куча.
Как корректно обновлять шаблон, когда хостов много? Удалять шаблон со всех хостов, удалять шаблон из Zabbix, импортировать новый, линковать шаблон обратно ко всех хостам? Или как?
- Несмотря на то, что в конфиге агента
[disksizes]
enabled = False
[diskstats]
enabled = False
[net]
enabled = False
в шаблоне присутствуют LLD и по дискам, и по сетевым картам. Это так и должно быть?
Более того, как я понял, если задизейблить блок system
[system]
enabled = False
то вообще никакие системные параметры не должны мониториться (ни память, ни процессор, ни диски, ни сетевые карты и пр.).
Но нет, в шаблоне все элементы в наличии, включая Discovery rules по дискам, FS, сетевухам.
Гораздо логичнее было бы в шаблоне либо не генерить эти правила вообще, либо делать их в статусе disabled, раз уж я все поотключал в агентском конфиге. LLD занимают время и ресурсы при обнаружениях, зачем они мне обнаруживают кучу элементов, которые я не собираюсь мониторить?