Под мониторингом разные люди понимают разные вещи. Для мониторинга нет универсального решения. Нужен взвешенный компромисс между тем, что мониторится, для чего этот мониторинг используется и необходимыми ресурсами. Большинство администраторов использует комбинацию из одной или двух программ. Настраиваемый мониторинг единственное приемлемое решение в настоящее время. Если программу мониторинга можно легко расширить самописными модулями - эту программу стоит изучить и сделать выводы о пригодности её в ваших условиях.
Задачи решаемые при мониторинге компьютерной сети:
Мониторинг Linux- кластеров затрудняется несколькими причинами:
Учитывая сложность проблемы, вот как её решают некоторые из самых ленивых известных нам администраторов.
Наиболее часто встречающееся решение, замеченное нами в больших кластерных вычислительных центрах (включая ведущие университеты и правительственные лаборатории) — это Nagios для оповещений и Ganglia для мониторинга. Эти два очень хорошо настраиваемых инструмента могут дать администратору отличное понимание множества вещей, происходящих в кластере. Ganglia, как оказалось, масштабируется чрезвычайно хорошо.
Но есть также и другие точки зрения. В Университете Южной Калифорнии (USC) Гаррик Стэплс (Garrick Staples) написал pbstop, расширение к программе TORQUE, которое визуально представляет, что делает каждое задание и где оно запущено. Он говорит, что это — весь мониторинг, который ему нужен, и не использует ничего больше.
Вот наиболее популярные, по нашим наблюдениям, инструментальные средства мониторинга с открытыми исходными кодами, применяемые при работе с масштабируемыми кластерами:
Мы можем сказать, что многие из этих инструментальных средств в своей реализации, в свою очередь, активно используют RRDtool. Кратко повторим то, что знает ленивый Linux- администратор:
Название | Лицензия | Карта сети | Virtual image | Клиенты ОС |
---|---|---|---|---|
Zabbix установка, настройка мониторинга сети и оборудования | GPL | ручная | yes | yes |
Мониторинг при помощи Cacti | GPL | CactiEZ iso | no | |
Icinga | GPL форк Nagios | vagrant | no | |
Pandora FMS | GPLv2 | yes | yes | |
OpenNMS | ||||
Система мониторинга Monit | открытый исходный код | |||
Munin | ||||
NetXMS | GPL | |||
Observium | ||||
M/Monit | ||||
Zenoss (Zenoss Core) | эта версия бесплатно | авто, ручная | ||
Nagios | GPL 2 | через плагины | ||
ManageEngine OpManager | Бесплатная полнофункциональная версия с ограничением на 10 устройств | |||
Dude | ||||
Приложение AutoScan-Network | ||||
JFFNMS | Free, Licensed under the GNU GPL |