Под мониторингом разные люди понимают разные вещи. Для мониторинга нет универсального решения. Нужен взвешенный компромисс между тем, что мониторится, для чего этот мониторинг используется и необходимыми ресурсами. Большинство администраторов использует комбинацию из одной или двух программ. Настраиваемый мониторинг единственное приемлемое решение в настоящее время. Если программу мониторинга можно легко расширить самописными модулями - эту программу стоит изучить и сделать выводы о пригодности её в ваших условиях.
Задачи решаемые при мониторинге компьютерной сети:
Мониторинг Linux- кластеров затрудняется несколькими причинами:
Учитывая сложность проблемы, вот как её решают некоторые из самых ленивых известных нам администраторов.
Наиболее часто встречающееся решение, замеченное нами в больших кластерных вычислительных центрах (включая ведущие университеты и правительственные лаборатории) — это Nagios для оповещений и Ganglia для мониторинга. Эти два очень хорошо настраиваемых инструмента могут дать администратору отличное понимание множества вещей, происходящих в кластере. Ganglia, как оказалось, масштабируется чрезвычайно хорошо.
Но есть также и другие точки зрения. В Университете Южной Калифорнии (USC) Гаррик Стэплс (Garrick Staples) написал pbstop, расширение к программе TORQUE, которое визуально представляет, что делает каждое задание и где оно запущено. Он говорит, что это — весь мониторинг, который ему нужен, и не использует ничего больше.
Вот наиболее популярные, по нашим наблюдениям, инструментальные средства мониторинга с открытыми исходными кодами, применяемые при работе с масштабируемыми кластерами:
Мы можем сказать, что многие из этих инструментальных средств в своей реализации, в свою очередь, активно используют RRDtool. Кратко повторим то, что знает ленивый Linux- администратор:
| Название | Лицензия | Карта сети | Virtual image | Клиенты ОС | 
|---|---|---|---|---|
| Zabbix установка, настройка мониторинга сети и оборудования | GPL | ручная | yes | yes | 
| Мониторинг при помощи Cacti | GPL | CactiEZ iso | no | |
| Icinga | GPL форк Nagios | vagrant | no | |
| Pandora FMS | GPLv2 | yes | yes | |
| OpenNMS | ||||
| Система мониторинга Monit | открытый исходный код | |||
| Munin | ||||
| NetXMS | GPL | |||
| Observium | ||||
| M/Monit | ||||
| Zenoss (Zenoss Core) | эта версия бесплатно | авто, ручная | ||
| Nagios | GPL 2 | через плагины | ||
| ManageEngine OpManager | Бесплатная полнофункциональная версия с ограничением на 10 устройств | |||
| Dude | ||||
| Приложение AutoScan-Network | ||||
| JFFNMS | Free, Licensed under the GNU GPL | |||
Мониторинг сайтов — это не роскошь, а необходимая часть поддержки любого проекта: регулярные проверки доступности, времени ответа и целостности страниц помогают быстро обнаруживать и устранять сбои, снижающие трафик и конверсии. Ненавязчиво настроенные алерты и отчёты экономят время команды и уменьшают простой, а правильная интеграция мониторинга с логами и метриками даёт представление о корневых причинах проблем. Подробнее о том, какие инструменты и сценарии мониторинга стоит использовать, читайте в нашем обзоре Мониторинг сайтов: Обзор лучших сервисов.
Список сервисов для отслеживания работоспособности сайтов: