====== Мониторинг дисковой активности с помощью zabbix ====== ===== Введение ===== Как мониторить дисковую активность с помощью zabbix писалось уже не раз, но ни один из вариантов меня полностью не устроил и я взял что-то из одного рецепта, что-то из другого, а что-то реализовал сам. В итоге получилось решение, которое устраивает меня и чтобы не забыть как я это сделал было решено задокументировать :) На все сторонние скрипты и идеи в конце статьи указаны ссылки. Для мониторинга используется утилита iostat из пакета sysstat. Она в течерии минуты записывает показания в файл(с интервалом в одну секунду), а затем zabix-агент считывает среднеарифмитическое. Для автоподключения дисков к мониторингу был написан свой скрипт, который выполняет поиск блочных устройств, но не просто всех имеющихся, а по определенным, нужным мне критериям, т.е. поиск начинается с просмотра всех примонтированных файловых систем и определения их блочных устройств, далее если это логические устройства, они отсекаются, например вместо sda1 и sda2 будет мониториться только sda и т.д. ===== Подготовка хоста ===== Устанавливаем пакет sysstat. С помощью утилиты iostat из этого пакета будем собирать статистику загруженности дисков и сохранять в файл. # apt-get install sysstat Далее создаем скрипт, который будет собирать данные в течении 55с и сохранять их в файл /opt/zabbix/iostat_collect.sh: #!/bin/bash # Script for iostat monitoring # Author Epikhin Mikhail # michael at nomanlab.org SECONDS=55 TOFILE=/tmp/iostat.log IOSTAT=/usr/bin/iostat DISK=$($IOSTAT -x 1 $SECONDS | awk 'BEGIN {check=0;} {if(check==1 && $1=="avg-cpu:"){check=0}if(check==1 && $1!=""){print $0}if($1=="Device:"){check=1}}' | tr '\n' '|') echo $DISK | sed 's/|/\n/g' > $TOFILE echo 0 Добавляем этот скрипт в крон, чтобы он выполнялся каждую минуту /etc/crontab: * * * * * root /opt/zabbix/iostat_collect.sh И перезапускаем крон: # /etc/init.d/crond restart Теперь каждую минуту в файле /tmp/iostat.log будет появляться ежесекундная статистика по загрузке дисков. Далее создаем скрипт, который будет парсить этот лог и считать среднеарифмитическое для заданного диска и заданного параметра /opt/zabbix/iostat_parse.sh: #!/bin/bash # Script for disk monitoring # Author Epikhin Mikhail # michael.nomanlab.org # version 1.1 NUBMER=100500 FROMFILE=/tmp/iostat.log DISK=$1 METRIC=$2 case "$2" in "rrqm/s") NUMBER=2 ;; "wrqm/s") NUMBER=3 ;; "r/s") NUMBER=4 ;; "w/s") NUMBER=5 ;; "rsec/s") NUMBER=6 ;; "wsec/s") NUMBER=7 ;; "avgrq-sz") NUMBER=8 ;; "avgqu-sz") NUMBER=9 ;; "await") NUMBER=10 ;; "svctm") NUMBER=11 ;; "util") NUMBER=12 ;; esac cat $FROMFILE | grep $DISK | tail -n +2 | tr -s ' ' | cut -f$NUMBER -d' ' | awk 'BEGIN {sum=0.0;count=0;} {sum=sum+$1;count=count+1;} END {printf("%.2f\n", sum/count);}' #iostat -x | grep $1 | tr -s ' ' | cut -f$NUMBER -d' ' И еще один скрипт, которые будет выполнять поиск использующихся устройств /opt/zabbix/devs_discovery.py: #!/usr/bin/env python import os import re devs = [] mountsFD = open("/proc/mounts", "ro") mounts = mountsFD.readlines() jsonData = '{\n"data":[\n\n' mountPoint = '' md = re.compile('^md[0-9]+$') for line in mounts: if line.startswith("/dev"): lineParts = line.split(" ") mountPoint = lineParts[1] if "/dev/mapper/" in lineParts[0]: dev = os.readlink(lineParts[0]).split("../")[1] else: dev = lineParts[0].split("/dev/")[1] # if not MD-drive if not md.match(dev): # removing numbers from string dev = ''.join([i for i in dev if not i.isdigit()]) mountPoint = "" if dev not in devs: if jsonData != '{\n"data":[\n\n': jsonData += ',\n' jsonData += """{"{#DEV}": "%s", "{#MOUNTPOINT}": "%s"}""" % (dev, mountPoint) mountPoint = "" devs.append(dev) mountsFD.close() jsonData += "\n\n]\n}" print(jsonData) Подготовка системы закончена. ===== Настройка zabbix-агента ===== В конфиге агента ничего не обычного, главное прописать свои параметры, один для поиска устройств(с помощью скрипта devs_discovery.py), второй для получения показаний по нужной метрике(с помощью скрипта iostat_parse.sh): UserParameter=custom.disks.discovery_python,/opt/zabbix/devs_discovery.py UserParameter=custom.disks.iostat[*],/opt/zabbix/iostat_parse.sh $1 $2 Первый параметр без аргументов, второй принимает два аргумента - блочное устройство и имя интересующей нас метрики. Теперь перезапускаем агента и тестируем: # zabbix_agentd -t custom.disks.discovery_python custom.disks.discovery_python[/opt/zabbix/devs_discovery.py] [t|{ "data":[ {"{#DEV}": "dm-0", "{#MOUNTPOINT}": "/"}, {"{#DEV}": "sda", "{#MOUNTPOINT}": ""}, {"{#DEV}": "dm-2", "{#MOUNTPOINT}": "/home"}, {"{#DEV}": "sdb", "{#MOUNTPOINT}": ""} ] }] # zabbix_agentd -t custom.disks.iostat[sdb,util] custom.disks.iostat[/opt/zabbix/iostat_parse.sh sdb util] [t|0.00] Если все в порядке, настройка на этом завершена. ===== Настройка zabbix-сервера ===== Все настройки на стороне сервера проводятся через веб-интерфейс. Вначале создаем шаблон(Configuration -> Templates -> Create template), при добавлении которого хосту, на этом хосте будет производиться мониторинг дисковой активности. Ниже представлен скриншот с параметрами, задаем имя шаблона и добавляем его в группу templates. {{ :zabbix:iostat:step1.png?direct&300 |}} Далее создаем приложение iostat (Configuration -> Templates -> Template IOstat Linux -> Applications): {{ :zabbix:iostat:step2.png?direct&300 |}} Теперь создадим регулярное выражение для фильтрации малоинтересных разделов, таких как /boot, /boot/efi и т.д. Назовем его Linux disk filter(Administration -> General -> Regulat expressions -> New regular expression): {{ :zabbix:iostat:step3.png?direct&300 |}} Zabbix поддерживает только posix регулярные выражения, при этом веб-интерфейс поддерживает как posix, так и perl регулярные выражения, что может привести к путанице. Например при составлении рег. выражения оно проходит тестирование в веб-интерфейсе, но по факту не работает, в этом случае надо проверить, соответствует ли оно стандарту posix. Следующий шаг - создание discovery rule, т.е. правила, которое будет автоматически определять устройства и создавать для них указанные элементы(Configuration -> Templates -> Template IOstat Linux -> Discovery): {{ :zabbix:iostat:step3_2.png?direct&300 |}} Здесь важными параметры: * Key - наш собственный ключ, который указали в конфиге агента * Filter - параметры фильтрации объектов, в данном случае в качестве параметра по которому фильтруем - точка монтирования, если она известена, то она отдается агентом с именем параметра MOUNTPOINT, ну и соответственно указывается ранее созданное рег. выражение, которым фильтровать этот параметр. Теперь создаем прототипы источников данных, т.е. на каждое устройство будет создан такой прототип и будет выполнятся коллекционирование данных, ниже приведен пример для метрики await(Configuration -> Templates -> Template IOstat Linux -> Item prototypes -> Create item prototype): {{ :zabbix:iostat:step4.png?direct&300 |}} * Key - тут опять же указывается ранее созданный пользовательский параметр и ему передаются два аргумента: имя блочного устройства(DEV)и имя интересующей нас метрики(await) Параметры rsec/s и wsec/s возвращаются в кбайт, поэтому в прототипе для них нужно задать custom multiplier равный 1024 Таким образом создается нужное кол-во прототипов данных для интересующих метрик. Поддерживаются следующие метрики: rrqm/s, wrqm/s, r/s, w/s, rsec/s, wsec/s, avgrq-sz, avgqu-sz, await, svctm, util. Что они означают можно поглядеть в мануале по iostat. У меня получились следующие прототипы данных: {{ :zabbix:iostat:step5.png?direct&300 |}} И в заключении создаются прототипы графиков. В примере ниже создается график, который отображается скорочть чтения/записи устройства(Configuration -> Templates -> Template IOstat Linux -> Graph prototypes -> Create graph prototype): {{ :zabbix:iostat:step6.png?direct&300 |}} В итоге у меня получилось четыре прототипа графиков: {{ :zabbix:iostat:step7.png?direct&300 |}} ===== Заключение ===== Полученный результат можно увидеть на скриншотах ниже. {{:zabbix:iostat:result1.png?direct&300|}} {{:zabbix:iostat:result2.png?direct&300|}} {{:zabbix:iostat:result3.png?direct&300|}} {{:zabbix:iostat:result4.png?direct&300|}} ===== Использованная литература ===== - [[http://michael.nomanlab.org/2012/09/zabbix-iostat.html|ZABBIX & IOSTAT. Мониторим диски]] - [[http://virtuallyhyper.com/2013/06/monitor-disk-io-stats-with-zabbix/|Monitor Disk IO Stats with Zabbix]] - [[https://www.zabbix.com/documentation/2.2/manual/discovery/low_level_discovery|Low-level discovery]]