Содержание
Мониторинг дисковой активности с помощью zabbix
Введение
Как мониторить дисковую активность с помощью zabbix писалось уже не раз, но ни один из вариантов меня полностью не устроил и я взял что-то из одного рецепта, что-то из другого, а что-то реализовал сам. В итоге получилось решение, которое устраивает меня и чтобы не забыть как я это сделал было решено задокументировать :) На все сторонние скрипты и идеи в конце статьи указаны ссылки.
Для мониторинга используется утилита iostat из пакета sysstat. Она в течерии минуты записывает показания в файл(с интервалом в одну секунду), а затем zabix-агент считывает среднеарифмитическое. Для автоподключения дисков к мониторингу был написан свой скрипт, который выполняет поиск блочных устройств, но не просто всех имеющихся, а по определенным, нужным мне критериям, т.е. поиск начинается с просмотра всех примонтированных файловых систем и определения их блочных устройств, далее если это логические устройства, они отсекаются, например вместо sda1 и sda2 будет мониториться только sda и т.д.
Подготовка хоста
Устанавливаем пакет sysstat. С помощью утилиты iostat из этого пакета будем собирать статистику загруженности дисков и сохранять в файл.
# apt-get install sysstat
Далее создаем скрипт, который будет собирать данные в течении 55с и сохранять их в файл /opt/zabbix/iostat_collect.sh:
#!/bin/bash
# Script for iostat monitoring
# Author Epikhin Mikhail
# michael at nomanlab.org
SECONDS=55
TOFILE=/tmp/iostat.log
IOSTAT=/usr/bin/iostat
DISK=$($IOSTAT -x 1 $SECONDS | awk 'BEGIN {check=0;} {if(check==1 && $1=="avg-cpu:"){check=0}if(check==1 && $1!=""){print $0}if($1=="Device:"){check=1}}' | tr '\n' '|')
echo $DISK | sed 's/|/\n/g' > $TOFILE
echo 0
Добавляем этот скрипт в крон, чтобы он выполнялся каждую минуту /etc/crontab:
- * * * * root /opt/zabbix/iostat_collect.sh
И перезапускаем крон:
# /etc/init.d/crond restart
Теперь каждую минуту в файле /tmp/iostat.log будет появляться ежесекундная статистика по загрузке дисков.
Далее создаем скрипт, который будет парсить этот лог и считать среднеарифмитическое для заданного диска и заданного параметра /opt/zabbix/iostat_parse.sh:
#!/bin/bash
# Script for disk monitoring
# Author Epikhin Mikhail
# michael.nomanlab.org
# version 1.1
NUBMER=100500
FROMFILE=/tmp/iostat.log
DISK=$1
METRIC=$2
case "$2" in
"rrqm/s")
NUMBER=2
;;
"wrqm/s")
NUMBER=3
;;
"r/s")
NUMBER=4
;;
"w/s")
NUMBER=5
;;
"rsec/s")
NUMBER=6
;;
"wsec/s")
NUMBER=7
;;
"avgrq-sz")
NUMBER=8
;;
"avgqu-sz")
NUMBER=9
;;
"await")
NUMBER=10
;;
"svctm")
NUMBER=11
;;
"util")
NUMBER=12
;;
esac
cat $FROMFILE | grep $DISK | tail -n +2 | tr -s ' ' | cut -f$NUMBER -d' ' | awk 'BEGIN {sum=0.0;count=0;} {sum=sum+$1;count=count+1;} END {printf("%.2f\n", sum/count);}'
#iostat -x | grep $1 | tr -s ' ' | cut -f$NUMBER -d' '
И еще один скрипт, которые будет выполнять поиск использующихся устройств /opt/zabbix/devs_discovery.py:
#!/usr/bin/env python
import os
import re
devs = []
mountsFD = open("/proc/mounts", "ro")
mounts = mountsFD.readlines()
jsonData = '{\n"data":[\n\n'
mountPoint = ''
md = re.compile('^md[0-9]+$')
for line in mounts:
if line.startswith("/dev"):
lineParts = line.split(" ")
mountPoint = lineParts[1]
if "/dev/mapper/" in lineParts[0]:
dev = os.readlink(lineParts[0]).split("../")[1]
else:
dev = lineParts[0].split("/dev/")[1]
# if not MD-drive
if not md.match(dev):
# removing numbers from string
dev = ''.join([i for i in dev if not i.isdigit()])
mountPoint = ""
if dev not in devs:
if jsonData != '{\n"data":[\n\n':
jsonData += ',\n'
jsonData += """{"{#DEV}": "%s", "{#MOUNTPOINT}": "%s"}""" % (dev, mountPoint)
mountPoint = ""
devs.append(dev)
mountsFD.close()
jsonData += "\n\n]\n}"
print(jsonData)
Подготовка системы закончена.
Настройка zabbix-агента
В конфиге агента ничего не обычного, главное прописать свои параметры, один для поиска устройств(с помощью скрипта devs_discovery.py), второй для получения показаний по нужной метрике(с помощью скрипта iostat_parse.sh):
UserParameter=custom.disks.discovery_python,/opt/zabbix/devs_discovery.py UserParameter=custom.disks.iostat[*],/opt/zabbix/iostat_parse.sh $1 $2
Первый параметр без аргументов, второй принимает два аргумента - блочное устройство и имя интересующей нас метрики.
Теперь перезапускаем агента и тестируем:
# zabbix_agentd -t custom.disks.discovery_python
custom.disks.discovery_python[/opt/zabbix/devs_discovery.py] [t|{
"data":[
{"{#DEV}": "dm-0", "{#MOUNTPOINT}": "/"},
{"{#DEV}": "sda", "{#MOUNTPOINT}": ""},
{"{#DEV}": "dm-2", "{#MOUNTPOINT}": "/home"},
{"{#DEV}": "sdb", "{#MOUNTPOINT}": ""}
]
}]
# zabbix_agentd -t custom.disks.iostat[sdb,util]
custom.disks.iostat[/opt/zabbix/iostat_parse.sh sdb util] [t|0.00]
Если все в порядке, настройка на этом завершена.
Настройка zabbix-сервера
Все настройки на стороне сервера проводятся через веб-интерфейс. Вначале создаем шаблон(Configuration → Templates → Create template), при добавлении которого хосту, на этом хосте будет производиться мониторинг дисковой активности. Ниже представлен скриншот с параметрами, задаем имя шаблона и добавляем его в группу templates.
Далее создаем приложение iostat (Configuration → Templates → Template IOstat Linux → Applications):
Теперь создадим регулярное выражение для фильтрации малоинтересных разделов, таких как /boot, /boot/efi и т.д. Назовем его Linux disk filter(Administration → General → Regulat expressions → New regular expression):
Следующий шаг - создание discovery rule, т.е. правила, которое будет автоматически определять устройства и создавать для них указанные элементы(Configuration → Templates → Template IOstat Linux → Discovery):
Здесь важными параметры:
- Key - наш собственный ключ, который указали в конфиге агента
- Filter - параметры фильтрации объектов, в данном случае в качестве параметра по которому фильтруем - точка монтирования, если она известена, то она отдается агентом с именем параметра MOUNTPOINT, ну и соответственно указывается ранее созданное рег. выражение, которым фильтровать этот параметр.
Теперь создаем прототипы источников данных, т.е. на каждое устройство будет создан такой прототип и будет выполнятся коллекционирование данных, ниже приведен пример для метрики await(Configuration → Templates → Template IOstat Linux → Item prototypes → Create item prototype):
- Key - тут опять же указывается ранее созданный пользовательский параметр и ему передаются два аргумента: имя блочного устройства(DEV)и имя интересующей нас метрики(await)
Таким образом создается нужное кол-во прототипов данных для интересующих метрик. Поддерживаются следующие метрики: rrqm/s, wrqm/s, r/s, w/s, rsec/s, wsec/s, avgrq-sz, avgqu-sz, await, svctm, util. Что они означают можно поглядеть в мануале по iostat. У меня получились следующие прототипы данных:
И в заключении создаются прототипы графиков. В примере ниже создается график, который отображается скорочть чтения/записи устройства(Configuration → Templates → Template IOstat Linux → Graph prototypes → Create graph prototype):
В итоге у меня получилось четыре прототипа графиков:












