Инструменты пользователя

Инструменты сайта


zabbix_raid

Различия

Показаны различия между двумя версиями страницы.

Ссылка на это сравнение

zabbix_raid [2014/02/21 17:29]
metallic [Ссылки]
zabbix_raid [2022/03/25 17:00]
Строка 1: Строка 1:
-====== Введение ====== 
-Есть у меня в парке серверов множество различных рейд-контроллеров, в том числе софтовых(mdadm). У каждого из них имеются различные средства мониторинга, но хотелось бы все это отслеживать централизовано, например через zabbix, а в случае изменения состояния любого из массивов - получать уведомления, например по почте. Данная статья не является пошаговым руководством, а представляет из себя набор заметок на память для различных контроллеров. В каждом подразделе описана техника получения информации о состоянии массивов zabbix-агентом. 
  
-===== mdadm ===== 
- 
-В Linux mdadm есть файл /proc/mdstat, в котором содержится информаци о всех массивах и их состоянии. У каждого массива есть вот такое текстовое обозначение: [UU] (кол-во букв U зависит от кол-ва дисков в массиве). Если один или более дисков выходит из строя, то вместо буквы U появляется знак подчеркивания: _ Соответственно ищем подобные массивы и подсчитываем их кол-во, если их больше 0, то поднимаем панику. В конфиге агента добавляем такой пользовательский параметр: 
- 
-  UserParameter=custom.softraid.status,egrep -c "\[.*_.*\]" /proc/mdstat 
-   
-И тестируем: 
- 
-  # zabbix_agentd -t custom.softraid.status 
-  custom.softraid.status[egrep -c "\[.*_.*\]" /proc/mdstat] [t|0] 
-   
-Как видно, параметр вернул ноль( [t|0] ), все нормально. 
- 
-===== 3Ware ===== 
- 
-Для мониторинга контроллеров 3ware (теперь уже LSI) понадобится утилита 3w_cli, скачать ее можно с оф. сайта производителя контроллера, либо поставить из стороннего репозитория(в случае с debian): [[http://hwraid.le-vert.net|hwraid]]. 
- 
-Утилита 3w_cli работает только из под рута, поэтому нужно установить sudo и в конфиге разрешить забиксу без пароля запуск утилиты, добавляем в конец /etc/sudoers: 
- 
-  zabbix  ALL=(ALL) NOPASSWD:/opt/3ware/CLI/tw_cli 
-   
-Теперь добавляем в конфиг забикса пользовательский параметр: 
- 
-  UserParameter=custom.3ware.status,sudo /opt/3ware/CLI/tw_cli /c0 show allunitstatus | grep "Not Optimal" | awk '{print $6}' 
- 
-Этот параметр аналогичным образом подсчитывает кол-во массивов(на первом контроллере), которое имеет статус "Not Optimal". Если в сервере установлено несколько контроллеров, то можно будет сделать скрипт с несколькими подобными командами и в конце сумировать результат. 
- 
-Проверяем работоспособность: 
- 
-  # zabbix_agentd -t custom.3ware.status 
-  custom.3ware.status[sudo /opt/3ware/CLI/tw_cli /c0 show allunitstatus | grep "Not Optimal" | awk '{print $6}'] [t|0] 
-   
-Все массивы в норме ([t|0]). 
-===== Adaptec ===== 
- 
-Для мониторинга контроллеров Adaptec понадобится утилита arcconf, скачать ее можно с оф. сайта производителя контроллера, либо поставить из стороннего репозитория(в случае с debian): [[http://hwraid.le-vert.net|hwraid]]. 
- 
-В конфиг zabbix-агента добавляем следующий пользовательский параметр: 
- 
-  UserParameter=custom.adaptec.status,/opt/adaptec/arcconf GETCONFIG 1 | grep "Status of logical device" | grep -cv Optimal 
-   
-Этот параметр производит подсчет кол-ва массивов первого контроллера, статус которых отличается от "Optimal". Если в системе более одного контроллера, то нужно создать скрипт, который будет выполнять подобную команду для каждого контроллера и суммировать результат. 
- 
-Проверяем: 
- 
-  # zabbix_agentd -t custom.adaptec.status 
-  custom.adaptec.status[/opt/adaptec/arcconf GETCONFIG 1 | grep "Status of logical device" | grep -cv Optimal] [t|0] 
-   
-Все нормально, кол-во отказавших массивов ноль ([t|0]). 
- 
-===== LSI(IBM) ===== 
- 
-В серверах IBM серии X, например x3650 ставят контроллеры LSI, которые управляются утилитой megacli, скачать ее можно с сайта IBM(например ibm_utl_sraidmr_megacli-8.04.10_linux_32-64.zip). Есть пакеты только для redhat и suse, но не составляет труда конвертировать их в deb с поомщью alien. Делается это командой: 
- 
-  # alien --scripts _pakage_name_.rpm 
-   
-После конвертирования устанавливаем пакеты и добавляем пользовательский параметр в zabbix-агент: 
- 
-  UserParameter=custom.lsi.status,megacli -LDInfo -Lall -aAll | grep State | grep -vc Optimal 
-   
-Этот параметр выполняет подсчет всех массивов со статусом отличным от "Optimal" 
- 
-Проверяем: 
- 
-  # zabbix_agentd -t custom.lsi.status 
-  custom.lsi.status[megacli -LDInfo -Lall -aAll | grep State | grep -vc Optimal] [t|0] 
- 
-===== LSI(Intel) ===== 
- 
-В некоторых сервера с мат. платами intel устанавливали интегрированные контроллеры axx4sasmod. Управлять и мониторить их можно с помощью RAID Web Console 2(не понятно, почему она называется Web, когда работает не через браузер, а требует установки на клиенте), либо с помощью snmp. Команднострочная утилита CmdTool2 почему-то контроллер не обнаружила. Корректно настроить работу через snmp на Debian мне не удалось, как это сделать на редхат-подобных описано в статье, ссылка на которую дана ниже. 
- 
-===== Пример создания тригера ===== 
- 
-===== Ссылки ===== 
- 
-  - [[http://www.alsigned.ru/?p=2556|Мониторинг LSI MegaRAID по SNMP]] 
-  - [[http://hwraid.le-vert.net/wiki/DebianPackages| HWRAID]] 
-  - [[https://wiki.debian.org/LinuxRaidForAdmins|LinuxRaidForAdmins]] 
-  - [[http://lab4.org/wiki/Zabbix_3ware_raidcontroller_ueberwachen|Zabbix 3ware raidcontroller ueberwachen]] 
-  - [[http://blog.nexcess.net/2010/12/28/managing-hardware-raid-with-megacli/|Managing hardware RAID with MegaCLI]] 
-  - [[http://undefinederror.org/installing-intel-raid-web-console-2-ubuntu/|Installing Intel Raid Web Console 2 on Ubuntu]] 
-  - [[https://downloadcenter.intel.com/Detail_Desc.aspx?lang=rus&changeLang=true&DwnldID=18441|Программа RAID Web Console 2 для ОС Linux]] 
-  - [[https://downloadcenter.intel.com/Detail_Desc.aspx?agr=Y&DwnldID=23474&keyword=Command+Line+Tool+for+linux&lang=eng|Command Line Tool 2]] 
zabbix_raid.txt · Последнее изменение: 2022/03/25 17:00 (внешнее изменение)