Инструменты пользователя

Инструменты сайта


zabbix_raid

Различия

Показаны различия между двумя версиями страницы.

Ссылка на это сравнение

Предыдущая версия справа и слева Предыдущая версия
Следующая версия
Предыдущая версия
zabbix_raid [2017/01/20 12:04]
metallic [LSI]
zabbix_raid [2022/03/25 17:00] (текущий)
Строка 46: Строка 46:
 В конфиг zabbix-агента добавляем следующий пользовательский параметр: В конфиг zabbix-агента добавляем следующий пользовательский параметр:
  
-  UserParameter=custom.adaptec.status,sudo arcconf GETCONFIG 1 | grep "Status of logical device" | grep -cv Optimal+  UserParameter=custom.adaptec.status,sudo arcconf GETCONFIG 1 | grep -i "Status of logical device" | grep -cv Optimal
      
 Этот параметр производит подсчет кол-ва массивов первого контроллера, статус которых отличается от "Optimal". Если в системе более одного контроллера, то нужно создать скрипт, который будет выполнять подобную команду для каждого контроллера и суммировать результат. Этот параметр производит подсчет кол-ва массивов первого контроллера, статус которых отличается от "Optimal". Если в системе более одного контроллера, то нужно создать скрипт, который будет выполнять подобную команду для каждого контроллера и суммировать результат.
Строка 54: Строка 54:
   # zabbix_agentd -t custom.adaptec.status   # zabbix_agentd -t custom.adaptec.status
   custom.adaptec.status[/opt/adaptec/arcconf GETCONFIG 1 | grep "Status of logical device" | grep -cv Optimal] [t|0]   custom.adaptec.status[/opt/adaptec/arcconf GETCONFIG 1 | grep "Status of logical device" | grep -cv Optimal] [t|0]
-  +
 Все нормально, кол-во отказавших массивов ноль ([t|0]). Все нормально, кол-во отказавших массивов ноль ([t|0]).
 +  
 +Со стороны сервера:
 +  # zabbix_get -s X.X.X.X -k "custom.adaptec.status"
 +  0
 +  
  
 ===== LSI ===== ===== LSI =====
Строка 76: Строка 81:
   custom.lsi.status[MegaCli64 -LDInfo -Lall -aAll | grep State | grep -vc Optimal] [t|0]   custom.lsi.status[MegaCli64 -LDInfo -Lall -aAll | grep State | grep -vc Optimal] [t|0]
  
-===== LSI(Intel=====+===== Intel =====
  
 В некоторых сервера с мат. платами intel устанавливали интегрированные контроллеры axx4sasmod. Управлять и мониторить их можно с помощью RAID Web Console 2(не понятно, почему она называется Web, когда работает не через браузер, а требует установки на клиенте), либо с помощью snmp. Команднострочная утилита CmdTool2 почему-то контроллер не обнаружила. Корректно настроить работу через snmp на Debian мне не удалось, как это сделать на редхат-подобных описано в статье, ссылка на которую дана ниже. В некоторых сервера с мат. платами intel устанавливали интегрированные контроллеры axx4sasmod. Управлять и мониторить их можно с помощью RAID Web Console 2(не понятно, почему она называется Web, когда работает не через браузер, а требует установки на клиенте), либо с помощью snmp. Команднострочная утилита CmdTool2 почему-то контроллер не обнаружила. Корректно настроить работу через snmp на Debian мне не удалось, как это сделать на редхат-подобных описано в статье, ссылка на которую дана ниже.
Строка 102: Строка 107:
 Нажимаем сохранить(Save). Нажимаем сохранить(Save).
  
 +===== Решение проблем =====
 +Если сервер не получает данные по рейду(в веб-интерфейсе в разделе latest data ничего нет, а должен быть 0), то в первую очередь нужно проверить что файл /etc/sudoers.d/zabbix создан и симлинк из /opt/... сделан в /usr/sbin/... Иначе будет такая ошибка:
 +
 +  Мы полагаем, что ваш системный администратор изложил вам основы
 +  безопасности. Как правило, всё сводится к трём следующим правилам:
 +  
 +      №1) Уважайте частную жизнь других.
 +      №2) Думайте, прежде что-то вводить.
 +      №3) С большой властью приходит большая ответственность.
 +  
 +  sudo: нет tty и не указана программа askpass
 +
 +Также была проблема с arcconf, он очень долго выполняется(5-6 секунд) и срабатывает таймаут сервера, по-умолчанию он 4 секунды. Ошибка очень не очевидная, потому как при тестировании через командную строку все срабатывает штатно, увидеть это я смог только при тестировании через веб-интерфейс: в разделе "Configuration -> Templates" выбираем нужный темплат и заходим в "Items -> Number of faild Adaptec devices", внизу нажимаем кнопку "Test" и в появившемся окне указываем адрес хоста, порт и нажимаем "Get Value". Если все в порядке, мы должны получить в поле Value 0, если нет, там будет сообщение об ошибке, либо как на скрине ниже, сообщение о таймауте.
 +
 +{{ :zabbix:raid:zabbix_web_test.png?direct&600 |}}
 +
 +Чтобы это избежать на стороне клиента и сервера увеличиваем Timeout хотя бы до 10 секунд.
  
 ===== Ссылки ===== ===== Ссылки =====
zabbix_raid.1484903060.txt.gz · Последнее изменение: 2022/03/25 17:04 (внешнее изменение)