RAID Monitoring mit Nagios
Geschrieben von andy • Mittwoch, 25. März 2009 • Kategorie: combjutaVor kurzem schrieb ich über einen Festplatten Ausfall in einem Software Raid.
Dieser Ausfall wurde einem Nagios Überwachungssystem gemeldet, mit welchem wir unsere Server überwachen. Als RAID Systeme kommen "normale" Linux Software Raids mit md devices und ein Server mit einem 3ware Hardware Raid (3ware Inc 8000-series) zum Einsatz.
Für das 3Ware Raid verwenden wir das check3wareraid von nagiosexchange.org. Dafür muss wie im Artikel beschrieben noch sudoers um "nagios ALL=(ALL) NOPASSWD: /path/to/check3wareraid" erweitert werden. Der Check selbst wird dann beispielsweise im nrpe Client über ein Wrapper Skript ausgeführt, welches ein "sudo /path/to/check3wareraid" ausführt.
Zur Ausführung benötigt man noch das 3ware Command Line Interface (CLI). Für Debian bekommt man das einfach über debian-unoffical mirror, der noch zu den apt-Sourcen hinzugefügt werden muss:
# For getting 3dm2-package for 3ware
deb http://ftp.debian-unofficial.org/debian sid main contrib non-free restricted
Nach einem
apt-get update && apt-get install 3ware-3dm2-binary 3ware-cli-binary
befinden sich die benötigten Binaries auf eurem Server und die Funktion lässt sich mit dem Aufruf von
twcli /c0 show
Unit UnitType Status %Cmpl Stripe Size(GB) Cache AVerify IgnECC
------------------------------------------------------------------------------
u0 RAID-1 OK - - 698.637 ON - -
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 698.63 GB 1465149168 5QD2DXQ8
p1 OK u0 698.63 GB 1465149168 5QD0XX6A
testen.
Software Raids werden mit dem einfachen checkmd_raid überwacht. Dazu wird der Check einfach als command oder im nrpe Client hinzugefügt und ausgeführt. Allerdings schreit er schon mit Critical, wenn nur ein Device Critical ist, und dies kann man auch nicht konfigurieren oder auf bestimmte md devices eingrenzen.
| Top Exits (595)








0 Kommentare
Kommentar schreiben