(SNMP) Monitoring der Heimnetz-Geräte

tiermutter

Well-known member
Moin zusammen,

aufgrund dieser Thematik https://forum.heimnetz.de/threads/librenms-auswertung-nicht-vollstaendig.531/ musste ich mich zuletzt etwas mehr mit dem Monitoring meiner Geräte beschäftigen.

@rednag hatte mir LibreNMS einst eingerichtet und seither nutze ich gelegentlich, selten benötige ich aber wirklich die aufgezeichneten Daten.
Aufgrund der aktuellen Problematik habe ich mir zwangsläufig auch mal (kurz) andere Monitoring Tools angesehen. Natürlich kam dabei die Frage auf, was ihr denn so verwendet und wo ihr Pro und Cons seht.
Für mich und mein Heimnetz ist dabei selbstredend: es muss gratis sein.

1. LibreNMS
Selbst installiert habe ich es nie, das hat ja @rednag gemacht, daher kann ich nicht viel dazu sagen, außer dass es durchaus einige Anleitungen dazu gibt.
Mir gefällt die Übersicht von LibreNMS sehr gut, da man viele Infos mehrerer Geräte auf einen Blick erhält und bei Bedarf ins Detail gehen kann; auch dann gestalten sich die Informationen und Grafiken übersichtlich und verständlich.
Die Bedienung und Einrichtung (nach der Installation) ist ebenfalls sehr komfortabel. Um Geräte zu überwachen muss man quasi nur IP und SNMP Daten des zu überwachenden Geräts angeben und schon hat man automatisch (fast) alle wünschenswerten Daten wie Auslastung von CPU, RAM und Disks, Temperaturen, etc. übersichtlich dargestellt. Fehlt einem doch noch eine Info, so kann man diese manuell über Custom OIDs abrufen, sofern das zu überwachende Gerät diese Daten bereitstellt.

Für mich landet LibreNMS, ein Fork (Abspaltung) von Obersvium daher auf dem ersten Platz in diesem Miniranking.

2. Observium
Observium gestaltet sich ähnlich wie LibreNMS und ist demnach auch sehr übersichtlich. Für die Installation (samt Webserver und Datenbank) wird ein Script bereitgestellt für unterschiedliche Betriebssysteme bereitgestellt, damit geht das entsprechend sehr leicht von der Hand (getestet unter Ubuntu).
Etwas störend finde ich, dass manche Funktionen (wie zB das dunkle Design, was mir sehr wichtig ist) nicht in der kostenlosen Version verfügbar sind. Genauer gesagt sind sie schon verfügbar, haben aber ohne jeglichen Hinweis keine Funktion. Auch die Verwendung von SNMPv3, zumindest mit "NoAuthNoPriv", ist nicht möglich (ob dies mit der kostenlosen Version zusammenhängt ist mir unklar), da man schlichtweg keinen SNMP User angeben kann.

Von dem allem abgesehen ist dieses Tool für mich aber durchaus eine gute Alternative zu LibreNMS.

3. Zabbix
Ich habe leider zu spät erfahren, dass es bei QNAP eine fertige VM im Marketplace gibt... Damit hätte ich mir einiges an Zeit gespart.
Auch hier existieren entwicklerseitige Anleitungen für die Installation, welche teils scriptgestützt ist, sodass man zumindest theoretisch wenig Arbeit mit der der Installation hat.
In der Praxis zeigte sich zumindest unter Debian 11 jedoch, dass hier etwas nicht stimmig ist. So mussten manche Schritte anders ausgeführt werden als angegeben, vir allem aber machte mir die enthaltene MySQL Version zu schaffen. Nachdem ich MySQL vor der eigentlichen Zabbix Installation (die MySQL offensichtlich nicht sauber beinhaltet) installiert habe, durfte ich mich dann aber schon bald der GUI von Zabbix erfreuen.
Wobei "erfreuen" sehr übertrieben bis gelogen ist. Zumindest für mich war die Oberfläche sehr unübersichtlich strukturiert, ohne Anleitungen und Hinweise hätte ich es wohl kaum geschafft überhaupt ein Gerät hinzuzufügen. Allein damit ist es aber noch nicht getan, zumindest nicht, wenn man auf dem zu überwachenden Gerät nicht den Zabbix Agent installiert hat. Denn möchte man mittels SNMP überwachen, muss man anders als bei den Vorgängern jede OID manuell eintragen, wozu man vorher die entsprechende MIB mühevoll auslesen muss; das Einlesen einer entsprechenden MIB ist nicht möglich.
Einmal eingetragen, liefert Zabbix immerhin zuverlässig die Werte, allerdings bin ich nicht dahintergekommen, wo ich entsprechende Graphen über den Verlauf dazu finde. Auch die Ist-Werte zu finden war für mich sehr gewöhnungsbedürftig.

Alles in allem muss ich den Versuch mit Zabbix für mich als verlorene Zeit verbuchen. Für mich ist das überhaupt nichts. Ich glaube dennoch, dass Zabbix für User die mehr Zeit investieren wollen und wahrscheinlich auch etwas versierter sind als ich, ein gutes Monitoringtool darstellt. Bei mir wären es nur die QNAP NAS gewesen, welche ein third-party Zabbix Agent beinhalten, sowie meine OPNsense, daher war meine Erfahrung nach der langen Installation mit Problemen doch sehr kurz.

4. Paessler PRTG
Ich kann, darf und werde mir hierzu kein Urteil erlauben, führe es dennoch kurz auf.
Das Tool läuft scheinbar nur unter Windows, was es für mich unbrauchbar macht. Dennoch habe ich es (mal wieder) installiert um es mir anzusehen. "Mal wieder", weil ich es schonmal installiert hatte, wie ich mich erinnerte als ich die Oberfläche sah. Schlecht ist diese nicht gemacht, aber irgendwie verspürte ich eine Art Abneigung, die mich dazu veranlasste, PRTG unverzüglich wieder zu deinstallieren. Auch hier erinnerte ich mich: Das war das Mal davor genauso.

Dennoch gibt es aber sicherlich Fälle und User, wo PRTG seine Berechtigung hat und seine Aufgaben wohl auch sehr gut erfüllt. Übersichtlich scheint es jedenfalls zu sein.


Also... Was verwendet ihr und was sollte man ich mir mal anschauen?
 
Zu Hause verwende ich nichts :LOL:. Da lasse ich mich rein von e-Mails bombardieren.
Alles, was kein "Warning" oder "Error" im Betreff/Text hat, wird wegkopiert (automagisch) und alle paar Wochen gelöscht (manuell).
Nur die so verbliebenen Nachrichten schau ich mir dann an. Ansonsten kriege ich es meist sehr schnell mit, wenn etwas aus der Reihe tanzt.
Aber SNMP oder Syslog, das ist mir zuviel Mühe für die paar Geräte. ;)

Gruss
 
Zuletzt bearbeitet:
Nagios, Icinga, OpenNMS, check_mk, Cacti, Monit, usw. (hier lassen wir noch eine Sache raus, damit @rednag noch was dazu packen kann (Hint: "P+G" 🤪). Es gibt es zig Sachen, man sollte sich nur gut überlegen, dass Monitoring auch einen Haufen Arbeit macht. Sicherlich kann man sich über alles informieren lassen, aber dann kriegt man halt auch "alles". Sehr schön passt da der Satz von @FSC830:
Da lasse ich mich rein von e-Mails bombadieren.
Via SNMP kriegt man "auf die schnelle" zwar sehr viele Infos über die internen Metriken eines Systems (CPU, RAM, HDD, etc.), via SNMP-Extend lässt sich sowas auch noch durch eigene Scripte erweitern, aber "mal eben" einen externen Port-Check machen, funktionert halt nicht "mal eben". Via Nagios/Icinga ist das z.B. innerhalb einer kurzen Textdatei sehr schnell eingerichtet (passiver Check). Active Checks (auf den Zielsystemen selbst) finden dagegen meist via Agent statt (sowas gibt es z.B. für Cacti wiederum nicht). Zabbix hingegen macht dagegen alles via Webinterface (bei Icinga z.B. via Director noch nachträglich möglich).

Alles in allem sollte man sich aber sehr gut - im Vorfeld - überlegen, was man eigentlich genau möchte. So kommen bei mir z.B. diverse Systeme zum Einsatz, wobei Observium/LibreNMS primär zwecks Langzeitstatistiken und Traffic-Messungen genutzt wird und diese Systeme für mich nicht unter das "typische" Monitoring fallen, denn "typisches" Monitoring bedeutet für mich nach wie vor (und das wird sich wohl auch so halten), dass aktiv und konfigurierbar "diverses" geprüft werden kann und ich auf entsprechenden Kanälen unter bestimmten Bedingungen informiert werde.

Ein "einfaches" Beispiel wäre z.B. eine Webseite auf einem Server. Mich interessiert: Ist der Server einwandfrei erreichbar (Ping-Zeiten), sind bestimmte Ports verfügbar bzw. läuft ein entsprechender Dienst (z.B. Port 443/TCP). Für die meisten ist das dann schon in Ordnung, für mich nicht. Nur weil der Dienst auf dem Port reagiert, heisst das ja noch lange nicht, dass die Webseite auch fehlerfrei ausgeliefert wird. Also wäre der nächste Check dann noch derjenige welche, der überprüft, ob auch bestimmte Inhalte auf der Webseite vorhanden sind, so dass ich davon ausgehen kann, dass die Website korrekt ausgeliefert wird. Will man es noch bunter treiben, kann man auch Logins auf der Webseite testen, oder z.B. die interne Suche auf der Website, etc.

Im Falle eines HomeAssistant wäre es - meiner Meinung nach - also "nicht" ausreichend, einfach nur zu schauen, ob der z.B. Raspi auf einen Ping reagiert. HomeAssistant muss laufen und muss auch in der Lage sein, bestimmte Dinge erledigen zu können. Als Beispiel könnte man dort einfach mal prüfen, ob sich z.B. ein Lichtschalter in die verschiedenen Stati (ein/aus) versetzen lässt.

Da sich das ganze auf zig Sachen umlegen lässt und man immer tiefer buddeln könnte, steht hier natürlich wieder Aufwand gegen Nutzen. Theoretisch könnte man auch via HomeAssistant und ping-Sensor von einem "Monitoring" sprechen (man könnte sich dabei ja auch benachrichten lassen), aber... "naja" 😁

Fakt ist jedenfalls: "Monitoring" ist nicht "mal eben" gemacht. Dinge wie LibreNMS sind sehr schnell installiert, eingerichtet und funktionstüchtig. Die Endgeräte sind auch recht schnell im Monitoring (SNMP einrichten, in z.B. LibreNMS werfen und ab warten) und man hat halt recht schnell die ersten Ergebnisse. Ob das alles dem entspricht, was man gerne hätte.... naja, jedenfalls hat man recht flott viele bunte Graphen und vermutlich ist sowas auch für die meisten einfacher, als sich mit Graphana und einer z.B. InfluxDB rumzuprügeln, was auch ein Grund war, warum ich das @rednag empfohlen habe (für "schnell bunte Graphen) 😁 Observium ist zwar recht ähnlich, ist vom Support verschiedener Geräte aber nicht so umfangreich (aufgrund der Spezialisierung auf professionelle (meist kabelgebundene) Netzwerk-Hardware).

Wo wir beim Thema "mit Mails bombardieren" waren... Man sollte sich auch sehr gut überlegen "wann" man sich benachrichten lässt. Nur weil mal eine handvoll Pings ins Leere laufen (z.B. Geräte-Reboot) sollte man sich nicht gleich zumailen lassen. Soll das System dauerhaft laufen, wäre es da z.B. sinnvoller, wenn man den Zeitraum auf 5 oder gar 15 Minuten setzt (so kriegt man auch keine Benachrichtigung, wenn die Kiste z.B. mal Firmware-Updates fährt samt Reboot), usw. Ist also auch schon ein wenig Denksport im Vorfeld notwendig 😉

Wenn jemand sowas ernsthaft implementieren will, sollte man sich erstmal ausgiebig mit den Eigenheiten der Systeme beschäftigen, da würde ich durchaus eine Woche bis einen Monat für ansetzen (nicht in Vollzeit, aber immer wieder so nebenbei). Wenn es an die grösseren Systeme geht, wird man sich wesentlich länger damit beschäftigen müssen (vor allem, wenn man noch keine Ahnung von der Materie als solches hat). Wenn man nicht grade von simplen SNMP-Requests und/oder -Traps ausgeht, die einfach alles einsacken, was die Systeme hergeben und Benachrichten aussen vor lässt, fährt man halt mit diesen primär SNMP-lastigen Systemen schon ganz gut, was vermutlich auch der Grund sein wird, warum das hier einige laufen haben. Ist halt auch anfängerfreundlich 🙂

EDIT: Wo @FSC830 noch Syslog erwähnt hat... Vielleicht wäre sowas auch erstmal primär wichtiger als bunte Bildchen (jaja, ich weiss schon, jetzt schreit die Belegschaft wieder, dass nichts wichtiger sein kann, als bunte Bildchen 🤪😁), aber zentralisiertes Logging hat einiges für sich und auch dort kann man sich über bestimmte Dinge informieren lassen (aber halt auch wieder nicht über "alles"). Interessant ist sowas vor allem, wenn das System kurz vor dem Tode noch ein paar Meldungen raushaut und danach stirbt. An die Logs kommt man dann nicht mehr so einfach, sind diese dann aber schon auf dem Syslog-Server gelandet, kann man dort problemlos nachschauen.
 
Monit habe ich übrigens auch im Einsatz, aber nur für die OPNsense (self hostet) um die Erreichbarkeit der Gateways zu überwachen und um AdGuard neu zu starten, falls es versagt.
Ansonsten ist "Monitoring" für mich auch eher auf längere Sicht interessant. ZB wollte ich letztens prüfen wie diverse Verläufe waren (Auslastung, Temperaturen) als eins meiner NAS Probleme hatte. Hier stehe ich also eindeutig auf bunte Graphen :D
Alarme habe ich (von Monit abgesehen) keine eingerichtet, hier "verlasse" ich mich wie @FSC830 auf die entsprechenden Meldungen der Geräte, und wenn das auch nicht mehr geht... Pech. Dennoch führt LibreNMS dazu, dass ich immer mal wieder ein Auge auf die Geräte und dessen Werte habe, was ich sonst nicht hätte.

Also ja: "Mein" Monitoring ist eher Spielerei, die selten von bedeutsamen Nutzen ist... Verzichten will ich aber nicht mehr darauf.
 
ZB wollte ich letztens prüfen wie diverse Verläufe waren (Auslastung, Temperaturen) als eins meiner NAS Probleme hatte.
Ja, für sowas sind langfristig angelegte Statistiken wirklich super, auch um vor der Anschaffung der nächsten Platten (mit Hinblick auf z.B. die nächsten 5 Jahre) auch vernünftig den zukünftigen Platzbedarf kalkulieren zu können.

dass ich immer mal wieder ein Auge auf die Geräte und dessen Werte habe
Bei mir eher weniger, wenn etwas ist, werde ich sowieso aktiv darüber benachrichtigt, ansonsten schaue ich bei den Statistiken nur genau die Dinge, die mich auch wirklich interessieren (ggf. nochmal kurz auf die WAN-Traffic-Statistik, aber das war's dann auch schon). Liegt mitunter aber auch an der Anzahl der Geräte, welche man drin hat... ich schaue da schon lange nicht mehr "alles" durch, sondern nur gezielt bei Bedarf 🙃

selten von bedeutsamen Nutzen
Heisst ja nur, dass nicht so oft was passiert, was ja schlussendlich auch wieder gut ist. Selbst wenn so ein Monitoring nur einmal im Jahr zuckt, umso besser, ist ja - bis auf das eine mal - quasi nix passiert 😁 (Allerdings sollte man zwischendurch auch mal testen und eine Meldung forcieren, um zu sehen, ob es auch noch funktioniert.)
 
Ja ne, zur Zeit nicht so richtig. Waren ja beide betroffen.
Die Auflösung hier könnte ein Blinder lesen. :cry:
 
Ich hab hier Telegraf als Collector laufen und schreibe alles in eine InfluxDB. Auch ein paar Temperatursensoren mit ESP8266 und anderes Zeug schreibt die Messwerte direkt oder über Umweg MQTT->Node-Red->InfluxDB in die Datenbank. Auswertung erfolgt mit Grafana und Warnmeldungen werden per Discord und/oder Mail ausgegeben. Auf ein paar Windows Rechnern läuft auch noch zusäztlich OhmGraphite.
 

Zurzeit aktive Besucher

Letzte Anleitungen

Statistik des Forums

Themen
4.379
Beiträge
45.226
Mitglieder
3.979
Neuestes Mitglied
Puffmutter
Zurück
Oben