Proxmox stürzt ab. Gibt es irgendwo ein Log ?

RudiP

Well-known member
In letzter Zeit stürzt mein Proxmox so ein bis zweimal am Tag ab. Das Äußert sich dadurch, das sämtliche VM's nicht mehr erreichbar sind und auch Proxmox selbst nicht mehr reagiert.
Die Eingabeaufforderung auf dem Rechner, auf dem Proxmox läuft, ist aber noch da und auch nutzbar. Ein "reboot" Kommando funktioniert da und danach ist dann auch alles wieder da, bis zum nächsten Absturz.
Ich kann es leider an nichts festmachen, da es zu unterschiedlichen Zeiten passiert. Tagsüber, nachts, eigentlich immer irgendwann mal.

Was habe ich seit dem geändert ?
Ich hatte eine I3 CPU verbaut und wollte eine Grafikkarte an eine VM durchreichen. Dazu muß aber VT-d bzw. VT-x im BIOS aktiviert sein und die CPU muß das können.
Die I3 konnte das aber nicht, also habe ich ne I5 verbaut.
Die Abstürze kamen aber auch schon mit der I3 kurz nachdem ich die Versuche mit dem weiterleiten eines PCI Gerät versucht hatte.
Im BIOS finde ich aber nichts, wo ich den Fehler dran festmachen würde.
Frage ist, da ich an die Console ja noch dran komme, ob es irgendein Log gibt, das man aufrufen könnte.
Die Logs in Proxmox helfen nicht, da steht nur der Neustart drin, aber nichts zum Absturz.
 
Hi,
In letzter Zeit stürzt mein Proxmox so ein bis zweimal am Tag ab. Das Äußert sich dadurch, das sämtliche VM's nicht mehr erreichbar sind und auch Proxmox selbst nicht mehr reagiert.
Die Eingabeaufforderung auf dem Rechner, auf dem Proxmox läuft, ist aber noch da und auch nutzbar
"und auch Proxmox selbst nicht mehr reagiert"... damit meinst Du vermutlich das Webinterface? Das auf die Netzwerk-Funktionalität schliessen lassen. Wenn sowas wieder vorkommt, schau doch bitte mal, wie es sich mit einem "ping <Deine Router-IP>" verhält. Die IP vom PVE-Host sollte standardmässig auf vmbr0 laufen (sofern Du da nichts anderweitig konfiguriert hast). Schau dann auch mal mittels "ip a", ob das Interface auch "UP" ist.

Logs findest Du unter /var/log, da könntest Du ggf. mal in messages und syslog nachschauen. Sofern Du es direkt via Shell machst (z.B. via cat /var/log/messages), kannst Du mittels z.B. grep auch noch filtern:

cat /var/log/messages | grep -i vmbr0 (-i ignoriert die Groß- und Kleinschreibung)

Alternativ kannst Du auch direkt nach mehreren Dingen filtern ("oder") mittels:

cat /var/log/messages | grep -i -E "eth0|vmbr0"

Falls noch ein Bond-Interface dabei ist, dann halt z.B. so:

cat /var/log/messages | grep -i -E "eth0|vmbr0|bond0"

Das ist jetzt natürlich nur in Bezug auf die Netzwerk-Interfaces (ich vermute einfach mal, dass da netzwerktechnisch etwas im argen ist). Sei's drum, nach Fehlern kann man auch direkt suchen, z.B. in so einer Form:

cat messages |grep -E "err|fail"

Vielleicht findest Du auf diesem Wege ja etwas entsprechendes :)
 
Ich würde hier vermuten, dass das weiterreichen des PCI(e)-Geräts das Problem verursacht.

Gerade, wenn IOMMU im Bios nicht aktiviert ist, kann beim Durchreichen von PCI-Geräten etwas schief gehen.
Nach einem Mainboard-Tausch hatte ich das Problem, dass sobald eine VM mit durchgerichtem Storage-Controller lief, plötzlich PVE nicht mehr über das Netzwerk erreichbar war. Bei mir lag es am deaktivierten IOMMU (Achtung: danach nochmal die Addresse des durchgereichten PCI(e)-Geräts anpassen!)

Hier nochmal der Link zur Anleitung was alles gemacht werden muss: https://pve.proxmox.com/wiki/PCI(e)_Passthrough
 
Zuletzt bearbeitet:
Au man. Das da einfach nur die LAN Verbindung weg sein könnte, kam mir nicht in den Sinn. Aber ja, kann natürlich sein, werde ich testen.

Das IOMMU das Problem ist, klar, denkbar, auch wenn ich es aktuell nicht nutze, die Einträge in diversen Config Dateien sind natürlich noch drin.
Schaue ich mir auch beim nächsten Absturz an.

Danke euch beiden für die Tipps.
 

Zurzeit aktive Besucher

Letzte Anleitungen

Statistik des Forums

Themen
6.678
Beiträge
64.080
Mitglieder
6.934
Neuestes Mitglied
Dlinus
Zurück
Oben