Proxmox stürzt ab. Gibt es irgendwo ein Log ?

was passiert (falls möglich) wenn du den switch mal weglässt und direkt an den Routeranschluss gehst?
Geht schlecht, zu langer weg zum Router.
Aber es ja ja zig Monate mit dem Switch funktioniert und ein Portwechsel hat auch nichts geändert.
Ich nenne das "Wackelkontakt" ;D...
Würde ich zustimmen, wenn es am Kabel wackeln liegen würde. Aber egal, ob ich am einen ende oder am anderen mal kurz ausstopsel, danach gehts wieder.
Oder ja auch, wie ich jetzt festgestellt habe, wenn ich am Switch den Port kurz deaktiviere und wieder aktiviere. Da wackel ich überhaupt nicht am Kabel.

Im System Log von Proxmox, was ich eben mal durch Zufall entdeckt habe, kann ich folgendes lesen.
May 30 11:20:01 pve kernel: e1000e 0000:00:19.0 eno1: Detected Hardware Unit Hang: TDH <65> TDT <7c> next_to_use <7c> next_to_clean <64>buffer_info[next_to_clean]: time_stamp <10837e3a7> next_to_watch <65> jiffies <1083884c0> next_to_watch.status <0>MAC Status <80083>PHY Status <796d>PHY 1000BASE-T Status <806>PHY Extended Status <3000>PCI Status <10>
May 30 11:20:01 pve kernel: e1000e 0000:00:19.0 eno1: NIC Link is Down
May 30 11:20:02 pve kernel: vmbr0: port 1(eno1) entered disabled state
May 30 11:20:02 pve kernel: eth0: entered promiscuous mode
May 30 11:20:02 pve pvestatd[1174]: storage 'NAS_Proxmox' is not online
May 30 11:20:05 pve kernel: e1000e 0000:00:19.0 eno1: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
May 30 11:20:05 pve kernel: vmbr0: port 1(eno1) entered blocking state
May 30 11:20:05 pve kernel: vmbr0: port 1(eno1) entered forwarding state
May 30 11:20:13 pve kernel: eth0: left promiscuous mode
May 30 11:20:25 pve kernel: e1000e 0000:00:19.0 eno1: NIC Link is Down
May 30 11:20:25 pve kernel: vmbr0: port 1(eno1) entered disabled state
May 30 11:20:30 pve kernel: e1000e 0000:00:19.0 eno1: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
May 30 11:20:30 pve kernel: vmbr0: port 1(eno1) entered blocking state
May 30 11:20:30 pve kernel: vmbr0: port 1(eno1) entered forwarding state
Proxmox hat also erkannt, das die Hardware Unit hängt.
Diese Meldung, das die Hardware hängt taucht dann auch im 1 oder 2 Sekunden Takt immer wieder auf, bis ich den Fehler halt behebe.
 
Hast Du denn mittlerweile mal das non-subscription-Repo eingebunden und die Updates installiert?

Falls das Problem dann noch immer besteht, mal bzgl. Treibern für die NIC (i218v) schauen (bitte nur direkt von Intel) und damit nochmal testen. Scheint jedenfalls kein unbekanntes Problem zu sein. Die Lösung von @Confluencer scheint auch zu helfen (wobei das Problem als solches damit ja nicht gelöst ist, sondern nur umgangen wird). Alternativ - auch nur ein "umgehen" - eine andere NIC nutzen.
 
Moinsen,
Kannst du den (war es nicht ein) Minirechner nicht kurz tragen? ;) Gerade weil
Aber es ja ja zig Monate mit dem Switch funktioniert und ein Portwechsel hat auch nichts geändert.
würde ich es auch noch mal ohne versuchen, als Ausschlussdiagnostik quasi.

Was für eine Hardware als NIC ist eingebaut? Weil...es gibt da wohl für Intel e1000er Modelle einen bekannten Bug, der wohl eine solche Meldung auslöst (bzw einen solchen Fehler, der dann gemeldet wird). Hat zumindest eine kurze Suche so zu Tage gefördert > Suchergebnisse
 
Hast Du denn mittlerweile mal das non-subscription-Repo eingebunden und die Updates installiert?
Also meine sources.list sieht so aus.
deb http://ftp.debian.org/debian bookworm main contrib
deb http://ftp.debian.org/debian bookworm-updates main contrib

# Proxmox VE pve-no-subscription repository provided by proxmox.com,
# NOT recommended for production use
deb http://download.proxmox.com/debian/pve bookworm pve-no-subscription

# security updates
deb http://security.debian.org/debian-security bookworm-security main contrib
danach auch "Aktualisieren" und ">_ Upgrade" gemacht.
Falls das Problem dann noch immer besteht, mal bzgl. Treibern für die NIC (i218v) schauen (bitte nur direkt von Intel) und damit nochmal testen. Scheint jedenfalls kein unbekanntes Problem zu sein. Die Lösung von @Confluencer scheint auch zu helfen (wobei das Problem als solches damit ja nicht gelöst ist, sondern nur umgangen wird). Alternativ - auch nur ein "umgehen" - eine andere NIC nutzen.
Mir graut vor einem Treiber Update. Aber ja, the Other, scheint so, als wenn die verbaute OnBoard Karte da Probleme macht. Warum erst nach Monatelangem Betrieb, wer weiß das schon.

Ich hatte gestern mal den Speed auf 100 MBit im Switch gesetzt. Seit dem läuft es (noch) ohne Ausfall.
Ist aber keine Dauerlösung.

Seufz. Ja, ich mach das Update. :D
 

Zurzeit aktive Besucher

Letzte Anleitungen

Statistik des Forums

Themen
6.734
Beiträge
64.663
Mitglieder
7.013
Neuestes Mitglied
Gordy
Zurück
Oben