Proxmox stürzt ab. Gibt es irgendwo ein Log ?

Ob du das Update mal probieren willst musst selbst entscheiden. 6.11 ist jedenfalls neuer als der 6.8.12-9.
Ob das was bringt kann ich dir nicht sagen, da ich weder die proxmox noch die Kernel changelogs, und was diese in Bezug auf deine Hardware eventuell an Veränderungen bringen, studiert habe.

Der Kernel kann auch beim Booten ausgewählt werden. Man kann also auch in eine ältere Konfiguration starten, oder den neuen Kernel wieder deinstallieren, falls sich irgendwelche Nachteile ergeben sollten.
 
Eine SSD, NEU, ca. 3 - 4 Monate alt.
SMART kann ich nicht sehen. BIOS gibt nix an und unter Linux, pffff, ich nix viel Ahnung von Linux.
smartctl -a sda liefert mir zwar eine Anzeige, aber frag mich nicht, ob sda auch meine SSD ist.
 
Krass, noch nicht gesehen, den Menüpunkt. Ich sollte doch noch mal zum Optiker gehen.
Aber, alles OK mit der SSD. Es werden keine Fehler angezeigt.
 
@blurrrr Das Thema mit den Logs hatten wir doch schon.
->
Hast Du denn den Vorschlag von @Confluencer mal ausprobiert? Nach Fehlern gucken -> immer in den Logs.
Nicht immer nur die halben Beiträge lesen 😜

Alternativ - auch Marke Holzhammer - mal eine andere NIC einbauen (die Möglichkeit hast Du ja), das System entsprechend auf die neue NIC umkonfigurieren und schauen, ob das Problem weiterhin besteht?
 
Zuletzt bearbeitet von einem Moderator:
Moinsen,
Zu den logs....
Wenn du mal einen erneuten Fehler bemerkt hast, also grob die Zeit einschätzen kannst, dann sollte dir doch ein
Code:
journalctl -r
auch mit Zeitangaben etwas verraten können, oder? Wie generiert du denn deine log Ansicht?
Zu journalctl...https://wiki.ubuntuusers.de/systemd/journalctl/
Gerade wieder einen Ausfall gehabt und gleich mal deinen Befehl eingegeben.
May 28 17:55:37 pve kernel: CIFS: VFS: \\192.168.178.9 has not responded in 180 seconds. Reconnecting...
May 28 17:55:36 pve kernel: vmbr0: port 1(eno1) entered forwarding state
May 28 17:55:36 pve kernel: vmbr0: port 1(eno1) entered blocking state
May 28 17:55:36 pve kernel: e1000e 0000:00:19.0 eno1: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
May 28 17:55:32 pve kernel: vmbr0: port 1(eno1) entered disabled state
May 28 17:55:32 pve kernel: e1000e 0000:00:19.0 eno1: NIC Link is Down
May 28 17:55:31 pve kernel: e1000e 0000:00:19.0 eno1: Detected Hardware Unit Hang:
TDH <21>
TDT <51>
next_to_use <51>
next_to_clean <20>
buffer_info[next_to_clean]:
time_stamp <10491eae6>
next_to_watch <21>
jiffies <104b0ec81>
next_to_watch.status <0>
MAC Status <80083>
PHY Status <796d>
PHY 1000BASE-T Status <3801>
 
Moinsen,
tja, ich bleibe dabei, das zeigt nach meiner Interpretation an, dass der NIC "hängt" (May28 17:55:31), dann ins "down" geht (offline) eine Sekunde später, was dann natürlichj vmbr0 auch runterfahren lässt (hängt ja an eno1). 5 Sekunden später ist der NIC dann wieder "up" (online) und es läuft.
Eine kurze Suche nach dem "detected hardware unit hang" weist dann u.a. auch in die Richtung, die @Confluencer bereits erwähnte bzgl tx recording usw...
BTW Kabel mal getauscht bisher?
 
Kabel ist neu, anderen Port am Switch.
Am Switch hatte ich das Aushandeln der Übertragungsgeschwindigkeit ja schon mal fest auf 1 Gbps gestellt, leider ohne Erfolg.

Leider habe ich aktuell keine andere Netzwerkkarte zum Testen da.

Ich überlege aber, die Änderungen, die ich damals wegen IOMMU in diversen config Dateien gemacht hatte, wieder rückgängig zu machen. Sollte zwar eigentlich alles nur die Grafikkarte betreffen, aber wer weiß.
 
Moinsen,
Das Protokoll zeigt ja auch detailliert Werte an. Mir sagen die allerdings nix, da bin ich bei weitem nicht genug erfahren oder interessiert.
Aber vielleicht sagen die ja den anderen hier was Näheres...
 
May 28 17:55:31 pve kernel: e1000e 0000:00:19.0 eno1: Detected Hardware Unit Hang:

Nach meinem Verständnis weist es entweder auf ein Treiber Problem, oder einen Hardware-Defekt hin, wobei ich eher zu ersterem tendieren würde. Da das e1000e Treiber-Modul Teil des Kernels ist, könnte hier ein Kernel-Upgrade tatsächlich schon die Lösung sein.

Selber kompilieren ist hier glaube ich wenig ratsam, da das letzte Release der Source durch Intel über 5 Jahre alt ist: https://www.intel.com/content/www/u...rk-connections-under-linux-final-release.html.
 
Najo, die Frage ist ja eigentlich auch, seit wann der Mist angefangen hat. Wenn es erst "irgendwann nach der Installation" angefangen hat, ggf. eine Konfigurationsfrage, wenn es "schon immer" so gewesen ist, dann vermutlich Hardware/Treiber. So wie ich das gesehen habe, ist es eine i218v (https://www.intel.com/content/www/u...ntel-ethernet-connection-i218v/downloads.html).

Ich würde einfach mal - alles was an VMs/CTs läuft - sichern, dann die Upgrades installieren ("non-subscription"-Repo nicht vergessen!) und wenn das Problem dann noch immer besteht, ggf. mal die Treiber von der Intel-Seite drüberbügeln. Wenn dann alles kaputt ist, kann man wenigstens flott neu installieren und die Backups wieder einspielen 😅
 
Also gerade ist er wieder weg gewesen, obwohl ich die Änderungen rückgängig gemacht hatte und natürlich auch einen reboot.
Das erste mal ist der Fehler, nach mehrjährigem problemlosem Betrieb, als ich IOMMU aktivieren wollte.

Ja, ich überlege auch gerade, den Rechner nochmal neu aufzusetzen, wobei es mir davor doch gewaltig graut. In laufe der Zeit haben sich ja doch ein paar VM's angesammelt, die auch ihre IP haben, die man mittlerweile auswendig kennt. Ich fürchte, nach einem neu aufsetzen, wird sich da einiges dran ändern.

Treiberproblem glaub ich weniger, da ich wissentlich kein Update gemacht habe und der Fehler ja erst vor kurzem auftrat.
Hardware kann es natürlich immer sein, was mich aber verwundert, warum es nach Stecker ziehen, Stecker rein dann wieder geht.
Im Umfeld um den Rechner hat sich eigentlich nur der Aufbau der Router und des Internet etwas geändert.
Ich hatte ja Glasfaser mit einem Speedport und DSL über ne FritzBox. Speedport und Fritz mit einem LAN Kabel verbunden und die Fritz hatte DHCP.
Nachdem nun DSL weggefallen ist, hat der Speedport DHCP und die FritzBox hängt nur noch als Mesh Gerät mit dran, baut ein eigenes WLAN auf, weil so manches WLAN Gerät hier darauf eingestellt ist und ich nicht alles auf einmal umstellen will.
Aber hier sehe ich eigentlich auch nichts, was da das Problem verursachen könnte. Außer der Speedport und Proxmox vertragen sich nicht.
 
Hardware kann es natürlich immer sein, was mich aber verwundert, warum es nach Stecker ziehen, Stecker rein dann wieder geht.
Schöne Vorstellung: Software (und ein Treiber ist nichts anderes) die immer zu 100% funktioniert oder nicht... Leider gibt es oft Probleme die nur unter bestimmten Voraussetzungen zum Vorschein kommen.
 

Zurzeit aktive Besucher

Keine Mitglieder online.

Letzte Anleitungen

Statistik des Forums

Themen
6.723
Beiträge
64.544
Mitglieder
7.003
Neuestes Mitglied
Justin
Zurück
Oben