Proxmox stürzt ab. Gibt es irgendwo ein Log ?

@Confluencer najo, schon richtig, aber direkt mit dem Holzhammer ist halt auch so eine Sache. Erstmal nach der Ursache forschen und je nach Ursache dann eine entsprechende Lösung umsetzen. Aber ich sagte ja auch, dass man es sicherlich mal probieren kann - kann man ja auch flott wieder rückgängig machen, wenn es nix bringt. Wenn es etwas bringt, würde ich mich dann aber dennoch um eine vernünftige Lösung bemühen (ggf. reicht ja auch schon ein frischer Treiber).

@RudiP Der Befehl dmesg sollte aber zumindestens funktionieren, schau da mal die Ausgabe durch.

Keine Ahnung, ob Du das pve-no-subscription-Repo schon entsprechend eingerichtet hast (dürfte standardmässig nicht vorhanden sein), aber ggf. würden dem PVE-Host auch einfach ein paar Updates ganz gut tun.

Ich vermute mal, dass der PVE-Host so eine Mini-Kiste ist, die keinen PCI-Slot mehr zur Verfügung hat? Damit wäre das Thema "mal andere NIC testen" schon so halb raus, es sei denn, dass Du noch irgendwo so einen USB-LAN-Adapter rumfliegen hast (welcher evtl. unterstützt wird).

Apropos... welchen Treiber nutzt Deine NIC eigentlich? Kannst Du mit ethtool -i <Interface-Name> sehen.
 
@RudiP Der Befehl dmesg sollte aber zumindestens funktionieren, schau da mal die Ausgabe durch.
gibt mir ca. 500 Zeilen aus. Auch ettliche mit eth0 und ein paar mit vmbt0
[ 1484.992094] eth0: entered promiscuous mode
[ 1496.130035] eth0: left promiscuous mode
[ 1601.817395] e1000e 0000:00:19.0 eno1: NIC Link is Down
[ 1601.817482] vmbr0: port 1(eno1) entered disabled state
[ 1659.934152] e1000e 0000:00:19.0 eno1: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
[ 1659.934264] vmbr0: port 1(eno1) entered blocking state
[ 1659.934272] vmbr0: port 1(eno1) entered forwarding state
[ 1661.136547] e1000e 0000:00:19.0 eno1: NIC Link is Down
[ 1661.136636] vmbr0: port 1(eno1) entered disabled state
[ 1678.722215] e1000e 0000:00:19.0 eno1: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
[ 1678.722295] vmbr0: port 1(eno1) entered blocking state
[ 1678.722310] vmbr0: port 1(eno1) entered forwarding state
[ 1784.812679] eth0: entered promiscuous mode
[ 1795.938655] eth0: left promiscuous mode
[ 2084.599012] eth0: entered promiscuous mode
[ 2095.729021] eth0: left promiscuous mode
[ 2278.149224] e1000e 0000:00:19.0 eno1: NIC Link is Down
[ 2278.149342] vmbr0: port 1(eno1) entered disabled state
[ 2334.460927] e1000e 0000:00:19.0 eno1: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
[ 2334.461023] vmbr0: port 1(eno1) entered blocking state
[ 2334.461030] vmbr0: port 1(eno1) entered forwarding state
[ 2335.609362] e1000e 0000:00:19.0 eno1: NIC Link is Down
[ 2335.609465] vmbr0: port 1(eno1) entered disabled state
[ 2352.978975] e1000e 0000:00:19.0 eno1: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
[ 2352.979017] vmbr0: port 1(eno1) entered blocking state
[ 2352.979024] vmbr0: port 1(eno1) entered forwarding state
[ 2385.515169] eth0: entered promiscuous mode
[ 2396.641245] eth0: left promiscuous mode
[ 2685.097567] eth0: entered promiscuous mode
[ 2696.227296] eth0: left promiscuous mode
[ 2984.991859] eth0: entered promiscuous mode
[ 2996.123279] eth0: left promiscuous mode
Nur mal ein Auszug, der mir anscheinend sagt, da ist was nicht ganz richtig.
Aber seit 22 Stunden und 36 Minuten läuft die Kiste nun ohne Ausfall.
Die wartet sicher nur darauf, das ich arbeiten bin. 😁

Keine Ahnung, ob Du das pve-no-subscription-Repo schon entsprechend eingerichtet hast (dürfte standardmässig nicht vorhanden sein), aber ggf. würden dem PVE-Host auch einfach ein paar Updates ganz gut tun.
Öhm, nein, extra installiert habe ich nichts. Aber sollte de nicht bescheid geben, wenn er ein Update hat ?
Oder wozu ist der Menüpunkt PVE -> Updates -> Repositories ?
Ich vermute mal, dass der PVE-Host so eine Mini-Kiste ist, die keinen PCI-Slot mehr zur Verfügung hat?
Falsch gedacht. Ist ein vollwertiger PC mit sicher noch 3 PCI Slots und 2 PCI-e Slots und 1. PCI-e 3.0 Slot.
Aktuell 32 GB RAM, Intel Core I5 CPU und 500 GB SSD.
Ich weiß, total überdimmensioniert, aber er soll ja auch noch ein paar andere Dinge außer HA erledigen.
Apropos... welchen Treiber nutzt Deine NIC eigentlich? Kannst Du mit ethtool -i <Interface-Name> sehen.
root@pve:~# ethtool -i vmbr0:
driver: bridge
version: 2.3
firmware-version: N/A
expansion-rom-version:
bus-info: N/A
supports-statistics: no
supports-test: no
supports-eeprom-access: no
supports-register-dump: no
supports-priv-flags: no
 
Moinsen,
Spuckt ein
Code:
ethtool -i eno1
auch Infos aus?
Im log scheint das eno1 Interface ins down zu gehen, startet dann wieder und das wiederholend. Ist jedenfalls meine Interpretation dazu...(NIC link up, down).
Steckt der proxmox server direkt am Router oder an einem switch? Mal Kabel gewechselt? Und Router bzw switch Port gewechselt?
 
Stimmen die Up/Down-Meldungen denn ungefähr mit Deinen Zeiten überein? Sieht ja schon erstmal ein bisschen nach der physikalischen Verbindung aus. Wobei ein Reboot so ein Problem nicht lösen sollte, aber die Verbindung war ja anscheinend - so wie ich Dich verstanden habe - nach einem Neustart wieder da war (mal abgesehen von der erwähnten Kabel-Steckerei).

Öhm, nein, extra installiert habe ich nichts. Aber sollte de nicht bescheid geben, wenn er ein Update hat ?
Oder wozu ist der Menüpunkt PVE -> Updates -> Repositories ?
Schon, allerdings betrifft das "nur" die Debian-Updates. Im o.g. Link siehst Du, was theoretisch an Repos vorhanden sein sollte:
deb http://ftp.debian.org/debian bookworm main contrib
deb http://ftp.debian.org/debian bookworm-updates main contrib


# Proxmox VE pve-no-subscription repository provided by proxmox.com,
# NOT recommended for production use
deb http://download.proxmox.com/debian/pve bookworm pve-no-subscription

# security updates
deb http://security.debian.org/debian-security bookworm-security main contrib
Du hast die üblichen Debian-Repos drin, aber es gibt noch das pve-no-subscription-Repo. Standardmässig sollte das kostenpflichtige Enterprise-Repo drin sein:
Wenn aktualisiert wird, sollte auch eine Fehlermeldung kommen, dass Du nicht auf das Enterprise-Repo zugreifen kannst. Von daher umstellen auf das kostenfreie Repo, sonst gibt es gar keine Updates für Proxmox (von den Debian-Updates mal abgesehen).

Falsch gedacht. Ist ein vollwertiger PC
Das ist schon mal eine gute Nachricht, denn so kann man im Zweifelsfall Abschied von der Onboard-NIC nehmen und einfach eine zusätzliche NIC einbauen. Bleibt natürlich abzuwarten, wie sich das System jetzt verhält, vielleicht war es doch nur ein Wackelkontakt.

Ich weiß, total überdimmensioniert, aber er soll ja auch noch ein paar andere Dinge außer HA erledigen.
Alles gut, ist ein Hypervisor zu klein dimensioniert, kommt schnell Frust auf, sowas möchte man ja auch nicht ☺️
 
Ja, da steckt ein intelligenter Switch zwischen Router und meinen Geräten. Nein, Kabel wurde noch nicht getauscht.

Ob die Zeiten im Log mit den Ausfällen zusammen hängen ? Ich sehe im Log keine Zeiten.
Es läuft jetzt aber seit 1 Tag und 11 Stunden wieder Störungsfrei. Ich bin geneigt, anzunehmen, das der Eintrag im Ressourcen Mapping die Ursache war, wie ja auch schon von @Confluencer vermutet.

Ich denke, ich lasse es jetzt erst mal weiter laufen und wenn es in 5 Tagen immer noch geht, war das wohl der Fehler. :D
 

Zurzeit aktive Besucher

Letzte Anleitungen

Statistik des Forums

Themen
6.703
Beiträge
64.305
Mitglieder
6.969
Neuestes Mitglied
WA6060
Zurück
Oben