Snapshot bricht mit Fehler ab

RudiP

Well-known member
2025-11-24 14:08:45 INFO: Starting Backup of VM 102 (qemu)
2025-11-24 14:08:45 INFO: status = running
2025-11-24 14:08:45 INFO: VM Name: home-assistant
2025-11-24 14:08:45 INFO: include disk 'scsi0' 'local-lvm:vm-102-disk-2' 250G
2025-11-24 14:08:45 INFO: include disk 'sata0' 'local-lvm:vm-102-disk-1' 32G
2025-11-24 14:08:45 INFO: include disk 'efidisk0' 'local-lvm:vm-102-disk-0' 4M
2025-11-24 14:08:45 INFO: backup mode: snapshot
2025-11-24 14:08:45 INFO: ionice priority: 7
2025-11-24 14:08:45 INFO: skip unused drive 'NAS-Proxmox:102/vm-102-disk-0.qcow2' (not included into backup)
2025-11-24 14:08:45 INFO: creating vzdump archive '/mnt/pve/NAS-Proxmox/dump/vzdump-qemu-102-2025_11_24-14_08_45.vma.zst'
2025-11-24 14:08:45 ERROR: unable to open file '/mnt/pve/NAS-Proxmox/dump/vzdump-qemu-102-2025_11_24-14_08_45.vma.dat' - Stale file handle
2025-11-24 14:08:45 INFO: aborting backup job
2025-11-24 14:08:45 INFO: resuming VM again
2025-11-24 14:08:45 ERROR: Backup of VM 102 failed - unable to open file '/mnt/pve/NAS-Proxmox/dump/vzdump-qemu-102-2025_11_24-14_08_45.vma.dat' - Stale file handle
Das passiert seit 3 Tagen. Zwei andere lxc werden problemlos gesichert, nur der vom HomeAssistant nicht.
Stale file handle soll angeblich veraltetes Dateihandle bedeuten. Was soll den daran veraltet sein, wenn es gerade erst angelegt werden soll.
 
Moinsen,
wie hast du den den Storage da eingebunden unter /mnt/pve/NAS-Proxmox?
NFS? CIFS /SMB?

Ich würde den backup job mal für den LXC / VM komplett entfernen und dann neu anlegen und erneut einen Teslauf dazu machen...
 
Als SMB. Ist ein Verzeichnis auf meinem NAS.
Der Backup Job wird doch entweder vom Rechenzentrum aus jede Nacht gemacht, ober eben, wie eben 5 mal versucht, auch manuell angestoßen. Was soll ich beim manuellen den neu anlegen ?
Gerade mal beim manuellen gesagt, das er local speichern soll und nicht auf dem NAS, das scheint zu laufen.
Aber warum laufen die beiden anderen problemlos.
 
Sicher, dass nicht ggf. noch am Ziel (NAS) Alt-Daten vorhanden sind? Mach das mal komplett platt und richte den Backup-Job mal - wie von @the other vorgeschlagen - neu ein.
 
Moinsen,
der Fehler kann u.a. wohl bedeuten, dass die vma.dat Datei für eben diesen snapshot nicht lesbar / zu öffnen ist. Jeder snapshot hat idR eine solche Datei, daher kann es gut sein, dass diese bei den anderen backup / snapsot Jobs in Ordnung ist, daher alles sauber durchläuft. Nur eben bei diesem einen nicht.
Kann daran liegen, dass die Datei nicht dem erwarteten Zustand entspricht...
Gerade bei deinem fraglichen Problem mit dem Proxmoxserver allgemein (hattest du hier ja an anderer Stelle berichtet) KANN das aber auch ein Hinweis auf ein beschädigtes Dateisystem sein bzw einem fehlerhaften Datenträger...
So jedenfalls mein bescheidenes Verständnis... :)
 
Sicher, dass nicht ggf. noch am Ziel (NAS) Alt-Daten vorhanden sind? Mach das mal komplett platt und richte den Backup-Job mal - wie von @the other vorgeschlagen - neu ein.
Sicher sind da ältere Backups vorhanden, aber wie man am Dateinamen sieht, besteht der auch aus Datum und Uhrzeit. Das da also eine gleichnamige alte Datei liegt ist maximal unmöglich.

Auch an dich dann die Frage, WIE richtet man den manuellen Backup Job den neu ein ?
Ich gehe ja auf die VM, dort auf Backup, sehe meine vorherigen Backup's und klicke oben auf "Backup starten". Ich wüßte nicht, das man da irgendwo was einstellen kann.

@the other Wo finde ich den diese vma.dat ?
Ein "find -name vma.dat" brachte kein Ergebnis.
Ok, den Backup Job im Rechenzentrum mal neu angelegt, ändert aber nichts. Der manuelle endet immer noch in einem Fehler.

Wenn ich die Befehlszeile für das Backup
vzdump 102 --node pve --remove 0 --notes-template '{{guestname}}' --compress zstd --storage NAS-Proxmox --mode snapshot --notification-mode notification-system
in ein ssh Terminal eingebe, kommt der selbe Fehler.
 
ERROR: unable to open file '/mnt/pve/NAS-Proxmox/dump/vzdump-qemu-102-2025_11_24-14_08_45.vma.dat' - Stale file handle

Also wenn schon, such nach "*.vma.dat". Davon aber mal abgesehen suchst Du mit dem Befehl auch nur "innerhalb" des Verzeichnisses wo Du Dich grade befindest. Befindest Du Dich also in Deinem Home-Verzeichnis (/root/) wird auch nur dieses rekursiv durchsucht. Wenn Du das gesamte System durchsuchen möchtest, musst Du einen entsprechenden Startpunkt angeben, z.B. via find / -name "*.vma.dat". So wird dann ab "/" gesucht, was dann /mnt/, usw. inkludiert.
 
Moinsen,
Wo finde ich den diese vma.dat ?
Schau mal unter (nach manuellem Start eines Backups auf den lokalen Speicherplatz) unter /var/lib/vz/dump...da sollte die dann sein. Meines (bescheidenen) Wissens nach ist das aber eh nur eine temporär angelegte Datei, eben da, wo das backup hingeschrieben wird (daher manuell eben auf dem localen Speicherort).
Stimmen denn für das backup alle Angaben, um überhaupt auf dem NAS schreiben zu dürfen? Da irgendwas abweichend?
Also, das System schreibt beim backup Dinge in diese temporäre vma.dat, die aber bei dir aus bisher unbekannten Gründen eben nicht
a) geschrieben wird als Option1
b) geschrieben wird, aber dann nicht lesbar /verarbeitbar ist als Option2

Du kannst ja mal schauen: maneull starten, Ziel auf lokal...dann sollte die Datei auch (vorübergehend) unter /var/lib/vz/dump erscheinen (und dann später zu einer vma.lzo zu werden)...
Und ebenso sollte es dann auch auf der Freigabe sein, unter der deine backups gespeichert werden...
Daher:
- passen die Rechte für den share, so dass dort geschrieben werden darf für diesen job?
- stimmt der mount Punkt auch wirklich (korrekter Pfad zum backup Platz)?

Bin da aber nun wirklich eigentlich so ziemlich der letzte, der Ahnung hat, starte ja eben selber erst mit dem Krempel...also alles wie immer ohne Gewähr. :)
 
Moinsen,
mal zur Auflockerung ne kurze Rückfrage: deine HA Instanz läuft auf dem Proxmoxserver aber schon in einer VM? Oder ist das in einem LXC untergebracht?? Denn du schreibst oben
Zwei andere lxc werden problemlos gesichert, nur der vom HomeAssistant nicht.
Hat nu vermutlich gar nix mit deinem Problem zu tun...wäre aber dankbar für ne Info dazu. ;)
 
Also wenn schon, such nach "*.vma.dat". Davon aber mal abgesehen suchst Du mit dem Befehl auch nur "innerhalb" des Verzeichnisses wo Du Dich grade befindest. Befindest Du Dich also in Deinem Home-Verzeichnis (/root/) wird auch nur dieses rekursiv durchsucht. Wenn Du das gesamte System durchsuchen möchtest, musst Du einen entsprechenden Startpunkt angeben, z.B. via find / -name "*.vma.dat". So wird dann ab "/" gesucht, was dann /mnt/, usw. inkludiert.
Verstehe. Sorry, Linux ist noch nich tso wirklich mein Fachgebiet. ;)
Aber auch ein find / -name "*.vma.dat" liefert kein Ergebnis.

@the other
Ja, HomeAssistant läuft in einer VM.

Schau mal unter (nach manuellem Start eines Backups auf den lokalen Speicherplatz) unter /var/lib/vz/dump...da sollte die dann sein. Meines (bescheidenen) Wissens nach ist das aber eh nur eine temporär angelegte Datei, eben da, wo das backup hingeschrieben wird (daher manuell eben auf dem localen Speicherort).
Das Backup wird ja nicht lokal abgelegt, sondern auf dem NAS. Ich habe das lokale Backup mal angestoßen, aber nein, das von Dir angegebene Verzeichnis ist leer und auch auf dem Verzeichnis auf dem NAS ist nichts.
Vermutlich ist das versuchte Backup schneller fertig, als ich auf ENTER drücken kann.
Hab deswegen das Backup mal auf das lokale Laufwerk umgeleitet, da fängt es an zu arbeiten und dann ist auch die *.vma.dat im angegebenen Verzeichnis.

Stimmen denn für das backup alle Angaben, um überhaupt auf dem NAS schreiben zu dürfen? Da irgendwas abweichend?
Das Verzeichnis ist ja via Proxmox eingebunden. Wenn also die lxc Backups laufen, dann muss das für die VM ja auch laufen. Ist ja nix anders.

Also, das System schreibt beim backup Dinge in diese temporäre vma.dat, die aber bei dir aus bisher unbekannten Gründen eben nicht
a) geschrieben wird als Option1
b) geschrieben wird, aber dann nicht lesbar /verarbeitbar ist als Option2
Ja, da würde ich eher Option 1 annehmen, da das Backup ja so schnell abbricht, da kann noch nicht der gesamte Snapshot (ca. 30 GB) geschrieben worden sein. Ich sehe ja gerade, wo es lokal läuft, das dauert.
Sieht mir also eher so aus, als wenn die Datei erst gar nicht geschrieben werden könnte.

So, Backup auf lokal ist durchgelaufen. 10 Minuten und 30 Sekunden.
Sofort das selbe Backup gestartet, aber als Ziel den NAS und bricht sofort wieder ab.
Nur um es mal gesagt zu haben, auf dem NAS sind 2,8 TB frei. Sollte ja ausreichend sein.
Das Verzeichnis ist im Rechenzentrum unter Storage wie folgt angelegt.
1764008933818.png
Und da gehen eben auch die lxc hin. Das da also irgendwas falsch konfiguriert wäre, kann ich mir nicht Vorstellen, vor allem, da es ja vorher lange Monate problemlos gelaufen ist.
 
Sofort das selbe Backup gestartet, aber als Ziel den NAS und bricht sofort wieder ab.
Stimmen denn die Berechtigungen auf das Share bzw. laufen die anderen Backups auch auf das NAS? Ich würde - Linux zu Linux - übrigens eher NFS bevorzugen (weniger Overhead). Storage unterstützt Snapshots? Die Backups sind alle als Snapshots eingerichtet? Auf dem Hostsystem selbst ist auch noch genügend freier Speicher? Remote-Storage ist auch "ganz sicher" gemountet (mal in der Shell ins Verzeichnis und Inhalt anzeigen lassen, ggf. vorher via Client/NAS mal eine Testdatei erstellen und diese dann via PVE-Shell anzeigen lassen). Und mal ganz blöd: Hast Du mal das NAS (und danach den PVE-Host) mal neugestartet? Nicht, dass da noch irgendwas im Cache hängt und PVE davon ausgeht, dass so eine Datei vorhanden ist, diese aber garnicht mehr dort ist.
 
Ich habe mal ein altes LOG, wo das Backup noch funktioniert hat und das LOG von gerade eben, wo er wieder abbricht.
2025-11-22 03:05:06 INFO: Starting Backup of VM 102 (qemu)
2025-11-22 03:05:06 INFO: status = running
2025-11-22 03:05:06 INFO: VM Name: home-assistant
2025-11-22 03:05:06 INFO: include disk 'scsi0' 'local-lvm:vm-102-disk-2' 250G
2025-11-22 03:05:06 INFO: include disk 'sata0' 'local-lvm:vm-102-disk-1' 32G
2025-11-22 03:05:06 INFO: include disk 'efidisk0' 'local-lvm:vm-102-disk-0' 4M
2025-11-22 03:05:06 INFO: backup mode: snapshot
2025-11-22 03:05:06 INFO: ionice priority: 7
2025-11-22 03:05:06 INFO: skip unused drive 'NAS-Proxmox:102/vm-102-disk-0.qcow2' (not included into backup)
2025-11-22 03:05:06 INFO: creating vzdump archive '/mnt/pve/NAS-Proxmox/dump/vzdump-qemu-102-2025_11_22-03_05_06.vma.zst'
2025-11-22 03:05:06 INFO: issuing guest-agent 'fs-freeze' command
2025-11-22 03:05:07 INFO: issuing guest-agent 'fs-thaw' command
2025-11-22 03:05:07 INFO: started backup task '99ab047b-c802-49e2-bbc7-43fb808273b9'
2025-11-22 03:05:07 INFO: resuming VM again
2025-11-22 03:05:10 INFO: 0% (456.8 MiB of 282.0 GiB) in 3s, read: 152.2 MiB/s, write: 128.5 MiB/s
2025-11-22 03:05:23 INFO: 1% (2.9 GiB of 282.0 GiB) in 16s, read: 193.8 MiB/s, write: 139.3 MiB/s
2025-11-22 03:05:35 INFO: 2% (5.9 GiB of 282.0 GiB) in 28s, read: 257.6 MiB/s, write: 150.1 MiB/s
2025-11-22 03:05:44 INFO: 3% (8.5 GiB of 282.0 GiB) in 37s, read: 296.6 MiB/s, write: 142.0 MiB/s
2025-11-22 03:05:58 INFO: 4% (11.3 GiB of 282.0 GiB) in 51s, read: 202.5 MiB/s, write: 136.9 MiB/s
2025-11-22 03:06:27 INFO: 5% (14.1 GiB of 282.0 GiB) in 1m 20s, read: 99.0 MiB/s, write: 49.1 MiB/s
.....
2025-11-22 03:23:16 INFO: backup is sparse: 241.23 GiB (85%) total zero data
2025-11-22 03:23:16 INFO: transferred 282.00 GiB in 1089 seconds (265.2 MiB/s)
2025-11-22 03:23:32 INFO: archive file size: 18.94GB
2025-11-22 03:23:32 INFO: adding notes to backup
2025-11-22 03:23:32 INFO: prune older backups with retention: keep-daily=7
2025-11-22 03:23:36 INFO: removing backup 'NAS-Proxmox:backup/vzdump-qemu-102-2025_07_13-01_00_39.vma.zst'
2025-11-22 03:25:08 INFO: pruned 1 backup(s) not covered by keep-retention policy
2025-11-22 03:25:08 INFO: Finished Backup of VM 102 (00:20:02)
2025-11-24 19:48:29 INFO: Starting Backup of VM 102 (qemu)
2025-11-24 19:48:29 INFO: status = running
2025-11-24 19:48:29 INFO: VM Name: home-assistant
2025-11-24 19:48:29 INFO: include disk 'scsi0' 'local-lvm:vm-102-disk-2' 250G
2025-11-24 19:48:29 INFO: include disk 'sata0' 'local-lvm:vm-102-disk-1' 32G
2025-11-24 19:48:29 INFO: include disk 'efidisk0' 'local-lvm:vm-102-disk-0' 4M
2025-11-24 19:48:29 INFO: backup mode: snapshot
2025-11-24 19:48:29 INFO: ionice priority: 7
2025-11-24 19:48:29 INFO: snapshots found (not included into backup)
2025-11-24 19:48:29 INFO: creating vzdump archive '/mnt/pve/NAS-Proxmox/dump/vzdump-qemu-102-2025_11_24-19_48_29.vma.zst'
2025-11-24 19:48:29 ERROR: unable to open file '/mnt/pve/NAS-Proxmox/dump/vzdump-qemu-102-2025_11_24-19_48_29.vma.dat' - Stale file handle
2025-11-24 19:48:29 INFO: aborting backup job
2025-11-24 19:48:29 INFO: resuming VM again
2025-11-24 19:48:29 ERROR: Backup of VM 102 failed - unable to open file '/mnt/pve/NAS-Proxmox/dump/vzdump-qemu-102-2025_11_24-19_48_29.vma.dat' - Stale file handle
Sieht für mich alles gleich aus, bis zu dem Augenblick, wo der Error ausgespuckt wird.
Und hier mal das Log von der lokalen Sicherung.
2025-11-24 18:36:53 INFO: Starting Backup of VM 102 (qemu)
2025-11-24 18:36:53 INFO: status = running
2025-11-24 18:36:53 INFO: VM Name: home-assistant
2025-11-24 18:36:53 INFO: include disk 'scsi0' 'local-lvm:vm-102-disk-2' 250G
2025-11-24 18:36:53 INFO: include disk 'sata0' 'local-lvm:vm-102-disk-1' 32G
2025-11-24 18:36:53 INFO: include disk 'efidisk0' 'local-lvm:vm-102-disk-0' 4M
2025-11-24 18:36:53 INFO: backup mode: snapshot
2025-11-24 18:36:53 INFO: ionice priority: 7
2025-11-24 18:36:53 INFO: snapshots found (not included into backup)
2025-11-24 18:36:53 INFO: creating vzdump archive '/var/lib/vz/dump/vzdump-qemu-102-2025_11_24-18_36_53.vma.zst'
2025-11-24 18:36:53 INFO: issuing guest-agent 'fs-freeze' command
2025-11-24 18:36:53 INFO: issuing guest-agent 'fs-thaw' command
2025-11-24 18:36:54 INFO: started backup task '3ca8ab1e-1912-4077-973c-775ed3c092ef'
2025-11-24 18:36:54 INFO: resuming VM again
2025-11-24 18:36:57 INFO: 0% (467.6 MiB of 282.0 GiB) in 3s, read: 155.9 MiB/s, write: 132.1 MiB/s
2025-11-24 18:37:10 INFO: 1% (3.0 GiB of 282.0 GiB) in 16s, read: 196.6 MiB/s, write: 156.1 MiB/s
2025-11-24 18:37:22 INFO: 2% (5.8 GiB of 282.0 GiB) in 28s, read: 240.4 MiB/s, write: 167.7 MiB/s
 
Stimmen denn die Berechtigungen auf das Share bzw. laufen die anderen Backups auch auf das NAS?
Richtig. Ist die selbe SMB Freigabe, also stimmen auch die Berechtigungen.
Ich würde - Linux zu Linux - übrigens eher NFS bevorzugen (weniger Overhead).
NFS habe ich nie zum laufen gebracht. Frag mich nicht, warum
Storage unterstützt Snapshots?
Hat es Monatelang, so lange, wie ich Proxmox nutze.
Die Backups sind alle als Snapshots eingerichtet?
Ja, habe aber auch die anderen Optionen getestet, selbes Ergebnis.
Auf dem Hostsystem selbst ist auch noch genügend freier Speicher?
2,8 TB sollten reichen.
Remote-Storage ist auch "ganz sicher" gemountet
Sonst würden die Backups des LXC nicht funktionieren.
(mal in der Shell ins Verzeichnis und Inhalt anzeigen lassen, ggf. vorher via Client/NAS mal eine Testdatei erstellen und diese dann via PVE-Shell anzeigen lassen).
Ja, kann ich drauf zugreifen.
Und mal ganz blöd: Hast Du mal das NAS (und danach den PVE-Host) mal neugestartet?
Nein. Bisher nur den Proxmox. Teste ich aber nachher mal.
 
Moinsen,
Ja, bestätigt eben, dass es da Probleme mit besagter Datei gibt...Und leider kann der Fehler eben diverse Gründe haben.
Deswegen ja die Nachfrage nach...
...mountpoint korrekt?
...kannst du von proxmox aus eine testdatei auf besagtes NAS share schreiben?
...auch wenn zwischendurch das NAS einen Reboot erlebt hat kann es zu dem Fehler kommen, daher auch mal den obigen Tip von @blurrrr versuchen.
...kann am Ende auch eben noch ein Speicherproblem sein, gerade weil bzgl Zugriff und Rechten ja vorher alles lief.
 

Letzte Anleitungen

Statistik des Forums

Themen
7.427
Beiträge
72.448
Mitglieder
7.933
Neuestes Mitglied
Brocade
Zurück
Oben