Peter
New member
Hallo allerseits,
ich wollte mal fragen, ob jemand mit Speech-to-text, z.B. Whisper Erfahrungen gesammelt hat.
Das Endergebnis soll sein, dass ich in einem Verzeichnis auf dem NAS Audiodateien (Sprache) ablege und mir dazu die Texte generiert werden.
Ausprobiert habe ich bisher:
Beispiel für go-whisper:
Erfolgreich per curl-Befehl das Modell geladen:
Bei der Übergabe der WAV-Datei stürzt der Container ab:
Grundsätzlich finde ich Whisper interessant und hoffe, dass es mit meiner Aussprache gut klarkommt. So könnte ich während der Fahrt schon Sachen diktieren, die dann als Textdatei schon vorliegen, wenn ich ankomme.
Viele Grüße
Peter
ich wollte mal fragen, ob jemand mit Speech-to-text, z.B. Whisper Erfahrungen gesammelt hat.
Das Endergebnis soll sein, dass ich in einem Verzeichnis auf dem NAS Audiodateien (Sprache) ablege und mir dazu die Texte generiert werden.
Ausprobiert habe ich bisher:
- github.com/linuxserver/docker-faster-whisper
- github.com/mutablelogic/go-whisper
Beispiel für go-whisper:
Erfolgreich per curl-Befehl das Modell geladen:
Code:
curl -X POST -H "Content-Type: application/json" \
-d '{"path": "ggml-medium-q5_0.bin"}' \
localhost:30000/api/v1/models?stream=true
Code:
curl -F model=ggml-medium-q5_0 \
-F file=@/volume1/spielwiese/jfk.wav \
localhost:30000/api/v1/audio/transcriptions?stream=true
Grundsätzlich finde ich Whisper interessant und hoffe, dass es mit meiner Aussprache gut klarkommt. So könnte ich während der Fahrt schon Sachen diktieren, die dann als Textdatei schon vorliegen, wenn ich ankomme.
Viele Grüße
Peter