This model export in onnx does not work
I run the transcribe.py with a demo english file and it returns:
C:\work\cohere\models>python transcribe.py ..\test_en.wav en
Loading 4 encoder splits, cross_kv, decoder...
..\test_en.wav (33.6s, RTF=0.44): >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
what is the result what you run the transcribe.py without passing a wav? It should auto-download from a known dataset and run inference. It is a good baseline to test if your audio file may be the problem.
PS C:\work\cohere\models> python transcribe.py ..\test_en.wav en
Loading 4 encoder splits, cross_kv, decoder...
..\test_en.wav (33.6s, RTF=0.50): plusieurs sicher굳ack얘 영상amp굳 Vaiδιαίτε굳 Vaiδιαίτε pair pair pair pair吹rianamp previously ainsi굳 button extremelyということで sicher bell昔 bell高uzτοι χώ» plusieurs高uz impossibleνον 다음에退uz trip looked enfinνον les υπηρε nayرج 동 υπηρε standingwelαλύτε standingwel谢金ということで manera انت wasnuld谢 tripνον μεuz退uz trip Bible light انت退uz退uz退uz退uz退uz退uz退uz退uz Moi enfinαλύτεن μεこのύνη nou cloudatt manera انت traff movingided寺uz退uz退 moving انت انت información enfin انت انت انت انت انت글θυν doss انت انت انت انت انت انت انت información enfin انت información enfin Greek判agueαλύτεgg light انت información enfin انت información enfin انتäch انت انت انت انت انت انت انت انت información enfin انتuro벤αλύτε standing انت》 traffancingouldlip standing townαλύτε vogjet nay晴 انت town悩lip standing town problema انتhlip standing town벤属 Chairman Sto standing 저 procedureamphobitoamp انت انت انت انت انت انت انت انت انت انت انت انت με legitamp انت Datństqué谢hliplip przez انت traff structure انتliplipliplip standing nou standing town zegぽίνει「amppar standingートぽlipliplip standing