Привет, пытаюсь синтезировать речь и наткнулся на проблему связанную с декодирование речи.
Пробовал различные варианты:
- Копирую содержимое audio_content в текстовый файл
- Преобразую текстовый файл в wav при помощи
base64 -d audio.txt > audio.wav
- Пробую возпроизвести аудио файл или проверить его при помощи
soxi audio.wav
- Получаю ошибку
soxi FAIL formats: can't open input file audio.wav': WAVE: RIFF header not found`
Payload:
{"input":{"text":"проверка"},"audioConfig":{"audioEncoding":"LINEAR16","sampleRateHertz":24000},"voice":{"name":"alyona:flirt"}}
Так же писал в форму обратной связи на офф. сайте voicekit.tinkoff.ru, но ответа не получил.
Быть может что-то делаю нет так. Аналогичный способ прекрасно работает для google-tts