Вопрос Проблема с библиотекой Speech Recognition

Gaurussel · 15 Апрель 2022

Добрый вечер. Столкнулся с ошибкой, которая стала для меня головной болью. Скачиваю файл с апишки телеграмма и даю прочесть его библиотеке speech recognition, но она выдаёт данную ошибку:

Audio file could not be read as PCM WAV, AIFF/AIFF-C, or Native FLAC; check if file is corrupted or in another format

Python:

def recognition_voice(url):
    download_file(url)

    r = sr.Recognizer()

    file_audio = sr.AudioFile('voice_message.ogg') # ошибка возникает на этой строчке

    with file_audio as source:
         audio_text = r.record(source)

    print(type(audio_text))
    print(r.recognize_sphinx(audio_text))

Так же попытался использовать assemblyai (как библиотеку так и их апи), но у них русская модель пока ещё в стадии тестирования (как я понял).
Перепробовал все способы которые нашёл, ни один не помог (там где не нужно было скачивать дополнительного ПО, ибо такой вариант мне не подходит), в частности с использованием таких библиотек, как: pydub, soundfile, wavio. Если кто-то знает решение данной проблемы пожалуйста ответьте. Спасибо!
P.S.: я находил ответы на этот вопрос на stackoverflow и не только, но увы не помогло.

Gaurussel · 16 Апрель 2022

KlareoN написал(а):
Попробуй конвертировать в mp3

А это уже вторая проблема :animehehe:

. Чтобы конвертировать нужно стороннее ПО (чаще всего это ffmpeg), а это уже огромный минус для меня (делаю практическую для колледжа, а на их компьютерах там нельзя что-либо ставить кроме библиотек). Ладно, брошу затею с голосовыми сообщениями.
Спасибо что пытался помочь!

Вопрос Проблема с библиотекой Speech Recognition

Похожие темы