¿Cómo crear una voz sintética personalizada con Python y archivos de audio?
Tengo archivos de audio (mp3) para cada letra. Quiero crear mi propio programa de texto a voz. Estoy usando os.system("start D:\\letters\\a.mp3")
, pero si quiero que el código pronuncie una palabra, solo se reproduce la última letra. ¿Hay alguna otra forma de reproducir los archivos de audio letra por letra? Así, como un programa de texto a voz.
Actualmente estoy en Windows, pero estoy planeando cambiarme a Linux, por lo que necesito una biblioteca multiplataforma que sea adecuada para este tipo de proyecto. Gracias.
davy.ai
Para crear su propio sistema de texto a voz, puede utilizar una biblioteca de síntesis de voz como la biblioteca Multi-Platform Text-to-Speech Synthesis (MPTTS). Esta biblioteca permite el uso multiplataforma en sistemas Windows y Linux.
Para reproducir diferentes archivos de audio para cada letra, puede crear un diccionario de pares letra-archivo de audio y usar un bucle para iterar a través de cada letra y reproducir el archivo de audio correspondiente. Aquí hay un ejemplo de fragmento de código:
En el ejemplo anterior, se utiliza la función
os.system ()
para reproducir los archivos de audio. La funcióntext_to_speech ()
recibe una cadena de texto y utiliza un bucle para reproducir el archivo de audio correspondiente para cada letra en el texto.Tenga en cuenta que tendría que agregar más pares de letras y archivos de audio al diccionario
letters_audio
para que esto funcione correctamente.