es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: CUFFT

Detectar las voces, los roles y posiblemente incluso la prosodia y la disfluencia en el habla de un archivo de audio.

La reconocimiento automático del habla de Google/YouTube genera subtítulos sin identificar las voces. Cuando hay una conferencia, hay una sola voz, pero cuando varias personas están teniendo una conversación o más de una persona está hablando, el software STT (reconocimiento de voz) podría identificar esto ya que debería ser capaz . . . Read more