Jente, ¡atención!
Les comento que justamente, y justo ahora, ¡están investigando cómo mejorar el sonido en Espeak NG!
Me enteré porque se lo planteé a Chris Leo, colaborador de Espeak NG y fue quien hizo eso de las preguntas en el español.
Pego el correo, aunque eso sí, no se quejen por la ortografía/dramática porque él es italiano pero así habla español.
¡Saludos!
Hola Carlos
Sì, despues la desaparición del creador de eSpeak Jonathan Duddington, unos de los problemas principales de la comunidad espeak-ng ha sido mejorar el sonido del sintetizador.
El klatt de espeak y MBrola usan tecnologiía muy vieja, hablamos de más de 20 años, una eternidad en terminos informaticos.
Por eso la primera cosa que hacer ha sido actualizar todo el codigo de espeak-ng, por ejemplo, ahora se usa C99 en vez de el viejo C++;
también ahora se usa Sonic, un algoritmo para controlar mejor la velosidad del habla.
Seguimos investigando para incluir o crear un klatt recente, aunque si en esto sentido no hay mucho en el mundo Open Source para TTs.
El klatt de speechPlayer creado por Michael Curran es muy bueno, pero todavía tiene varios problema, como el volumen muy bajo. Cuando intentamos subir el volumen original algunos fonemas basados en audio van a clipear y se oye sonidos extraños.
A ver si podemos buscar resultados más esperado con estas nuevas tecnologias, el camino es muy largo y el proyecto espeak-ng es pobre de contribudores.
es decir, no se puede comparar espeak-ng al proyecto NVDA donde hay muchos desarrolladores alrededor.
Otro problema es que hay pocos feedback, pocos usuarios usan espeak-ng, la mayoría son usuarios de Linuz.
Por eso digo que el camino será muy largo, lo importante es no abandonar el proyecto!
Muchas gracias, y estamo en contacto para cualquier feedback, sugerencia o contribución.
Saludos,
Chris.
Carlos Esteban Martínez Macías, 08/10/2018 20:42:
¡Hola Chris!
Soy Carlos Esteban Martínez Macías. usuario de NVDA, de tus complementos
Emoticons y Place Markers, y también de Espeak NG.
Bien, en este mensaje me gustaría plantearte algo para Espeak NG:
Este sintetizador lo llevo usando por mucho tiempo, y lo sigo usando,
porque me gusta el tema de que lee más símbolos como por ejemplo los
asiáticos, donde otros sintetizadores se quedan como si no los hubieran
y al navegar por carácteres sobre ellos no dicen nada.
De hecho, creo que Espeak NG está progresando. Me es de muchísima
utilidad, por ejemplo, el diccionario de Emogis que hay ahora, ¡me lee
muchos más emogis! Y las mejoras que le estás poniendo al español
también son buenas, por su puesto.
A raíz de esto, pues el problema de muchos usuarios hispanohablantes de
NVDA rechazan a Espeak NG y prefieren otros sintetizadores, como
ETI-Eloquence, sin ir más lejos.
Ahora bien, en el artículo Espeak NG que publicaste en junio de 2016 dice:
El sintetizador eSpeak-ng usa spectral formant syntesis por defecto, por
eso tiene un sonido robótico, pero puede ser configurado para usar klatt
syntesis, y también MBROLA, para darle un sonido más natural.
El klat sintesis de Speech Player me ha gustado, pero probé un
complemento llamado M Brola in espeak con MBrola tools instalado, y no
me gustó el cómo suena.
Bueno, se debería hacer algo para mejorar el sonido en Espeak NG, en el
sentido de que, no tenga notado el sonido robótico y mejorar las
frecuencias. No sé cómo funciona esto de las frecuencias, pero tengo un
amigo, por ejemplo, que tiene 40% de pérdida auditiva a demás de ser
ciego y para escuchar con claridad usa audífonos, pero con este
problema, no puede usar Espeak NG por muchísimo tiempo porque le hace
doler, pero a Eloquence sí lo puede usar. Supongo que algo tendrá que
ver con la síntesis klat, no lo sé. Otra cosa que se podría hacer, es ya
incluir el klat de NV Speech Player, y se podrían mejorar las variantes
klat (klat, klat 1, etc) para que no suenen muy... digamos, distorsionadas.
Me gustaría extender en la comunidad hispanohablante el uso de Espeak NG
porque es de código abierto, y está en constantes mejoras, a diferencia
de Eloquence que pese a sonar muy natural a pesar de ser una síntesis
por formantes hace ya varios años se descontinuó su desarrollo de
sintetizador como tal, y o se vende, o muchos cojen el complemento
Eloquence para NVDA (ilegal) y lo utilizan.
A ver qué se puede hacer para mejorar el sonido en Espeak NG para que no
sea robótico y metálico.
¡Saludos!