Hilo oficial sobre los sintetizadores de voz

4013 mensajes, 134 páginas: 1 …  3 45  6 7 …  134 ↖ Volver a la lista de temas

Resultado: +39

121. leocapo,

che, a mi nunca me pasó que el eloquence hiciera, pausas a lo tonto. xd. donde sí pasa mucho es en las versiones viejas de eloquence o en las versiones, viejas de viavoice. por ejemplo tengo entendido que en el jaws, 3.31, hacía esas pausas, tan raras que ustedes mencionan. además no sé, si recuerdan al talks, el eloquence, para el talks también hacía esas pausas tan molestas. pero ahorita ya no hace eso.

Resultado: +0

122. sukil,

No, Hawking no usaba Dectalk. Es algo parecido, eso sí.

Resultado: +0

123. r-althor,

según tengo entendido, la variante de Auking fue creada especialmente para el, y no podía ser vendida ni reproducida en otros lugares.

Resultado: +0

124. leocapo,

era de suponer, jaja. si él no tenía un sintetizador de voz hecho sólo para su persona quién mas lo podía tener? nadie. pero sí es muy parecido a dectalk jaja.

Resultado: +0

125. Amleset_Agonafir ,

yo pienso que deberían poner voces vocalizer en amárico (Idioma de etiopía), suahili (De Kenia y partes de áfrica), Y el idioma tradicional de sudáfrica

Resultado: +0

126. leocapo,

estoy casi seguro de que algún sinettizador con esos idiomas que no sea el espeak hay. de todas formas bocalicer siempre va actualizando sus voces y sus idiomas. bueno, lo que es siempre siempre, no tan siempre, pero por lo menos pasan unos cuantos años y tenemos seguramente alguna que otra voz nueva. el otro día un amigo me estaba haciendo escuchar una voz argentina que nunca antes había escuchado, que según él era de bocalizer, asique bueno.

Resultado: +0

127. El_Observador ,

Eloquence de Code Factory para NVDA y también para Android, tienen para desactivar, o volver a activar, estas pausas.

Resultado: +0

Última edición por El_Observador , 25.09.2018 01:34:53

128. Exink,

¿Por qué no podría hacer la conversión desde el entorno Sapi5? Argumentos, por favor.

Pero si no se pudiera pienso que sería ridículo, se supone que uno paga para poder usar las voces del modo más personal que uno quiera ¿o no?

Pues bueno... nos quedaremos, por razones de seguridad quizá, sin poder reproducir esta legendaria voz. :D

Resultado: +0

129. Nicky_Jam ,

Ah pará! jájajajajaa, pensaba que hablabas del addon para NVDA con vocalizer, porque ese toy usando hasta que se me termine el tiempo. Claro que con el de Sapi sí, dale nomá.

Resultado: +0

130. El_Observador ,

Y ya que estamos con Eloquence, el complemento de Eloquence y Vocalizer de Code Factory también hace que NVDA pueda leer los emogis. Y es algo que sirve aunque no lo crean, porque hay muchos, muchísimos. El complemento Emoticons no tiene un diccionario por defecto de todos, y para que lo sepan, en cualquier cuadro de edición, si tienen Windows 10 fall creators update o superior pulsen windows+punto o windows+coma (usen Espeak NG o voces One Core para que puedan leer bien la lista y que describa todos los emogis esos). Hay de distintas categorías para insertar, ¡y son variedades!

Resultado: +0

131. Nicky_Jam ,

Chicos, ya están para NVDA las voces de Isabella y Ximena para que las prueben o compren.

Resultado: +0

132. El_Observador ,

Jente, ¡atención!
Les comento que justamente, y justo ahora, ¡están investigando cómo mejorar el sonido en Espeak NG!
Me enteré porque se lo planteé a Chris Leo, colaborador de Espeak NG y fue quien hizo eso de las preguntas en el español.
Pego el correo, aunque eso sí, no se quejen por la ortografía/dramática porque él es italiano pero así habla español.
¡Saludos!
Hola Carlos
Sì, despues la desaparición del creador de eSpeak Jonathan Duddington, unos de los  problemas principales de la comunidad espeak-ng ha sido mejorar el sonido del sintetizador.
El klatt de espeak y MBrola usan tecnologiía muy vieja, hablamos de más de 20 años, una eternidad en terminos informaticos.
Por eso la primera cosa que hacer ha sido actualizar todo el codigo de espeak-ng, por ejemplo, ahora se usa C99 en vez de el viejo C++;
también ahora se usa Sonic, un algoritmo para controlar mejor la velosidad del habla.
Seguimos investigando para incluir o crear un klatt recente, aunque si en esto sentido no hay mucho en el mundo Open Source para TTs.
El klatt de speechPlayer creado por Michael Curran es muy bueno, pero todavía tiene varios problema, como el volumen muy bajo. Cuando intentamos subir el volumen original algunos fonemas basados en audio van a clipear y se oye sonidos extraños.
A ver si  podemos buscar resultados más esperado con estas nuevas tecnologias, el camino es muy largo  y el proyecto espeak-ng es pobre de contribudores.
es decir, no se puede comparar espeak-ng al proyecto NVDA donde hay muchos desarrolladores alrededor.
Otro problema es que hay pocos feedback, pocos usuarios usan espeak-ng,  la mayoría son usuarios de Linuz.
Por eso digo que el camino será muy largo, lo importante es no abandonar el proyecto!
Muchas gracias, y estamo en contacto para cualquier feedback, sugerencia o contribución.
Saludos,

Chris.

Carlos Esteban Martínez Macías, 08/10/2018 20:42:
¡Hola Chris!

Soy Carlos Esteban Martínez Macías. usuario de NVDA, de tus complementos
Emoticons y Place Markers, y también de Espeak NG.

Bien, en este mensaje me gustaría plantearte algo para Espeak NG:

Este sintetizador lo llevo usando por mucho tiempo, y lo sigo usando,
porque me gusta el tema de que lee más símbolos como por ejemplo los
asiáticos, donde otros sintetizadores se quedan como si no los hubieran
y al navegar por carácteres sobre ellos no dicen nada.

De hecho, creo que Espeak NG está progresando. Me es de muchísima
utilidad, por ejemplo, el diccionario de Emogis que hay ahora, ¡me lee
muchos más emogis! Y las mejoras que le estás poniendo al español
también son buenas, por su puesto.

A raíz de esto, pues el problema de muchos usuarios hispanohablantes de
NVDA rechazan a Espeak NG y prefieren otros sintetizadores, como
ETI-Eloquence, sin ir más lejos.

Ahora bien, en el artículo Espeak NG que publicaste en junio de 2016 dice:

El sintetizador eSpeak-ng usa spectral formant syntesis por defecto, por
eso tiene un sonido robótico, pero puede ser configurado para usar klatt
syntesis, y también MBROLA, para darle un sonido más natural.

El klat sintesis de Speech Player me ha gustado, pero probé un
complemento llamado M Brola in espeak con MBrola tools instalado, y no
me gustó el cómo suena.

Bueno, se debería hacer algo para mejorar el sonido en Espeak NG, en el
sentido de que, no tenga notado el sonido robótico y mejorar las
frecuencias. No sé cómo funciona esto de las frecuencias, pero tengo un
amigo, por ejemplo, que tiene 40% de pérdida auditiva a demás de ser
ciego y para escuchar con claridad usa audífonos, pero con este
problema, no puede usar Espeak NG por muchísimo tiempo porque le hace
doler, pero a Eloquence sí lo puede usar. Supongo que algo tendrá que
ver con la síntesis klat, no lo sé. Otra cosa que se podría hacer, es ya
incluir el klat de NV Speech Player, y se podrían mejorar las variantes
klat (klat, klat 1, etc) para que no suenen muy... digamos, distorsionadas.

Me gustaría extender en la comunidad hispanohablante el uso de Espeak NG
porque es de código abierto, y está en constantes mejoras, a diferencia
de Eloquence que pese a sonar muy natural a pesar de ser una síntesis
por formantes hace ya varios años se descontinuó su desarrollo de
sintetizador como tal, y o se vende, o muchos cojen el complemento
Eloquence para NVDA (ilegal) y lo utilizan.

A ver qué se puede hacer para mejorar el sonido en Espeak NG para que no
sea robótico y metálico.

¡Saludos!

Resultado: +0

133. Amleset_Agonafir ,

yo uso espeak y creo que e es el mejor sintetizador del mundo. Lo uso porque me lee los símbolos por ejemplo del amárico, la verdad está genial

Resultado: +0

134. El_Observador ,

Si, ahora la cosa es: ¡En un futuro quizá puedan mejorar el sonido que tiene actualmente! ¿Ea!
Si alguien tiene alguna sugerencia es vienvenida, que yo se la hago a Chris, ya que él es colaborador en el desarrollo de Espeak NG.

Resultado: +0

Última edición por El_Observador , 09.10.2018 00:50:34

135. mimethedj,

buenas noches gente, les saluda DJ Mime Vzla, quisiera saber si alguien por casualidad tendrá a mano un linck para descargar el complemento ETI-Eloquence para nvda actualizado, se lo agradezco de antemano a quien me lo pueda facilitar por favor

Resultado: +0

136. El_Observador ,

https://www.nvda-fr.org/voix/EloquenceAutoLanguageSwitching.nvda-addon

Resultado: +0

137. VagonnChicano ,

por qué mejor nó conbierten al espeak en un sintetizador con voces humanas, como el loquendo? sería genial

Resultado: +0

138. Yeri_mua ,

eso la verdad es que viéndolo realmente sería una buena idea, pero es muy difícil de hacer. ya que para las voces humanas, hay que programarlas y grabar un montón de frases. osea primero tienen o tendrían que graberse un montón de frases y después irlas programando. no sé como funcione esto. pero lo que sí quisiera hacer es crearme mi propio tts. en coreano. ok no. pero sí mi propio tts.

Resultado: +0

139. Exink,

Yo hace mucho tiempo me creé mi propia demo de TTs en una página llamada lyrebird (perdón la ortografía). Si bien pude hacerlo, no me convenció mucho el resultado que digamos, aunque supongo que eso debido a que yo no soy profesional en esto. Y además, los hispanos tendremos que esperar... vaya novedad ¿no?

A pesar que no disfruto mucho de ESpeak, sí que reconozco la inclusión de más idiomas como el maorí, que hasta donde yo sé no hay ninguna otra síntesis que lo incluya. ¿Habrá planes para añadir el hawaiano o el samoano? Jeje.

Resultado: +0

140. VagonnChicano ,

esa página es accesible para hacer tts? haber haber comparte! eso me interesó! porfa! a, y para los que hacen sus tts, en donde las cargan? sapy5? android? sapy4? en donde?

Resultado: +0

141. Exink,

El sitio se jacta de poder "hacer clones de tu voz ultra realistas para usarse en asistentes, audiolibros y servicios telefónicos", en inglés, pagando ciertos precios y realizando el proceso en la página. Nota que cuando hice la demo fue hace como un año, y por alguna razón ésta ya no se encuentra disponible... aunque la verdad, no creo que exista alguna otra tecnología más realista que Wavenet, pero eso ya dependerá de gustos.

Básicamente te pedían que leyeras frases y te grabaras diciéndolas; no hubo tantas frases, pero aún así funcionaba.

Resultado: +0

142. Nicky_Jam ,

En este mismo momento estoy usando Infovox 230. En ese entonces manejaba síntesis por formantes, también tengo Truvoice.

Resultado: +0

143. julian_suarez,

hola chicos! alugno me podria pasar por permanente porfabor la voz de angélica premium hig para n v d a ? gracias

Resultado: +0

144. trabant,

Yo encontré alguna web de una universidad de aquí de España que te crea un TTS, pero no era accesible el tipo de captcha que incluía y lo dejé por imposible, quizá ahora haya mejorado el asunto

Resultado: +0

145. Nicky_Jam ,

Hablamos de Zure TTS?
En efecto, hay que resolver un capcha. Pero ahora sucede que, tras donar nuestra voz, naturalmente se va a querer utilizar la voz que creamos. Bien, ocurre que ahora para seleccionar la voz personalizada hay que clickear en un punto amarillo, cosa que no logro de ninguna forma.

Resultado: +0

146. trabant,

pues no recuerdo si era esa

Resultado: +0

147. tu-principito-lindo ,

yo estoy creando en byrebird, y es un poco fácil de crear!

Resultado: +0

148. dj-dalsim ,

@rodolfo_alcardi: ¿puedes crear en español? o solo en inglés. saludos.

Resultado: +0

149. Nicky_Jam ,

De última voy a hablar con los sasios de byrebird, la cosa es que altoSpeech siempre ha ido en serio. Que me lleve los años que me lleve, después de todo aprendí que cuanto más tiempo nos lleve algo, mejor nos saldrá. Pero lo importante es que no lo dejo.

Resultado: +0

150. tu-principito-lindo ,

por la mala suerte no la pude crear, por que solo me da unas oraciones en inglés que tengo que grabarlas, pero yo quiero hacer en español

Resultado: +0

4013 mensajes, 134 páginas: 1 …  3 45  6 7 …  134 ↖ Volver a la lista de temas

Responder al tema

Usted debe estar conectado para poder postear.