Hilo oficial sobre los sintetizadores de voz

4214 mensajes, 141 páginas:  1; 136 137138 139 140 141 ↖ Volver a la lista de temas

Resultado: +41

4111. Willem,

qué onda, ya no hay novedades respecto a los sintes? es raro ver el hilo muerto por tanto tiempo

Resultado: +0

4112. Iris-AI,

yo no sé si realmente no hay, pero al menos no tengo nada nuevo. Ahora es como que la síntesis de voz se centra mucho o casi en exclusiva en IA, y como que ahora la IA generativa de texto a voz está ganando terreno. Digamos que como muy muy nuevo me quedé en Sonata/Piper, y las que se mandaron con las voces de azure.

Resultado: +0

4113. Willem,

sí, tienes razón! pero las de azure ya se pueden usar libremente en NVDA o como sapi 5? bueno, tengo win10 todavía, no me he querido pasar al 11

Resultado: +0

4114. Iris-AI,

Siempre que tengas Win 10 de 64 bits, todavía tenés la opción de usar el complemento Neural voices, que en español solo te trae 4 oces, es decir, las que también tendrías de manera local para narrador en Win 11.
Ahora, que el index donde estaba ha morto, así que tendré que buscarlas bien. si no, hay una especie de adapter para Sapi 5, para que utilices estas voces bajo Sapi 5 y acá sí, las tenés de todos los países y todos los "supuestos" dialectos latinoamericanos. En 32 bits te debería andar, y lo ideal e que tengas Edge instalado, ya que de ahí las va a utilizar el coso en línea, pero la responsibidad es bastante aceptable.

Resultado: +0

4115. Symbian,

de echo no hace falta Microsoft Edge para usar esas voces.

Resultado: +0

4116. DolbyAtmos,

A carai, me interesa eso de tener los dialectos adicionales para sapi.

Resultado: +0

4117. Willem,

sí, pasen el dato! cómo se puede conseguir ese complementillo o adaptador?

Resultado: +0

4118. Un-Duende-Malote-Malote,

yo lo escuché en: https://tecnoconocimientoaccesible.blogspot.com/2024/07/naturalvoicesapiadapter-desbloquea.html

Resultado: +0

4119. Willem,

gracias, le doy una revisada.

Resultado: +0

4120. ZuluChild,

pequeños y pequeñas!
Esto no se si va aquí pero tengo que contarlo.
Resulta que ayer instalé RH voice en mi nuevo celular. Y cuando me preparaba para descargar las voces que yo uso siempre, me encontré con una voz en un idioma que ningún sintetizador de voz ha tenido.
Estoy hablando de la nueva voz de Dimpho, en Setswana.
Si, ya se, el Espeak tiene Setswana, muy mal hecho pero esta es la primera vez que un sintetizador de voz tiene una voz en uno de los 11 idiomas oficiales de Sudáfrica grabada a partir de muestras de un nativo!
Yo ya sabía que esto iba a llegar, porque hace bastante leí una entrada en el sitio de Rh voice que decía que iban a ir agregando nuevos idiomas.
Ahora habría que ver si está disponible en nvda o sapi 5, que no creo. Pero ahora es cuestión de esperar las actualizaciones y ver que otro idioma agregarán :)

Resultado: +0

4121. Willem,

Eh, gracias por el aporte, endemoniado! Funciona de maravilla, y la respuesta como biens eñalaron, es bastante buena. Ligeramente lenta, pero nada como phyzzer o como se llamara el otro.

Resultado: +0

4122. Symbian,

a mi me funcionaron en una VM de Windows Server 2003. La cosa, supongo que requieren de internet obviamente, así que dudo que uno pueda estar siempre con esas voces prendidas.

Resultado: +0

4123. helena_desktop,

que voces funcionaron en Windows server 2003? las de azure? juuas, eso es bien raro xdd

Resultado: +0

Última edición por helena_desktop, 16.07.2024 16:22:04

4124. Willem,

la parte mala es que si lo pones a leer de corrido se traba con unas pocas palabras.

Resultado: +0

4125. Symbian,

y si, las voces de azure. El creador del repositirio de GitHub pone Windows XP SP3 como versión mínima de Windows soportada, Windows Server 2003 es equivalente.

Resultado: +0

4126. Willem,

Por cierto, se supone que instalé también las voces del narrador. Cuáles son? las de onecore de toda la vida? o esas no están disponibles para w10. al menos yo no las encontré.

Resultado: +0

4127. Exink,

¿Será que se vienen las voces en hawaiiano o en maorí?

¡Bueno, soñar no cuesta nada! :D

Personalmente, no he visto mucho que la síntesis de voz o incluso la tecnología RVC siga evolucionando tanto como los modelos de imágenes o de texto. En pocas palabras, es como si todo esto se hubiera estancado. Dudo que los que trabajen en la empresa "tengo un motor que puede clonar tu voz en 15 segundos, pero no lo lanzo porque podría destruir el mundo" vayan a hacer algo, a menos que igualmente lleguen los chinos con algún proyecto funcional, como lo han hecho ya con la generación de videos.

Ojalá esté equivocado y haya por a´hi algún otro sintetizador nuevo que no conozca en alguna de las dos modalidades. Pero bueno, por lo mientras a usar las voces que usa medio mundo para sus videos.

Resultado: +0

Última edición por Exink, 16.07.2024 22:11:35

4128. copilot,

alguien coso otro aparte de eloquense acapela las voses naturales y todas esas de las comunes es que me quedé estancado.

Resultado: +0

Última edición por copilot, 16.07.2024 22:24:39

4129. DolbyAtmos,

Se que Microsoft tiene un modelo que clona tu voz con solo tres segundos de ella, pero dado a que dicen que es muy efectiva y peligrosa no estará al público. Igual Samsung puede clonar tu voz para Bixby, pero solo en inglés.

Resultado: +0

4130. El-Megalovano,

Exacto. Y por lo que ví claro el soporte para setswana es terrible, ni se diga del maltés.
Pensé en una ocasión que Piper agregaría soporte a los idioms esperanto, ido, interlingua, lingua franca nova y lojban, aunque con lo limitado con el código que sé nó estoy del todo seguro si se agregarían.
Ah, por cierto, hay nuevas voces para Piper TTS a demás del repositorio oficial y los otros que subieron en el hilo de Sonata como fuera de ellos?

Resultado: +0

4131. helena_desktop,

no sé, ando estancada jaja.

Resultado: +0

4132. killer-instinct,

Si quieren sacar la voz del paseo de Windows xp:
extraigan la voz como una akapella, y así pueden trabajarla.
No se diga más, ya les dí la idea.

Resultado: +0

4133. Iris-AI,

Pero si ya está entrenada y todo...

Resultado: +0

4134. killer-instinct,

¿Ya está entrenada? ¿cómo puedo escucharla?
suena interesante.

Resultado: +0

4135. Exink,

Hombre, si ya hay voces de algunos audiojuegos españoles, no dudo que no esté esa voz jajaja. O sea, si el tema en cuanto a la extracción de voz sí que está avanzando, de eso no me queda duda.

Resultado: +0

4136. Symbian,

creo que esa voz estaba en fakeyou, pero no sé si la voz inglesa y la española son idénticas.

Resultado: +0

4137. Iris-AI,

Acá está. Te la doy directamente en su variante RT: https://huggingface.co/AIHeaven/piper_unofficial_voices/blob/main/es/rt-voices/es_ES-xp%2BRT-medium.tar.gz

Resultado: +0

4138. Willem,

y al final, saben de dónde salió la voz esa del paseíto? es sintética, cierto?

Resultado: +0

4139. Iris-AI,

o sea, a ver. La voz originalmente es una voz en off grabada, una persona real relatando todo. Pensemos que en la época en que se hizo, teníamos la existencia de la síntesis de oz concatenativa por selección de unidad, que casi nunca lograba ese nivel de realismo, y todavía se notaban detallitos para poderse distinugis de oído que era un sintetizador de voz. una persona fue y entreó esa misma voz para Piper, que es lo que pasé e mi mensaje anterior, y bueno, he aquí lo que se pretende hacer con Piper. convertir en oces sintéticas lo más fieles a sus equivalentes humanas que se pueda, y bueno, eso. Windows vista y 7 también tenían sus vídeos con una voz femenina, no sé si la misma porque ya no me acuerdo.

Resultado: +0

4140. Hermione12,

Creo que sí sabe que vos hablan creo que están hablando de la que te explica al principio todo lo de Windows XP si no recuerdo mal digo esto lo menciono espero no haberme equivocado pero creo que sí es no sé porque me suena muy familiar esto lo que dicen del paseo este de Windows XP

Resultado: +0

4214 mensajes, 141 páginas:  1; 136 137138 139 140 141 ↖ Volver a la lista de temas

Responder al tema

Usted debe estar conectado para poder postear.

¿Perdió su contraseña? Crear una cuenta