Hilo oficial sobre los sintetizadores de voz

4214 сообщений, 141 страниц:  1; 136 137138 139 140 141 ↖ Вернуться к списку тем

счёт: +41

4111. Willem,

qué onda, ya no hay novedades respecto a los sintes? es raro ver el hilo muerto por tanto tiempo

счёт: +0

4112. Iris-AI,

yo no sé si realmente no hay, pero al menos no tengo nada nuevo. Ahora es como que la síntesis de voz se centra mucho o casi en exclusiva en IA, y como que ahora la IA generativa de texto a voz está ganando terreno. Digamos que como muy muy nuevo me quedé en Sonata/Piper, y las que se mandaron con las voces de azure.

счёт: +0

4113. Willem,

sí, tienes razón! pero las de azure ya se pueden usar libremente en NVDA o como sapi 5? bueno, tengo win10 todavía, no me he querido pasar al 11

счёт: +0

4114. Iris-AI,

Siempre que tengas Win 10 de 64 bits, todavía tenés la opción de usar el complemento Neural voices, que en español solo te trae 4 oces, es decir, las que también tendrías de manera local para narrador en Win 11.
Ahora, que el index donde estaba ha morto, así que tendré que buscarlas bien. si no, hay una especie de adapter para Sapi 5, para que utilices estas voces bajo Sapi 5 y acá sí, las tenés de todos los países y todos los "supuestos" dialectos latinoamericanos. En 32 bits te debería andar, y lo ideal e que tengas Edge instalado, ya que de ahí las va a utilizar el coso en línea, pero la responsibidad es bastante aceptable.

счёт: +0

4115. Symbian,

de echo no hace falta Microsoft Edge para usar esas voces.

счёт: +0

4116. DolbyAtmos,

A carai, me interesa eso de tener los dialectos adicionales para sapi.

счёт: +0

4117. Willem,

sí, pasen el dato! cómo se puede conseguir ese complementillo o adaptador?

счёт: +0

4118. Un-Duende-Malote-Malote,

yo lo escuché en: https://tecnoconocimientoaccesible.blogspot.com/2024/07/naturalvoicesapiadapter-desbloquea.html

счёт: +0

4119. Willem,

gracias, le doy una revisada.

счёт: +0

4120. ZuluChild,

pequeños y pequeñas!
Esto no se si va aquí pero tengo que contarlo.
Resulta que ayer instalé RH voice en mi nuevo celular. Y cuando me preparaba para descargar las voces que yo uso siempre, me encontré con una voz en un idioma que ningún sintetizador de voz ha tenido.
Estoy hablando de la nueva voz de Dimpho, en Setswana.
Si, ya se, el Espeak tiene Setswana, muy mal hecho pero esta es la primera vez que un sintetizador de voz tiene una voz en uno de los 11 idiomas oficiales de Sudáfrica grabada a partir de muestras de un nativo!
Yo ya sabía que esto iba a llegar, porque hace bastante leí una entrada en el sitio de Rh voice que decía que iban a ir agregando nuevos idiomas.
Ahora habría que ver si está disponible en nvda o sapi 5, que no creo. Pero ahora es cuestión de esperar las actualizaciones y ver que otro idioma agregarán :)

счёт: +0

4121. Willem,

Eh, gracias por el aporte, endemoniado! Funciona de maravilla, y la respuesta como biens eñalaron, es bastante buena. Ligeramente lenta, pero nada como phyzzer o como se llamara el otro.

счёт: +0

4122. Symbian,

a mi me funcionaron en una VM de Windows Server 2003. La cosa, supongo que requieren de internet obviamente, así que dudo que uno pueda estar siempre con esas voces prendidas.

счёт: +0

4123. helena_desktop,

que voces funcionaron en Windows server 2003? las de azure? juuas, eso es bien raro xdd

счёт: +0

Последнее изменение helena_desktop, 16.07.2024 16:22:04

4124. Willem,

la parte mala es que si lo pones a leer de corrido se traba con unas pocas palabras.

счёт: +0

4125. Symbian,

y si, las voces de azure. El creador del repositirio de GitHub pone Windows XP SP3 como versión mínima de Windows soportada, Windows Server 2003 es equivalente.

счёт: +0

4126. Willem,

Por cierto, se supone que instalé también las voces del narrador. Cuáles son? las de onecore de toda la vida? o esas no están disponibles para w10. al menos yo no las encontré.

счёт: +0

4127. Exink,

¿Será que se vienen las voces en hawaiiano o en maorí?

¡Bueno, soñar no cuesta nada! :D

Personalmente, no he visto mucho que la síntesis de voz o incluso la tecnología RVC siga evolucionando tanto como los modelos de imágenes o de texto. En pocas palabras, es como si todo esto se hubiera estancado. Dudo que los que trabajen en la empresa "tengo un motor que puede clonar tu voz en 15 segundos, pero no lo lanzo porque podría destruir el mundo" vayan a hacer algo, a menos que igualmente lleguen los chinos con algún proyecto funcional, como lo han hecho ya con la generación de videos.

Ojalá esté equivocado y haya por a´hi algún otro sintetizador nuevo que no conozca en alguna de las dos modalidades. Pero bueno, por lo mientras a usar las voces que usa medio mundo para sus videos.

счёт: +0

Последнее изменение Exink, 16.07.2024 22:11:35

4128. copilot,

alguien coso otro aparte de eloquense acapela las voses naturales y todas esas de las comunes es que me quedé estancado.

счёт: +0

Последнее изменение copilot, 16.07.2024 22:24:39

4129. DolbyAtmos,

Se que Microsoft tiene un modelo que clona tu voz con solo tres segundos de ella, pero dado a que dicen que es muy efectiva y peligrosa no estará al público. Igual Samsung puede clonar tu voz para Bixby, pero solo en inglés.

счёт: +0

4130. El-Megalovano,

Exacto. Y por lo que ví claro el soporte para setswana es terrible, ni se diga del maltés.
Pensé en una ocasión que Piper agregaría soporte a los idioms esperanto, ido, interlingua, lingua franca nova y lojban, aunque con lo limitado con el código que sé nó estoy del todo seguro si se agregarían.
Ah, por cierto, hay nuevas voces para Piper TTS a demás del repositorio oficial y los otros que subieron en el hilo de Sonata como fuera de ellos?

счёт: +0

4131. helena_desktop,

no sé, ando estancada jaja.

счёт: +0

4132. killer-instinct,

Si quieren sacar la voz del paseo de Windows xp:
extraigan la voz como una akapella, y así pueden trabajarla.
No se diga más, ya les dí la idea.

счёт: +0

4133. Iris-AI,

Pero si ya está entrenada y todo...

счёт: +0

4134. killer-instinct,

¿Ya está entrenada? ¿cómo puedo escucharla?
suena interesante.

счёт: +0

4135. Exink,

Hombre, si ya hay voces de algunos audiojuegos españoles, no dudo que no esté esa voz jajaja. O sea, si el tema en cuanto a la extracción de voz sí que está avanzando, de eso no me queda duda.

счёт: +0

4136. Symbian,

creo que esa voz estaba en fakeyou, pero no sé si la voz inglesa y la española son idénticas.

счёт: +0

4137. Iris-AI,

Acá está. Te la doy directamente en su variante RT: https://huggingface.co/AIHeaven/piper_unofficial_voices/blob/main/es/rt-voices/es_ES-xp%2BRT-medium.tar.gz

счёт: +0

4138. Willem,

y al final, saben de dónde salió la voz esa del paseíto? es sintética, cierto?

счёт: +0

4139. Iris-AI,

o sea, a ver. La voz originalmente es una voz en off grabada, una persona real relatando todo. Pensemos que en la época en que se hizo, teníamos la existencia de la síntesis de oz concatenativa por selección de unidad, que casi nunca lograba ese nivel de realismo, y todavía se notaban detallitos para poderse distinugis de oído que era un sintetizador de voz. una persona fue y entreó esa misma voz para Piper, que es lo que pasé e mi mensaje anterior, y bueno, he aquí lo que se pretende hacer con Piper. convertir en oces sintéticas lo más fieles a sus equivalentes humanas que se pueda, y bueno, eso. Windows vista y 7 también tenían sus vídeos con una voz femenina, no sé si la misma porque ya no me acuerdo.

счёт: +0

4140. Hermione12,

Creo que sí sabe que vos hablan creo que están hablando de la que te explica al principio todo lo de Windows XP si no recuerdo mal digo esto lo menciono espero no haberme equivocado pero creo que sí es no sé porque me suena muy familiar esto lo que dicen del paseo este de Windows XP

счёт: +0

4214 сообщений, 141 страниц:  1; 136 137138 139 140 141 ↖ Вернуться к списку тем

Ответить на тему

Чтобы писать на форуме, вам нужно сначала войти.

Забыли пароль? Создать учётную запись