Hilo oficial sobre los sintetizadores de voz

4215 messaggi, 141 pagine:  1; 87 8889 90 91; 141 ↖ Torna alla lista degli argomenti

Punteggio: +41

2641. El-Megalovano,

Lo estaba.
Al post anterior, Josh borró todas las demos de synfony tts de google drive debido a que se trata de un software alfa muy temprano y el producto final sonará muy diferente. Así que creo que lo mejor es borrar todas las demos, y esperar hasta mediados o finales de 2023 para que synfony tts esté mucho más avanzado. Sin embargo, será emocionante comprar este nuevo sistema de tts en varias formas cuando salga al mercado. Ansí que escuchamos las demos, di mi opinión, ansina que ahora puedo borrarlas... y esperar a comprar lo definitivo o quizás a probar la beta a finales del año que viene.
Excúsame, pero Synfony se está desarrollando desde 2014 o algo ansí?
Pase lo que pase...

Punteggio: +0

2642. Furret,

gente conocedora de sintes retro, alguien reconoce cuál TTS samplearon para esta canción?
https://www.youtube.com/watch?v=bIANpsA2dRI

Punteggio: +0

2643. vrivri,

ese es sam, orpheus, no sé cual seria el nombre bien cierto. pero sam es el nombre de la voz. la tengo aqui.

Punteggio: +0

2644. Furret,

oooo genial! Me resultaba muy familiar. Por alguna razón las nuevas series de terror analógico usan mucho este tipo de voces porque suenan re tétricas xD, hasta el espeak queda bien

Punteggio: +0

2645. El-Megalovano,

Hablando del eSpeakNG ayer abrí un issue para agregar más idiomas al sinte. Entre ellos están.

  1. Anglosajón (inglés antiguo)
  2. Arrumano
  3. Asturiano
  4. Bretón
  5. Córnico
  6. Corso
  7. Feroés
  8. Frisón (sobre todo frisón occidental, también podría añadirse el frisón del norte y del este (Saterland))
  9. Franco-Provenzal (Arpitano)
  10. Friulano
  11. Gallego
  12. Gótico
  13. Interlingue (antes Occidental)
  14. Criollo jamaicano
  15. Judeoespañol, ladino, sefardí (esta es de alguna manera especial e interesante. siendo una lengua judía, utiliza el alfabeto hebreo, pero también el alfabeto latino con muchas versiones de ellos. Propongo basarlo en el alfabeto español, pero no sé su opinión.)
  16. Kotava
  17. Ladino o dolomita
  18. Ligur
  19. Manés
  20. Mirandés
  21. Napolitano
  22. Novial
  23. Occitano (incluidos los dialectos)
  24. Nórdico antiguo
  25. Romanche (principalmente la variedad de Rumantsch Grischun, también podría añadir dialectos (modismos))
  26. Sardo
  27. Escocés
  28. Siciliano
  29. Talosano (También es interesante, ya que es la primera vez que se añade una lengua micronacional).
  30. Veneciano
  31. Volapük
  32. Valón
  33. Yiddish
  34. Yo no soy hablante de estos idiomas.

Punteggio: +0

Ultima edizione da El-Megalovano, 02.09.2022 00:34:05

2646. grekmusic33,

también abrí un hilo de espeak con el archivo coregido de el español latino donde las preguntas no entonan los signos de interrogaciónde forma ascendente, ese archivo ya está arreglado, ojalá que sea añadido. Apropósito, en las versiones alfas de NVDA, hay como 2 o 3 variantes. Entre ellas, está la variante reed que está hecha mediante variante klatt6

Punteggio: +0

Ultima edizione da grekmusic33, 02.09.2022 01:31:57

2647. Iris-AI,

También, como novedad, el guaraní ahora sí leerá correctamente los números.

Punteggio: +0

2648. Yisuslavestia,

No deja. El propietario no permite la descarga ni la reproducción de este archivo de audio. sección

Punteggio: +0

2649. Manfred,

Sii, ¡Genial! Por fin van a tocar el Idioma de México, que era muy feo escucharla. Hablo del eSpeak, por supuesto. De ahí a que siempre me iba al Español de España, pero si se arregla eso ya la podré dejar en Mexicano sin problemas

Punteggio: +0

2650. Tu_gatito_ron_ron,

wtf. no entiendo el afán de saturar de idiomas que casi nadie habla al eSpeak.
lo que se debería hacer con urgencia, es que suene mejor.
tuve que ejecutar hace unas semanas una versión del NVDA 2017, y si hay mejoras desde ese tiempo, pero muy notorias no són.

Punteggio: +0

2651. Symbian,

@GLaDOS mándame porfa esas voces! Me interesan mucho! Por cierto, hay que tener en cuenta las excepciones fonológicas, y, el gótico también tiene dos alfabetos.

Punteggio: +0

2652. Yeri_mua ,

lol napolitano también es un idioma? Yo pensé que eso era un savor de elado jajajajaj. Por lo menos aquí en México hay un savor de elado que en realidad son 3, creo que es vainilla, freza y pistache, creo. Pero bueno volviendo al tema de speak, yo estoy interesada en que añadieran el inglés antiguo y otro que no recuerdo pero que dijeron que tenía como que alfabeto hebreo y latino o algo así.

Punteggio: +0

2653. Symbian,

de paso, podrían añadir el inglés medio (el inglés de la época de los Cuentos de Canterbury y Geoffrey Chaucer)

Punteggio: +0

2654. grekmusic33,

la variante reed de espeak, se parece a esto: https://www.nvaccess.org/files/synthTests20140808/sample5.mp3

Punteggio: +0

2655. Symbian,

eh, suena bien la voz! Parece Eduard de Speech Player. Por cierto, olvidé otro idioma a agregar, el zulú, un idioma de África xd.

Punteggio: +0

2656. grekmusic33,

La voz de Edward está en espeak ng, de hecho en la versión de NVDA 2022.3, se escucha mucho mejor.
De hecho en los cambios de espeak el klatt 6 es más entendible a mi gusto, junto con sus variantes.

Punteggio: +0

Ultima edizione da grekmusic33, 02.09.2022 07:01:26

2657. Antonio-Mora ,

naa tanto idioma es mucho, yo quiero diferentes tonos de voz, que tal franco escamilla leyendo wpp o la voz de dulce maría leyendo Facebook. xd hay si mejor tonos y tonalidades

Punteggio: +0

2658. grekmusic33,

claro, eso también falta, más entonación y más inflección en la voz

Punteggio: +0

2659. Antonio-Mora ,

siii mas de eso

Punteggio: +0

2660. Symbian,

a mi, puesto que es fácil crear idiomas, justamente me gustaría que creen más idiomas también. Por más que alteren la tonalidad, a menos que cambien más cosas difícil que saquen una voz realista.

Punteggio: +0

2661. grekmusic33,

es que si lo vemos de ese punto, la voz de eloquence tampoco es una voz realista pero de que tiene buena dicción la tiene por que entona las exclamaciones y los signos de preguntas. Ahora si hablamos de espeak, en síntesis klatt para los usuarios que no les entiende, sería bueno crear una nueva formante de claridad para estas voces y variantes, así como lo hicieron con eloquence. Sin no, fíjate en old eloquence que también habla entre paréntesis como speechplayer in espeak. digo speech player in espeak por que el espeak ng, también tiene una copia de speech player.
Lo bueno es que el old eloquence, siempre tuvo inflección de tono, tanto como el español de España como el español latino.
Ahora. El espeak siendo de código avierto, se puede hacer más.
tal cual como dice en su página, eSpeak NG . El nuevo proyecto eSpeak NG es una desviación significativa del proyecto eSpeak, con la intención de limpiar la base de código existente, agregar nuevas funciones y agregar y mejorar los idiomas admitidos.
copio y pego esto. 1.51Más reciente
nuevas características:
• Agregue soporte para SpeechPlayer.
A mi antes no me gustaba el espeak, pero con las mejoras que se an hecho, a comparación como era antes, antes si que era robótico. Recuerdo cuando estaba el windows xp, tenía que usar una voz loquendo las primeras veces.

Punteggio: +0

Ultima edizione da grekmusic33, 02.09.2022 12:26:34

2662. Iris-AI,

Si queremos voces realistas, significaría cambiar la síntesis por formantes por la síntesis neuronal. Como no es el caso de ESpeak, yo también tengo esa fantasía de podre usar las voces que actualmente tenemos enFake You n NVDA, y en local. Pero bueno, a ver si dentro de 50 años se puede jeje

Punteggio: +0

2663. alaska ,

me gustaría probar el idioma sardo en speak ng. Cómo podría hacer? Disculpen mi ignorancia. Alguien lo ha añadido según mensajes más arriba.

Punteggio: +0

2664. Symbian,

yo quiero probar todos los mencionados.

Punteggio: +0

2665. rmcpantoja,

Yo he comprobado que sí se puede sintetizar las voces de tacotron2 de forma local en Windows, a través de python e instalando dependencias con pip, a parte de otras librerías de inteligencia artificial como torch. Pero para ahorrarnos eso, hay una aplicación que permite eso en GitHub, compilada y todo. Solamente debes requerir de un buen CPU, y para mejorar la experiencia, una targeta GPU de Nvidia para sintetizar en tiempo real.

Punteggio: +0

2666. Iris-AI,

Me pasarías esa app, rmcpantoja? O su GitHub al menos, a ver si logro hacer algo?
En serio quisiera mucho poder usarlas en local. Luego, si no andan, será por mi GPU, pero bue-

Punteggio: +0

2667. rmcpantoja,

Esto es. Hay 2 compilaciones, la que está en los assets es solo CPU, más arriba hay un enlace para la compilación con GPU, de todos modos paso los dos:

Lanzamiento: https://github.com/BenAAndrew/Voice-Cloning-App/releases/tag/v1.1.1
Versión GPU: https://mega.nz/file/4hpgFBAb#6GP3p0n-s5v9KIXmFRqxDst7BPaNhEy14JMlEe0aopY

Punteggio: +0

Ultima edizione da rmcpantoja, 02.09.2022 18:02:28

2668. El-Megalovano,

Yoli, te refieres al Judeoespañol?
Y para los otros idiomas artificiales se encuentra el Occidental (ahora Interlingue después de la 2a guerra mundial), Novial, Talosano (lengua oficial del reino micronacional de Talossa) y volapük.
Cambiando de tema y hablando de Talossa, estoy haciendo una versión de su himno al estilo megalóvano.

Punteggio: +0

Ultima edizione da El-Megalovano, 02.09.2022 18:11:54

2669. Exink,

🩸Opinión impopular:

Estoy de acuerdo con los demás compañeros, que en vez de agregar tantos idiomas, debería trabajarse en mejorar los existentes. Hay idiomas que no leen ni los números, otros que nada más deletrean el alfabeto latino, otros Espeak no pronuncia bien las letras... pienso que agregar tantos idiomas así, a menos que se haga bien, traerá más problemas que soluciones a largo plazo.

Un saludo.

Punteggio: +0

2670. Iris-AI,

concuerdo totalmente.
Después, una vez trabajadospero bien trabajados los idiomas ya existentes, lo cual en sí fácil no es porque los hablantes que los iniciaron pueden abandonarlos o no ser hablantes en absoluto, una vez ya hecho todo eso para los cientos de idiomas que tenemos, ahí sí por qué no agregarse más. Ahora creo yo, lo más importante y necesario, es la mejora del sintetizador en sí. Ya hacer tantas variantes no es tan útil, sino más entretenido, le pese a quien le pese. Lo digo yo como un usuario que además tiene hipoacusia, y no es falta de costumbre si no que realmente no logro entender lo que lee a la perfección, y si lo requiero para cosas importantes estoy en el horno.

Punteggio: +0

4215 messaggi, 141 pagine:  1; 87 8889 90 91; 141 ↖ Torna alla lista degli argomenti

Rispondere all'argomento

Devi aver loggato per postare.

Password dimenticata ? Crea un account