Google crea una voz sintética casi idéntica a la generada por los humanos

22 mensajes, 1 páginas: 1  ↖ Volver a la lista de temas

1. jere-de-mardel,

Al momento, las voces utilizadas por los asistentes virtuales disponibles en el mercado aún pueden sonar artificiales. Sin embargo, Google acaba de presentar una investigación donde asegura que pudo crear un sistema de lectura de texto a voz que tiene la virtud de imitar la entonación humana.
Denominado Tacotron 2, es la segunda generación de una tecnología desarrollada por Google, cuyo funcionamiento está basado en dos redes neuronales que interpretan el texto y aplican los efectos, pausas y entonaciones presentes en el documento junto a WaveNet, el software responsable de generar las voces de Google Assistant.
Entre las características más destacadas de Tacotron 2 está la capacidad de pronunciar nombres y palabras, distinguir signos de puntuación o si una parte del texto requiere ser remarcada con una entonación más destacada.
De hecho, Google puso a disposición las pistas de audio generadas de forma sintéticacon sus redes de inteligencia artificial junto a otras pistas relatadas por humanos, con un desempeño perfecto con palabras y frases complejas.
Por el momento Tacotron 2 se encuentra en una etapa de evaluación, disponible sólo en inglés y con una voz femenina, aunque se espera que Google entrenar en otros formatos, con una versión masculina y en otros idiomas. De esta forma, la compañía de Internet planea en el corto plazo perfeccionar aún más los sistemas guiados por voz como Assistant.

¿Qué opinan ustedes? Aquí pego un link donde hay ejemplos de cómo son las voces. A mí me parecen, realmente, increíbles.

https://google.github.io/tacotron/publications/tacotron2/index.html

2. sonido-melody-chip,

Eso es, increíble. Cuando fui a ver por primera vez, y buscando algo relacionado,me llevo esta sorpresa, y acá reafirmo lo que siempre pensé. La síntesis de voz va a seguir evolucionando y encontrando nuevos métodos de síntesis como se acaba de ver claramente acá. Piensen que antes de Svox Pico (allá por 2008) no se usaba o en tanto no era casi conocida la síntesis mediante modelos ocultos de MarkOv, queestá tan de moda hasta hoy.
Ojalá lo mismo sea para este método y resulte adecuado para los dispositivos de hoy día.

3. boby-z,

me gusta.en breves tendremos casi voses humanas de lector.

4. sonido-melody-chip,

Ya hay, pero esta es una tecnología demasiado prometedora, según este experimento. Piensen que por primera vez una voz sintética sonando como humana sea capaz de entonar exclamaciones incluídas, como la síntesis de formantes a través de este método, sin que los locutores tengan que grabar frases y toda una base de datosenorme.

5. jostin_tu_chicopreferido,

wao que interesante el problema es que la vos de síntesis, la use con talbac o con lector es muy lenta en barias ocaciones pone lento el dispositivo y e comprobado que no solamente ami me pasa, yo no me cambio de lector y elokence

6. sonido-melody-chip,

Qué tiene que ver? Con un poco de suerte estas voces en un futuro tal vez puedan manejarse con TalkBak y demás, y claro, quien sabe cómo será su velocidad de respuesta. Aunque, por supuesto puede pasar que se use únicamente en asistentes y cosas así. Eso ya lo sabremos con el tiempo.

7. jostin_tu_chicopreferido,

era un ejemplo solamente, ahora, tiene razón, en asistente suele ser un poco mas rápido su interacción

8. sonido-melody-chip,

De hecho, vieron que Google Assistant ya está manejando no quiero decir aún ue esta síntesis, fijo que no, pero ya anda en esa onda con la voz que tiene, como lo haría Cortana.

9. jere-de-mardel,

Leer un texto con esta voz sería espectacular. Aunque la verdad no creo que salga para lectores, pues aún hoy día no podemos usar las voces de Google con Jaws o NVDA. Quizá sí con TalkBack, si saliesen como motores de voz para Android. Esta es la primera vez que me impresiona una voz artificial. Ni siquiera me ha sorprendido Carlos cuando salió y todo el mundo estaba embobado.

10. Gaviota_Laurita,

Por lo poco que sé ese tipo de asistencia solo se planea para asistentes, no tanto para lectores de pantalla. pero, quién sabe. todo puede pasar

11. victoria07,

El mundo TTS sorprendiéndonos cada vez más con la evolución de las voces. Realmente es increíble!

12. demmonoid,

lo que sé es que si me topo con una de estas voces en el futuro... y si encima les agregan factores como emociones y respirar, en serio me voy a llevar un buen susto

13. el_perro_negro-del-diablo,

están biendo algo que ni es de sorprenderce, para todos, la vos de ciry la que salió recientemente, es igual que esa, antes ciry usava la voz de paulina, pero ahora tiene otra voz que no se save de cual es, y juraría que si no fuera un asistente, diría que es una umana, pero tiene hasta la forma de contestar una vestia, por eso digo esa voz no me sorprendió, y apple ya lo hiso sería raro que google no lo aga

14. Saniel_Morse,

La voz de Siri ciertamente se ha vuelto más expresiva, pero aún tiene sus cosillas que la hacen estar un poco por debajo de estas muestras.
Venga, si yo ya con lyrebird ya estaba sorprendido... ahora con esto que probablemente se viene...

15. LawyerVirtual,

lean origen de dan brown xd

16. sonido-melody-chip,

Yo no sé si este nuevo método de síntesis fue descubierto y creado por Google. En todo caso sabemos ya que Apple es un competidor, y Cortana utiliza lo mismo que la nueva voz de Siry y que lo que tenemos ahora en Google assistant.

17. NikolaTesla,

Hola. Chicos, ya que este ilo es de Google, aprovecho a preguntarles una cosa. ¿Como puedo utilizar ok Google en un móvil 2016? -. Para el que no sepa, ok Google es el asistente de Google. Lo mismo que Ciry, solo que Google XD. Le puedes hablar, te puede cantar, te cuenta chistes ETC ETC. Pero a mi mi móvil me lo dieron en Diciembre de el 2016, y creo que ok Google se empesó a poner en 2017. Por eso quiero saver si hay manera de poder hacerlo andár en un móvil 2016. Actualizando Google o algo no se XD. Bueno, si lo quieren provar. Lo activan teniendo su celular en la pantalla de inicio, una ves aí dicen: Okey Google, y aí se fijan ustedes por que no se XD. Bueno, espero sus respuestas. Saludos y feliz año 2018! -. N, T.

18. AnimalMetal,

hmm no se, la voz en inglés de siri me gusta mas que esta. claro hablo de la nueva voz de siri

19. Ishamael,

si, así es lord anival, tienes toda la razón

20. sonido-melody-chip,

Creo que vas a poder tenerlo, siempre que tengas desde Android 6 para adelante. Que me corrijan los buenos andróidicos, porque yo todavía me digo entre principiante e intermedio.

21. NikolaTesla,

Hola. No estoy seguro. Pero creo que tengo Android 7.1. Saludos.

22. gaby_casla_targaryen,

En efecto, Google assistant ya utiliza parte de esta tecnología, creo que es evidente que muchas frases están grabadas. pero parte de su tonalidad parte de este proyecto, cuyo experimento comenzó allá por septiembre de 2016. wave net, antes utilizaba una tecnología capaz de comprender el dialecto del ser humano convirtiéndo esos matices en síntesis, pero ahora ya es mucho más inteligente, pudiendo distinguir entre expreciones y texto plano, y eso es una gran novedad. yo que he visto evolucionar el sistema Android desde hace muchos años, pienso que no falta mucho para que en un principio, la tecnología aplicada en el grandioso google assistant, llegue a la síntesis de google. ya así talcual está, yo no la cambiaría jamás. que contradictorio no? pasar a decir esto después de orripilantes años oyendo estas voces sin expreción, ruidosas, sin graves, pero así es la tecnología. buen año para todos!

22 mensajes, 1 páginas: 1  ↖ Volver a la lista de temas

Responder al tema

Usted debe estar conectado para poder postear.