Hilo oficial sobre los sintetizadores de voz

4339 сообщений, 145 страниц: 1…; 86 8788 89 90…; 145 ↖ Вернуться к списку тем

счёт: +42

2611. Yares, 25.07.2022 18:16:00

Holaaa. Alguien tiene el instalador del old eloquence para sapi4?

счёт: +0

2612. el-patito-tokischo, 29.07.2022 20:22:59

estuve notando unos fallos de pronunciación en el IBM. No lee los signos de interrogación al final de la frase, y hay veces en que pronuncia la NT como ND, y la MP como MB. Depende de la frase, una vez me leyó importante como imbortante, y un tanto extraño como un tando extraño. Lo noté todavía más cuando leí los mismos tweets en android, y las consonantes estaban bien marcadas

счёт: +0

2613. Caracolito, 01.08.2022 21:57:04

Hola! Lo del IBM puede ser porque viene una coma después del signo de interrogación, para solucionarlo podés hacer un diccionario de NVDA donde pongas ?, y lo reemplaces por ? solo, y lo mismo con el signo de exclamación. (Leer carácter por carácter o o poner la puntuación en toda para que se entienda jeje).
Eso de que pronuncia mal nunca me pasó...

счёт: +0

2614. el-patito-tokischo, 05.08.2022 15:04:28

bueenas gente! Estoy súper impresionado con esto. Yo creí que era la voz hablada por uberduck y afinada con melodine, pero al parecer la propia IA de uverduck puede intentar imitar la forma de cantar del archivo que le cargues!
https://www.youtube.com/watch?v=c8YEnCcsg5w

счёт: +0

2615. martin_garrix , 05.08.2022 20:13:34

jiesho+ es el mejor lector porque se puede cambiar los sonidos

счёт: +0

2616. el-lirio-de-Oro, 05.08.2022 22:46:12

hola chicos. Miren, una consulta; Me pueden compartir por privado, o permanente (antes que me digan que pido piratería) el elokence que sea más semejante con el IBM TTS, porque me gusta el IBM las pausas y entonación... Tengo un infinitix hot 11S. Android 11. estuve probando una versión que me compartieron en el grupo de amantes de la tecnología, pero, nó podía ponerlo de sintetizador predeterminado. nosé por qué. Gracias, a quien pueda ayudarme. porfaaa.

счёт: +0

2617. el_brillante, 05.08.2022 22:51:06

hola. quería pedirles una recomendación:
alguna voz que me recomienden? que lea emojis/emoticonos, tipo la voz de Samsung u otros, no importa si es de paga. resulta que se actualizó a Android 12 y la voz de Samsung en español España se perdió, y se actualizó a otra voz que no me agrada. sin contar eloquence. incluye las de paga. saludos

счёт: +0

2618. Exink, 07.08.2022 01:54:37

Chicos, ¿alguno de ustedes ya puede usar las voces de Google TTS, pero que tienen mejor calidad? En mi caso solamente me funcionan con @Voice, pero ya se escuchan mejor, al menos se parecen más a las que suenan en la nube.

¡Un saludo!

счёт: +0

2619. el-patito-tokischo, 07.08.2022 03:39:56

ooo no sabía de esa actualización! Vamos a ver qué onda

счёт: +0

2620. Audacity, 07.08.2022 03:43:36

Con Alexa (Solo en Android) Se puede con una app que está en PlayStore llamada TextalkPro, pero es de paga y solo incluye la voz concatenativa de Alexa, no la neuronal para los que quieren más natural la voz. Podrías copiar el texto del PDF y pegarlo ahí ya que es la única forma. Y la otra sería si tienes un Amazon Tab.

счёт: +0

2621. el-patito-tokischo, 07.08.2022 03:44:23

no, todavía sigo con las mismas. Me ilusioné porque se estaban descargando otra vez los datos, pero suenan igual. Voy a revisar en aptoide haber si hay actualización

счёт: +0

2622. el-lirio-de-Oro, 07.08.2022 03:56:13

hola, para michael04. consulta. cómo es eso de las voces en mejor calidad de la nuve del tts de Google? cómo las puedo escuchar?

счёт: +0

2623. PolloGuerrero, 07.08.2022 06:04:27

O sea, hoy se me actualizó el TTS también, pero más de lo mismo.

счёт: +0

2624. amitabh_bachchan , 07.08.2022 06:26:13

yo igualmente veo lo mismo en el TTS de google.

счёт: +0

2625. el-patito-tokischo, 07.08.2022 07:39:10

gente, ssaben si hay alguna forma de acceder a fakeyou premium o algo así? Es que los audios que te deja crear son muy cortitos, creo que son 11 segundos

счёт: +0

2626. el-prevoste, 07.08.2022 07:40:25

que es faqueyou? xd

счёт: +0

2627. el-patito-tokischo, 07.08.2022 07:45:50

es una página para escribir texto con voces de personajes. Están los personajes de bob esponja, los simpsons, erick cartman, incluso hay algunos youtubers

счёт: +0

2628. El-Megalovano, 24.08.2022 21:30:09

Buenas gente,
Como hice un tópic sobre este sintetizador por separado hace una hora no se si repostearlo aquí.
Hace poco o no mucho en el foro de Audiogames se está hablando sobre un futuro sintetizador de voz por formantes, llamado Synfonica TTS, antes NovaSpeech. Un usuario del foro (JOSH) dijo que quizá este sintetizador reemplazaría a ESpeak y o a ETI-Eloquence en un año o más, si sería posible.
Les dejo el link del tópico en cuestión:
https://forum.audiogames.net/topic/45994/synfony-tts-may-replace-eloquence-in-a-year-or-two/
Y el link de Synfónica en cuestión:
https://www.synfonicaspeech.com/about
Para resumir, Synfonica fue conocida como NovaSpeech cuando se creó en 2004. Su jefa y presidenta es Susan "Sue" Herts. Ella fundó en los años 80 la famosa (para nosotros) compañía Eloquent Technology (ETI) creadora de Eloquence (vaya casualidad?) Ella es lingüista y desarrolladora de software.
Junto a ella están en el equipo Dr. Masayuki Gibson, Isaac Spencer y Patrick Hegde.
Recientemente Josh ha escrito un EMail mencionando una conversación en LinkedIn con la presidenta de Synfonica y fundadora de ETI. Aunque la página de Synfónica ofrece información sobre su sistema, quizá las respuestas encontradas a sus preguntas darán más información y responda a dudas sobre su uso y comparación con sintetizadores que utilizamos. Gracias DeepL por traducirlas.
Ah, antes les dejo una demo de como suena este sinte. No se yo pero se escucha moderno?
https://drive.google.com/file/d/1sOBLADDv8BJCVSp7dz-77ts2vuxL_zJ2/view?usp=sharing
Y aquí las preguntas y respuestas.
Nota al usuario: Decidí corregir los nombres de sintetizadores mencionados, algunos tienen letras mayúsculas en partes donde no estaban: E.G. DecTalk, decTalk, Dectalk, Dec Talk o Dec talk por DECtalk.
Hola Joshua,
Gracias por todas tus sugerencias y comentarios en LinkedIn. Tal y como prometí, he adjuntado una demostración del resultado de nuestro sistema de conversión de texto a voz Synfony.
Su objetivo es resaltar las diversas capacidades del sistema. Estamos trabajando activamente en todos los aspectos del sistema, por lo que debería tomarse la demostración
como un reflejo del estado actual del software.
A continuación, se responden las distintas preguntas y comentarios, algunos de los cuales amplían lo que ya dije en nuestro chat de LinkedIn:
Pregunta 1: Sólo por curiosidad, ¿se basa eloquence en el sintetizador Klatt de DECtalk, o se parece más al texto-a-voz Keynote gold basado en Klatt
de principios de los 90?
Para responder a esta pregunta, me gustaría asegurarme de que estamos en la misma página con nuestra terminología. Un sistema de síntesis de texto a voz (TTS) basado en reglas como
DECtalk, ETI-Eloquence o Synfony tiene tres componentes principales: (1) un componente de análisis de texto que analiza el texto de entrada y produce una representación lingüística simbólica
que incluye información sobre el fraseo, los patrones de entonación, las pronunciaciones y otras propiedades lingüísticas del enunciado que se está sintetizando;
(2) un componente de generación de voz que utiliza la información producida por el componente de análisis de texto para producir varios valores acústicos; y (3) un vocoder
que genera una forma de onda a partir de los valores acústicos. Los componentes de análisis de texto y de generación de voz de ETI-Eloquence no se basan en los componentes comparables
componentes de DECtalk o de cualquier otro sistema TTS. El vocoder utilizado en ETI-Eloquence incorpora un modelo similar pero no idéntico al que
que Klatt y Klatt describieron en el siguiente artículo: D.H. Klatt & L.C. Klatt (1990): "Análisis, síntesis y percepción de las variaciones de la calidad de la voz
entre hablantes masculinos y femeninos". Journal of the Acoustical Society of America 87: 820-856.
Pregunta 2: Además, ¿hay alguna manera de que los usuarios finales hagan sus propios archivos SYN para añadir más idiomas, o todo el código pertenece ahora a Nuance Communications, INC (ahora Microsoft Corporation)?
No, no hay manera de que los usuarios finales añadan idiomas a ETI-Eloquence, por varias razones. Tanto Nuance (ahora Microsoft) como IBM tienen derechos sobre el código fuente de ETI-Eloquence,
y, por lo que sé, ninguno de los dos ha puesto a disposición el código fuente. Dicho esto, creo que está subestimando lo que supone añadir un lenguaje -al menos uno que suene razonablemente natural y
al menos uno que suene razonablemente natural e inteligible. Los requisitos de análisis de texto difieren mucho entre los idiomas, y los algoritmos no son ni mucho menos triviales de desarrollar.
triviales de desarrollar. Lo mismo ocurre con los algoritmos de generación de voz.
Pregunta 3: ¿Y qué pasó con los acentos de Nueva York y Alabama que desarrollaron para Eloquence a mediados de los 90? ESpeak-ng es bueno, pero no se puede comparar con Eloquence y me gustaría que Eloquence se hubiera desarrollado más, es decir, que se hubieran desarrollado más idiomas para él.
Por diversas razones, nunca lanzamos una versión del producto ETI-Eloquence con los diversos dialectos en los que estábamos trabajando.
Pregunta 4: En otras palabras, ¿se basa eloquence en Klatt de Berkeley Speech Technology o en el trabajo de Dennis Klatt?
Los algoritmos de análisis de texto y de generación de voz subyacentes a ETI-Eloquence no se basan en el trabajo de nadie más. De hecho, hemos diseñado los algoritmos para
superar las limitaciones de los modelos lingüísticos subyacentes a los sistemas basados en reglas que precedieron a ETI-Eloquence. La única parte del sistema que se parece
es el codificador de voz.
Pregunta 5: Además, ¿podría hacer una variante de voz para ESpeak que incluya el cambio de sus enunciados de tono para que suene más como eloquence -como en su calidad de voz Klatt
y la forma en que se inflexiona al hablar?
Por las razones expuestas anteriormente, esto no sería trivial. Además, me interesa desarrollar sistemas de síntesis de voz de nueva generación, no parchear
los existentes con todas sus deficiencias.
Pregunta 6: Y si no tiene más interés en desarrollar para Eloquence, ¿podríamos tener esos acentos de Nueva York y Alabama para ESpeak que se encuentran en:
http://espeak.sourceforge.net/test/latest.html
?? ESpeak y su código fuente Klatt están en el sitio web mencionado.
No tengo los derechos del código para los acentos de Nueva York y Alabama.
Pregunta 7: Además, ¿utilizarán Jaws y otros lectores de pantalla eventualmente Synfonica como un reemplazo moderno de Eloquence?
Espero que sí.
Pregunta 8: ¿Ofrecerá Synphony muchos más idiomas que Eloquence?
En la actualidad no tenemos un camino planificado hacia el desarrollo de múltiples idiomas. Nuestro interés inmediato es desarrollar nuevos tipos de tecnología de síntesis.
En uno de nuestros proyectos, por ejemplo, estamos trabajando en una nueva tecnología que mantiene todas las ventajas de los sistemas de síntesis basados en reglas, pero también tiene
la calidad de voz natural que producen otros tipos de sistemas de síntesis que actualmente son menos adecuados para su uso por parte de personas ciegas. Además, nos centramos en
en añadir voces expresivas (por ejemplo, voces que suenen alegres, tristes, etc.) a Synfony para personas que no pueden hablar con su propia voz. Sin embargo, si se da la oportunidad
oportunidad de negocio, sin embargo, ciertamente consideraríamos el desarrollo de idiomas adicionales.
Pregunta 9: ¿Sustituirá Nuance text-to-speech a Eloquence con Synphony? Si es incluso mejor que Eloquence y sigue siendo compatible con un discurso rápido y agradable como el de Eloquence, espero que sea así.
Eloquence, entonces espero que sí.
No he tenido ninguna comunicación con Nuance.
Pregunta 10: También espero que Synfonica llc venda una versión sapi5 del Synfonica TTS para que las personas ciegas puedan comprarlo y utilizarlo con Jaws
y NVDA aunque no sean directamente compatibles con Synfonica tts de inmediato.
Nuestra intención es desarrollar una versión SAPI 5, así como otras.
Pregunta 11: Además, para las personas que no pueden hablar, ¿podrían vender también una versión de Synfonica tts con una aplicación de ventana de habla? Pero lo más importante, si
posible, por favor, déjenos poner comandos en los valores de tono y duración de la ventana de voz y un modo de fonemas, para que el synfonics tts pueda cantar igual que
como el DECtalk puede cantar. También se pueden añadir comandos que permitan reproducir directamente archivos de onda, y generar tonos táctiles y tonos directamente, como el decTalk
puede generar varios tipos de tonos introduciendo comandos de tono en hercios y valores de duración.
para su uso en su lector de pantalla voiceOver, además de permitir que funcione con android, Linux y windows a través de sapi5.
Nuestra intención es proporcionar una aplicación con todas las capacidades que ha mencionado para múltiples plataformas, con la excepción de que en un futuro previsible
el sistema sólo estará disponible para el inglés.
Pregunta 12: También si necesitáis voluntarios para probar la beta de Synfony TTS cuando esté disponible. Me gustaría ser voluntario.
Estaremos encantados de proporcionarle una aplicación beta para probar Synfony cuando esté disponible.
Pregunta 13: Un error importante que he observado con ETI eloquence 6.1 y que tal vez se pueda eliminar en Synfonica tts: cuando Eloquence encuentra una frase muy larga
frase muy larga, por ejemplo, una frase con 15 o más palabras, algunas de las cuales pueden ser largas, sin puntuación para separarlas, el tono de ETI eloquence
sigue bajando de su tono por defecto y sigue bajando más y más y más mientras lee la frase muy larga. ¿Podría asegurarse de que
este error se corrija con synfony TTS si es posible? gracias.
Synfony no tiene este problema. Es poco probable que tenga los mismos errores que ETI-Eloquence, dado que utiliza algoritmos muy diferentes en los tres
componentes de síntesis mencionados.
Pregunta 14: ¿también se puede utilizar el diccionario de pronunciaciones para Eloquence hecho por Amir, o tal vez implementarlo en synfony tts--a menos que debido a los avances
en la tecnología tts dicho diccionario no sea necesario... se encuentra en:
https://github.com/thunderdrop/IBMTTSDictionaries
Proporcionaremos soporte para diccionarios definibles por el usuario para que éste pueda añadir cualquier palabra, raíz y abreviatura que Synfony no maneje como desea.
Pregunta 15: Tengo otro comentario que transmitir, por favor, asegúrense de que Synfony tts ponga un énfasis adecuado cuando encuentre signos de interrogación y exclamación
durante la lectura. Es importante que las personas ciegas sepan cuándo se leen ese tipo de signos de puntuación en el contexto de varias frases.
Así será.
En general, espero que mis respuestas anteriores respondan a sus preguntas, pero hágamelo saber si no es así.
Gracias por mencionar que el enlace de contacto de nuestro sitio web no funciona. He transmitido su comentario al administrador de nuestro sitio web. Gracias también
por mencionar nuestro software a Apple. Soy consciente de que probablemente querrán más idiomas. Si todavía está interesado en escuchar a Synfony producir el habla
a diferentes velocidades, hágamelo saber y le enviaré una o dos frases a diferentes velocidades de habla.
Por último, me interesaría saber más sobre usted y si tiene alguna necesidad específica de tecnología de asistencia que podamos atender
aparte de las que ya ha mencionado. ¿A cuántas palabras por minuto sueles escuchar el habla sintética, o depende de la tarea que realices?
¿Sigue trabajando como técnico de soporte de escritorio?
Estoy deseando recibir sus comentarios sobre la demostración.
Un saludo,
Sue
Dra. Sue Hertz
Presidenta y jefa científica
Synfonica LLC

счёт: +0

2629. vrivri, 24.08.2022 22:07:46

muy interesante la verdad. eso me anima a ver como vá seguir el desarrollo. solo espero que por lo menos tenga los mismos idiomas que tiene eloquence actualmente, mismo ellos decindo que de momento no estan interesados en desarrollar más idiomas. pero en un futuro, se hace necesario. eso es.

счёт: +0

2630. El-Megalovano, 24.08.2022 23:00:38

Josh y yo lo estamos preguntando,a ver si eso sale, después quizá Synfónica reemplazará a Eloquence como sinte por defecto en JAWS a saber si en Mac o Iphone o quizá en Android para reemplazar al ya descontinuado Eloquence aí.

счёт: +0

2631. vrivri, 24.08.2022 23:32:28

añadirlos o dejarlos por defecto, eso si. pero no diria reemplazar.

счёт: +0

2632. PolloGuerrero, 25.08.2022 00:09:07

El tema es el siguiente. si Sinfonica TTS es comercial, supongo que se comercializará y remplazaría a Eloquence, si es que se lo remplaza porque... Ya saben. Igual la gente ya tiene oquence y pirata, la verdad sea dicha. Si fuese de open source y multilingüe al nivel de ESpeak, ahí sí podría ir compilado a NVDA, aunque no me extrañaría que en ese caso NVDA integrara ambos sintes en un mismo paquete, cosa que si no estoy mal se pensaba hacer con NV Speech Player, pero es mucho especular. A ver qué pasa a futuro.

счёт: +0

2633. El-Megalovano, 25.08.2022 01:48:19

Por el tiempo que tiene desarrollàndose me temo que no serìa buena idea comercializarlo. Ya desde 2014 se estaba desarrollando ansì nò màs.

счёт: +0

2634. Yares, 25.08.2022 03:49:06

Yo no me ilusinaría tanto. La verdad tiene tremenda calidad que a pesar de estár en desarrollo no me sorprendería que se comercialice. Además quien sabe: si no me equibóco el motivo es para proporcionar una alternativa para las personas mudas y dudo que liveren una compilación para un so al mismo tiempo o incluso en el mismo año que liberen la versión estable.

счёт: +0

2635. El-Megalovano, 25.08.2022 15:19:22

Hay que ver. Sin duda la calidad d'este sinte es tremenda comparándola con el Eloquence antiguo y moderno.

счёт: +0

2636. Yares, 25.08.2022 16:08:43

Tampoco exageremos. Para mi es mucho mejor que speak y su intento de clat. Suena mejor que el speech player original pero no creo que se acerque a eloquence. Andá a saver si tendría un español como decktal que suena como extranjero

счёт: +0

2637. PolloGuerrero, 25.08.2022 16:39:48

Vamos a ver...
Al menos en inglés se le entiende, pero hay que ver ya que a DecTalk en ciertas versiones se le entendía re bien en inglés. Porque Keynote tampoco tenía la súper calidad, aunque estaba bastante bueno.

счёт: +0

2638. El-Megalovano, 25.08.2022 16:51:26

Entendí claro. Sabemos ahora como suena, pero aún no sabemos si será comercial o gratuito, o si será gratuito para uso personal y comercial para... bueno... También en qué protocolo de interfaz de voz será, o en Sapi, o como complemento de NVDA, o como sintetizador adicional en JAWS, quizá como controlador de SAM para Dolphin SuperNova...

счёт: +0

2639. Caracolito, 26.08.2022 00:11:22

¡hola! Al abrir el enlace para escuchar la demo me dice que "El propietario no permite la descarga ni la reproducción de este archivo de audio". ¿Alguien más lo tiene?

счёт: +0

Последнее изменение Caracolito, 26.08.2022 00:11:22

2640. FrancoBattiato, 26.08.2022 00:21:32

Hola.
Alguien sabe si el decktalk está disponible para NVDA?

счёт: +0

4339 сообщений, 145 страниц: 1…; 86 8788 89 90…; 145 ↖ Вернуться к списку тем

Перейти к меню ↑
Перейти к содержимому ↑

Ответить на тему

Чтобы писать на форуме, вам нужно сначала войти.