Hilo oficial sobre los sintetizadores de voz

4108 Nachrichten, 137 Seiten:  1; 51 5253 54 55; 137 ↖ Zurück zur Themenliste

~msgScore~: +40

1561. El-Megalovano,

Cuando intento iniciar el instalador me sale esto:
Número de error: 0x80004005
Descripción: Error no especificado

La instalación va a finalizar.

~msgScore~: +0

1562. Franco_Montecucco,

Estamos igual, a mi me pasa lo mismo. Algunos pudieron instalar, no sé a mí no me dejó. me sale el mismo mensaje

~msgScore~: +0

1563. Princeps-Tenebris ,

Bueno, De Porsí Sapi4 Es Tan Viejo Que Con NVDA No Se Lleva Todo Lo Bien Que Digamos, Mucho Menos Estando En Windows 10.
Incluso Yo Experimenté El Que NVDA Se Me Inestabilizara, Teniendo Que Recurrir Al Narrador Para Hacer Ajustes.

~msgScore~: +0

1564. Yeri_mua ,

oiran a mí tambien me ocurre ese error que está comentando acá, jooo der. y yo si tengo instalado toodo.

~msgScore~: +0

1565. vrivri,

Recuerden que windows 10 no tiene el driver de sapi 4 instalado, van a tener que hacerlo. creo que en la pagina de jack gross, en tts y en sapi voices ai un archivo que se llama spchapi.exe, ese archivo lo instalan como administrador y creo que el error no aparece mas ahí. a mi me dejó instalar, sin problemas.

~msgScore~: +0

1566. Arya_Stark,

eeeemnmn ando un tanto mareada en todo esto. qué tengo que vajar, dónde lo consigo, y cómo instalo todo esto xd?

~msgScore~: +0

1567. El-Megalovano,

iNstalando el spchapi no me instala las voces en español, todavía me sale error desconocido.

~msgScore~: +0

1568. pianino.64,

oigan alguien puede compartir sus experiencias con la version sapi5 de eloquence de dccode factory, que tal les ha ido, como funciona alguien la hizo andar la version de code factory?

~msgScore~: +0

1569. Franco_Montecucco,

Hola. Es una que está solo en inglés, pero que hay unos códigos para que hable en español españa o español mexicano? Si es esa, el año pasado lo instalé y anda perfecto. La tuve unos días para probar y anda bien. Guardé los códigos y el instalador, para cuando quiera grabarme un texto a mp3 con la calidad de balabolka, un día la uso

~msgScore~: +0

1570. un-kit-de-herramientas,

En realidad esa versión es una modificación hecha por Grosg. La versión de Code Factory no requiere de la línea de comandos para introducir nada, y ya trae todo en las diferentes voces Sapi 5 aunque a mí, no sé si era yo pero me sonaba de una forma un poco raronga en cuanto al audio del sinte. 7 días de prueba gratuita, luego hay que comprar.

~msgScore~: +0

1571. Franco_Montecucco,

Ah ese era. No tenía claro. Ese que decís ya no lo probé, me comfundí con este que hay que ponerle ese código al comienzo de la línea

~msgScore~: +0

1572. El-Megalovano,

Hola, amigos,
No sé si postearlo aquí o crear un nuevo hilo o tema separado, pero aunque este post sería excesivamente largo, un o una ¿amigo o amiga? rusoparlante, llamado Ilía, cuyo inglés casi, se entiende, os recomendó a vosotros/nos recomendó a ustedes múltiples ideas (la mayoría a síntesis de voz) en un post enAudiogames: https://forum.audiogames.net/post/638588/#p638588. Tal vez algunas se han dicho por aquí, mas lo que aclara son múltiples reseñas dirigidas hacia el gran gigante Microsoft. (¿vey ya os están dando cuenta la tendencia de esta compañía no?)
Ansí que no paren de leer esto, ya que quizá o no os revele algo, pero no importa si entendieron poca o mucha información, de todas formas podrá ser esencial.
En primer lugar y como dije en la entrada de Open Source Eloquence, comentar una petición: Jake Gross, hace dos semanas atrás, creó una petición que da como objetivo el hacer Eloquence de código abierto. Como saben o no, dicha iniciativa es debido a un reciente anuncio por parte de Microsoft adquirir la compañía Nuance Communications, INC. con 16 millardos de dólares, la cual "aparentemente" tiene los derechos de dicho sintetizador. Dado que hoy en día, este sintetizador para varias cualidades de consumo no parece competitivo en el mercado de soluciones masivas, y Microsoft abre regularmente el código fuente de proyectos más antiguos (y no solo), los representantes de la Comunidad de usuarios ciegos del equipo informático decidieron probar Para elevar el problema de la transferencia de correo electrónico al estado de la provisión de software libre.
Para hacer un poco de historia: La síntesis de voz ETI Eloquence dio la luz en 1995 por la compañía estadounidense Eloquent Technology, INC. cuya abreviación (¿quizá acrónimo?) suele ser habitualmente escrito al principio del nombre del producto junto con un guion: es decir, ETI-Eloquence. (¿Ya saben de donde viene ETI? de Eloquent Technology, INC.)
En 1996, Eloquent Technology entró en una alianza con IBM, cual adquirió ciertas partes de la tecnología desarrollada por ETI, lo cual lo incluyó en su rango de sistemas de voz. Ansí es, de esa forma IBM ViaVoice nació.
En el 2000, Eloquent Technology, INC. fue adquirida por SpeechWorks International, Inc. la cual continuó vendiendo su sistema de texto a voz, combinándolo con sus programas de conversión de textos (Speechworks, Spechify ) entre otras tecnologías de voz. A su vez, en 2003, SpeechWorks International, INC. fue adquirida por SCANSOFT, INC. la cual, a su vez, en 2005, fue adquirida por Nuance, cual su nombre anterior"ScanSoft, Inc." se reemplazó por el que ya conocemos hoy, "Nuance Communications, INC." Que, anteriormente, en 2001, compró a Lernout/Hauspie, y en 2004 compró Retorical (saben esa síntesis de voces cuyas voces hablan en español e inglés?), Y que, tras adquirir varias compañías, en 2011, compró Loquendo y SVox, para sí formar parte de lo que conocemos como Vocalizer Expressive.
El 12 de abril de 2021, Microsoft anunció la compra de Nuance Communications, INC. por $ 19.7 millardos, o $ 56 por acción, un aumento del 22% sobre el precio de cierre anterior. El CEO de Nuance, Mark Benjamin, se quedará con la compañía. Este será el segundo mayor trato de Microsoft, después de su compra de LinkedIn por $ 24 millardos en 2016. Bien Mark, que te vaya bien en Microsoft! A tomar la síntesis se ha dicho.
Bolviendo a Eloquence, hoy en día hay dos opciones principales para usar dicho sintetizador: O ir por la licencia de IBM, o por la de Nuance. Y es por ello que la petición es para Microsoft, debido, de nuevo, al anuncio oficial de la compra de Nuance Communications un 12 de abril.
Anteriormente, Eloquence solamente soportó el idioma inglés, sobre todo los dialectos americanos y británicos (porqué no el canadiense, australiano, escocés o irlandés?) Pero, desde 1996 hasta 2001, mucho trabajo se ha dado para expandir el portafolio de idiomas a 13: Inglés de América o estadounidense, Inglés de Europa (británico o reinounidense (esa yo la creé)), Español de Europa (de España o Castellano), Español de América (México, América latina, Estados Unidos), Francés de Europa (francia) y de América (Canadá), Alemán, Italiano, Portugués americano (de Brasíl), finés, chino mandarín, japonés y coreano, aunque recientemente se descubrió el chino cantonés y los idiomas nórdicos: Danés, noruego y sueco, para un total de 17.
Como todos saben, Eloquence se basa en síntesis por formantes. Este tipo de síntesis utiliza modelos artificiales de oscilaciones de sonido, que imitan el trabajo de la voz humana. Esto le ayuda a lograr un alto sonido posible, a diferencia de tomar artefactos de la voz original grabada, cual es una característica de las voces compiladas para una tecnología de texto a voz. Eso entendí algo, aunque si hay algunos problemas corríjanme, soy casi principiante intermedio en esto.
Ah, sí cierto! Devido a la inperfección de algoritmos la síntesis por formantes es caracterizada por la roboticidad de la voz. (¿eh robots?) En adición, y como saben, esta tecnología permite cambiar los parámetros de la voz, ya sea cambiándola de un hombre, mujer o infante, también imitar emociones o expresiones, y agregar susurro, ajustar entonación, etc.
Eloquence, por su puest, lo soporta, aunque en muchas de las implementaciones que forman parte de productos populares no se transfieren a la interfaz de comandos. Al ser compacto, con respuesta rápida, y por hablar más rápido hace de ETI Eloquence popular entre la gente ciega, la cual con su ayuda le da un performance alto en trabajos no físicos.
A pesar de una presencia muy alta de alternativas y competidores, como eSpeak NG, Eloquence aún se considera por muchos ciegos uno de las mejores soluciones de síntesis de voz utilizado en trabajo cotidiano en un equipo.
Sin envargo, su desarrollo cesó al principio del tercer milenio, y los usuarios ciegos enfrentan una situación cuando en sistemas operativos o software modernos, el uso de Eloquence da por complicado o imposible, Incluso si está dispuesto a comprar una versión propietaria, ya sea de Nuance, ya sea de IBM.
Consciente de la baja probabilidad de ser escuchado, pero queriendo hacer todo lo posible para salvar a Eloquence de la pérdida de desarrollo como software actual y reciente, Jake Gross publicó una petición para Microsoft Corporation, llamándoles para que este sintetizador de culto sea open source, bajo la licencia de… OK van a decir de nuevo que sería de la GPL, aunque no sé…
Nota: Dado a que el amigo lo tradujo con Google (no ofendo a la compañía), el texto original de la petición en inglés pudo ser aalterado. De ser así y disculpa por alejarme del tema e ir a la gramática, el texto original escrito por Jake más el texto alterado estarán aquí para comparar.

Texto original:
ETI-Eloquence is a text to speech program that hasn't been updated since 2002. It is used widely by the blind community and would benefit being open sourced because It could then be freely used by many projects such as the NVDA screen reader. It has amazing characteristics that don't compare with modern speech synthesizers. These include having a small footprint and being able to speak at fast rates and still be understandable. The engine could be improved by the community because their are lots of people who could take it to the next level such as adding new languages and porting it to more modern platforms.
Texto alterado:
"ETI-ELOQUENCE is a program for converting text into speech that has not been updated since 2002. It is widely used by the blind community, and its source code will be useful because it can be freely used in many projects, such as NVDA screen access program. It has amazing characteristics that do not compare with modern speech synthesizers. These include a small size, as well as the ability to speak quickly and at the same time be disassembly.
The community could improve the engine because there are a lot of people who could take it to the next level, like adding new languages and porting it to more modern platforms."

Doy mi primera comparación y opinión, después las de ustedes. Mientras comparan, En ambos textos se explica:
“ETI-Eloquence es un programa de texto a voz (programa para convertir texto a voz) que nó estuvo actualizado desde 2002.” Aquí el texto alterado es un poco detallado, aunque sugería utilizar “sintetizador de voz” o “síntesis de voz” para ser lo más genérico.
“Está ciendo utilizado por la comunidad ciega y beneficiaría ser de código abierto (su código fuente será útil) ya que podría ser utilizado (se puede utilizar) libremente en muchos proyectos, como el lector de pantalla (programa de acceso a la pantalla) NVDA. Tiene características interesantes las cual no lo comparan con otros sintetizadores de voz. Se incluye un tamaño pequeño, como la habilidad de hablar a velocidades rápidas (hablar rápidamente) y aún ser inteligible (Al mismo tiempo, ser desmontable.)” Creo que el de ser código abierto a que el código fuente sea útil dan lo mismo o nó? En la otra parte, cuando el texto original dice que podría ser utilizado libremente (en el futuro), el texto alterado dice que se puede utilizar libremente (en el presente). Si estoy gramaticalmente equivocado, siéntase libre de corregir. Lo del programa de acceso a la pantalla… umm… no lo entiendo, será de un programa de acceso remoto o se refiere a el mismo lector de pantalla? En la última frase no tiene sentido: De hablar rápido y ser aún inteligible a hablar rápido y ser aún desmontable… no me cuadra.
“El motor podrá ser mejorado por la comunidad (La comunidad podrá mejorar el motor) ya que hay mucha gente que lo podrá llevar al siguiente nivel, como añadir más idiomas y implementarlos en otras plataformas.” Solo noto un cambio. Al principio el texto original está en modo activo, más el alterado en modo pasivo. De nuevo, algún error, corregid.
Desafortunadamente y como vieron, Las oraciones en el texto de la petición son bastante vagas y no contienen apelaciones claramente formuladas. (¿vamos jake otro intento eh?) Además, y dado que el acuerdo entre Microsoft y Nuance todavía está pendiente, la petición todavía se dirige formalmente a la compañía que no controla la licencia de elocuencia. Es decir, se dirige a la compañía cual autorizó la adquisición, y nó a la que está siendo adquirida. Es decir, dirigida a Microsoft en lugar de Nuance. Sin embargo, nada mejor ha sido propuesto por la comunidad de partes interesadas hasta la fecha, por lo que se sugiere que apoyemos lo que tenemos.
“open source ETI-Eloquence” puede encontrarse en change.org: https://www.change.org/p/microsoft-open-source-eti-eloquence
La información sobre esta petición se publica en el centro de retroalimentación de Windows Insider para atraer más atención, por lo que también puede votar por el comentario relevante. Eso sí, debes ser un insider para estar atento.
https://aka.ms/AAc2a4u
Para recordar, y como un reminder, actualmente están disponibles las siguientes licencias y usos de ETI-Eloquence:
Como conocemos, como sintetizador de voz por defecto e integrado en varios productos de FreedomScientific.
Como complemento en NVDA, en Windows, ya sea ilegal, o de Code Factory, o por el controlador IBMTTS.
- En forma de sintetizador de voz compatible con SAPI5 para Windows.
Como paquete Voxin, que viene con un módulo para el servidor de voz Speech Dispatcher más un módulo de integración para el servidor Emacspeak, eso sí, en Linux.
En forma de sintetizador de voz para Android, de nuevo por Code Factory, pero solo disponible para los usuarios que han comprado previamente el programa, ya que este está descontinuado recientemente.
Todas estas versiones se distribuyen de forma pagada, con la excepción de la versión dentro de algunos productos de FreedomScientific , que está cubierta por la licencia de programa general.
Además, también se utilizó Eloquence en varios programas ahora obsoletos con el tiempo, como el avanzado Window-Eyes, la poca conocida COBRA, TALKS, Pronto organizer, entre otros.
Vaya vaya, cuanta toma de tiempo para escribir esta sección!
En segundo lugar, No sé si soy yo, pero las voces en el narrador, aIlía, como que no convencen. Tengo, o tenemos, varias propuestas:
O ir por la forma de Apple y proveer voces gratuitas de alta calidad, la cual se puede hacer posible si tienes una licencia ya sea de Windows 10 o 8.1 integrada en tu cuenta de Microsoft,
o reemplazar las voces existentes con voces de mayor calidad que lean el texto expresivamente y pronuncie claramente las palabras. (yo voy por la última opción).
En tercer lugar, y como va con este hilo, compañías de texto a voz muy conocidas y algunas no tan famosas.
Nó se si hay límite de caracteres en el texto?
1: La primera de ellas es, por su puesto, acapela. Rimó o no rimó?
Conocidas y odiadas? Por muchas y pocas, Acapela es uno de los mejores sintetizadores de voz naturales que existen. Soporta 30 idiomas, en nuestro caso está el español, en el caso de mi amigo está el ruso.
http://www.acapela-group.com/index.php.
2: Vocalizer.
Aunque es popular más en móviles que en pc’s, Vocalizer es uno de los mejores sintetizadores de voz creados por Nuance, que recientemente y por si no lo sabían, su estructura de síntesis de voz produjo un spinnoff, Cerence, la cual ahora mismo toma el control de Vocalizer Expressive (ahora Cerence TTS).Suena natural, discurso de voz fiable, le instalas diccionarios, todo eso.
Aunque es complicado de encontrar en la página de Nuance, le dejo el link de la principal.
http://www.nuance.com/
3: RHVoice.
Desarrollada por la rusa Olga Yakovleva, RHVoice, es un sintetizador que va a prometer mucho, aunque no está disponible en varios idiomas, ni siquiera el español.
https://github.com/olga-yakovleva/rhvoice
5: eSpeak (ahora eSpeakNG)
La primera versión del sintetizador eSpeak NG (en ese tiempo lamada eSpeak) se lanzó en 2006, con una versión para Windows en 2007. Desde este tiempo, el desarrollador (bajo la autoría de Reece Dun y Valdins Vitalins) constantemente produce versiones avanzadas del software. Para Ilía, la versión más reciente, para Ilía, es tiene una pronunciación no tan clara del idioma ruso y otros idiomas similares, pero mejor para el Inglés, como a mí, y, por su puesto, es software libre.

5: Festival
Si no saben, y por lo que sí están en Linux, Festival es un sistema entero de reconocimiento y síntesis de voz, desarrollado en la Universidad de Edinburgo, Escocia, Reino Unido, Europa, Planeta Tierra, Sistema Solar, Vía Láctea. Todos los módulos y programas son libres de manera absoluta y distribuída por una licencia de código abierto. También funciona en Mac, aunque temo decirles que para ilía, el soporte al idioma ruso es muy, muy bajo.
http://www.cstr.ed.ac.uk/projects/Festival/
Pues ahí están. Las dos compañías, tanto Acapela como Vocalizer, son los pioneros en la industria de síntesis de voz, con más idiomas y voces, y por su puesto, de alta calidad.
Ahí está el comentario del amigo:
https://aka.ms/AAcfsro
Notas finales:
1: Como mi amigo y otros, respeto las opinions de cualquiera, y como él, prometo si su compañía favorita no estaría en mi lista.
2: Aunque el inglés de Ilía lo daré como principiante/intermedio, es casi conprencible. Siga mejorando.
3. Depende de cada individuo elegir esa calidad.
4: Como él, no garantizo que todas las opciones anteriores tome un mejor resultado.
Bum, el post más largo de la historia de la salita se ha revelado! o no?
Gracias, me voy, a acostarse o comer pizza, lo que sea.

~msgScore~: +0

Zuletzt geändert von El-Megalovano, May 9 2021 23:03:48

1573. Luis-sama ,

solo tengo algo que decir.
no me molesta que los textos sean largos, en realidad siento que sirbe para poder explicar detalles importantes sobre un problema o un tema que se quiere tocar.
pero... colega, creo que, de todo lo que dijiste... solo me puedo quedar con un 25%. el resto parece el relleno de naruto en sus peores épocas.

~msgScore~: +0

1574. El-Megalovano,

Colea, creo tu opinión. No importa si entendió poco o mucho, con todo lo que me informé hace poco, pueen ser medio importantes. Recientemente un amigo mío me contó que aparentemente ETI-Eloquence fue adquirida por una compañía en 2019, aunque no sé si lo dudo o no, ya que no tenemos el nombre de dicha compañí.

~msgScore~: +0

1575. Lan-Mandragoran,

mmmmm la verdad personalmente no me gusta eloquence, es que lo que sucede es que las palabras en inglés por ejemplo no las pronuncia como deberían ser jake, que en realidad se dice yeik, o they, que en verdad es dey, es complicado usarlo por eso, prefiero las de jorge o esas de vocalicer, no pronuncian todas como deben ser pero si algunas xd

~msgScore~: +0

1576. El-Megalovano,

Raro, amí sí me lo pronuncia.

~msgScore~: +0

1577. un-kit-de-herramientas,

Ojo con esto.
En realidad Eloquence casi no tiene palabras en inglés para pronunciar desde su diccionario en español y entonces sí las pronuncia así como se escriben, si es a eso a lo que te referís. Sintetizadores como Loquendo, Vocalizer, Microsoft TTS entre otros ya es otra cuestión. De hecho lo mismo podrás esperar de sintetizadores viejos como SOftVoice, que además parece que le fue implementada algún tipo de regla bastante extraña como a Loquendo 6 y 7 para ponerles acento a ciertas palabras donde no los llevan e intentar una pronunciación medio rara en inglés...
Pero volviendo al Eloquence en inglés, realmente en inglés ahora sí, aunque pronuncia bien siento que en versiones antiguas que datan de 2001 o por ahí era mucho más claro y menos monótono. Con DecTalk sucedían cosas parecidas a lo largo de las versiones.

~msgScore~: +0

1578. Lan-Mandragoran,

si pues e ahí lo malo, en pocas palabras sería bueno que diga feisbuk en lugar de facebook

~msgScore~: +0

1579. NilMoliner ,

uf, pude probar ava en inglés en una prueba y es la paulina yankee, de verdad. Xd. Es como un ASMR casi y pronuncia todo perfectamente, incluso a altas velocidades.

~msgScore~: +0

1580. Caracolito,

¡Hola!
Es bastante fácil agregar esas palabras a los diccionarios de NVDA o JAWS para que eloquence las pronuncie correctamente. Las voces de microsoft intentan pronunciar correctamente el inglés, pero a veces el resultado es un desastre, y también leen palabras en español con reglas de ese pseudoinglés. Yo personalmente prefiero que el sintetizador me lea todo lo más literalmente posible, y si me interesa que pronuncie bien algún nombre extrangero o abreviatura la agrego yo al diccionario.

~msgScore~: +0

1581. FrancoBattiato,

Qué es aba?

~msgScore~: +0

1582. NilMoliner ,

hola, al final me terminé cambiando a Jorge de vocalizer en lugar de a paulina. Hacía tiempo que no utilizaba una voz con acento español España, y en comparación a eloquence sí que se extrañaba xd. De todas formas, va muchísimo más rápido de lo que iba paulina, al menos en la computadora, y necesito hacer cosas rápido así que va bastante bien.

~msgScore~: +0

1583. Luis-sama ,

es como las voces neuronales de microsoft. suenan bien, pronuncian bien, pero tienen ese supuesto inglés mal pronunciado que te hace terminar escuchando odásety en lugar de audasity

~msgScore~: +0

1584. Lan-Mandragoran,

si también uso jorge el problema que al menos yo tengo es que las letras mayúsculas las dice igual que las ninúsculasm al nenos eloquence hacía la voz más aguda y te dabas cuenta de la diferencia

~msgScore~: +0

1585. CarlosEsteban,

Él seil de su casa, pulsa un botón daváisar en un aparato y se activa la cerradura. Bueno, bueno, que así leerían las voces estas, y es lo que yo vengo comentando ya no se cuántas veces.

~msgScore~: +0

1586. NilMoliner ,

tuve que volver a paulina justo porque las letras mayúsculas las pronuncia igual que las minúsculas, baya porquería. Lo mismo pasa con las voces de siri, he escrito al departamento de accesibilidad de apple y nada de nada, solo dicen que van a redirigirlo mi consulta al departamento "encargado" de eso.

~msgScore~: +0

1587. El-Megalovano,

Volviendo al tema de los sintetizadores, a uno de ustedes recuerdan las voces de Verbio? El tocayo de carlos me gustó.

~msgScore~: +0

1588. julian_suarez,

hola! les hago una pregunta la version 2 de vocalicer funciona con la ultima version de n v d a o tiene que ser si o si la 3

~msgScore~: +0

1589. Princeps-Tenebris ,

Tengo Instalado El Más Antiguo De Los Vocalizer y Funciona, Por Tanto La Versión Que Comentas (Que No Tiene a Angie ni a Marisol) Funciona También, Pero Hay Que Comprarla.

~msgScore~: +0

1590. Yeri_mua ,

Y hablando de las voces de vervio o como se escriba xd. Alguien sabe si hay alguna especie de demo online para poderlas usar atravez de navegador? Por que yo las recuerdo haver porbado un momento en una demo online pero ya no sé si esté. A mí me gustó mucho la voz de Javier, el de la voz de español argentina de vervio.

~msgScore~: +0

4108 Nachrichten, 137 Seiten:  1; 51 5253 54 55; 137 ↖ Zurück zur Themenliste

Auf das Thema antworten

Sie müssen angemeldet sein, um posten zu können

Passwort vergessen? Benutzerkonto erstellen