sonata / Piper Neural voices: Un sintetizador para NVDA que suena muy bien y utiliza inteligencia artificial

715 Nachrichten, 24 Seiten:  1; 3 45 6 7; 24 ↖ Zurück zur Themenliste

~msgScore~: +32

121. LaMontarra,

Bandita, ¿en qué lugar encuentro voces para este sintetizador en español?

~msgScore~: +0

122. PrincesoGuerrero,

Lean mi primer mensaje, por favor. Recuerden que está el botón este de abrir esta discusión desde la web. Dejé un par de carpetas de drive con más voces y otro usuario también dejó las voces que hizo.

~msgScore~: +0

123. CREADOR ,

no hay una voz de nuestro querido pichón para este programa? ejem, digo.

~msgScore~: +0

124. cordelia ,

yo instalé todo de 0 con esta nueva actualización del complemento y no funciona. No me da error, simplemente no habla ninguna voz. Tuve que activar narrador para volver a eloquence con NVDA.

~msgScore~: +0

125. El-Loro-Azul,

Instalaste las voces? Tienes que darle sus segundos para que te hable porque igual sigue lento

~msgScore~: +0

126. un_oso,

alguien tiene la carpeta que pasó un usuario que se llamaba algo de rbpantoja? la busqué pero nola encuentro

~msgScore~: +0

127. El-Megalovano,

Debe estar en el primer mensaje si no me equivo...

~msgScore~: +0

128. clapmauricio,

Para todos que ya instalaron la versión 2.0 Beta del addon, hay que tener en cuenta que sí está más responsiva, pero en compus menos potentes las vozes no hablarán como esperamos, o simplemente no hablarán, hasta que el proceso piper-grpc.exe gane alta prioridad. Lo probé en dos compus com distintos procesadores, ram etc para llegar a esta conclusión.

~msgScore~: +0

129. PrincesoGuerrero,

De hecho algo pasa, que si nos ponemos a jugar con los nuevos parámetros es como que se va todo a la mierda y se alenteja todo el sistema. No importa que reinicies NVDA y tal, se alenteja todo horriblemente. será que se está cagando el servidor GRPC? Por cierto, estaba esa novedad y se me re olvidó mencionarla. Es como más responsivo el coso pero sí, como que todavía hay que pulirlo. Yo pensaba oara una futura versión que en el manager se pudiera elegir por el usuario el modo de funcionamiento por el tema de la eficiencia y tal, si usar GRPC o hacer como antes una simple comunicación entre el sinte y NVDA.

~msgScore~: +0

130. El-Megalovano,

Estaba pensando en lo mismo ya que en mi laptop cuando se ejecuta con servidor GRPC nó me anda, en el registro me sale que no es una aplicación win32 válida.

~msgScore~: +0

131. cordelia ,

Entonces es mi ordenador. Ya está. me quedo con la versión anterior. lenta pero segura.

~msgScore~: +0

132. elangeldelaguarda,

Acabo de probar, pero creo que el problema que hace que deje de funcionar es que pierde el acceso a cómo decir las cosas.
Lo he probado en la ayuda de teclado de NVDA, con cosas tan sencillas como nomrar las letras.
Nombra la k, con una respuesta inmediata, y no sé que otra letra.
Las demás, silencio total.
Puede que haya problemas con las combinaciones fonéticas del idioma.
Supongo que habría que crear un modelo con todas las combinaciones lingüísticas del idioma.
A ver si encuentro un relato que creé, que contiene toda la fonética del español, porque puede que ese sea el problema, proporcionarle un modelo completo del idioma para que sepa pronunciar cualquier combinación, aunque sea inventada.
Además, parece que tiene problemas para interpretar órdenes directas de NVDA, pues el diálogo de apagar Windows lo lee, y en cuanto te sales de ahí, ya no lee nada.
Menos mal que sé cómo volverme para atrás, pero, de momento, no son usables.
Para explicarlo de otra manera, estas voces no se pueden usar a nivel usuario.

~msgScore~: +0

Zuletzt geändert von elangeldelaguarda, Oct 28 2023 10:49:44

133. PrincesoGuerrero,

¿Lo probaste con las voces en calidad Low? POrque tienen ese problema en efecto. No sé todaía si es error de NVDA o de las mismas voces en sí y la IA está alucinando, pero a nivel lectura no sirven así como están. Yo probé desactivando la funcionalidad de deletreo, pero tampoco. Igual, empiezan a decir cosas random durante una lectura puntual, así que no sirve. sería una lástima, ya que se usaron datasets muy grandes (véanse los datasets que están en cada tarjeta de modelo) Pero está también una aplicación de Piper ejecutable para Windows, sin NVDA, aunque es por línea de comandos. No la probé aún.

~msgScore~: +0

Zuletzt geändert von PrincesoGuerrero, Oct 28 2023 15:49:08

134. clapmauricio,

Dónde puedo encontrar esa aplicación para Windows? Quiero probarla y compartir mis impresiones, si posible.

~msgScore~: +0

135. elangeldelaguarda,

Parece que el problema, al final, es que se toma cualquier pulsación como una interrupción, o que no es capaz de determinar que NVDA le está ordenando que hable lo siguiente que le toca.
Y ahora, un modelo:
Jovencillo emponzoñado en whisky, qué figurota exhibes.
Muy importante respetar la ortografía.
En este modelo que os he puesto, están todos los fonemas del español.
También habría que contemplar modelos con alocuciones invariables, como "sin embargo," incluyendo la coma, y otras, que se crean con preposiciones y otras combinaciones.
También hay que ver qué puede crear conflictos, como la imposibilidad de leer caracteres extraños.
Se le llama caracteres extraños a combinaciones de letras impronunciables por no tener vocales.
Ejemplos:
NVDA.
CLS.
Lo dicho, hay que respetar la ortografía a rajatabla cuando se creen los modelos, si no, esto no podrá avanzar porque habrá conflictos.
Por otro lado, he intentado leer el manual de cómo crear voces, pero, aparte de que está en inglés, no he encontrado los mismos en forma esquemática, para hacerlo por pasos sin tener que leer tanto texto.
¿Alguien tendría un manual más resumido?

~msgScore~: +0

136. El-Loro-Azul,

Una pregunta chicos: Si piper es un complemento como los demás, que son esos procesos que me aparecen de él en el administrador de tareas? Alguien más los a visto?

~msgScore~: +0

137. slann-tonic,

para @clapmauricio. No es aplicación, es complemento para NVDA. no confunda conceptos mijo. jajajajaja.

~msgScore~: +0

138. PrincesoGuerrero,

No, Slan. está una aplicación independiente para ejecutar en Windos, pero funciona para la línea de comandos. Lo que yo no sé, es si es la que te dan para ejecutar en Python, porque otra cosa no vi en el repo oficial, o es otra que yo ahora mismo no sé dónde está.
-en cuanto al otro proceso que se va abriendo sería el del servidor que hace de intermediario entre el complemento y el TTS. debería haber una forma de matarlo que ahora mismo no se me ocurre, cuando queremos jugar con los parámetros extra y se pone a consumir procesador a lo loco.

~msgScore~: +0

139. clapmauricio,

Para Caramelos_felices: ah si, lo siento. Ya utilizo la versión 2.0 del addon, esta que trabaja con piper_grpc.exe. Pasa que yo había entendido que existe una aplicación a parte del addon, eso es, sin relacción con el addon.
Gracias por la explicación.

~msgScore~: +0

140. El-Megalovano,

Nó creé el modelo, pero alguien creó un modelo de Piper con la voz de Keynote Gold en inglés. Si tuviera una máquina virtual haría una versión en español. Aún sigo con el problema de hacer una voz multi-speaker con fine-tuning.

~msgScore~: +0

141. PrincesoGuerrero,

Dónde está ese modelo? En algún tema de audogames.net tal vez?

~msgScore~: +0

142. El-Megalovano,

En un post de Mastodon. A la internacional, aquí está, aquí está.
https://eurpod.com/en-us-keynote-medium.tar.gz

~msgScore~: +0

143. PrincesoGuerrero,

O sea, al Keynote en español lo tenemos. LA cosa es andarlo por máquina virtual y hacer el modelo. Yo lamentablemente nunca pude.

~msgScore~: +0

144. copilot,

me pueden pasaer el enlace, por favor y como descargar, el conplemento,!

~msgScore~: +0

145. PrincesoGuerrero,

pastel de Chocolate, creo (creo, ahora voy a verificar pero creo) que en el primer post de este hilo, que de última podés leer abriendo esta discusión desde la web, que lo tenés al alcance, ahí puse todo lo que hay que tener. Link de complemento, de alguna carpeta de drive con voces y tal, instrucciones de cómo se instala y eso.

~msgScore~: +0

146. copilot,

ay un tutorial, de reflexiones, y tutoriales, accesibles, por los que quieren, instalar, linc https://youtu.be/ZoNshqVcIGg?si=FPSEnO4FMX6Zwu-2 para las voces naturales.

~msgScore~: +0

147. El-Megalovano,

Sí tenemos al Keynote en español, solo falta pasarlo por la máquina virtual y me mal que sea hasta el núcleo 4.1 de Windows...
Hay una forma automatizada y quizá en la nube para crear voces en Piper sin necesidad de un cuaderno? Hojo quídado aquí que quizá yo sí manejo bien el cuaderno, pero los errores como que no me dejan, y hacer voces multispeaker me dá error...

~msgScore~: +0

148. PrincesoGuerrero,

Nunca ecscuché de algo más automatizado, de todas maneras requeriría saber programación y tal. Ojo, no hice voces multi speaker yo tampoco, para ver si también me daba ese error. Se me ocurre una teoría. Yo para hacer un modelo simple speaker tenía que usar sí o sí un finetuning de Dave Fx, ya que si elegía sarvar me daba error. Recordemos que sarvar es multi speaker, pero tal vez no tenga nada que ver. se me ocurre.

~msgScore~: +0

149. Ren_Yamamoto,

hola, oigan, que es grpc?

~msgScore~: +0

150. PrincesoGuerrero,

es el servidor que hará de intermediario entre el TTS y el complemento de NVDA, riene su proceso aparte.
clapmauricio, te encontré Piper para Windows por línea de comandos pero eso sí, no sé cómo usarlo. Creo que es cosa de que abras un símbolo del sistema y sigas las instrucciones sintácticas en el readme que tenemos en el repo oficial, pero no terminé de probar.
https://github.com/rhasspy/piper/releases/download/2023.9.27-1/piper_windows_amd64.zip

~msgScore~: +0

715 Nachrichten, 24 Seiten:  1; 3 45 6 7; 24 ↖ Zurück zur Themenliste

Auf das Thema antworten

Sie müssen angemeldet sein, um posten zu können

Passwort vergessen? Benutzerkonto erstellen