sonata / Piper Neural voices: Un sintetizador para NVDA que suena muy bien y utiliza inteligencia artificial

723 Nachrichten, 25 Seiten: 1…; 3 45 6 7…; 25 ↖ Zurück zur Themenliste

~msgScore~: +32

121. ElMontarro, Oct 26 2023 23:27:13

Bandita, ¿en qué lugar encuentro voces para este sintetizador en español?

~msgScore~: +0

122. PolloGuerrero, Oct 27 2023 00:09:06

Lean mi primer mensaje, por favor. Recuerden que está el botón este de abrir esta discusión desde la web. Dejé un par de carpetas de drive con más voces y otro usuario también dejó las voces que hizo.

~msgScore~: +0

123. CREADOR , Oct 27 2023 00:33:03

no hay una voz de nuestro querido pichón para este programa? ejem, digo.

~msgScore~: +0

124. cordelia , Oct 27 2023 04:00:51

yo instalé todo de 0 con esta nueva actualización del complemento y no funciona. No me da error, simplemente no habla ninguna voz. Tuve que activar narrador para volver a eloquence con NVDA.

~msgScore~: +0

125. Tu_Tomate, Oct 27 2023 05:31:24

Instalaste las voces? Tienes que darle sus segundos para que te hable porque igual sigue lento

~msgScore~: +0

126. un_oso, Oct 27 2023 07:17:58

alguien tiene la carpeta que pasó un usuario que se llamaba algo de rbpantoja? la busqué pero nola encuentro

~msgScore~: +0

127. El-Megalovano, Oct 27 2023 12:55:55

Debe estar en el primer mensaje si no me equivo...

~msgScore~: +0

128. clapmauricio, Oct 28 2023 01:11:51

Para todos que ya instalaron la versión 2.0 Beta del addon, hay que tener en cuenta que sí está más responsiva, pero en compus menos potentes las vozes no hablarán como esperamos, o simplemente no hablarán, hasta que el proceso piper-grpc.exe gane alta prioridad. Lo probé en dos compus com distintos procesadores, ram etc para llegar a esta conclusión.

~msgScore~: +0

129. PolloGuerrero, Oct 28 2023 01:32:28

De hecho algo pasa, que si nos ponemos a jugar con los nuevos parámetros es como que se va todo a la mierda y se alenteja todo el sistema. No importa que reinicies NVDA y tal, se alenteja todo horriblemente. será que se está cagando el servidor GRPC? Por cierto, estaba esa novedad y se me re olvidó mencionarla. Es como más responsivo el coso pero sí, como que todavía hay que pulirlo. Yo pensaba oara una futura versión que en el manager se pudiera elegir por el usuario el modo de funcionamiento por el tema de la eficiencia y tal, si usar GRPC o hacer como antes una simple comunicación entre el sinte y NVDA.

~msgScore~: +0

130. El-Megalovano, Oct 28 2023 01:50:00

Estaba pensando en lo mismo ya que en mi laptop cuando se ejecuta con servidor GRPC nó me anda, en el registro me sale que no es una aplicación win32 válida.

~msgScore~: +0

131. cordelia , Oct 28 2023 02:10:10

Entonces es mi ordenador. Ya está. me quedo con la versión anterior. lenta pero segura.

~msgScore~: +0

132. elangeldelaguarda, Oct 28 2023 09:24:16

Acabo de probar, pero creo que el problema que hace que deje de funcionar es que pierde el acceso a cómo decir las cosas.
Lo he probado en la ayuda de teclado de NVDA, con cosas tan sencillas como nomrar las letras.
Nombra la k, con una respuesta inmediata, y no sé que otra letra.
Las demás, silencio total.
Puede que haya problemas con las combinaciones fonéticas del idioma.
Supongo que habría que crear un modelo con todas las combinaciones lingüísticas del idioma.
A ver si encuentro un relato que creé, que contiene toda la fonética del español, porque puede que ese sea el problema, proporcionarle un modelo completo del idioma para que sepa pronunciar cualquier combinación, aunque sea inventada.
Además, parece que tiene problemas para interpretar órdenes directas de NVDA, pues el diálogo de apagar Windows lo lee, y en cuanto te sales de ahí, ya no lee nada.
Menos mal que sé cómo volverme para atrás, pero, de momento, no son usables.
Para explicarlo de otra manera, estas voces no se pueden usar a nivel usuario.

~msgScore~: +0

Zuletzt geändert von elangeldelaguarda, Oct 28 2023 10:49:44

133. PolloGuerrero, Oct 28 2023 15:45:48

¿Lo probaste con las voces en calidad Low? POrque tienen ese problema en efecto. No sé todaía si es error de NVDA o de las mismas voces en sí y la IA está alucinando, pero a nivel lectura no sirven así como están. Yo probé desactivando la funcionalidad de deletreo, pero tampoco. Igual, empiezan a decir cosas random durante una lectura puntual, así que no sirve. sería una lástima, ya que se usaron datasets muy grandes (véanse los datasets que están en cada tarjeta de modelo) Pero está también una aplicación de Piper ejecutable para Windows, sin NVDA, aunque es por línea de comandos. No la probé aún.

~msgScore~: +0

Zuletzt geändert von PolloGuerrero, Oct 28 2023 15:49:08

134. clapmauricio, Oct 28 2023 16:39:36

Dónde puedo encontrar esa aplicación para Windows? Quiero probarla y compartir mis impresiones, si posible.

~msgScore~: +0

135. elangeldelaguarda, Oct 29 2023 08:58:58

Parece que el problema, al final, es que se toma cualquier pulsación como una interrupción, o que no es capaz de determinar que NVDA le está ordenando que hable lo siguiente que le toca.
Y ahora, un modelo:
Jovencillo emponzoñado en whisky, qué figurota exhibes.
Muy importante respetar la ortografía.
En este modelo que os he puesto, están todos los fonemas del español.
También habría que contemplar modelos con alocuciones invariables, como "sin embargo," incluyendo la coma, y otras, que se crean con preposiciones y otras combinaciones.
También hay que ver qué puede crear conflictos, como la imposibilidad de leer caracteres extraños.
Se le llama caracteres extraños a combinaciones de letras impronunciables por no tener vocales.
Ejemplos:
NVDA.
CLS.
Lo dicho, hay que respetar la ortografía a rajatabla cuando se creen los modelos, si no, esto no podrá avanzar porque habrá conflictos.
Por otro lado, he intentado leer el manual de cómo crear voces, pero, aparte de que está en inglés, no he encontrado los mismos en forma esquemática, para hacerlo por pasos sin tener que leer tanto texto.
¿Alguien tendría un manual más resumido?

~msgScore~: +0

136. Tu_Tomate, Oct 30 2023 02:56:20

Una pregunta chicos: Si piper es un complemento como los demás, que son esos procesos que me aparecen de él en el administrador de tareas? Alguien más los a visto?

~msgScore~: +0

137. slann-tonic, Oct 30 2023 10:11:34

para @clapmauricio. No es aplicación, es complemento para NVDA. no confunda conceptos mijo. jajajajaja.

~msgScore~: +0

138. PolloGuerrero, Oct 30 2023 12:56:06

No, Slan. está una aplicación independiente para ejecutar en Windos, pero funciona para la línea de comandos. Lo que yo no sé, es si es la que te dan para ejecutar en Python, porque otra cosa no vi en el repo oficial, o es otra que yo ahora mismo no sé dónde está.
-en cuanto al otro proceso que se va abriendo sería el del servidor que hace de intermediario entre el complemento y el TTS. debería haber una forma de matarlo que ahora mismo no se me ocurre, cuando queremos jugar con los parámetros extra y se pone a consumir procesador a lo loco.

~msgScore~: +0

139. clapmauricio, Oct 30 2023 21:02:02

Para Caramelos_felices: ah si, lo siento. Ya utilizo la versión 2.0 del addon, esta que trabaja con piper_grpc.exe. Pasa que yo había entendido que existe una aplicación a parte del addon, eso es, sin relacción con el addon.
Gracias por la explicación.

~msgScore~: +0

140. El-Megalovano, Oct 31 2023 01:14:04

Nó creé el modelo, pero alguien creó un modelo de Piper con la voz de Keynote Gold en inglés. Si tuviera una máquina virtual haría una versión en español. Aún sigo con el problema de hacer una voz multi-speaker con fine-tuning.

~msgScore~: +0

141. PolloGuerrero, Oct 31 2023 01:17:25

Dónde está ese modelo? En algún tema de audogames.net tal vez?

~msgScore~: +0

142. El-Megalovano, Oct 31 2023 11:05:41

En un post de Mastodon. A la internacional, aquí está, aquí está.
https://eurpod.com/en-us-keynote-medium.tar.gz

~msgScore~: +0

143. PolloGuerrero, Oct 31 2023 12:09:27

O sea, al Keynote en español lo tenemos. LA cosa es andarlo por máquina virtual y hacer el modelo. Yo lamentablemente nunca pude.

~msgScore~: +0

144. copilot, Oct 31 2023 14:23:30

me pueden pasaer el enlace, por favor y como descargar, el conplemento,!

~msgScore~: +0

145. PolloGuerrero, Oct 31 2023 16:33:21

pastel de Chocolate, creo (creo, ahora voy a verificar pero creo) que en el primer post de este hilo, que de última podés leer abriendo esta discusión desde la web, que lo tenés al alcance, ahí puse todo lo que hay que tener. Link de complemento, de alguna carpeta de drive con voces y tal, instrucciones de cómo se instala y eso.

~msgScore~: +0

146. copilot, Oct 31 2023 18:29:38

ay un tutorial, de reflexiones, y tutoriales, accesibles, por los que quieren, instalar, linc https://youtu.be/ZoNshqVcIGg?si=FPSEnO4FMX6Zwu-2 para las voces naturales.

~msgScore~: +0

147. El-Megalovano, Nov 1 2023 01:21:39

Sí tenemos al Keynote en español, solo falta pasarlo por la máquina virtual y me mal que sea hasta el núcleo 4.1 de Windows...
Hay una forma automatizada y quizá en la nube para crear voces en Piper sin necesidad de un cuaderno? Hojo quídado aquí que quizá yo sí manejo bien el cuaderno, pero los errores como que no me dejan, y hacer voces multispeaker me dá error...

~msgScore~: +0

148. PolloGuerrero, Nov 1 2023 12:10:36

Nunca ecscuché de algo más automatizado, de todas maneras requeriría saber programación y tal. Ojo, no hice voces multi speaker yo tampoco, para ver si también me daba ese error. Se me ocurre una teoría. Yo para hacer un modelo simple speaker tenía que usar sí o sí un finetuning de Dave Fx, ya que si elegía sarvar me daba error. Recordemos que sarvar es multi speaker, pero tal vez no tenga nada que ver. se me ocurre.

~msgScore~: +0

149. Ren_Yamamoto, Nov 1 2023 14:53:34

hola, oigan, que es grpc?

~msgScore~: +0

150. PolloGuerrero, Nov 1 2023 15:51:20

es el servidor que hará de intermediario entre el TTS y el complemento de NVDA, riene su proceso aparte.
clapmauricio, te encontré Piper para Windows por línea de comandos pero eso sí, no sé cómo usarlo. Creo que es cosa de que abras un símbolo del sistema y sigas las instrucciones sintácticas en el readme que tenemos en el repo oficial, pero no terminé de probar.
https://github.com/rhasspy/piper/releases/download/2023.9.27-1/piper_windows_amd64.zip

~msgScore~: +0

723 Nachrichten, 25 Seiten: 1…; 3 45 6 7…; 25 ↖ Zurück zur Themenliste

Nach oben springen ↑
Zum Inhalt springen ↑

Auf das Thema antworten

Sie müssen angemeldet sein, um posten zu können