sonata / Piper Neural voices: Un sintetizador para NVDA que suena muy bien y utiliza inteligencia artificial

702 poruka, 24 stranica:  1 2 34 5 6; 24 ↖ Vrati se nazad na listu tema

Skor: +32

91. Chuy ,

menú NVDA, entra en preferencias y en la ventana de preferencias busca el nombre del complemento

Skor: +0

92. PrincesoGuerrero,

No la va a encontrar en la ventana de preferencias, sino en opciones. es una nueva categoría que se añade siempre que haya voces instaladas.

Skor: +0

93. Chuy ,

bueno bueno bueno. dirían en micro electronica ticktock
me equiboqué

Skor: +0

94. ulimilani,

hola ¿cómo están? bueno, intenté probar ese complemento, pero por alguna razón no me lo descarga desde drive. ¿alguien sabe por qué puede ser?

Skor: +0

95. El-Megalovano,

Error 500. Bueno, quizá por muchas personas que lo descargan...

Skor: +0

96. ulimilani,

si, puede ser

Skor: +0

97. kaladin-bendito-por-la-tormenta,

la respuesta es más rápida de lo que me esperaba. funciona bien. hay un par de detalles que debo mencionar. 1. la voz al leer ciertas palabras como que se atora. 2. por otra parte, aveces es como si el idioma español de la voz se enredara. como explicarme, para que no se mal entienda. no quiero decir que, cambia de idioma. por decir algo, al inglés. sigue hablando en español, pero con indicios de inglés. vamos, que habla en español con asento inglés. eso quiero decir. funciona genial eso si. ojalá lo mejoren, ya que le veo bastante futuro por ejemplo, fíjense en la palabra respuesta, si tienen instalado el complemento. estoy usando a la hermosa dalia la sandalia xd.

Skor: +0

98. cordelia ,

en mi caso, la versión estable luego de instalada, desapareció, es decir no está entre los sintetizadores o sea, que toca regresar a la beta e instalar todas las voces de nuevo. y supuestamente las versiones estables son mejores que las beta. Vaya mejoría.

Skor: +0

99. El-Megalovano,

Nó tanto. Cuando instalé la versión última las voces se guardavan en una carpeta diferente por lo que, oh sorpresa, nó aparecían, ni siquiera la voz de skíbidi que yo tenía, a menos que volvías a reinstalar las voces para que así estarían en una nueva carpeta y eliminar las voces remanentes anteriores para ahorrar espacio en disco como para que yo no sepa como se podrían...

Skor: +0

100. PrincesoGuerrero,

Sí, yo creo que era innecesario todo ese cambio de ruta para esta nueva vesión supuestamente estable, que aún tiene algún bug pero bue, no importa. Todavía estas voces se podrían moer y renombrar ligeramente pero aunque yo lo sepa hacer, sé que no es para cualquiera.
Bueno, sobre que en ciertas palabras algo cortas (sobre todo ahí) quiera como hablar en inglés, es porque hoy por hoy, para los modelos que entrenamos en español usamos modelos preentrenados (finetuned) que a su vez se hicieron de modelos finetuneados en inglés. Para entrenar un modelo from scrach, totalmente de 0, según esta cosa tienen que tener mínimo 8 horas de audio. Aparentemente la voz de CarlFM que es una de esas voces que se ofrecen en español de España cumple con esto, o sea eso pone en la el model card.

Skor: +0

101. El-Megalovano,

En ello en promedio quizá se requieran 2500 archivos o algo así para llegar al mínimo de 8 horas de audio. Eso le dije a la "megalovania de las IA's".

Skor: +0

102. cordelia ,

hola, pregunto. instalé la versión estable del complemento de piper para NVDA y ahora no aparece entre los sintetizadores instalados. Además, me dice que no tengo voces instaladas, siendo que hasta el momento, si que las tenía y estaba utilizando la versión beta. Cómo podría resolver el problema? Tengo que instalar todas las voces nuevamente? Fui a la carpeta de NVDA en Roaming y allí está piper y sus archivos y las voces que efectivamente tenía utilizando la versión beta del complemento. Gracias a quien pudiera ayudar.

Skor: +0

103. PrincesoGuerrero,

sí, para esa versión estable (que yo no siento que sea estable en verdad pero bueno) otra vez hay que reinstalar ya que hay un ligero cambio de ruta de instalación y de nombre de carpetas, aunque también podés hacer todo el cambio de forma manual. Por ahí yo las reinstalaría, como por asegurarnos. Para mí no ear necesario hacer ese cambio pero bue, el desarrollador dirá.

Skor: +0

104. El-Megalovano,

Levanta hilo de las voces...
Nó se si soy yo, pero me da un error cuando creo un modelo multi-speaker mientras utilizo un fine tuned model:
RuntimeError: Error(s) in loading state_dict for VitsModel:
    Missing key(s) in state_dict: "model_g.dec.cond.weight", "model_g.dec.cond.bias", "model_g.enc_q.enc.cond_layer.bias", "model_g.enc_q.enc.cond_layer.weight_g", "model_g.enc_q.enc.cond_layer.weight_v", "model_g.flow.flows.0.enc.cond_layer.bias", "model_g.flow.flows.0.enc.cond_layer.weight_g", "model_g.flow.flows.0.enc.cond_layer.weight_v", "model_g.flow.flows.2.enc.cond_layer.bias", "model_g.flow.flows.2.enc.cond_layer.weight_g", "model_g.flow.flows.2.enc.cond_layer.weight_v", "model_g.flow.flows.4.enc.cond_layer.bias", "model_g.flow.flows.4.enc.cond_layer.weight_g", "model_g.flow.flows.4.enc.cond_layer.weight_v", "model_g.flow.flows.6.enc.cond_layer.bias", "model_g.flow.flows.6.enc.cond_layer.weight_g", "model_g.flow.flows.6.enc.cond_layer.weight_v", "model_g.dp.cond.weight", "model_g.dp.cond.bias", "model_g.emb_g.weight".
O soy yo, o las voces o locutores en el modelo necesitan más frases, o si los locutores tendrán el mismo número de frases, o los locutores tendrán las mismas frases, o quizá algunas frases alcanzaron el tiempo límite de 15 segundos?

Skor: +0

105. PrincesoGuerrero,

hola! se actualizó el complemento de Piper. Pruébenlo ahora, es mucho más responsivo, con muchos errores corregidos y 3 parámetros nuevos de voz: https://github.com/mush42/piper-nvda/releases/download/v2.0-beta2/piper_neural_voices-2.0-beta.nvda-addon

Skor: +0

106. El-Loro-Azul,

A la orden mi capitán! A ver

Skor: +0

107. un_oso,

lo probé, pero no se si sea por mi pc que tiene 3 de ram, probaré con mi otra pc que no es del gobierno haver si funciona. bien trabado que va el coso, ni me respondía casi.

Skor: +0

108. copilot,

como lo descargo por que, tiene un chingo de archivos, y no entiendo nada

Skor: +0

109. Berlinnn,

Lo descargué sin problemas pero al momento de instalarlo, me sale el siguiente aviso: Error diálogo Fallo al instalar el complemento desde D:\Descargas de internet\piper_neural_voices-2.0-beta.nvda-addon.
alguna idea de qué puede ser? Tengo win 10 y NVDA en su última versión (2023.2).

Skor: +0

110. El-Megalovano,

Algún conflicto de archivos?
Instalé la versión reciente de Piper en mi laptop, pero al iniciar el sintetizador me aparece un error. Lo tengo en el log.
ERROR - synthDriverHandler.getSynthList (05:35:54.743) - MainThread (32276):
Error while importing SynthDriver piper_neural_voices
Traceback (most recent call last):
File "synthDriverHandler.pyc", line 408, in getSynthList
File "synthDriverHandler.pyc", line 395, in _getSynthDriver
File "importlib__init__.pyc", line 127, in import_module
File "<frozen importlib._bootstrap>", line 1006, in _gcd_import
File "<frozen importlib._bootstrap>", line 983, in _find_and_load
File "<frozen importlib._bootstrap>", line 967, in _find_and_load_unlocked
File "<frozen importlib._bootstrap>", line 677, in _load_unlocked
File "<frozen importlib._bootstrap_external>", line 728, in exec_module
File "<frozen importlib._bootstrap>", line 219, in _call_with_frames_removed
File "C:\Users\LUIS CARLOS\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices__init__.py", line 59, in <module>
grpc_client.initialize()
File "C:\Users\LUIS CARLOS\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\grpc_client__init__.py", line 52, in initialize
start_grpc_server()
File "C:\Users\LUIS CARLOS\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\grpc_client__init__.py", line 46, in start_grpc_server
stderr=subprocess.DEVNULL,
File "subprocess.pyc", line 800, in __init__
File "subprocess.pyc", line 1207, in _execute_child
OSError: [WinError 193] %1 no es una aplicación Win32 válida
Debe ser el procesador? Porque tengo un procesador Intel(R) Core(TM) i7-10750H CPU @ 2.60GHz 2.59 GHz Intel(R) Core(TM) i7-10750H CPU @ 2.60GHz 2.59 GHz DE 64 bits.
En mi compu de escritorio sí funciona UTILIZANDO Intel(R) Core(TM) i7-4770 CPU @ 3.40GHz 3.00 GHz Intel(R) Core(TM) i7-4770 CPU @ 3.40GHz 3.00 GHz también de 64 bits. Extraño, muy extraño...

Skor: +0

Poslednja izmena od strane El-Megalovano, 26 Oct 2023 12:41:07

111. Laositadepeluche ,

dios, como que salió una nueva versión de piper? la probaré, señoras y señores. Edit, mentira, no a mejorado nada, las voces siguen sin responder! o creo que sería mi pc, ni idea xd, pero el caso es que no me funciona

Skor: +0

Poslednja izmena od strane Laositadepeluche , 26 Oct 2023 16:24:40

112. Aurorita-Dulce-y-Bonita,

lo baje, me instaló una voz, y en vez de hablarme en espaol, me habló en idioma extraterrestre

Skor: +0

113. PrincesoGuerrero,

Chicos, me parece que hay varios puntos que aclarar.
se cambió mucho de esta versión a la que creo que usábamos mayoría.
Por ahí, el cambio a destacar más, es que ahora las voces que teníamos instaladas tendrán que ser movidas y ligeramente renombradas, o volver a bajarlas, ya que se cambió la ruta de ubicación donde están almacenadas las voces. Para qué o con qué propósito, andá a saber.
Si vamos a la carpeta de configuración del usuario tenemos ahí nomás, una que dice Piper. no es el complemento en sí. ahí estaban todas las voces, hasta donde teníamos. Dentro de esa carpeta estaba otra más, Voices. esta nueva versión agrega otra carpeta, v1.0. Por qué, los desarrlladores sabrán. La cosa es que todas esas carpetas que icen por ejemplo voice-es-nombre-médium y tal, habría que moverlas a esa nueva subcarpeta, o bajarlas de nuevo para aseguraros de que la instalación esté sin errores. de todas maneras, no solo habría que mover estas carpetas, sino renombrarlas ligeramente a todas. Todo lo que es voice- (véase el guión también) habría que borrarlo, incluyendo ese guión, de forma que se llamarían, es-nombre-médium. Por ejemplo la carpeta que contiene mi oz se llama, es-fer-médium.
Si quieren, las vuelven a bajar e instalar. Ahora, sigo preguntándome por qué tenía que estar todo en una subcarpeta más, ya que igual dentro de la carpeta voices no veo nada más. Bueno, espero logren andarlas ahora sí. Me encanta, da mucho más gusto leer así.
Como se habrán dado cuenta, de las pocas voces en español que hay para descargar desde el mismo Manager, es porque las descargamos del repositorio oficial de voces. de ahí lo que decíamos en primeros posts de algún repositorio no oficial para todas esas voces que hacemos nosotros.

Skor: +0

Poslednja izmena od strane PrincesoGuerrero, 26 Oct 2023 18:02:51

114. James_Potter,

Alguna voz buena?
Todas las que escuché se escuchan re raro.

Skor: +1

115. PrincesoGuerrero,

no es por ser yo ni por haberla hecho yo, pero creo que mi propia voz está bastante bien hecha. También, la voz de Pedro (que es una recreación de Pedro de Innoetics TTS) o la de Dalia de Microsoft. de las voces hechas por qrpantoja mi favorita es la de Oriol. Igual de las que hizo él me gustan varias. me gustó la de @laositadepeluche aunque por ahí para leer ciertas frases como que se acelera mucho o por alguna razón ya no se le entiende bien, pero en sí me gusta mucho. La de Ulises también me gustó mucho, hay una que dice LTTs que no sé quienes son pero son como 4 voces con acento colombiano. Hay voces de algún que otro personaje o YouTuber conocido, como Luisito comunica, auron, Calamardo...
Las voces en el repositorio no me gustan, aunque sí la de savar me gustó bastante, son 2 voces. Ah! _Recordé la voz que @rpantoja etiquetó como narrador, me gusta mucho y creo que corresponde a Adam de ElevenLabs.
Como se habrán dado cuenta, me gustan más las voces que no estarían en el repo oficial, o no están por ahora. No sé si sí o sí tienen que estar el model card, que no se lo puse a las voces que hice.

Skor: +0

116. El-Loro-Azul,

Aún anda demasiado lento y como que lee peor que como estaba. Si le van a tocar cosas, que sea sobre la velocidad

Skor: +0

117. matias1912,

a mi lo que me desanima es la lentitud, pero es un avance del carajo tener estas voces si

Skor: +0

118. el_pichon,

Pues a mí la voz de Oriol no me gusta porque se hizo sin su permiso. A él le da igual, así que el drama no va más allá, pero si yo estuviera en su lugar me encargaría de que el responsable quisiera desaparecer durante una buena temporada.

Skor: +0

119. manantial,

Como se usa con voces de personas? yo quiero una voz pero no para filtrarla, si no nomas para uso personal

Skor: +0

120. PrincesoGuerrero,

todavía hay un error. Si nos ponemos a leer con Piper un mensaje de acá del foro, algo largo, o mismo en cualquier otro programa pero texto largo sin usar la lectura continua de NVDA, lee una partecita y ahí se queda. Faltaría corregir ahí.

Skor: +0

702 poruka, 24 stranica:  1 2 34 5 6; 24 ↖ Vrati se nazad na listu tema

Odgovori na temu

Morate da se prijavite kako biste mogli da pišete

Zaboravljena lozinka? Napravi nalog