sonata / Piper Neural voices: Un sintetizador para NVDA que suena muy bien y utiliza inteligencia artificial

723 mensajes, 25 páginas: 1…; 10 1112 13 14…; 25 ↖ Volver a la lista de temas

Resultado: +32

331. marcoML, 03.02.2024 05:30:13

q raro 30gb jajaj

Resultado: +0

332. Dani-el-profe-Tunes, 03.02.2024 14:05:30

Quiso decir 29

Resultado: +0

333. rmcpantoja, 03.02.2024 14:13:50

Buenas, las voces RT por el momento deben instalarse manualmente (decoder, encoder y config). El soporte para estas voces todavía no es oficial, por lo que no podría actualizar el cuaderno de exportación hasta que suceda el cambio.

Velocidad de respuesta: implementé ISTFT-VITS a piper, el cual aparte de proporcionar una mejor calidad de sonido es 4.1 veces más rápido que el VITS original en un PC de bajos recursos, según el artículo Lightweight and High-Fidelity End-to-End Text-to-Speech with Multi-Band Generation and Inverse Short-Time Fourier Transform. Al ser otro modelo, hay que entrenar los modelos de cero.

Resultado: +0

334. El-Megalovano, 03.02.2024 14:54:00

Gracias Mateo. Lo mencioné hace mensajes atrás, pero se podrá añadir soporte de Vits2 y otros fonemizadores a demás de eSpeakNG en alguna futura versión de Piper?

Resultado: +0

335. Una-IA-andante, 03.02.2024 14:57:05

Cómo ponemos exacto la voz rt, con la única que tengo? Ya tenga la voz de abel, la que sí funciona, ya instalada. Van los archivos de la voz RT ahí mism y entonces no puedo tener ambas versiones juntas porque se sobreescibe el archivo .json? Porque en su momento descomprimí la carpeta que hay dentro de la voz RT, y la puse ahí con las demás voces, pero nada.

Resultado: +0

336. El-Megalovano, 03.02.2024 23:37:13

Instalando las voces en español de Piper en mi nueva laptop, me parece que de alguna forma u otra los links de las voces que publicó están vacíos. Ummm digo algo pasó con los modelos en su Hughingface? Como que nó lo encontró...

Resultado: -1

337. Una-IA-andante, 03.02.2024 23:38:05

Tranqui, en algún momento con calma los arreglo. en efecto hay algunos cambios.

Resultado: +0

338. El-Megalovano, 04.02.2024 11:45:04

Lo esperaré, lo esperaré. Es que pocas veces soy algo impaciente, pero a toda firmeza lo esperaré.

Resultado: +0

339. Ren_Yamamoto, 06.02.2024 15:44:49

lol jente, soy yo o el NVDA o el complemento ya no está instalando las voces recientes? Hice 2 y ninguna me la ah instalado

Resultado: +0

340. Una-IA-andante, 06.02.2024 18:11:11

No sé? Me vas a tener que mostrar y te digo, porque me acuerdo que no estaba andando bien esto de la exportación.

Resultado: +0

341. Ren_Yamamoto, 07.02.2024 23:24:24

ahora el complemento es el que me falla

Resultado: +0

342. Chuy , 08.02.2024 21:41:57

como se instalan las voces rt de forma manual.

Resultado: +0

343. anna_ffiuffiu , 08.02.2024 22:10:13

chicos, alguien a creado algún modelo de las voces de Samsung para usar en piper?

Resultado: +0

344. Una-IA-andante, 08.02.2024 22:46:11

No hasta donde sabemos, y yo no lo haría.

Resultado: +0

345. Chuy , 08.02.2024 22:47:42

es muy complicado crear una voz para ese complemento.

Resultado: +0

346. anna_ffiuffiu , 10.02.2024 15:27:06

en si es complicado jaja, una vez lo quise hacer pero no me funcionó xd

Resultado: +0

347. Una-IA-andante, 10.02.2024 15:51:14

Edité el primer post. Ninguna actualización sobre el comic o nueva versión del complemento en sí pero corregí el link al repo no oficial con todas las voces en español que tenemos, faltaría ir agregando muchas de las que hice @rpantoja pero ya está todo.

Resultado: +0

348. El-Megalovano, 10.02.2024 19:55:44

Me aparece que Huggingface está en mantenimiento.
Por cierto, si lo desean, crearé un resilio synk para voces Piper, ya que he visto uno con voces de ElevenLabs y voces RVC.

Resultado: +0

Última edición por El-Megalovano, 10.02.2024 19:56:37

349. Sephiroth, 11.02.2024 01:32:43

El-Megalovano: Me aparece que Huggingface está en mantenimiento. Por cierto, si lo desean, crearé un resilio synk para...: ayer 19:55 20 de 28 puedes porfavor compartir esas carpetas de resilio

Resultado: +0

350. El-Megalovano, 11.02.2024 01:37:02

Ah pensaba en crear una, pero gracias a un amigo hay una carpeta en la que dije que contiene voces de ElevenLabs y voces RVC. En ella creé la carpeta para voces piper.
Clave de la carpeta (hay que pegarla en el cuadro de clave después de dar click en el enlace correspondiente):
AAA6SOD7QKLBWXF7TTAERYBMGLCU5TGQR
Ahí aparece la carpeta Piper TTS. Está en blanco, pero pueden subir sus voces Piper creadas. Nó se si al creador le aparece, pero amí me aparece.
Nota: algún contenido es NSFW.

Resultado: +0

Última edición por El-Megalovano, 11.02.2024 01:37:52

351. Una-IA-andante, 11.02.2024 01:49:39

Bueno, desconozco ´como se entraría ahí. Ni conocía esa plataforma.

Resultado: +0

Última edición por Una-IA-andante, 11.02.2024 01:58:03

352. El-Megalovano, 11.02.2024 05:45:54

Resilio Synk?
Veo que sí se mostró la carpeta agregada.

Resultado: +0

353. Sephiroth, 11.02.2024 18:53:59

El-Megalovano: Ah pensaba en crear una, pero gracias a un amigo hay una carpeta en la que dije que contiene voces de...: hoy 01:37 18 de 28: Gracias por la Carpeta

Resultado: +0

354. rmcpantoja, 11.02.2024 21:39:52

Hola @el-megalobano.
siempre que el fonemizador esté en c++ o corra a través de onnxruntime es válido para hacerlo funcionar en piper_phonemize. Actualmente, el desarrollador de piper está trabajando en algo relacionado a fonemizadores, independiente de espeak-NG, aunque desconozco cómo progresa.

Resultado: +0

355. El-Megalovano, 12.02.2024 05:24:11

Es Megalóvano, btw.
Gracias con respecto a los fonemizadores. Creo que DeepPhonemyzer corre en ONX, creo. Nó leí la documentación completa, ansí que quizá lo que digo es totalmente vago y carece de información encontrada. Si se añaden más fonemizadores a demás de los integrados eSpeakNG y texto como el propuesto DeepPhonemyzer, estaría encantado. Esto tendría la ventaja en la cual similar a lo ocurrido con Rhetorical RHSpeech las voces que a demás de hablar su lengua madre también hablarían en otros idiomas, con la adición de más que soportan alfabetos diferentes. Me imajino mi voz hablando en griego, en hebreo, hasta en japonés...

Resultado: +0

356. lev-yashin , 13.02.2024 03:01:29

alguien sabe donde puedo conseguir más voces del sintetisadór? esque solo tengo una de piper neural.

Resultado: +0

357. Una-IA-andante, 13.02.2024 03:45:07

En el primer post dejé un link al repositorio con un montón de voces, hay como 12 o 13. Después en otro post, qrpantoja dejó su carpeta de drive ocn aún más voces.

Resultado: +0

358. El-Megalovano, 13.02.2024 05:54:26

Hay 2 voces en inglés de Piper TTS. Está la voz en inglés de Keynote Gold y la de Alex de MacOS.
Edit: Hay dos nuevos pull requests concerniente a la posibilidad de, mediante el fonemizador de textos usar el alfabeto fonético internacional para que la voz pueda "intentar" hablar diferentes idiomas. Digo intentar entre comillas ya que para que pronuncie perfectamente la voz necesitaría un gran catálogo de grabaciones que incluyan otros fonemas. Nó se cómo funcionaría...

Resultado: +0

Última edición por El-Megalovano, 21.02.2024 18:16:23

359. Una-IA-andante, 24.02.2024 04:03:58

Aprovecho como única novedad a enseñarles a instalar una voz RT, o voz en tiempo real. Cuando la cosa esté más pulida, creo que les va a gustar mucho, ya que vamos a tener una velocidad de respuesta superior y una lectura más fluída, por lo que estoy probando. La parte de entrenamiento y el futuro de cómo las vamos a instalar y tal se lo dejo a @rpantoja, por ahora.
Prueben la única voz que tengo en mi poder, la de Abel Folk, que es quién puso la voz de Jorge Loquendo. Pero no es un clon de la voz de Jorge, es el actor real.
Aunque el archivo sea .tag.7z no lo instalen como de costumbre. No vayan a instalar la voz en calidad Medium normal como las demás voces, ya que igual estamos como sobreescribiendo todo y no vale la pena.
Ahora, descomprimimos y verán que tienen la carpeta Abel Folk. LA renombran a esto:
es_ES-avelfolk-medium
Así como la puse. La van a mover a donde están las demás voces, que explorando el directorio de configuración del usuario de NVDA suele ser en Piper\voices\1.0 y ahí dentro están tantas voces como hayan instalado.

Resultado: +0

Última edición por Una-IA-andante, 24.02.2024 04:05:57

360. El-Megalovano, 26.02.2024 00:48:45

Arriba hilo arriba! No quiero que se pierda en el olvido.

Y ya que hablamos de las voces Loquendo, sería posible hacer un modelo multi-voice para las voces loquendo en varios idiomas? Sí, lo sé que nó creé uno por perder tiempo, pero si alguien a demás de mí lo crea sería fantástico.
Ah porqué nó Eloquence? Y también las voces de At&T y ReadSpeaker?

Estoy tratando de hacer un modelo de algunas voces de la antigua Rhetorical...

Resultado: +0

723 mensajes, 25 páginas: 1…; 10 1112 13 14…; 25 ↖ Volver a la lista de temas

Ir a los menús ↑
Ir al contenido ↑

Responder al tema

Usted debe estar conectado para poder postear.