sonata / Piper Neural voices: Un sintetizador para NVDA que suena muy bien y utiliza inteligencia artificial

723 mensajes, 25 páginas: 1…; 14 1516 17 18…; 25 ↖ Volver a la lista de temas

Resultado: +32

451. LeboMathosa , 25.03.2024 21:25:41

lo del cuaderno me animó! Voy a ver si consigo una entrevista de Nippy (Whitney) para hacer el dataset!

Resultado: +0

452. magali27, 25.03.2024 23:10:24

pasan porfis e l sintetiador

Resultado: +0

453. un_oso, 25.03.2024 23:33:16

Y ESE CUADERNO DONDE lo puedo conseguir?

Resultado: +0

454. PolloGuerrero, 26.03.2024 02:22:01

https://colab.research.google.com/github/rmcpantoja/My-Colab-Notebooks/blob/main/notebooks/OpenAI_Whisper_-_DotCSV_(Speech_dataset_multi-transcryption_support)es.ipynb?fbclid=IwAR1RUDJXCRY4QkDglLLFus5o2m6JcoArMiE5vqmuDJIRvW-CWMbWCJ3B_i0

Resultado: +0

455. LeboMathosa , 26.03.2024 03:23:34

lo que no entendí bien es como hay que hacer el dataset. ¿Tengo que recortar los audios como con los de rvc? O como funciona?

Resultado: +0

456. PolloGuerrero, 26.03.2024 15:08:33

No sé cómo tenés que recortar los que usaras para RVC para hacerte la comparativa, pero sí acá tenés que tener todos archivos wav, que duren de 4 a 15 segundos. Cuantos más minutos de cortus, mejor.

Resultado: +0

457. Ren_Yamamoto, 26.03.2024 18:17:19

el cuaderno en inglés si no subes una transcripción usa wisper solito, el español tiene un errorcillo y aunque tiene wisper ciempre falla

Resultado: +0

458. Yordy, 26.03.2024 20:06:31

alguien me pasa la voz de oriol gomez en español España porfa

Resultado: +0

459. Ren_Yamamoto, 26.03.2024 21:03:13

está en eso de las primeras páginas, en una carpeta, puedes darle en abrir esta discusión en la web y buscar con la letra k en modo explorción el enlace en la primera página, si no está ahí dale al enlace que dice 2 y así hasta que encunetres esa carpeta, si te sirve e algo la pasó rmcpantoja. No es porque no te la quiera pasar sino que hay muchos modelos de oriol y bue

Resultado: +0

Última edición por Ren_Yamamoto, 26.03.2024 21:03:28

460. LeboMathosa , 26.03.2024 21:39:47

jamás hice un modelo de nada, por eso tantas preguntas que tengo jajaja.

Resultado: +0

461. nathalie , 27.03.2024 00:12:08

x2, yo quiero tratar de hacer algún modelo XD

Resultado: +0

462. Ren_Yamamoto, 27.03.2024 01:02:37

n el primer mensaje tienen una guía. bue en fin.

Resultado: +0

463. el-mauzote, 27.03.2024 10:02:50

hola, alguien e ustedes tendría el enlace directo para descargar el complemento? muchas gracias de antemano.

Resultado: +0

464. Ren_Yamamoto, 27.03.2024 14:46:22

por favor dios ayúdame con esta jente que pide lo mismo cada 2 mensajes. Mira, te voy a dar un consejo así de buena fe aunque realmente puede sonar un poquito a crítica pero esque hay tanta jente que pregunta lo mismo que ando medio arto :D En cada tema de lo que sea, en la mayoría si no es que todos, en el primer mensaje osea puedes abrir el tema desde la web y te lleva a la primera página primer mensaje, ahí tiene que estar todo lo del tema, o almenos un poco. En hilo de batalla constante, no lo eh visto porque realmente no me interesa mucho, supongo yo que en el primer mensaje te deja link o almenos en donde puedes encontrarlo. En hilo de... Yo que se, si hay uno de lector prudencia en el primer mensaje tiene que haber un link. En piper hay un link. No creas que la jente nomás crea un tema y dice. Bueno, hablemos de esto. Ni se que sea ni en donde descargarlo, pero hablemos de esto. Y para el próximo que pregunte copio este mensaje y lo pego pero le cambio cosas pa que suene mas feo y se ballan a tirarme tiflomierd, en fin. PD: te aseguro que menos de 2 páginas atrás alguien preguntó lo imsmo que tú, lean, lean que ni siquiera se les cansa la vista en fin

Resultado: +0

Última edición por Ren_Yamamoto, 27.03.2024 14:49:26

465. Chuy , 27.03.2024 14:55:58

alguna novedad o voz nueva para provar.
actualmente ando con la de mirella medium pero no tengo otra.
tengo una real time pero no logré hacerla funcionar. y eso que seguí los pasos explicados en mensajes anteriores.

Resultado: +0

466. El-Megalovano, 27.03.2024 21:41:21

Existe una nueva voz de Votrax.
https://eurpod.com/en-us-Votrax_medium.tar.gz
La misma de Braille hablado pero en inglés

Resultado: +0

467. PolloGuerrero, 27.03.2024 23:16:11

O sea, yo hasta no lograr recrear el coso en español no descansaría en paz. el detalle es que mi Braille and speak está hecho pelota, no logro reararlo de momento. si lo reparaba, lo grababa aunque no fuese en HQ, ya que tampoco logro conectar acá ni siquiera mis instrumentos. Vayan guardando los que ya hay por ahí como el de Keynote Gold.

Resultado: +0

468. oscar93, 28.03.2024 01:07:11

Una pregunta, instalé el sintetizador, le puse una voz pero no me aprece en la lista de sintetizadores. que está sucediendo? tengo win 7

Resultado: +0

469. PolloGuerrero, 28.03.2024 01:12:32

puede que sea justamente porque tenés Win 7, aunque como expliqué algunos mensajes arriba, tal vez tengas que instalar las librerías Microsoft Visual C++, que también dejé un link directo para obtenerlas.

Resultado: +0

470. dhegwork-adakly, 28.03.2024 01:17:57

A mí no me funciona bien y tengo windows 10. Se supone que tengo esas librerías instaladas. La segunda o tercera vez que lo intenté usar si funcionó, pero ya luego me terminó reiniciando el NVDA para luego no agregar las voces a la lista cuando las instalo. Ni si quiera sale el sintetizador en la lista de sintetizadores.Ya ni lo seguí intentando porque me bloquea el NVDA y se reinicia. dejándolo sin voz.

Resultado: +0

Última edición por dhegwork-adakly, 28.03.2024 01:18:59

471. oscar93, 28.03.2024 01:27:58

es raro, porque en ningún momento saltó nada de incompatibilidad, cosa que cuando suelo instalar algunos complementos suele saltar

Resultado: +0

472. PolloGuerrero, 28.03.2024 01:32:10

Lo que pasa ue la incompatibilidad va por el lado de NVDA, no del sistema operativo, imaginándome que tenés Windows 7 con el Servis Pack actualizado y entonces tenés la última estable. Pero ya no te van a andar las versiones que vienen.

Resultado: +0

473. oscar93, 28.03.2024 03:41:53

igual me da igual las versiones que vienen xd, con que tenga una que ande ya es suficiente

Resultado: +0

474. Borja , 28.03.2024 04:49:14

Gente, pregunto. ¿hay alguna forma de grabar audios con piper tipo balabolka? se me ocurre grabar el NVDA y dejarlo leyendo, pero si se puede más rápido, mejor.
para lo de Oscar. A mi me pasaba lo mismo, no se por qué. tuve que reinstalar el NVDA.

Resultado: +0

Última edición por Borja , 28.03.2024 04:50:24

475. PolloGuerrero, 28.03.2024 15:20:15

Para eso te recomiendo el cuaderno de inferencia. Tenés que tener el modelo de voz que quieras usar en tu drive, y no sé si realmente no hay límite de caracteres pero podés meterle mucho texto y descargarlo para vos.

Resultado: +0

Última edición por PolloGuerrero, 28.03.2024 15:30:12

476. Yordy, 28.03.2024 15:53:09

hola no veo la voz de oriol gomez para n v d a

Resultado: +0

477. nathalie , 28.03.2024 16:17:25

oigan chicos, si por ejemplo quiero hacer un dataset de la voz inglesa de victoria de macin talk algo así, que tengo que hacer? e encontrado un video de YouTube de la misma, pero tengo que gravar alguna parte o que onda?

Resultado: +0

478. PolloGuerrero, 28.03.2024 16:35:18

Obiamente, si no cómo la vas a clonar? Y más que una parte te tendrías que grabar tanto como puedas, si querés una calidad más o menos buena. unos cuántos minutitos.

Resultado: +0

479. Ren_Yamamoto, 28.03.2024 16:37:51

para yordi o como se escriva, mensaje 22, primera página, link decarpeta y ahí está. Yordy: hola no veo la voz de oriol gomez para n v d a: hace 48 minutos
Para anna :D depende si tienes un descargador de video o ene ste caso de audio, si no solo te queda usar mezcla estèreo. Si descargas Luego importas a audaciti, wavepad o dependiendo el editor de audio que uses, luego vas seleccionando (yo prefiero manualmente y colocarlo en un nuevo archivo para guardar pero depende de ti) Seleccionas y haces el proceso para ir guardando parte por aprte, preferiblemente que no sea a media frace, tiene que se que cortes en un silencio o pausa que se haga por si vas a usar wisper o transcribir no te comfundas. Si vas a aplicar lo de seleccionar, poner en nuevo archivo la selección y guardar slo recuerda después de guardar audio borrar esa parte del audio. Tienes que guardar los audios en una carpeta en donde sea pero que sea una carpeta que tenga el nombre que sea, pero preferiblemente de una palabra o sin signos porque almenos a mi no me han funcionado algunas cosas cuando uso puntuación o mayúsculas. Los audios tienes qué guardarlos como 1.wav, 2.wav, etc. Luego transcribir o mandarlo a wissper, si vas a transcribir el proceso más sencillo es en un txt poner algo así:

1	hola
2	que tal

o así
Luego entrenar, recomiendo poner el numCKPT a 1 y desmarcar solo lo de guardar el último modelo porque puede salir corrupto aunque eso sí, vas a tener que revisar tu papelera en drive seguido para borrar los rchivos de modelos que se van borrando
PD: obbio cuando pongas eso de
1|
2|
no pondrás hola en el 1 y que tal en el 2, osea poner lo que balla diciendo la persona en cada audio
PD3: Tienes que ir poniendo por línea la transcripción. La del audio 1 en una y la del 2 en otra y así

Resultado: +0

Última edición por Ren_Yamamoto, 28.03.2024 16:44:26

480. nathalie , 28.03.2024 17:57:52

ok xd, vamos a hacerlo, si no me da floje jajajajjjajajajajajajajaja

Resultado: +0

723 mensajes, 25 páginas: 1…; 14 1516 17 18…; 25 ↖ Volver a la lista de temas

Ir a los menús ↑
Ir al contenido ↑

Responder al tema

Usted debe estar conectado para poder postear.