sonata / Piper Neural voices: Un sintetizador para NVDA que suena muy bien y utiliza inteligencia artificial

588 mensajes, 20 páginas:  1; 14 1516 17 18; 20 ↖ Volver a la lista de temas

Resultado: +28

451. Mmadipetsane,

lo del cuaderno me animó! Voy a ver si consigo una entrevista de Nippy (Whitney) para hacer el dataset!

Resultado: +0

452. maestradearma,

pasan porfis e l sintetiador

Resultado: +0

453. gabm,

Y ESE CUADERNO DONDE lo puedo conseguir?

Resultado: +0

454. Braille_and_Speak2000,

https://colab.research.google.com/github/rmcpantoja/My-Colab-Notebooks/blob/main/notebooks/OpenAI_Whisper_-_DotCSV_(Speech_dataset_multi-transcryption_support)es.ipynb?fbclid=IwAR1RUDJXCRY4QkDglLLFus5o2m6JcoArMiE5vqmuDJIRvW-CWMbWCJ3B_i0

Resultado: +0

455. Mmadipetsane,

lo que no entendí bien es como hay que hacer el dataset. ¿Tengo que recortar los audios como con los de rvc? O como funciona?

Resultado: +0

456. Braille_and_Speak2000,

No sé cómo tenés que recortar los que usaras para RVC para hacerte la comparativa, pero sí acá tenés que tener todos archivos wav, que duren de 4 a 15 segundos. Cuantos más minutos de cortus, mejor.

Resultado: +0

457. proyecto_winter,

el cuaderno en inglés si no subes una transcripción usa wisper solito, el español tiene un errorcillo y aunque tiene wisper ciempre falla

Resultado: +0

458. Yordy,

alguien me pasa la voz de oriol gomez en español España porfa

Resultado: +0

459. proyecto_winter,

está en eso de las primeras páginas, en una carpeta, puedes darle en abrir esta discusión en la web y buscar con la letra k en modo explorción el enlace en la primera página, si no está ahí dale al enlace que dice 2 y así hasta que encunetres esa carpeta, si te sirve e algo la pasó rmcpantoja. No es porque no te la quiera pasar sino que hay muchos modelos de oriol y bue

Resultado: +0

Última edición por proyecto_winter, 26.03.2024 21:03:28

460. Mmadipetsane,

jamás hice un modelo de nada, por eso tantas preguntas que tengo jajaja.

Resultado: +0

461. Anna_fiufiu,

x2, yo quiero tratar de hacer algún modelo XD

Resultado: +0

462. proyecto_winter,

n el primer mensaje tienen una guía. bue en fin.

Resultado: +0

463. el-mauzote,

hola, alguien e ustedes tendría el enlace directo para descargar el complemento? muchas gracias de antemano.

Resultado: +0

464. proyecto_winter,

por favor dios ayúdame con esta jente que pide lo mismo cada 2 mensajes. Mira, te voy a dar un consejo así de buena fe aunque realmente puede sonar un poquito a crítica pero esque hay tanta jente que pregunta lo mismo que ando medio arto :D En cada tema de lo que sea, en la mayoría si no es que todos, en el primer mensaje osea puedes abrir el tema desde la web y te lleva a la primera página primer mensaje, ahí tiene que estar todo lo del tema, o almenos un poco. En hilo de batalla constante, no lo eh visto porque realmente no me interesa mucho, supongo yo que en el primer mensaje te deja link o almenos en donde puedes encontrarlo. En hilo de... Yo que se, si hay uno de lector prudencia en el primer mensaje tiene que haber un link. En piper hay un link. No creas que la jente nomás crea un tema y dice. Bueno, hablemos de esto. Ni se que sea ni en donde descargarlo, pero hablemos de esto. Y para el próximo que pregunte copio este mensaje y lo pego pero le cambio cosas pa que suene mas feo y se ballan a tirarme tiflomierd, en fin. PD: te aseguro que menos de 2 páginas atrás alguien preguntó lo imsmo que tú, lean, lean que ni siquiera se les cansa la vista en fin

Resultado: +0

Última edición por proyecto_winter, 27.03.2024 14:49:26

465. Andytalecorner,

alguna novedad o voz nueva para provar.
actualmente ando con la de mirella medium pero no tengo otra.
tengo una real time pero no logré hacerla funcionar. y eso que seguí los pasos explicados en mensajes anteriores.

Resultado: +0

466. El-Megalovano,

Existe una nueva voz de Votrax.
https://eurpod.com/en-us-Votrax_medium.tar.gz
La misma de Braille hablado pero en inglés

Resultado: +0

467. Braille_and_Speak2000,

O sea, yo hasta no lograr recrear el coso en español no descansaría en paz. el detalle es que mi Braille and speak está hecho pelota, no logro reararlo de momento. si lo reparaba, lo grababa aunque no fuese en HQ, ya que tampoco logro conectar acá ni siquiera mis instrumentos. Vayan guardando los que ya hay por ahí como el de Keynote Gold.

Resultado: +0

468. oscar93,

Una pregunta, instalé el sintetizador, le puse una voz pero no me aprece en la lista de sintetizadores. que está sucediendo? tengo win 7

Resultado: +0

469. Braille_and_Speak2000,

puede que sea justamente porque tenés Win 7, aunque como expliqué algunos mensajes arriba, tal vez tengas que instalar las librerías Microsoft Visual C++, que también dejé un link directo para obtenerlas.

Resultado: +0

470. dhegwork-adakly,

A mí no me funciona bien y tengo windows 10. Se supone que tengo esas librerías instaladas. La segunda o tercera vez que lo intenté usar si funcionó, pero ya luego me terminó reiniciando el NVDA para luego no agregar las voces a la lista cuando las instalo. Ni si quiera sale el sintetizador en la lista de sintetizadores. Ya ni lo seguí intentando porque me bloquea el NVDA y se reinicia. dejándolo sin voz.

Resultado: +0

Última edición por dhegwork-adakly, 28.03.2024 01:18:59

471. oscar93,

es raro, porque en ningún momento saltó nada de incompatibilidad, cosa que cuando suelo instalar algunos complementos suele saltar

Resultado: +0

472. Braille_and_Speak2000,

Lo que pasa ue la incompatibilidad va por el lado de NVDA, no del sistema operativo, imaginándome que tenés Windows 7 con el Servis Pack actualizado y entonces tenés la última estable. Pero ya no te van a andar las versiones que vienen.

Resultado: +0

473. oscar93,

igual me da igual las versiones que vienen xd, con que tenga una que ande ya es suficiente

Resultado: +0

474. Borja,

Gente, pregunto. ¿hay alguna forma de grabar audios con piper tipo balabolka? se me ocurre grabar el NVDA y dejarlo leyendo, pero si se puede más rápido, mejor.
para lo de Oscar. A mi me pasaba lo mismo, no se por qué. tuve que reinstalar el NVDA.

Resultado: +0

Última edición por Borja, 28.03.2024 04:50:24

475. Braille_and_Speak2000,

Para eso te recomiendo el cuaderno de inferencia. Tenés que tener el modelo de voz que quieras usar en tu drive, y no sé si realmente no hay límite de caracteres pero podés meterle mucho texto y descargarlo para vos.

Resultado: +0

Última edición por Braille_and_Speak2000, 28.03.2024 15:30:12

476. Yordy,

hola no veo la voz de oriol gomez para n v d a

Resultado: +0

477. Anna_fiufiu,

oigan chicos, si por ejemplo quiero hacer un dataset de la voz inglesa de victoria de macin talk algo así, que tengo que hacer? e encontrado un video de YouTube de la misma, pero tengo que gravar alguna parte o que onda?

Resultado: +0

478. Braille_and_Speak2000,

Obiamente, si no cómo la vas a clonar? Y más que una parte te tendrías que grabar tanto como puedas, si querés una calidad más o menos buena. unos cuántos minutitos.

Resultado: +0

479. proyecto_winter,

para yordi o como se escriva, mensaje 22, primera página, link decarpeta y ahí está. Yordy: hola no veo la voz de oriol gomez para n v d a: hace 48 minutos
Para anna :D depende si tienes un descargador de video o ene ste caso de audio, si no solo te queda usar mezcla estèreo. Si descargas Luego importas a audaciti, wavepad o dependiendo el editor de audio que uses, luego vas seleccionando (yo prefiero manualmente y colocarlo en un nuevo archivo para guardar pero depende de ti) Seleccionas y haces el proceso para ir guardando parte por aprte, preferiblemente que no sea a media frace, tiene que se que cortes en un silencio o pausa que se haga por si vas a usar wisper o transcribir no te comfundas. Si vas a aplicar lo de seleccionar, poner en nuevo archivo la selección y guardar slo recuerda después de guardar audio borrar esa parte del audio. Tienes que guardar los audios en una carpeta en donde sea pero que sea una carpeta que tenga el nombre que sea, pero preferiblemente de una palabra o sin signos porque almenos a mi no me han funcionado algunas cosas cuando uso puntuación o mayúsculas. Los audios tienes qué guardarlos como 1.wav, 2.wav, etc. Luego transcribir o mandarlo a wissper, si vas a transcribir el proceso más sencillo es en un txt poner algo así:

1hola
2que tal

o así
Luego entrenar, recomiendo poner el numCKPT a 1 y desmarcar solo lo de guardar el último modelo porque puede salir corrupto aunque eso sí, vas a tener que revisar tu papelera en drive seguido para borrar los rchivos de modelos que se van borrando
PD: obbio cuando pongas eso de
1|
2|
no pondrás hola en el 1 y que tal en el 2, osea poner lo que balla diciendo la persona en cada audio
PD3: Tienes que ir poniendo por línea la transcripción. La del audio 1 en una y la del 2 en otra y así

Resultado: +0

Última edición por proyecto_winter, 28.03.2024 16:44:26

480. Anna_fiufiu,

ok xd, vamos a hacerlo, si no me da floje jajajajjjajajajajajajajaja

Resultado: +0

588 mensajes, 20 páginas:  1; 14 1516 17 18; 20 ↖ Volver a la lista de temas

Responder al tema

Usted debe estar conectado para poder postear.

¿Perdió su contraseña? Crear una cuenta