Hola! Gracias por participar. En efecto, este es de código abierto y podemos crear por nosotros mismos voces de personas tan mortales como lo somos nosotros. Fijate algunos mensajes más arriba, que puse para alguien que pidió, una guía de entrenamiento muy completa. Leela y así vas a saber cómo hacer una voz.
~msgScore~: +0
3782. rmcpantoja,
¡Buenas! Y ya que seguimos con piper, hemos creado cuadernos traducidos al español; todo el agradecimiento a Xx_Nessu_xX por hacer esto más fácil. A continuación los enlaces en formato markdown:
Aún no tenemos una traducción del cuaderno de inferencia de los modelos exportados (onnx), pero pronto nos pondremos a ello.
Reenvío también la carpeta pública de algunas voces que puedan ser de interés. Hice a GLaDos (Gortal) tanto en Español como en inglés de alta calidad. Para soportar alta calidad en español y otros idiomas, lo ideal es hacer un modelo pre-entrenado para ellos, (entrenando de cero con un conjunto de datos de varias horas).
hola amigos como puedo conseguir las voces esas de las que hablan
~msgScore~: +0
3785. Katniss_Prior ,
y esas voces que pasaron valen para NVDA?
~msgScore~: +0
3786. PrincesoGuerrero,
sí, van para NVDA. Piper se llama el sintetizador (sale como Piper Neural Voices) y de momento anda en NVDA, aparte de en otros sistemas como la Braspberry.
~msgScore~: +0
3787. clapmauricio,
Hola. Dejo aqui mi voz para Piper, en portugués brasileño, pero antes hay que tener en cuenta que yo la hice solo como algo experimental. El dataset fue creado con menos de 5 minutos de audio y yo hablé de una forma linear. Aun así, la calidad me sorprendió. La entrené por dos horas. Así que las expectativas no deben de ser altas, pero a alguien puede servir. Además, no tengo condiciones técnicas para grabar con más calidad que eso. Pero, de nuevo, a alguien puede ser útil. Estoy muy agradecido por las guias y los cuadernos que me han ayudado muchísimo a empezar con todo eso de Colabs y modelos de voz. Pero basta, vamos al enlace. https://drive.google.com/uc?id=1-FhuwFpmyqv-k99tmSP4HgxzRsMlWGKy&export=download
~msgScore~: +0
3788. el_guarda_halcoon ,
yo solo digo: probé la voz de dalia para piper creo que se escribe, y me encantó: lo único que le veo de malo, es lo que tarda en leer: pero eso supongo que es una cosa que lo mejorarán pronto por mientras: solo la utilizaré para leer
~msgScore~: +0
3789. Jeon-Jungkook,
concuerdo con el_enamorato
~msgScore~: +0
3790. Laositadepeluche ,
síiii, la voz de dalia es media lenta para leer El_enamorato23: yo solo digo: probé la voz de dalia para piper creo que se escribe, y me encantó: lo único que le veo...: hace aproximadamente 2 horas
~msgScore~: +0
3791. PrincesoGuerrero,
De todas maneras, las cosas como son, desde Microsoft azure va a ser mucho mejor. Pero claro, por mientras...
~msgScore~: +0
3792. Ren_Yamamoto,
jente, se que a veces cimplemente oyen motor tts realista y les llama la atención, pero por favor, que les cuesta leer 2 mensajes más arriba del sullo? osea, digamos, usuario a pregunta: como se usa piper? usuario b responde. bueno acá ta la guía enlace de la guía. ahí encontrarás lo que necesitas. luego un usuario c pregunta algo diferente, y un usuario d pregunta. como uso piper? entonces, el usuario que contesta también les sigue la corriente y le contesta a todo el que pregunta eso cuando ya hay respuesta, dejando ignorado al pobre man que quizá su pregunta no aya sido respondida en ninguna página de foro o que fue contestada yo que se, que el ilo tenga 100 páginas y su mensaje aya sido contestado en la página 55. ya enserio, al siguiente que pregunte sobre piper y crea que su alta clase le permite hacer preguntas que ya fueron respondidas 3 mensajes atrás para llenar el ilo de misma pregunta misma respuesta... nose, quizá por mala onda puedan quitarme el foro pero no dije nada malo en realidad. enserio, huevones, pónganse a buscar 5 mensajes mas arriba joder, o que su flecha arriba no les funciona? miren, ahí si les contesto. den inicio y no sean huevones, usen flecha abajo hasta llegar al maldito mensaje que pregunta lo mismo! a! y si en este ilo oyen de piper ablar así como si nada, es probable que el soco aya sido introducido en el ilo con algo mas completo que. aquí está el link de mi voz. enlace. y saben porqué en el ilo aplica? porque es ilo de sintetizadores, y si algo mas que uno o 2 mensajes sobre piper, entonces es porque, muy probablemente es un fuking sintetizador! nose ya ando diciendo puras pendejadas pero eso, al siguiente que pregunte. oigan que es piper? funca para NVDA? oigan y hay una guía? en las mínimo 5 6 páginas siguientes voy a su casa y le ago una morición estilo lefti. si a caso una pregunta sobre el complemento que no les funca una voz, ahí si quizá podría ser más pasable que crean que nose, nos e ocupa addon y la voz se instala abriendo con NVDA o algo así nose. chau
~msgScore~: +0
3793. PrincesoGuerrero,
Lo ideal de última sería hacer un hilo para Piper. Yo lo haría, pero tal vez espere a que se haga un producto más estable y popular. Igual ya está. hablamos de todo sintetizador de voz, pero sí, ya tenemos un hilo para elevenLabs aparte así que tal vez... Ya me dirán qué opinan.
~msgScore~: +0
3794. james_holden,
hola. recuerdo que hace un buen tiempo alguien pasó una página con muestras me parece que de la evolución de la síntesis de voz klatt, o algo así era. por más que la busqué retroceediéndo y retrocediendo páginas hasta el 2019 no encontré el mensaje, y no recuerdo si fue en este hilo o en otro, o si directamente eso nunca pasó y es mi cerebro queriendo que me crea algún recuerdo falzo o algo jajaj. de todas maneras, ¿alguien tiene esa página que me la pueda compartir? gracias.
~msgScore~: +0
3795. Ren_Yamamoto,
me parese una buena idea si. y eso de esperar a que sea más estable... te refieres al complemento? porque el sinte me parese que ya está lo suficiente para crearle su ilito :D y am bueno... pues sería bueno crearlo para no llenar el ilo con esto :D y a cualquiera que pida guías, bueno pa, dale en abrir esta discusión en la web y primer mensaje :V
~msgScore~: +0
Zuletzt geändert von Ren_Yamamoto, Sep 12 2023 15:11:02
3796. alfred,
Abran un nuevo tema. Me estoy interesando en instalarlo y probarlo, pero me da flojera preguntar y buscar documentación. En un hilo propio estaría mejor.
~msgScore~: +0
3797. PrincesoGuerrero,
muchachos, lo he dicho otras veces. A mí también me dan flojera tantas cosas en la vida, saben? Pero hay algo que tengo que entender y me cuesta mucho terminar de asimilar, y es que con la flojera no vamos a avanzar en la vida. En fin, voy a crear el hilo respectivo. Tomen nota, flojos, y este hilo será para los sintes en general, y populares o más conocidos y responsivos para ustedes en particular.
~msgScore~: +0
3798. alfred,
Es que esta es una flojera constructiva, que busca ordenar un tema.
~msgScore~: +0
3799. Exink,
El problema es que con tanta flojera uno no termina haciendo las cosas. Vamos, solamente falta que pidan a la gente que entrenen las voces. Antes que preguntar investigar, ¿no?
~msgScore~: +0
3800. alfred,
Dejo este nuevo desarrollo que seguro beneficiará a otros sintetizadores como el Piper. Se trata de XTTS. La novedad que trae es que puede clonar tu voz con solo 3 segundos de un clip, dicen.Aúnn no la pruevo mucho:https://huggingface.co/spaces/coqui/xtts
~msgScore~: +0
3801. Storm-Monster,
x, no será creada por eron? xddd
~msgScore~: +0
3802. Maldita-Nerea ,
que tienen con elon y la x jajajajajaja
~msgScore~: +0
3803. El-Megalovano,
Ah mucho que tanto nó se multiplique con la x équisdeskibidi. Yo también estoy buscando esa carpeta con la historia de sintetizadores de voz, recuerdo que en esa carpeta estaba un audio del antiguo eloquence con la voz de Wade y otras coses...
~msgScore~: +0
3804. Ren_Yamamoto,
que onda jente, revivo hilo. oigan, alguien tiene modelo voice to voice de eloquence que no comfunda las letras que pase pleace?
~msgScore~: +0
3805. Maldita-Nerea ,
cómo que modelo que no confunda las letras? no entiendo.
~msgScore~: +0
3806. PrincesoGuerrero,
Mepa que lo que quiso pedir es el modelo voz a voz de eloquence, para hacerlo cantar. No el sinte de voz, sino el modelo de
~msgScore~: +0
3807. elsocodrilo ,
como es ese modelo?. Es la primera vez que escucho hablar de él
~msgScore~: +0
3808. El-Megalovano,
También tengo algo ansí. Model de voz a voz de Eloquence, en qué idioma? De los 9 o algo de idiomas que soporta...
~msgScore~: +0
3809. Ren_Yamamoto,
español porfa ci. no, esque por ejemplo a mi me pasa por ejemplo, si le pongo a cantar la de ven a mi puede nose poner men a fi o algo así adsgpjkdslfñjkl nose porqué
~msgScore~: +0
3810. un_oso,
alguien a probado kits.ai? me rrefiero con la cuestión de entrenar modelos. yo intenté pero no pude.