Hilo oficial sobre los sintetizadores de voz

4339 messages, 145 pages: 1…; 125 126127 128 129…; 145 ↖ Retour à la liste des sujets

Score: +42

3781. PolloGuerrero, 09.09.2023 01:37

Hola!
Gracias por participar. En efecto, este es de código abierto y podemos crear por nosotros mismos voces de personas tan mortales como lo somos nosotros. Fijate algunos mensajes más arriba, que puse para alguien que pidió, una guía de entrenamiento muy completa. Leela y así vas a saber cómo hacer una voz.

Score: +0

3782. rmcpantoja, 09.09.2023 06:16

¡Buenas! Y ya que seguimos con piper, hemos creado cuadernos traducidos al español; todo el agradecimiento a Xx_Nessu_xX por hacer esto más fácil. A continuación los enlaces en formato markdown:

Cuaderno de entrenamiento, Cuaderno para probar los modelos producidos por el entrenamiento.ipynb), y el cuaderno de exportación de modelos compatible para piper.

Aún no tenemos una traducción del cuaderno de inferencia de los modelos exportados (onnx), pero pronto nos pondremos a ello.

Reenvío también la carpeta pública de algunas voces que puedan ser de interés. Hice a GLaDos (Gortal) tanto en Español como en inglés de alta calidad. Para soportar alta calidad en español y otros idiomas, lo ideal es hacer un modelo pre-entrenado para ellos, (entrenando de cero con un conjunto de datos de varias horas).

Score: +0

3783. PolloGuerrero, 09.09.2023 15:52

He aquí mi carpeta de drive con las pocas voces que entrené: https://drive.google.com/drive/folders/1p4-snbSzEpYG_-WmQiZku82ryYm7LNPL?usp=drive_link

Score: +0

3784. dainel, 10.09.2023 12:45

hola amigos como puedo conseguir las voces
esas de las que hablan

Score: +0

3785. Katniss_Prior , 10.09.2023 15:18

y esas voces que pasaron valen para NVDA?

Score: +0

3786. PolloGuerrero, 10.09.2023 15:25

sí, van para NVDA. Piper se llama el sintetizador (sale como Piper Neural Voices) y de momento anda en NVDA, aparte de en otros sistemas como la Braspberry.

Score: +0

3787. clapmauricio, 10.09.2023 22:16

Hola. Dejo aqui mi voz para Piper, en portugués brasileño, pero antes hay que tener en cuenta que yo la hice solo como algo experimental. El dataset fue creado con menos de 5 minutos de audio y yo hablé de una forma linear. Aun así, la calidad me sorprendió. La entrené por dos horas. Así que las expectativas no deben de ser altas, pero a alguien puede servir. Además, no tengo condiciones técnicas para grabar con más calidad que eso. Pero, de nuevo, a alguien puede ser útil. Estoy muy agradecido por las guias y los cuadernos que me han ayudado muchísimo a empezar con todo eso de Colabs y modelos de voz. Pero basta, vamos al enlace.
https://drive.google.com/uc?id=1-FhuwFpmyqv-k99tmSP4HgxzRsMlWGKy&export=download

Score: +0

3788. el_guarda_halcoon , 10.09.2023 23:55

yo solo digo: probé la voz de dalia para piper creo que se escribe, y me encantó: lo único que le veo de malo, es lo que tarda en leer: pero eso supongo que es una cosa que lo mejorarán pronto por mientras: solo la utilizaré para leer

Score: +0

3789. Kim-TaeHyung, 11.09.2023 02:18

concuerdo con el_enamorato

Score: +0

3790. Laositadepeluche , 11.09.2023 02:27

síiii, la voz de dalia es media lenta para leer El_enamorato23: yo solo digo: probé la voz de dalia para piper creo que se escribe, y me encantó: lo único que le veo...: hace aproximadamente 2 horas

Score: +0

3791. PolloGuerrero, 11.09.2023 02:32

De todas maneras, las cosas como son, desde Microsoft azure va a ser mucho mejor. Pero claro, por mientras...

Score: +0

3792. Ren_Yamamoto, 11.09.2023 17:21

jente, se que a veces cimplemente oyen motor tts realista y les llama la atención, pero por favor, que les cuesta leer 2 mensajes más arriba del sullo? osea, digamos, usuario a pregunta: como se usa piper? usuario b responde. bueno acá ta la guía enlace de la guía. ahí encontrarás lo que necesitas. luego un usuario c pregunta algo diferente, y un usuario d pregunta. como uso piper? entonces, el usuario que contesta también les sigue la corriente y le contesta a todo el que pregunta eso cuando ya hay respuesta, dejando ignorado al pobre man que quizá su pregunta no aya sido respondida en ninguna página de foro o que fue contestada yo que se, que el ilo tenga 100 páginas y su mensaje aya sido contestado en la página 55. ya enserio, al siguiente que pregunte sobre piper y crea que su alta clase le permite hacer preguntas que ya fueron respondidas 3 mensajes atrás para llenar el ilo de misma pregunta misma respuesta... nose, quizá por mala onda puedan quitarme el foro pero no dije nada malo en realidad. enserio, huevones, pónganse a buscar 5 mensajes mas arriba joder, o que su flecha arriba no les funciona? miren, ahí si les contesto. den inicio y no sean huevones, usen flecha abajo hasta llegar al maldito mensaje que pregunta lo mismo! a! y si en este ilo oyen de piper ablar así como si nada, es probable que el soco aya sido introducido en el ilo con algo mas completo que. aquí está el link de mi voz. enlace. y saben porqué en el ilo aplica? porque es ilo de sintetizadores, y si algo mas que uno o 2 mensajes sobre piper, entonces es porque, muy probablemente es un fuking sintetizador! nose ya ando diciendo puras pendejadas pero eso, al siguiente que pregunte. oigan que es piper? funca para NVDA? oigan y hay una guía? en las mínimo 5 6 páginas siguientes voy a su casa y le ago una morición estilo lefti. si a caso una pregunta sobre el complemento que no les funca una voz, ahí si quizá podría ser más pasable que crean que nose, nos e ocupa addon y la voz se instala abriendo con NVDA o algo así nose. chau

Score: +0

3793. PolloGuerrero, 11.09.2023 17:48

Lo ideal de última sería hacer un hilo para Piper. Yo lo haría, pero tal vez espere a que se haga un producto más estable y popular. Igual ya está. hablamos de todo sintetizador de voz, pero sí, ya tenemos un hilo para elevenLabs aparte así que tal vez... Ya me dirán qué opinan.

Score: +0

3794. james_holden, 11.09.2023 21:03

hola. recuerdo que hace un buen tiempo alguien pasó una página con muestras me parece que de la evolución de la síntesis de voz klatt, o algo así era. por más que la busqué retroceediéndo y retrocediendo páginas hasta el 2019 no encontré el mensaje, y no recuerdo si fue en este hilo o en otro, o si directamente eso nunca pasó y es mi cerebro queriendo que me crea algún recuerdo falzo o algo jajaj. de todas maneras, ¿alguien tiene esa página que me la pueda compartir? gracias.

Score: +0

3795. Ren_Yamamoto, 12.09.2023 15:09

me parese una buena idea si. y eso de esperar a que sea más estable... te refieres al complemento? porque el sinte me parese que ya está lo suficiente para crearle su ilito :D y am bueno... pues sería bueno crearlo para no llenar el ilo con esto :D y a cualquiera que pida guías, bueno pa, dale en abrir esta discusión en la web y primer mensaje :V

Score: +0

Dernière édition par Ren_Yamamoto, 12.09.2023 15:11

3796. alfred, 12.09.2023 16:23

Abran un nuevo tema. Me estoy interesando en instalarlo y probarlo, pero me da flojera preguntar y buscar documentación. En un hilo propio estaría mejor.

Score: +0

3797. PolloGuerrero, 12.09.2023 17:20

muchachos, lo he dicho otras veces. A mí también me dan flojera tantas cosas en la vida, saben? Pero hay algo que tengo que entender y me cuesta mucho terminar de asimilar, y es que con la flojera no vamos a avanzar en la vida.
En fin, voy a crear el hilo respectivo. Tomen nota, flojos, y este hilo será para los sintes en general, y populares o más conocidos y responsivos para ustedes en particular.

Score: +0

3798. alfred, 12.09.2023 18:19

Es que esta es una flojera constructiva, que busca ordenar un tema.

Score: +0

3799. Exink, 12.09.2023 23:07

El problema es que con tanta flojera uno no termina haciendo las cosas. Vamos, solamente falta que pidan a la gente que entrenen las voces. Antes que preguntar investigar, ¿no?

Score: +0

3800. alfred, 15.09.2023 18:48

Dejo este nuevo desarrollo que seguro beneficiará a otros sintetizadores como el Piper. Se trata de XTTS.
La novedad que trae es que puede clonar tu voz con solo 3 segundos de un clip, dicen.Aúnn no la pruevo mucho:https://huggingface.co/spaces/coqui/xtts

Score: +0

3801. Mi-Recinto, 15.09.2023 18:51

x, no será creada por eron? xddd

Score: +0

3802. Maldita-Nerea , 15.09.2023 19:05

que tienen con elon y la x jajajajajaja

Score: +0

3803. El-Megalovano, 15.09.2023 20:49

Ah mucho que tanto nó se multiplique con la x équisdeskibidi.
Yo también estoy buscando esa carpeta con la historia de sintetizadores de voz, recuerdo que en esa carpeta estaba un audio del antiguo eloquence con la voz de Wade y otras coses...

Score: +0

3804. Ren_Yamamoto, 24.09.2023 21:16

que onda jente, revivo hilo. oigan, alguien tiene modelo voice to voice de eloquence que no comfunda las letras que pase pleace?

Score: +0

3805. Maldita-Nerea , 24.09.2023 21:48

cómo que modelo que no confunda las letras? no entiendo.

Score: +0

3806. PolloGuerrero, 24.09.2023 22:54

Mepa que lo que quiso pedir es el modelo voz a voz de eloquence, para hacerlo cantar. No el sinte de voz, sino el modelo de

Score: +0

3807. elsocodrilo , 24.09.2023 23:23

como es ese modelo?. Es la primera vez que escucho hablar de él

Score: +0

3808. El-Megalovano, 25.09.2023 00:13

También tengo algo ansí. Model de voz a voz de Eloquence, en qué idioma? De los 9 o algo de idiomas que soporta...

Score: +0

3809. Ren_Yamamoto, 28.09.2023 05:22

español porfa ci. no, esque por ejemplo a mi me pasa por ejemplo, si le pongo a cantar la de ven a mi puede nose poner men a fi o algo así adsgpjkdslfñjkl nose porqué

Score: +0

3810. un_oso, 29.09.2023 21:53

alguien a probado kits.ai? me rrefiero con la cuestión de entrenar modelos. yo intenté pero no pude.

Score: +0

4339 messages, 145 pages: 1…; 125 126127 128 129…; 145 ↖ Retour à la liste des sujets

Aller aux menus ↑
Aller au contenu ↑

Répondre au sujet

Vous devez être connecté pour pouvoir poster.