sonata / Piper Neural voices: Un sintetizador para NVDA que suena muy bien y utiliza inteligencia artificial

723 messages, 25 pages: 1…; 22 2324 25 ↖ Go back to topic list

Score: +32

691. Disquete, Oct 23 2024 09:47:22

Pero preg, esa voz no tiene ningún equivalente moderno? Si no es así, adelante. El viernes puedo empezar si mandas un dataset completo. Seguramente necesite más datos para entrenar (mínimo un dataset de 20 minutos) y manda de paso una transcripción para que no tenga que ponerme a transcribir todo eso, se hace realmente pesado.

Score: +0

692. Willem, Oct 24 2024 15:57:33

si lo hay yo no lo he escuchado. bueno, creo que el fin de semana tendré tiempo de hacer eso, ya te cuento.

Score: +0

693. El-Megalovano, Oct 25 2024 06:04:24

Chicos,
Encontré otra librería TTS que me parece interesante. Quiero que se pueda agregar a Sonata. Así tendremos 3 librerías de TTS con modelos de voz para escojer, sean los de Piper, el por venir OptiSpeech y este (Melo TTS).
https://github.com/myshell-ai/MeloTTS

Score: +0

Last edited by El-Megalovano, Oct 25 2024 06:10:41

694. Ren_Yamamoto, Oct 25 2024 15:22:54

¿Resumen de qué tiene de especial? Me da hueva verme todo un repo de GitHub. No te creas ya me metí. suena interesante con esto de que es multilingüe. Pero algo que sí me disgustó tantito es que la mayoría de los ejemplos son. Inglés americano, inglés británico, inglés predeterminado, inglés de mi casa, inglés de mi colonia, inglés que usan mis besinos. Haber en español si se mamaron, haber les faltó español mexicano, español España, español venezuela, español colombiano, español hablado por un gringo, español de chile, español de panamá, español ecuatoriano, español de los mexicanos así pues los rancheros, mexicano de sonora, mexicano de Guanajuato y bue

Score: +0

Last edited by Ren_Yamamoto, Oct 25 2024 15:27:36

695. El-Megalovano, Oct 25 2024 15:25:30

Soporte para otros idiomas. Aguante que el japonés y coreano están allí. Según escuché las voces suenan buenas.

Score: +0

696. Ren_Yamamoto, Oct 25 2024 15:28:38

Na si me disgustó que la mayoría son gringos. Y español solo... Spanish, y... ¿Ya? Osea eso se nota que fue hecho por gringos, luego no se quejen cuando los ispanohablantes no les traducimos los comentarois en YouTube a su idioma en un video en inglés

Score: +0

697. PolloGuerrero, Oct 25 2024 15:43:29

el desarrollador de sonata no mira este foro, entonces, independientemente de que nos gusten o no estas librerías, ya saben qué tienen que hacer.

Score: +0

698. Willem, Oct 25 2024 16:23:09

sobre la voz Lara de Nokia HQ ayer la estuve comparando, y suena bastante parecido a Isabel de RealSpeak, que al menos en w10 todavía se puede usar. Tiene una calidad desastrosa, pero es posible usarla. Las diferencias son mínimas.

Score: +0

699. PolloGuerrero, Oct 25 2024 16:59:02

chicos, estoy necesitando algo, para quien sea más entendido en el desarrollo en entornos Android. Estoy necesitando mi propio modelo de voz, de ser posible, que sí, lo tengo ya exportado y todo desde hace cosa de un año, pero compilado para Android utilizado como los demás motores TTS, por una cuestión comunicacional en la que no veo relevante entrar en detalles.
con ayuda de un amigo que entiende mucho más que yo, intentamos aunque no necesariamente con mi modelo de voz, y no pudimos. En cualquier caso, yo intentaba instalar y no me daba ningún error de incompatibilidad,simplemente no se podía instalar. Tengo un Samsung A10s con Android 11, que supongo yo que será x 86. comprenderán que entiendo más de Windows que de Android.
Si es posible obtener esto sin Multi TTS sería de agradecer también, es decir, lo he visto muy complejo para la poca destreza que tengo con el teléfono. Lo ideal sería, poder instalar al menos desde un APK ya instalado con el motor TTS y mi modelo de voz, y que ya funcione como motor tts, o en todo caso 2 APK, uno con el motor y mi modelo de voz puesto váyase a saber cómo, pero no tengo acceso root ni nada similar.
Muchísimas gracias desde ya por su ayuda.

Score: +0

700. Disquete, Oct 25 2024 21:13:02

A mi me pasa algo así. De ninguna forma logro entender como demonios exportar mi modelo de piper convertido a SherpaOnnx como apk de Android. La guía que encontré en la web oficial es muy confusa, y me pregunto si es posible efectuarla desde Windows y cómo se haría, o bien hacerlo todo en WSL a pura línea de comandos o incluso una VM de Linux, porque instalar Android studio apuesto que será un fiasco, casi que no me atrevo a probarlo.

Score: +0

701. PolloGuerrero, Oct 25 2024 22:57:02

Me dicen que instalar Android Studio es bastante jodido, así que no sé. Pero sí, según he investigado sí hay que firmar el APK, si no no nos deja instalar a menos que seamos root, cosa que no es mi caso.

Score: +0

702. Disquete, Oct 26 2024 15:40:00

Na, firmar un APK no es gran cosa. Tienes que crearte una clave en la que te piden un pseudónimo o similar así como otros datos (ahora no recuerdo bien), y luego firmas el apk con herramientas de línea de comando como jarsigner, aunque creo que Android Studio tb te deja usando la GUI. En fin, que ese no es el mayor problema, el mayor problema aquí es como demonios compilar el SherpaOnnx con la nuestro propio modelo, y que sea usable en TalkBack y otros softwares.

Score: +0

703. PolloGuerrero, Nov 20 2024 00:33:02

Simbian, te consulto. ¿Tendrías algún problema si subimos tu voz de Nokia al repo en hugging Face?

Score: +0

704. Disquete, Nov 20 2024 09:22:21

@PrincesoGuerrero en principio yo lo permito, pero, qué pasa si se sube a uggingface? ¿Qué consecuencias tendría? Por otro lado, como las grabaciones han sido realizadas por el usuario @Willem, conviene que le pregunten a él también. Yo solo he entrenado el modelo, él hizo las grabaciones.

Score: +0

705. PolloGuerrero, Nov 20 2024 13:37:28

Bueno, yo no tengo contacto con ese usuario, por eso te decía. Consecuencias no habría ninguna, salvo que la descarga quién quisiera y además ese repo es re undergroun, o sea hay voces como la de Keynote gold, entre otras que consideramos que podríamos subirlas tranquilamente. No hay voces personales de gente re viva y coleando a la que no les pudimos consultar eso, o no quieren que sus voces estén públicamente por ahí. Por eso te digo. Imaginate como un repo no oficial de voces, las que vamos haciendo en español y ni siquiera están todas, como alternativa a las c arpetas de drive.

Score: +0

706. Willem, Nov 20 2024 16:00:39

hola! Bueno, efectivamente yo hice las grabaciones, y no tengo problema con que se suba la voz y esté disponible, en tanto no tenga consecuencias legales para nadie. Ni para mí que grabé, ni para Symbian que la entrenó, ni para quienes la suban. si nos vemos libres de todo ello, lo dicho, no tengo problema.

Score: +0

707. Disquete, Nov 20 2024 16:02:49

Pues lo dicho, teniendo en cuenta que está la voz de keynote, pasa el enlace. TB me pregunto si cuando cree otro modelo, puedo subirlo, y cómo se haría. No me gusta mucho depender de Google y sus servicios, así que me parece genial.

Score: +0

708. PolloGuerrero, Nov 20 2024 17:08:39

Hola, @Willem, muchísimas gracias! La voz ya está subida. En teoría no deberíamos tener consecuencias legales por esto, es decir, solo veamos las voces que hay, como la de Keynote Gold, que está abandonadísimo de años, o mismo este de Nokia que también está abandonadísimo por Nokia que yo sepa. Por ahí el problema podría radicar en la voz de Dalia, que yo la entrené en un tiempo en que no teníamos ni el Sapi adapter ni el complemento este de Neural Voices, cosa que ahora no veo que valga la pena, salvo para quienes puedan tener a Piper pero no las voces de Azure. Pero de cualquier forma, ya les digo, es re undergroun este repo así que ni se van a enterar.

Score: +0

709. Willem, Nov 20 2024 17:49:46

Muy bien, pues a disfrutarla entonces! Gracias

Score: +0

710. Lebogang, Nov 20 2024 18:42:18

yo sigo insistiendo, me encantaría poder tenerla a Whitney Houston en piper leyendo mis mensajes del talkback en android si se pudiera :)

Score: +0

711. PolloGuerrero, Nov 20 2024 19:37:19

Bueno, pero ya te expliqué yo muchas veces. Si no te ponés las pilas y no hacés el dataset y no la entrenás, aunque sea con ayuda de alguien, cómo la vas a tener? a ponerse media pila. Yo te ayudo, pero moviendo moviendo moviendo

Score: +0

712. Lebogang, Nov 20 2024 20:13:02

necesitaría conseguir suficientes entrevistas limpias de ella como para tener un dataset, luego si. Pero no encuentro algo con qué quitar música de fondo, que algunas veces ponen canciones de ella de fondo y eso.
Well, editamos porque se me vino otra duda a mi cabecita. ¿Como le haríamos para que pueda hablar español?

Score: +0

Last edited by Lebogang, Nov 20 2024 20:16:10

713. PolloGuerrero, Nov 20 2024 20:42:36

Yo lo hice con ElevenLabs, pero además de que te va a costar al menos 1 dólar la primera vz para el Plan Starter, 5 dólares las demás veces, tan precisa no es, y tendrías que usar IRV o uno d eesas que ya sabés usar vos para rescatar su voz tal como viene, o sea esperemos que no se distorsione mucho su timbre en el proceso de todo eso.

Score: +0

714. Lebogang, Nov 20 2024 20:51:50

la idea que tenía era algo así como buscar una voz que sea lo más natural posible para que lea algo y usarla de base, y luego a esa voz convertirla a la de Whitney usando rvc pero no se que tan seguro sea hacer eso igual.

Score: +0

715. Disquete, Nov 20 2024 22:51:32

De echo, creo que con el modelo de fakeyou se puede hacer eso. Si quieres que hable, no se va a notar de que época es ese modelo. Eso sí, lo de correr esas voces Piper en Android no lo he conseguido aún, lo de convertirlas a SherpaOnnx es un auténtico lío y me pierdo con eso, a menos que, de pronto pueda editar la voz de un apk ya existente. Estoy pensando probar eso pero, qué me dicen?

Score: +0

716. boeing777-200LRWordliner, Dec 28 2024 22:31:22

Quizá no vaya en este hilo, pero para que el avión de Boeing (OSEA yo no cree un hilo realdope), pregunto por acá:
Quiero hacer una voz que pueda utilizar como una voz en Android. Tengo un a50 donde probarlo, sé que se puede porque en una vez vi que se podía, pero ni idea de como hacerlo. Alguien tiene una idea?

Score: +0

717. El-Megalovano, Jan 4 2025 15:43:18

Quizá eso lo pensaba yo.
Otra vez yo jugando al ignorante aquí, aunque revisé el primer repositorio no oficial en la primera página, pero hay nuevas voces en Español? Seguramente encontré un modelo de voz para el letón, y eso que aún no tiene soporte oficial para ese idioma, a pesar que el fonemizador eSpeak NG lo soporta.
Tan solo si obtengo una GPU NVidia GForce RTX quizá de la 4070 hasta 4090 podría entrenar voces de manera local, tanto como pasar desde el colab de google como de lo más técnico posible.

Score: +0

718. Willem, Jan 4 2025 16:56:24

alguien de aquí recuerda la serie de argarañá que hizo franco petrini con voces sintéticas? Había un personaje que apareció poco, creo que era una voz de un sinte llamado Boxigen o algo así. estaría interesante ver si podemos rescatar esa voz con sonata.

Score: +0

719. El-Megalovano, Jan 5 2025 04:50:06

Marta, creo que se llamaba o no recuerdo.
Creo que era esa.

Score: +0

720. killer-instinct, Jan 5 2025 14:10:46

si a esas vamos: a mí me encantaría tener la voz de la cantante Fey cuando quiera leer un libro, almenos para mí sería genial.

Score: +0

723 messages, 25 pages: 1…; 22 2324 25 ↖ Go back to topic list

Go to top ↑
Go to contents ↑

Answer to topic

You must be connected in order to be allowed to post.