Bueno, lo primero es recopilar audios, cuantos más sean posibles, de ella hablando, y si es por el ruido o música de fondo hay IAs que arreglan esos detalles. A mí no me da el oído para ayudar con más, pero de ahí, tras lograr todo el conjunto de audios habría que cortar todos en archivos wav de 4 a 15 segundos. Bueno, me es re frustrante depender de otra persona para armar un dataset, pero a penas esté en condiciones quisiera volver a intentarlo, es decir la parte de aprender a cortar los audios, porque recopilar y pasarlos por estas herramientas de limpiarlos no lo veo como algo que no pudiera, aunque claro, hoy por hoy ni me voy a enterar del resultado. Hace meses no entreno una voz.
Skor: +0
722. Willem,
así es, así se llamaba. y si todavía es posible conseguir una demo, podríamos armar el dataset sin problema, me parece. voy a investigar un poco y les cuento.
Skor: +0
723. GingerFox,
Oe preg. Cual es la empresa que hace el multi-TTS? Hay forma de mandarles mi modelo de NokiaTTS para que lo conviertan a un paquete usable desde MultiTTS en Android?