721. PolloGuerrero,
Bueno, lo primero es recopilar audios, cuantos más sean posibles, de ella hablando, y si es por el ruido o música de fondo hay IAs que arreglan esos detalles. A mí no me da el oído para ayudar con más, pero de ahí, tras lograr todo el conjunto de audios habría que cortar todos en archivos wav de 4 a 15 segundos.
Bueno, me es re frustrante depender de otra persona para armar un dataset, pero a penas esté en condiciones quisiera volver a intentarlo, es decir la parte de aprender a cortar los audios, porque recopilar y pasarlos por estas herramientas de limpiarlos no lo veo como algo que no pudiera, aunque claro, hoy por hoy ni me voy a enterar del resultado. Hace meses no entreno una voz.
Resultado: +0