1. PrincesoGuerrero,
Nota: En este primer post intentaré poner todos los links que considere necesarios para el usuario que quiera probar y posteriormente desarrollar su voz.
Piper es una joyita relativamente nueva en el campo de los sintetizadores. se llamaba Piper, pero ahora se renombró a Sonata Neural Voices, ya que quieren integrar otros modelos tts neuronales. Se trata de un sinte de código abierto, que utiliza una síntesis por redes neuronales, funciona en local, o sea, sin Internet, y lo podemos usar en NVDA. También está para la Raspberry Pi y otras distribuciones GNU/Linux, pero a nosotros ahora mismo nos interesa usarla en NVDA.
piper aún está en una fase temprana de desarrollo. Tanto el sintetizador en sí, como el complemento. Utiliza TTS de extremo a extremo. Al ser software libre, lo que tenemos es que cualquiera de nosotros podría crear su propia voz, o la de otra persona, siempre de manera responsable. Tal vez en algún momento podamos debatir esta cuestión de la clonación de voces. Posteriormente, usarlas en NVDA; que era algo que siempre quise. Primero tuve esa fantasía de poder usar voces de personas tan mortales como nosotros, con sus expresiones y demás, y luego quise poder utilizar localmente voces que manejaran síntesis neuronal.
ahora mismo, Piper es como undergroun. Lo conoce poca gente, y mi idea e intención es que se popularice, siendo que ahí lo tenemos, gratis, al alcance de la mano y para NVDA, sin Internet. Sería una muy buena alternativa para cuando no se puede tener eloquence y no nos gustan otros sintetizadores, ya que a mi juicio, las voces salen muy buenas cuando se entrenan bien. El incombeniente, es que aún son lentas y a nosotros muchas veces nos interesa una buena velocidad de respuesta para navegar cómodamente, pero que eso no los desanime, muchachos. Se planea trabajar aún en la velocidad de respuesta, y hoy por hoy, en mi opinión son muy buenas para leer.
creo que serían una alternativa legal para usar un sintetizador extra en NVDA, apartando el tema del entrenamiento de voces que prefiero dejarlo para otro post.
Sin más, voy a dejarles links.
descargar e instalar lo necesario.
descarguen la última versión del complemento.
He aquí el repositorio directamente en las voces en español. Para mayor accesibilidad, pueden pulsar la l, de moverse rápidamente entre listas, y ahí tienen una lista bastante grande con unas cuántas voces para que descarguen. Solo tienen que dar enter en cada archivo, por ejemplo, voice-daila-es.tar.gz o similar.
Hay otro usuario que espero participe por acá cuando se conecte, que seguramente dejará su carpeta de drive también, ya que él ha desarrollado voces en español y algunas herramientas para que cualquiera de nosotros pueda entrenar sus propias voces. Ya podemos ver este mismo material en el hilo de sintetizadores, pero bueno. Para que quede todo al alcance.
Y ahora, si finalmente quieren aprender a crear sus propias voces, que sería genial, he aquí una guía muy completa, en texto, realizada por @rmcpantoja, quien además tiene cuadernos (incluídos en la guía) para entrenar voces, exportarlas y hacer inferencia:
accedan a la guía desde aquí
Instalación de Piper en NVDA.
Lo primero es descargar e instalar el complemento, que lo tendría que poner en mi carpeta de drive, también.
La primera vez que instalemos, tras reiniciar NVDA, como la lista de voces estará vacía nos va a preguntar si deseamos abrir el administrador de voces de Piper y descargar voces.
Tanto si sí como si no, si no se abrió, entramos al administrador de voces de Piper, que lo vamos a encontrar en el menú de NVDA. Ahora, como no hay voces instaladas, tenemos 2 opciones:
- Vamos a la segunda pestaña, para descargar voces, que el complemento las tomará del repositorio oficial. Hay unas pocas voces en español, pero en realidad los usuarios y personas tan mortales como ustedes habrán hecho muchas voces más, que ahí no están. Si vamos a descargar voces, tenemos un cuadro combinado para elegir el idioma y otro para elegir la voz. Podemos probar dicha voz, donde se va a reproducir un pequeño wav para que escuchen cómo suena, y tendrán el botón de descargar. el complemento les avisará que es necesario reiniciar NVDA para refrescar la lista de voces, pero en realidad no es necesario.
- Instalar una voz desde un archivo local, lo que quiero hacer yo. Tan fácil como seleccionar dicho botón en la primera pestaña anterior, donde la primera vez estará vacía de voces, y ahí sea briría el explorador de archivos, para así seleccionar el archivo con extensión .tar.gz que contiene la voz, y al dar enter se instala. No vamos a descomprimirlos, sino instalarlos como acabo de explicar. eso es todo. Luego, ya se puede salir de ahí y cambiar de sintetizador.
Solo agregar que, además, ya se han realizado voces conocidas para muchos de nosotros. Pueden ser de Youtubers, tal vez algún desarrollador de juegos como Oriol, y... Bueno, más o menos lo que se esperaría tener en FakeYou, pero sin toda esa cantidad buenísima de celebridades, (por ahora) ya que de hecho hemos creado voces de personas tan desconocidas y comunes pero tal vez muy especiales para quienes las usamos, o simplemente por quienes queremos contribuir de alguna manera, para el uso en lectores de pantalla, o cómo no, para ofrecer alguna voz que quede a gusto de una persona con discapacidad oral, cosa que hice yo al entrenar mi voz tanto acá como para ElevenLabs.
Iré editando el post a medida que fuese necesario. ahora, es cosa de que lo descubran, lo disfruten y con suerte comience a popularizarse, estar en la web de NVDA.es, en la wiki de voces extra de NV Access, y al menos cuando sea más responsivo, sea muy solicitado por los tiflo... tiflo.
ahora es cada vez más responsivo, pero téngase cuidado con jugar con los parámetros extra. Todavía hay errores que corregir.
¡Hasta otra!
счёт: +12
Последнее изменение PrincesoGuerrero, 10.10.2024 20:16:46