sonata / Piper Neural voices: Un sintetizador para NVDA que suena muy bien y utiliza inteligencia artificial

616 сообщений, 21 страниц:  1; 5 67 8 9; 21 ↖ Вернуться к списку тем

счёт: +30

181. un-kit-de-herramientas,

Hay que hacer un modelo multi speaker, yo lo voy a intentar si no lográs entrenarlo con tiempo, pero será el primer modelo multi speaker que entreno así que espero no tener errores.

счёт: +0

182. grekmusic33,

LISTO CARAMELOS FELICES, Aí DEJÉ EL FONIXTALK en el post que edité

счёт: +0

183. gabm,

bueno haver si entendí. los audios de transcripción se pueden poner en un mismo archivo? es decir, puedo poner todas las transcripciones en un mismo archivo txt, y separarlas por líneas? a y una última cosita. el archivo de transcripción se sube aparte del dataset al cuaderno? o va junto con el archivo comprimido. gracias

счёт: +0

184. un-kit-de-herramientas,

Muy bien, Ángel. El archivo de texto será uno solo, que contie todas las transcripciones de todos los audios. Intentá que cada línea sea cada audio, es decir, intentá que el texto de un audio si es bastante largo no se te baje a otra línea, porque alguna vez me pasó sin querer y me dio error después. Es decir, cada línea es para un archivo distinto.
Grego, tenés el dataset como privado, acordate de modificar los permisos en drive.

счёт: +0

185. grekmusic33,

una pregunta, y el archivo txt como se podría renombrar dentro del dataset, si adentro del txt biene la transcripciones de los audios?
@Caramelos_felices: listo ahora si.
link: https://drive.google.com/file/d/1EF5cSPrquUQ4nvMXrXWKaI2EBr0GWM6R/view?usp=sharing

счёт: +0

Последнее изменение grekmusic33, 20.11.2023 15:19:41

186. un-kit-de-herramientas,

Me olvidé de aclarar eso con respecto al archivo de texto. Cuando lo cargan al cuaderno, lo pueden tener en la compu, lo único que suben a drive ese l .zip con los wavs. Al archivo de texto nómbrenlo como quieran y si quieren déjenlo como txt como viene, porque igual el coso hace la conversión automáticamente.
Grego, mi tiempo no es tanto. No sé si leíste en la guía de entrenamiento, que los wavs deben durar de 8 a 15 segundos. Yo no sé cortarlos, si no (y si el tiempo me alcanzaba) con gusto lo haría. Te diría que te hagas una subcarpeat para cada voz como más omenos tendrías, y de ahí el wav de cada variante lo dividas en muchos de hasta 15 segundos como mucho. Igual, no es tanto lo que tenés que tener tampoco, con 10 minutos de audio de cada uno ya estaría porque aunque sí entonan mucho y tal, siguen teniendo su monotonía.

счёт: +0

Последнее изменение un-kit-de-herramientas, 20.11.2023 16:25:31

187. Baxcalibur,

NO PASA NADA CON ESTO JAJAJAJA.
Dalia se escucha con problemas de lenguaje, y Luisito comunica tuvo una embolia creo.
Almenos me hiso la tarde esto 🤣

счёт: +0

Последнее изменение Baxcalibur, 20.11.2023 18:01:50

188. un-kit-de-herramientas,

Y sí. ¿Recuerdan que dije que este último comic tiene una regresión bastante importante al menos en el idioma español? A eso me refería, pero bueno, mejor eso a tener toda una versión inestable que te come procesador a lo loco, y en lecturas puntales y largas con la lectura continua por suerte pronuncian mucho mejor.

счёт: +0

189. manantial,

a mi me gustaría clonar la voz de chalino sanchez, tengo la curiosidad de como se escucharía

счёт: +0

190. El-Megalovano,

Escuché via el AddOn de PiperTTS que se implementó soporte para voces en tiempo real (voces RT) que proporciona baja latencia al leer frases largas, aunque no veo voces RT en el repositorio oficial de Piper, solamente las voces estándar. En una futura versión estarán soportadas, solo es un commit.
https://github.com/mush42/piper-nvda/commit/334768af32876c0387d4311a1406021d2889a566

счёт: +0

191. grekmusic33,

@ El-Megalovano: como se descarga ese complemento que dejaste en ese link?

счёт: +0

192. El-Megalovano,

Jesús, Nó es un complemento, solo es el reciente commit que se publicó en el GitHub del complemento en sí. Aún sigo esperando que haigan voces RT por el momento no hay ninguna ni sé como se harán, No sé si el método utilizado para hacer voces estándar aplicará a voces rt.

счёт: +0

193. un-kit-de-herramientas,

A ese comic de hecho lo puse compilado en el primer mensaje, es la versión del complemento que les puse para que descarguen directamente ay que la última release no se lleva bien con las voces que hagamos ahora.

счёт: +0

194. El-Megalovano,

Podrase llevar bien con ellas. Hay que ver si en una actualización del cuaderno tendrá soporte para voces RT.

счёт: +0

195. un-kit-de-herramientas,

Nunca escuché una voz RT hasta ahora, no sé qué tan nueva es la última voz que agregaran al repo oficial. Lo único que logro imaginar es que respondiesen un cachitín más rápido, pero después ¿cómo va eso de en tiempo real y tal?

счёт: +0

196. Babo-cartel,

buenas
estoy intentando axceder para explorar los links, pero el de descarga me da error

счёт: +0

197. un-kit-de-herramientas,

Listo Babo-cartel, ahora sí te debería andar. Puse la última release, de vuelta en el primer post.

счёт: +0

198. Babo-cartel,

gracias man

счёт: +0

199. Yostein-san,

Hola, ¿pueden decirme donde sería la página de voces subidas para Piper? Me refiero a voces subidas por usuarios en diferentes idiomas y no al link directo de google del primer post.
Otra pregunta es: ¿Cada cuanto tiempo se actualiza tanto el controlador piper como la subida de nuevas voces?
Gracias por la ayuda.

счёт: +0

200. un-kit-de-herramientas,

La subida de nuevas voces en el repo oficial sinceramente no sé, o sea nunca más vi una nueva voz en español desde que conozco Piper hace meses.
ahora, un repo no oficial de voces, que no tiene muchas, y ya las compartí: https://huggingface.co/polysound/piper_unofficial_voices/
Y ahora viene la carpeta de drive de @rpantoja, que también la compartió muchos posts atrás y tiene varias ovces casi todas en español: https://drive.google.com/drive/folders/1zFJRTI6CpVw9NkrTiNYOKGga0yn4JXzv?hl=es

счёт: +0

201. hadad,

que tal son estas boses?

счёт: +0

202. Pablo,

hola, ¿Cualquier actualización de piper la avisarían por acá o sería de ir checando el primer post si no hay cambios en el link o algo así?

счёт: +0

203. un-kit-de-herramientas,

sí, no te preocupes. Voy a avisar, no sé si cualquier actualización pero sí cuando la haya y me parezca que vale la pena y tiene cambios relevantes, o no tenga regresiones importantes.

счёт: +0

204. Maximo ,

hola , consulta como puedo usar estas boses en el NVDA ya las e activado pero , nomeablan

счёт: +0

205. milton_el_piola ,

hola me podrían pasar el link del síntesis?

счёт: +0

206. El-Megalovano,

En la primera página está el enlace.
Por sierto aún sigo intentando hacer voces multi-speaker, pero me sigue dando error.

счёт: +0

207. Maximo ,

yo me e descargado una bos pero cuando quero que able en el NVDA no funsiona

счёт: +0

208. El-Megalovano,

Velocidad de respuesta lenta? Mejor espera...

счёт: +0

209. un-kit-de-herramientas,

Nueva voz. Mario Castañeda: https://huggingface.co/polysound/piper_unofficial_voices/blob/main/es/voice-es_MX-mario-medium.tar.gz

счёт: +0

210. Dani-Tunes,

Ay. Quien se atrevió jajajajaja. Ojalá no se enchile el mario

счёт: +0

616 сообщений, 21 страниц:  1; 5 67 8 9; 21 ↖ Вернуться к списку тем

Ответить на тему

Чтобы писать на форуме, вам нужно сначала войти.

Забыли пароль? Создать учётную запись