sonata / Piper Neural voices: Un sintetizador para NVDA que suena muy bien y utiliza inteligencia artificial

702 messages, 24 pages:  1; 5 67 8 9; 24 ↖ Retour à la liste des sujets

Score: +32

181. PrincesoGuerrero,

Hay que hacer un modelo multi speaker, yo lo voy a intentar si no lográs entrenarlo con tiempo, pero será el primer modelo multi speaker que entreno así que espero no tener errores.

Score: +0

182. grekmusic33,

LISTO CARAMELOS FELICES, Aí DEJÉ EL FONIXTALK en el post que edité

Score: +0

183. un_oso,

bueno haver si entendí. los audios de transcripción se pueden poner en un mismo archivo? es decir, puedo poner todas las transcripciones en un mismo archivo txt, y separarlas por líneas? a y una última cosita. el archivo de transcripción se sube aparte del dataset al cuaderno? o va junto con el archivo comprimido. gracias

Score: +0

184. PrincesoGuerrero,

Muy bien, Ángel. El archivo de texto será uno solo, que contie todas las transcripciones de todos los audios. Intentá que cada línea sea cada audio, es decir, intentá que el texto de un audio si es bastante largo no se te baje a otra línea, porque alguna vez me pasó sin querer y me dio error después. Es decir, cada línea es para un archivo distinto.
Grego, tenés el dataset como privado, acordate de modificar los permisos en drive.

Score: +0

185. grekmusic33,

una pregunta, y el archivo txt como se podría renombrar dentro del dataset, si adentro del txt biene la transcripciones de los audios?
@Caramelos_felices: listo ahora si.
link: https://drive.google.com/file/d/1EF5cSPrquUQ4nvMXrXWKaI2EBr0GWM6R/view?usp=sharing

Score: +0

Dernière édition par grekmusic33, 20.11.2023 15:19

186. PrincesoGuerrero,

Me olvidé de aclarar eso con respecto al archivo de texto. Cuando lo cargan al cuaderno, lo pueden tener en la compu, lo único que suben a drive ese l .zip con los wavs. Al archivo de texto nómbrenlo como quieran y si quieren déjenlo como txt como viene, porque igual el coso hace la conversión automáticamente.
Grego, mi tiempo no es tanto. No sé si leíste en la guía de entrenamiento, que los wavs deben durar de 8 a 15 segundos. Yo no sé cortarlos, si no (y si el tiempo me alcanzaba) con gusto lo haría. Te diría que te hagas una subcarpeat para cada voz como más omenos tendrías, y de ahí el wav de cada variante lo dividas en muchos de hasta 15 segundos como mucho. Igual, no es tanto lo que tenés que tener tampoco, con 10 minutos de audio de cada uno ya estaría porque aunque sí entonan mucho y tal, siguen teniendo su monotonía.

Score: +0

Dernière édition par PrincesoGuerrero, 20.11.2023 16:25

187. Tu_gatito_ron_ron,

NO PASA NADA CON ESTO JAJAJAJA.
Dalia se escucha con problemas de lenguaje, y Luisito comunica tuvo una embolia creo.
Almenos me hiso la tarde esto 🤣

Score: +0

Dernière édition par Tu_gatito_ron_ron, 20.11.2023 18:01

188. PrincesoGuerrero,

Y sí. ¿Recuerdan que dije que este último comic tiene una regresión bastante importante al menos en el idioma español? A eso me refería, pero bueno, mejor eso a tener toda una versión inestable que te come procesador a lo loco, y en lecturas puntales y largas con la lectura continua por suerte pronuncian mucho mejor.

Score: +0

189. manantial,

a mi me gustaría clonar la voz de chalino sanchez, tengo la curiosidad de como se escucharía

Score: +0

190. El-Megalovano,

Escuché via el AddOn de PiperTTS que se implementó soporte para voces en tiempo real (voces RT) que proporciona baja latencia al leer frases largas, aunque no veo voces RT en el repositorio oficial de Piper, solamente las voces estándar. En una futura versión estarán soportadas, solo es un commit.
https://github.com/mush42/piper-nvda/commit/334768af32876c0387d4311a1406021d2889a566

Score: +0

191. grekmusic33,

@ El-Megalovano: como se descarga ese complemento que dejaste en ese link?

Score: +0

192. El-Megalovano,

Jesús, Nó es un complemento, solo es el reciente commit que se publicó en el GitHub del complemento en sí. Aún sigo esperando que haigan voces RT por el momento no hay ninguna ni sé como se harán, No sé si el método utilizado para hacer voces estándar aplicará a voces rt.

Score: +0

193. PrincesoGuerrero,

A ese comic de hecho lo puse compilado en el primer mensaje, es la versión del complemento que les puse para que descarguen directamente ay que la última release no se lleva bien con las voces que hagamos ahora.

Score: +0

194. El-Megalovano,

Podrase llevar bien con ellas. Hay que ver si en una actualización del cuaderno tendrá soporte para voces RT.

Score: +0

195. PrincesoGuerrero,

Nunca escuché una voz RT hasta ahora, no sé qué tan nueva es la última voz que agregaran al repo oficial. Lo único que logro imaginar es que respondiesen un cachitín más rápido, pero después ¿cómo va eso de en tiempo real y tal?

Score: +0

196. Patricio-Estrella,

buenas
estoy intentando axceder para explorar los links, pero el de descarga me da error

Score: +0

197. PrincesoGuerrero,

Listo Babo-cartel, ahora sí te debería andar. Puse la última release, de vuelta en el primer post.

Score: +0

198. Patricio-Estrella,

gracias man

Score: +0

199. Yostein-san,

Hola, ¿pueden decirme donde sería la página de voces subidas para Piper? Me refiero a voces subidas por usuarios en diferentes idiomas y no al link directo de google del primer post.
Otra pregunta es: ¿Cada cuanto tiempo se actualiza tanto el controlador piper como la subida de nuevas voces?
Gracias por la ayuda.

Score: +0

200. PrincesoGuerrero,

La subida de nuevas voces en el repo oficial sinceramente no sé, o sea nunca más vi una nueva voz en español desde que conozco Piper hace meses.
ahora, un repo no oficial de voces, que no tiene muchas, y ya las compartí: https://huggingface.co/polysound/piper_unofficial_voices/
Y ahora viene la carpeta de drive de @rpantoja, que también la compartió muchos posts atrás y tiene varias ovces casi todas en español: https://drive.google.com/drive/folders/1zFJRTI6CpVw9NkrTiNYOKGga0yn4JXzv?hl=es

Score: +0

201. tiktok,

que tal son estas boses?

Score: +0

202. Ren_Yamamoto,

hola, ¿Cualquier actualización de piper la avisarían por acá o sería de ir checando el primer post si no hay cambios en el link o algo así?

Score: +0

203. PrincesoGuerrero,

sí, no te preocupes. Voy a avisar, no sé si cualquier actualización pero sí cuando la haya y me parezca que vale la pena y tiene cambios relevantes, o no tenga regresiones importantes.

Score: +0

204. Maximo ,

hola , consulta como puedo usar estas boses en el NVDA ya las e activado pero , nomeablan

Score: +0

205. milton_el_piola ,

hola me podrían pasar el link del síntesis?

Score: +0

206. El-Megalovano,

En la primera página está el enlace.
Por sierto aún sigo intentando hacer voces multi-speaker, pero me sigue dando error.

Score: +0

207. Maximo ,

yo me e descargado una bos pero cuando quero que able en el NVDA no funsiona

Score: +0

208. El-Megalovano,

Velocidad de respuesta lenta? Mejor espera...

Score: +0

209. PrincesoGuerrero,

Nueva voz. Mario Castañeda: https://huggingface.co/polysound/piper_unofficial_voices/blob/main/es/voice-es_MX-mario-medium.tar.gz

Score: +0

210. El-Loro-Azul,

Ay. Quien se atrevió jajajajaja. Ojalá no se enchile el mario

Score: +0

702 messages, 24 pages:  1; 5 67 8 9; 24 ↖ Retour à la liste des sujets

Répondre au sujet

Vous devez être connecté pour pouvoir poster.

Mot de passe perdu ? Créer un compte