sonata / Piper Neural voices: Un sintetizador para NVDA que suena muy bien y utiliza inteligencia artificial

715 сообщений, 24 страниц: 1…; 5 67 8 9…; 24 ↖ Вернуться к списку тем

счёт: +32

181. PrincesoGuerrero, 19.11.2023 23:23:34

Hay que hacer un modelo multi speaker, yo lo voy a intentar si no lográs entrenarlo con tiempo, pero será el primer modelo multi speaker que entreno así que espero no tener errores.

счёт: +0

182. grekmusic33, 19.11.2023 23:27:11

LISTO CARAMELOS FELICES, Aí DEJÉ EL FONIXTALK en el post que edité

счёт: +0

183. un_oso, 20.11.2023 04:46:31

bueno haver si entendí. los audios de transcripción se pueden poner en un mismo archivo? es decir, puedo poner todas las transcripciones en un mismo archivo txt, y separarlas por líneas? a y una última cosita. el archivo de transcripción se sube aparte del dataset al cuaderno? o va junto con el archivo comprimido. gracias

счёт: +0

184. PrincesoGuerrero, 20.11.2023 14:39:00

Muy bien, Ángel. El archivo de texto será uno solo, que contie todas las transcripciones de todos los audios. Intentá que cada línea sea cada audio, es decir, intentá que el texto de un audio si es bastante largo no se te baje a otra línea, porque alguna vez me pasó sin querer y me dio error después. Es decir, cada línea es para un archivo distinto.
Grego, tenés el dataset como privado, acordate de modificar los permisos en drive.

счёт: +0

185. grekmusic33, 20.11.2023 15:07:17

una pregunta, y el archivo txt como se podría renombrar dentro del dataset, si adentro del txt biene la transcripciones de los audios?
@Caramelos_felices: listo ahora si.
link: https://drive.google.com/file/d/1EF5cSPrquUQ4nvMXrXWKaI2EBr0GWM6R/view?usp=sharing

счёт: +0

Последнее изменение grekmusic33, 20.11.2023 15:19:41

186. PrincesoGuerrero, 20.11.2023 15:29:37

Me olvidé de aclarar eso con respecto al archivo de texto. Cuando lo cargan al cuaderno, lo pueden tener en la compu, lo único que suben a drive ese l .zip con los wavs. Al archivo de texto nómbrenlo como quieran y si quieren déjenlo como txt como viene, porque igual el coso hace la conversión automáticamente.
Grego, mi tiempo no es tanto. No sé si leíste en la guía de entrenamiento, que los wavs deben durar de 8 a 15 segundos. Yo no sé cortarlos, si no (y si el tiempo me alcanzaba) con gusto lo haría. Te diría que te hagas una subcarpeat para cada voz como más omenos tendrías, y de ahí el wav de cada variante lo dividas en muchos de hasta 15 segundos como mucho. Igual, no es tanto lo que tenés que tener tampoco, con 10 minutos de audio de cada uno ya estaría porque aunque sí entonan mucho y tal, siguen teniendo su monotonía.

счёт: +0

Последнее изменение PrincesoGuerrero, 20.11.2023 16:25:31

187. Kyurem, 20.11.2023 18:01:24

NO PASA NADA CON ESTO JAJAJAJA.
Dalia se escucha con problemas de lenguaje, y Luisito comunica tuvo una embolia creo.
Almenos me hiso la tarde esto 🤣

счёт: +0

Последнее изменение Kyurem, 20.11.2023 18:01:50

188. PrincesoGuerrero, 20.11.2023 18:36:02

Y sí. ¿Recuerdan que dije que este último comic tiene una regresión bastante importante al menos en el idioma español? A eso me refería, pero bueno, mejor eso a tener toda una versión inestable que te come procesador a lo loco, y en lecturas puntales y largas con la lectura continua por suerte pronuncian mucho mejor.

счёт: +0

189. manantial, 22.11.2023 02:27:25

a mi me gustaría clonar la voz de chalino sanchez, tengo la curiosidad de como se escucharía

счёт: +0

190. El-Megalovano, 26.11.2023 02:24:17

Escuché via el AddOn de PiperTTS que se implementó soporte para voces en tiempo real (voces RT) que proporciona baja latencia al leer frases largas, aunque no veo voces RT en el repositorio oficial de Piper, solamente las voces estándar. En una futura versión estarán soportadas, solo es un commit.
https://github.com/mush42/piper-nvda/commit/334768af32876c0387d4311a1406021d2889a566

счёт: +0

191. grekmusic33, 26.11.2023 05:27:56

@ El-Megalovano: como se descarga ese complemento que dejaste en ese link?

счёт: +0

192. El-Megalovano, 26.11.2023 12:32:47

Jesús, Nó es un complemento, solo es el reciente commit que se publicó en el GitHub del complemento en sí. Aún sigo esperando que haigan voces RT por el momento no hay ninguna ni sé como se harán, No sé si el método utilizado para hacer voces estándar aplicará a voces rt.

счёт: +0

193. PrincesoGuerrero, 26.11.2023 14:38:36

A ese comic de hecho lo puse compilado en el primer mensaje, es la versión del complemento que les puse para que descarguen directamente ay que la última release no se lleva bien con las voces que hagamos ahora.

счёт: +0

194. El-Megalovano, 28.11.2023 14:15:52

Podrase llevar bien con ellas. Hay que ver si en una actualización del cuaderno tendrá soporte para voces RT.

счёт: +0

195. PrincesoGuerrero, 28.11.2023 17:38:11

Nunca escuché una voz RT hasta ahora, no sé qué tan nueva es la última voz que agregaran al repo oficial. Lo único que logro imaginar es que respondiesen un cachitín más rápido, pero después ¿cómo va eso de en tiempo real y tal?

счёт: +0

196. Patricio-Estrella, 28.11.2023 17:52:11

buenas
estoy intentando axceder para explorar los links, pero el de descarga me da error

счёт: +0

197. PrincesoGuerrero, 28.11.2023 17:57:10

Listo Babo-cartel, ahora sí te debería andar. Puse la última release, de vuelta en el primer post.

счёт: +0

198. Patricio-Estrella, 28.11.2023 18:48:15

gracias man

счёт: +0

199. Yostein-san, 28.11.2023 19:50:00

Hola, ¿pueden decirme donde sería la página de voces subidas para Piper? Me refiero a voces subidas por usuarios en diferentes idiomas y no al link directo de google del primer post.
Otra pregunta es: ¿Cada cuanto tiempo se actualiza tanto el controlador piper como la subida de nuevas voces?
Gracias por la ayuda.

счёт: +0

200. PrincesoGuerrero, 28.11.2023 22:12:49

La subida de nuevas voces en el repo oficial sinceramente no sé, o sea nunca más vi una nueva voz en español desde que conozco Piper hace meses.
ahora, un repo no oficial de voces, que no tiene muchas, y ya las compartí: https://huggingface.co/polysound/piper_unofficial_voices/
Y ahora viene la carpeta de drive de @rpantoja, que también la compartió muchos posts atrás y tiene varias ovces casi todas en español: https://drive.google.com/drive/folders/1zFJRTI6CpVw9NkrTiNYOKGga0yn4JXzv?hl=es

счёт: +0

201. L-gang, 28.11.2023 22:22:28

que tal son estas boses?

счёт: +0

202. Ren_Yamamoto, 29.11.2023 20:03:13

hola, ¿Cualquier actualización de piper la avisarían por acá o sería de ir checando el primer post si no hay cambios en el link o algo así?

счёт: +0

203. PrincesoGuerrero, 29.11.2023 20:15:30

sí, no te preocupes. Voy a avisar, no sé si cualquier actualización pero sí cuando la haya y me parezca que vale la pena y tiene cambios relevantes, o no tenga regresiones importantes.

счёт: +0

204. Maximo , 30.11.2023 11:31:44

hola , consulta como puedo usar estas boses en el NVDA ya las e activado pero , nomeablan

счёт: +0

205. milton_el_piola , 30.11.2023 12:20:46

hola me podrían pasar el link del síntesis?

счёт: +0

206. El-Megalovano, 30.11.2023 14:27:27

En la primera página está el enlace.
Por sierto aún sigo intentando hacer voces multi-speaker, pero me sigue dando error.

счёт: +0

207. Maximo , 30.11.2023 15:48:40

yo me e descargado una bos pero cuando quero que able en el NVDA no funsiona

счёт: +0

208. El-Megalovano, 30.11.2023 18:31:38

Velocidad de respuesta lenta? Mejor espera...

счёт: +0

209. PrincesoGuerrero, 05.12.2023 19:58:14

Nueva voz. Mario Castañeda: https://huggingface.co/polysound/piper_unofficial_voices/blob/main/es/voice-es_MX-mario-medium.tar.gz

счёт: +0

210. El-Loro-Azul, 05.12.2023 20:20:23

Ay. Quien se atrevió jajajajaja. Ojalá no se enchile el mario

счёт: +0

715 сообщений, 24 страниц: 1…; 5 67 8 9…; 24 ↖ Вернуться к списку тем

Перейти к меню ↑
Перейти к содержимому ↑

Ответить на тему

Чтобы писать на форуме, вам нужно сначала войти.