3751. Laositadepeluche ,
revivo hilo xd
счёт: +0
4283 сообщений, 143 страниц: 1…; 124 125126 127 128…; 143 ↖ Вернуться к списку тем
счёт: +42
revivo hilo xd
счёт: +0
a mi me gustaría poder usar la voz de dalia del narrador en NVDA. espero que pronto se pueda que para leer será genial.
счёт: +0
uuuuuuu síiiiiiiii, poder usar las voces neuronales de Microsoft en NVDA sería jeniaaaaaaal, somos 2. d
счёт: +0
por mientras tanto, he hecho una recreación de Dalia en Piper para que la puedan usar con NVDA, por mientras hay forma de usarla desde Windows 11 como se esperaría: https://drive.google.com/file/d/1-AhU70qWBhmqXu-jtdMSeNj01q2YuTCS/view?usp=drive_link
счёт: +0
pregunta. en qué parte ay que pegar los archivos es-dalia-medium.onnx y es-dalia-medium.onnx.json para que funcionen?
счёт: +0
No, no descomprimas eso.
al archivo ese con extensión .tar.gz tal como lo descargaste déjalo así. Tenés qje instalar el complemento de Piper, si no lo tenés, acá está: https://drive.google.com/file/d/1MuvYPXklFxvQw_DKxFO1qpkqcEGcGD5j/view?usp=drive_link
Una vez instalaste eso, la primera vez te pone un mensaje avisándote que no hay voces instaladas y te va a preguntar si querés ir a la página web a descargar voces. no hace falta. Ya descargaste el archivo de la ovz de dalia, ahora vas al menú de preferencias de NVDA, opciones, y tenés una nueva categoría, Piper Voice Manager. ahí tabulás hasta que te dice, install from local voice, das enter y seleccionás el archivo de la voz, que ya lo descargaste, y se instala solo. Luego podés salir de ahí y cambiar de sintetizador, y lo mismo con cualquier voz e Piper (en este hilo se postearon unas cuantas)
счёт: +0
una vez traté de probar eso, pero me anduvo re lento. así va esta?
счёт: +0
no es cosa de las voces, sino del sintetizador. Hoy por hoy es así de lentejo (tengamos en cuenta que usa una IA optimizada para andar en CPU y por tanto sin Internet) pero se espera que el desarrollador a futuro pueda darle una velocidad de respuesta más rápida. No sé cómo va en cuanto a eso.
счёт: +0
Oigan chines, De por sí hay algún linuxero por acá? Y si es así, que tenga las voces IBM para Linux? Lo que pasa es que voy a darle un chancecín a Linux, pero antes quise comprar las voces IBM, (eloquence en Voxin) y resulta que ya no las venden. Sólo están las de Vocalizer.
счёт: +0
¿Wtf? Recién veo la página y no entendí el motivo. Y yo que pensaba comprar el de idioma inglés y español latinoamericano. Sólo tengo el de español castellano si te interesa. Cualquier cosa pv.
счёт: +0
Chicos, solamente paso para contar que luego de algunos esfuerzos, he conseguido entrenar un modelo de mi voz para Peper, y curiosamente quedó bastante bien. Ah, también he probado el nuevo modelo de Elevenlabs y, si bien hay voces que quedan mejor que otras, siento que van por buen camino.
Un saludo.
счёт: +0
gente. ¿me podrían explicar de que se trata esto de piper? porque lo nombraron 598 veces en este foro y no encuentro algún mensaje que explique esto. obviamente se que es un sintetizador pero nada más que eso
счёт: +0
eeew, pasala! O pasámela. al modelo de tu voz.
Bueno, como ya dijimos en páginas atrás, Piper es un sintetizador neural que funciona en local, se ejecuta en CPU y no necesita internet para nada. Fijate páginas atrás (desde la web, no desde acá de última) y varios compartimos voces que entrenamos.
счёт: +0
ahora me fijo, pero gracias por la explicación. el problema es que de las 10000 páginas que tiene este foro no se en qué página estará espesíficamente el inicio de esto del sintetizador pero ahí busco
счёт: +0
hola!
me comparten el conplemento, actualisado de piper, ya que el que esta en el enlace no es compatible
Caramelos_felices: No, no descomprimas eso. al archivo ese con extensión .tar.gz tal como lo descargaste déjalo así. Tenés...: domingo 16:15
счёт: +0
Qué versión de NVDA estás usando? Porque yo uso la última estable de NVDA y sí es compatible.
счёт: +0
listo ya quedo
счёт: +0
Последнее изменение escanor0, 01.09.2023 00:00:45
Mensaje: Este es el link de mi voz en Piper
счёт: +0
ea! se escucha bastante bien lograda. debería ponerme a estudiar las herramientas a ver si creo la mía también.
счёт: +0
capaz que yo también jajaja xd... no sé en realidad jajjajajsjs
счёт: +0
Hola chicos: por casualidad anda algún tutorialillo por ahí de como entrenar voces para esto? Gracias
счёт: +0
счёт: +0
Ok gracias. Vamos a checar a ver
счёт: +0
revivo hilo xd
счёт: +0
una curiosidad algo tonta, pero.
De los sintes que podemos usar para lectores de pantalla, Piper parece ser el único que si le hacemos repetir algo lo leería diferente. Claro que no va a llgear al nivel de aleatoriedad de elevenLabs, pero hagan la prueba y un mínimo detallito en entonación o algo así, van a notar, como si estuviese vivo ahí leyendo.
La cosa es que me decepcioné con otros sintes neurales a ese respecto. Les hice repetir cosas por ejemplo a algunas voces de Microsoft azure (al menos las que usamos nosotros en español) y erpite todo igualito. Luego hice pruebas con Google TTS y Samsung TTS, especialmente con la voz en español de EEUU que suele ser muy aleatoria y dinámica, inclusive respira. Pero también, si le hago repetir algo, devuelve todo igualito. Haría lo mismo en ElevenLabs pero me quedan muy pocos caracteres, pero para que cada generación de texto sea totañ,ente aleatoria no creo que repitiera igual.
Me falta hacer pruebas con Google Cloud y Amazon Polly.
счёт: +0
Hasta donde yo sé, tanto Tacotron 2 como Forward Tacotron también conservan cierto grado de aleatoriedad, pero eso sí, la mayoría de los sintetizadores repiten texto como si estuviera pregrabado, o en otras palabras, como si usaran síntesis concatenativa, como siempre. Al usar las voces de Google para escuchar audiolibros con frecuencia, puedo confirmar que efectivamente no tienen dicha característica.
счёт: +0
¡Hola!
Sí, es cierto, la mayoría de estas voces neurales leen todo como si estuviera pregrabado. De hecho en un rato de escucharlas les captas el patrón y te acaban aburriendo, a mí me suenan más dinámicas otras voces menos avanzadas como las de acapela, que usan síntesis concatenativa.
счёт: +0
Yo también siento la aleatoriedad con el sinte piper, y eso que hasta algunos como que lo tendrían en su lista de sintes para leer textos largos... No se si con Mimic3 de Microft también tiene dicha aleatoriedad, pero Piper también soporta el formato Microft a demás de JLSpeech, y eso que también estoy explorando otros resources de datasets de voces como CommonVoice de Mozilla y el Open Speech and Language Resources en la cual algunas voces de Piper fueron recogidas del proyecto y algunas voces Mimic también...
счёт: +0
Me gustaría probar una en alta calidad, a ver qué onda. Probé casi todas en médium y alguna en Low, hasta ahora.
счёт: +0
HOla chicos, es mi primera vez que participo en este hilo, resulta que tengo una pregunta:
unos amigos y yo conseguimos este sintetizador (Piper Neural Voices). escuchamos de este sintetizador que se puede crear/entrenar voces, y quiero preguntar si es cierto y como se hace? gracias el que pueda explicar.
счёт: +0
4283 сообщений, 143 страниц: 1…; 124 125126 127 128…; 143 ↖ Вернуться к списку тем
Чтобы писать на форуме, вам нужно сначала войти.