3571. manantial,
A mí me encantaría usar una voz humana real como sintetizador, haber que tal
Skor: +0
4273 poruka, 143 stranica: 1…; 118 119120 121 122…; 143 ↖ Vrati se nazad na listu tema
Skor: +42
A mí me encantaría usar una voz humana real como sintetizador, haber que tal
Skor: +0
qué honda con estas cosas. lo abro ahora y el lector se queda sin habla.
Skor: +0
Bueno, hace unas horas actualizaron el complemento de NVDA mejorando un componente que debería garantizar una velocidad ligeramente más rápida, que está en la carpeta de Drive ya compilado con el último commit. También se puede probar a través de Google Colab. la interfaz es accesible, y la accesibilidad mejorada te guía en el proceso. También está la guía de entrenamiento.
Skor: +0
Buenísimo che, muchas gracias por la guía!
Te pregunto, siendo que ya existen modelos como el de Homero, que me encantaría poder usarlo en este sinte, habría que volver a hacer los datasets de 0 y no son compatibles los que ya circulaban por ahí? digo porque el proceso de entrenamiento me suena bastante parecido, y bueno, hicieron tantos datasets para usar en FakeYou que me gustaría usarlos acá.
Ahí estaba volviendo a descargar el complemento desde la carpeta de drive, pero es la misma versión que descargué ayer.
Skor: +0
Poslednja izmena od strane PrincesoGuerrero, 3 Jul 2023 17:37:54
Si hay modelos de voces Loquendo estaría más que agradecido. Yo haría varios de Eloquence o DECtalk.
Skor: +0
Hola @IA_speechsynth_and_GPT, los datasets (siempre que sean en formato LJSpeech) son compatibles, y en caso de que no lo sean se puede formatear, que son audios (carpeta wav o wavs) y transcripción (nombre.csv).
La transcripción sería de esta forma:
wavs/1 | texto. |
---|---|
wavs/2 | texto. |
Para mejor estabilidad, es recomendable que el texto tenga puntuación final (,;.:-_¡!¿?, etc), excepto puntos suspensivos.
Algo también importante es que en caso de palabras desconocidas, verificar su pronunciación o fonemización usando el sintetizador espeak-ng, ya que piper usa espeak-ng como backend (fonemizador) tanto en el entrenamiento como la síntesis.
Los nombres de archivos de los audios pueden tener caracteres o números, pero siempre se acude a lo último por facilidad.
Aquí uno de los datasets que hice: https://drive.google.com/drive/folders/1_BkdO802JxjeppFLxnKotQuKVluDreYw?usp=drive_link
Skor: +0
Sáben si hay sintetizadores parecidos al lector de documentos de Edge, para jaws?
Skor: +0
creo que no, si no entiendo mal edge usa las voces neurales como las de azure.
Skor: +0
tengo una pregunta, una vez creados los wavs y el texto, como creo esos archivos csv?
Skor: +0
ah, excelente. Porque me encantaría poder usar estos datasets que ya hicieron de voces como Homero, que yo no tengo a la mano ni nada.
Po soy yo o a las voces de calidad Low no se les entiende un pomo? Al menos yo no entiendo ni j, no probé esas voces femeninas que tienen mls y unos números y leen cualquier cosa menos lo que hay. Me recuerda un poco a ese complemento de Alex de Mac, que pulsabas las letras y leía una cosa determinada para todo.
Skor: +0
hola, e descargado el complemento de las voses tipo neuronales pipe y al reiniciar en NVDA me pide descargar una vos, le doy en la página luego de seleccionar la vos, pero me redirije a una página y no encuentro donde descargar la vos, me aparecen varios archivos pero no encuentro el adecuado alguien que me pueda oriantar gracias
Skor: +0
Tengo el mismo problema, no encuentro ningún archivo .tarGZ, solamente el source de las voces. Es que no se como utilizar el sitio de hughingface para descargar datasets y la verdad quiero descargar una voz en suahili que me gustó.
A demás tengo miedo de usar el colab ya quequiero hacer la voz de Eloquence para esta gaita, pero configurar algo yo no se la verdad yo no se. Primero creo los datasets pero en qué formato de texto hago las transcripciones? Se que tengo que seguir la convención LJSpeech, pero no se en qué formato guardaré las transcripciones para así subirlas y o enviarlas al colab. Si alguien o tiene las voces de Loquendo en la gaita o también las del Eloquence o quizá de Keinote gold sería interesante como sonarían.
Skor: +0
Poslednja izmena od strane El-Megalovano, 5 Jul 2023 06:23:05
Chicos, yo no comprendo por qué el complemento redirige a los samples y no a las descargas de las voces ya compiladas. Sería lo ideal, o darte ambas opciones desde el manager y después vos elegís.
He auqí la página de los .tar.gz ya armados: https://github.com/rhasspy/piper/releases/tag/v0.0.2
Skor: +0
Poslednja izmena od strane PrincesoGuerrero, 5 Jul 2023 17:17:16
por eso siempre he dicho, viva eloquence por muchos años!.
quizás nunca llegara a tener la tegnologìa que ahora cargan las voces neurales, pero hasta para leer un libro es lo mas indispensable, a que es cierto lo que digo?.
arriba eloquence!
Skor: +0
Yo digo arriba eSpeak NG y su soporte multilíngüe, espero que el judeoespañol lo añadan... OK no XD cada uno con su sinte megalóvano.
Solo quiero hacer una versión de Eloquence para piper y ahí lo tengo como nuevo, a poco no chicos.
Skor: +0
yo espero que añadan el gótico, inglés antiguo, otros dialectos de inglés y el que se ha mencionado (el judeoespañol)
Skor: +0
cómo que se actualizó el complemento Piper? Fui a descargar de drive y es el mismo que había descargado hace días cuando lo compartieron. piper_neural_voices-1.0-beta.nvda-addon. Y sobre la respuesta, es normal que sea así tan lenta pero ya es un avance poder utilizar voces neurales sin conexión. Y sobre estas que podemos utilizar con NVDA, digo que de las 11 hay 3 o 4 que suenan bien. Al menos para mi gusto.
Skor: +0
Había tantos datasets que ahora se podrían usar en FakeYou y me encantaría usar acá en Piper también.
Skor: +0
Buenas.
teniendo la transcripción y el formato indicado (wav/archivo.wav|texto) basta para tenerlo en un archivo txt o csv, el cuaderno se encarga de arreglar la extensión.
piper para NVDA se actualiza en Github. Es la misma versión, pero en realidad hay cambios, sea para mejorar el rendimiento o para agregar cualquier otra cosa. El complemento de la carpeta de Drive está compilado con el último commit del repositorio de Mush, actualizando un componente para mejorar el rendimiento.
Es posible que sugiera o contribuya con un descargador automático debido al nuevo diseño de la página de samples y la subida de los nuevos modelos en huggingface.
Skor: +0
aH bien, ya veo en sí. Instalaré la versión proporcionada allí. Si alguna cosa que me suceda mientras entreno la(s) voz(ces) lo preguntaré.
Skor: +0
¡Hola! Parece que para instalar las voces del sitio de Piper, hay que saber en qué carpeta de NVDA colocar los archivos, y listo.
Skor: +0
rmcpantoja, hay forma de que me lleguen notificaciones cuando hacés modificaciones a la carpeta de drive? estoy desde la web. De casualidad entré y encontré la voz que etiuetás como narrador, muy buena quedó para mi gusto.
Skor: +0
yo me pregunto si es posible forzar que me salga la voz de piper en la lista de tts de NVDA. Actualicé y no me sale, me pregunto si es que tendrá que estar en sint drivers o una carpeta de esas.
Skor: +0
Hola @IA_speechsynth_and_GPT, me temo que no es posible hacerlo a través de Drive, pero justamente estaba diseñando un sistema de notificaciones en el cuaderno de exportación de modelos (una copia privada), en el que, si realmente voy a publicar una voz en la carpeta pública (léase el mensaje 3567) notificará por correo a quienes se suscriban a partir de ahora por la nueva voz exportada. Para los interesados, pueden proporcionar los correos por aquí o mensaje permanente.
@Symbian_Belle, asegúrate de que el complemento esté instalado de forma correcta, o revisar si se encuentra una carpeta pending-install dentro de los complementos de NVDA.
Skor: +0
Poslednja izmena od strane rmcpantoja, 10 Jul 2023 17:07:36
He estado leyendo un poco sobre un nuevo sintesis de voz por IA.
Dicen que lo pueden usar con NVDA, alguien me puede dar una explicación introductoria acerca de ese complemento, a que esta destinado a usar, que se puede hacer, y que limitaciones tiene, y por ultimo me gustaría saber de sus requisitos minimos para su correcto funcionamiento.
Ya despues creo que pedire amablemente que me puedan dar un intructivo de su instalación.
Skor: +0
De el que estamos hablando es de Piper, un sintetizador de voz por IA pero local, sin internet, rápido y flexible que principalmente funciona para el Rasberry Pi 4, aunque también se puede usar por su puesto en Windows con NVDA. Para mac no se, aunque para Linux creo, ya que el mismo sistema (Rasbian) se basa en Debian, que utiliza el kernel de Linux para funcionar. Estoy tratando de crear una voz sintética para leer textos y siempre me fijé en hacer la mía para tal acción, a ver como va el resultado una vez esté lista. Ya voy a preparar los datasets para que funcione.
Skor: +0
intentaré portearla para Mac, si es que no lo está, a ver que pasa. Este fin de semana bichearé un poco con el código y a ver si hago mi primer aporte a la comunidad, que desde 2016 que no paso nada jajaja.
Skor: +0
bueno ya estoy preparado con mi primer dataset para piper, en que collab lo entreno?
Skor: +0
no se que sea pero entre más haya en rvc mejor :D
Skor: +0
El cuaderno de entrenamiento: https://colab.research.google.com/github/rmcpantoja/piper/blob/master/notebooks/piper_multilingual_training_notebook.ipynb
Skor: +0
4273 poruka, 143 stranica: 1…; 118 119120 121 122…; 143 ↖ Vrati se nazad na listu tema
Morate da se prijavite kako biste mogli da pišete