Hilo oficial sobre los sintetizadores de voz

4283 Nachrichten, 143 Seiten:  1; 126 127128 129 130; 143 ↖ Zurück zur Themenliste

~msgScore~: +42

3811. Exink,

Entrenar un modelo con kits es lo más simple del mundo, tanto que ya tengo dos modelos publicados. Lo malo es que ahora está muy, muy limitado en su uso, pero el entrenamiento es tan fácil como cargar uno o más audios en el dataset que no superen los 10 minutos, especificar si se trata de un cantante o personaje, el idioma y demás cuestiones, y cuando todo esté listo se le da a "train". Al menos, así fue la última vez que lo usé hace unas semanas.

~msgScore~: +0

3812. Storm-Monster,

en qué sentido está limitado el este?

~msgScore~: +0

3813. Ren_Yamamoto,

planes premium nuevos que nos mandan a los free a la mierd…

~msgScore~: +0

3814. Storm-Monster,

aaa. pero, cuanto tiempo deja usar una voz, por ejemplo, pongo un audio o audios que no superen los 10 mins, cuanto tiempo deja digamos usarlos para covers y así una vez entrenado el modelo?

~msgScore~: +0

3815. un_oso,

lo que ago es doy click aquí. New voice visitado enlace. luego di click donde dice create. me aparece un diálogo, simple mente le doy en continue. subo mis audios pero cuando intento continuar, me aparece esto. botón no disponible Continue. no se que esté haciendo mal, o que tenga que hacer en el dataser¿t. los audios que subo son de aprox 15 segundos

~msgScore~: +0

3816. Storm-Monster,

yo ya pude iniciar con el entrenamiento, pero, me dice que tengo que verificar mi número, lo pongo, me llega el código, pero, la pag como que laguea y sale un error de aplicación o algo así, y si intento recargar pues lo mismo

~msgScore~: +0

3817. inuyassha,

holaa jente bonita, pregunta curiosa, será que me pueden compartir el bocaloiz? y gracias a quien me pueda ayudar.

~msgScore~: +0

3818. Storm-Monster,

esonosepideporaquí

~msgScore~: +0

3819. Ren_Yamamoto,

oye, pobre man, del ilo de NVDA alguien lo mandó acá, tons hay que ir a putear al wei que lo mandó pa acá. a digo adjgkdgjlasdfjlkñ, anda, al menos díganle a donde preguntar, no sean malos :D

~msgScore~: +0

3820. Storm-Monster,

antes yo obtenía cosillas de blindhelp project, pero, creo que esa pag ya no anda.

~msgScore~: +0

3821. Ren_Yamamoto,

para @inuyassha, creo que hay un hilo que dice como hacer cantar al jaws? o algo así, y ahí pasan tipo música con vocaloid y cosas así. podrías intentar, si quieres y si te animas a postear lebanto ilo para que puedas pedirlo, no se, pondr´3e posteo a petición de @unmanquequierevocaloid, y yata. Edit: el ilo se llama: alguien sabe hacer cantar al jaws?

~msgScore~: +0

Zuletzt geändert von Ren_Yamamoto, Oct 2 2023 15:11:17

3822. PrincesoGuerrero,

Ahora mismo la página de BlindHelp está en mantenimiento.

~msgScore~: +0

3823. Zagreus,

talvez no les interese mucho, pero existe alter/ego. está bastante interesante, y es algo como un vocaloid, pero gratis, y se tiene que usar dentro de un daw, como reaper. aquí paso algo que yo hice, haciendo el cober de una canción:
https://1drv.ms/u/s!AgS04Pl7iLp2gdwLZJFKIE-NGxn38w?e=wCKohn
https://www.plogue.com/products/alter-ego.html
no me juzguen, fue de las primeras cosas que hice con esto. quedó mejor de lo que esperé.

~msgScore~: +0

3824. clapmauricio,

Cuando intenté usar Alter/Ego, no logré activar el botón para añadir una voz, tanpoco comprendí donde se escribe cada sílaba. Hay un addon o algo así para la accesibilidad?

~msgScore~: +0

3825. Marandina,

Estuve probando XTTS y está bastante genial, no te dejará la voz exactamente igual pero es divertido xD. Alguien sabe cómo se puede hacer tu propia página sin limitaciones de caracteres? Porque la página dice que se pueden hacer versiones personales.

~msgScore~: +0

Zuletzt geändert von Marandina, Oct 8 2023 17:50:57

3826. El-Megalovano,

Se que quizá alguien posteó aquí, pero de sintetizadores de hace 2 décadas recuerdo a Rhetorical TTS que soportaba voces multilíngües a poco no lo conocían?

~msgScore~: +0

3827. PrincesoGuerrero,

Yo lo conocía, pero nadie de nosotros lo pudo usar. Por dar un poco más de info, las voces eran buenísimas y eran el antecesor de lo que luego era scansofft.

~msgScore~: +0

3828. El-Megalovano,

A lo mejor eran màs para uso empresarial que para el consumidor, asì como pasa actualmente con las actuales voces de Cerence o RealSpeaker. No estoy seguro ya que yo no lo conocì hasta por allà del 2014.

~msgScore~: +0

3829. Caracolito,

Ooh sí, creo recordar que la dicción era algo exajerada, como marcando mucho algunas consonantes, pero sonaban muy bien.
Y una pregunta: ¿alguien tiene la versión 4 de las voces de Cepstral? Creo que esa era la mejorcita, en la 5 como que Miguel suena demasiado apagado...

~msgScore~: +0

3830. El-Megalovano,

Yo no las tengo desafortunadamente.
Volviendo a Piper y se que publiqué el registro en el hilo asociado al tema, pero me da un error al intentar hacer una voz multi-speaker mientras elijo una finetuned voice. O estoy haciendo algo mal? O las frases coinciden con otros locutores? O algunas pasaron el límite de 15 segundos?
Y habrá una posibilidad que Piper añada soporte para voces multilíngües a lo Rhetorical?

~msgScore~: +0

3831. FrancoBattiato,

Hola, buenas.
Oigan, hace poco vi un vídeo en el que mediante inteligencia artificial, hicieron cantar al presidente de México, entre otras personas famosas. Alguien tiene idea de como hacer eso? Me gustaría aprender como se hace eso.

~msgScore~: +0

3832. El-Megalovano,

Yo pensaba en hacer lo mismo con la voz de skibidi dob dob yes yes...

~msgScore~: +0

3833. Borja ,

No se, pero con omero jimiendo ya me traumé. Esto se fue al carajo.

~msgScore~: +0

3834. PrincesoGuerrero,

Ah no, esto ya es demasiado.
No, lo de hacer cantar y tal es con modelos de voice to voice, no tts. es lo que se habla en el hilo este de hacer covers con IA.

~msgScore~: +0

3835. El-Megalovano,

Ah pues nos equivocamos? Um perdón perdón...
Alguna solución con lo del problema de Piper?

~msgScore~: +0

3836. FrancoBattiato,

Homero gimiendo? Donde se puede escuchar eso?

~msgScore~: +0

3837. Laositadepeluche ,

juas como así? omero gimiendo? lóóóóóóóóóóóóól eso ni me lo esperaba! ups perdón por ese tipo de bromas jajaja mejor me dejo de bromas juas. enserio, donde se puede escuchar eso jajaja?

~msgScore~: +0

3838. FrancoBattiato,

@Osita, está en YouTube, ahí lo escuché

~msgScore~: +0

3839. PrincesoGuerrero,

Cuando lo encuentre y lo escuche, si me doy cuenta les digo, pero por ahora no se alarmen tanto. No creo que sea más que un audio de alguien gimiento transformado mediante vtv con la voz de Homero. Ya sería como demasiado recontra lol si también con TTS se llega a esto, cosa que no estamos tan lejos si tenemos en cuenta qué hace un TTS que funciona más o menos tipo GPT 3.5. Recordemos cómo se puede ir al carajo el coso en ElevenLabs cuando a ciertas voces le ponemos la estabilidad en 0.

~msgScore~: +0

3840. Caracolito,

Hola! No sé si este mensaje corresponde para el hilo de NVDA o este, pero allá vamos.
Estoy queriendo probar la nueva versión de Piper para NVDA, pero se queda mudo. En el registro me sale lo siguiente:
ERROR - external:synthDrivers.piper_neural_voices._process_speech_sequence (13:27:01.166) - piper4nvda_asyncio (7172):
Failed to execute speech task <synthDrivers.piper_neural_voices.SpeechTask object at 0x057AD148>
Traceback (most recent call last):
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices__init__.py", line 132, in _process_speech_sequence
await callable()
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices__init__.py", line 104, in __call__
async for wave_samples in stream:
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\tts_system.py", line 186, in synthesize
async for ret in stream:
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\grpc_client__init__.py", line 148, in speak
yield ret
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 573, in __aexit__
raise exc_val
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 563, in __aexit__
await self._maybe_finish()
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 533, in _maybe_finish
await self.recv_trailing_metadata()
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 497, in recv_trailing_metadata
self._raise_for_grpc_status(status, message, details)
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 356, in _raise_for_grpc_status
raise GRPCError(status, message, details)
grpclib.exceptions.GRPCError: (<Status.UNKNOWN: 2>, 'Failed to obtain results', None)
Se lo envié por email al desarrollador del complemento, pero se lo muestro a ustedes por si alguno sabe cómo arreglarlo o le pasa lo mismo.

~msgScore~: +0

4283 Nachrichten, 143 Seiten:  1; 126 127128 129 130; 143 ↖ Zurück zur Themenliste

Auf das Thema antworten

Sie müssen angemeldet sein, um posten zu können

Passwort vergessen? Benutzerkonto erstellen