Hilo oficial sobre los sintetizadores de voz

4339 Nachrichten, 145 Seiten: 1…; 126 127128 129 130…; 145 ↖ Zurück zur Themenliste

~msgScore~: +42

3811. Exink, Sep 30 2023 05:58:44

Entrenar un modelo con kits es lo más simple del mundo, tanto que ya tengo dos modelos publicados. Lo malo es que ahora está muy, muy limitado en su uso, pero el entrenamiento es tan fácil como cargar uno o más audios en el dataset que no superen los 10 minutos, especificar si se trata de un cantante o personaje, el idioma y demás cuestiones, y cuando todo esté listo se le da a "train". Al menos, así fue la última vez que lo usé hace unas semanas.

~msgScore~: +0

3812. Mi-Recinto, Sep 30 2023 06:24:48

en qué sentido está limitado el este?

~msgScore~: +0

3813. Ren_Yamamoto, Sep 30 2023 14:45:58

planes premium nuevos que nos mandan a los free a la mierd…

~msgScore~: +0

3814. Mi-Recinto, Sep 30 2023 17:55:10

aaa. pero, cuanto tiempo deja usar una voz, por ejemplo, pongo un audio o audios que no superen los 10 mins, cuanto tiempo deja digamos usarlos para covers y así una vez entrenado el modelo?

~msgScore~: +0

3815. un_oso, Oct 1 2023 02:30:21

lo que ago es doy click aquí. New voice visitado enlace. luego di click donde dice create. me aparece un diálogo, simple mente le doy en continue. subo mis audios pero cuando intento continuar, me aparece esto. botón no disponible Continue. no se que esté haciendo mal, o que tenga que hacer en el dataser¿t. los audios que subo son de aprox 15 segundos

~msgScore~: +0

3816. Mi-Recinto, Oct 1 2023 05:06:29

yo ya pude iniciar con el entrenamiento, pero, me dice que tengo que verificar mi número, lo pongo, me llega el código, pero, la pag como que laguea y sale un error de aplicación o algo así, y si intento recargar pues lo mismo

~msgScore~: +0

3817. inuyassha, Oct 1 2023 19:16:17

holaa jente bonita, pregunta curiosa, será que me pueden compartir el bocaloiz? y gracias a quien me pueda ayudar.

~msgScore~: +0

3818. Mi-Recinto, Oct 2 2023 00:37:32

esonosepideporaquí

~msgScore~: +0

3819. Ren_Yamamoto, Oct 2 2023 05:09:09

oye, pobre man, del ilo de NVDA alguien lo mandó acá, tons hay que ir a putear al wei que lo mandó pa acá. a digo adjgkdgjlasdfjlkñ, anda, al menos díganle a donde preguntar, no sean malos :D

~msgScore~: +0

3820. Mi-Recinto, Oct 2 2023 05:19:37

antes yo obtenía cosillas de blindhelp project, pero, creo que esa pag ya no anda.

~msgScore~: +0

3821. Ren_Yamamoto, Oct 2 2023 15:10:08

para @inuyassha, creo que hay un hilo que dice como hacer cantar al jaws? o algo así, y ahí pasan tipo música con vocaloid y cosas así. podrías intentar, si quieres y si te animas a postear lebanto ilo para que puedas pedirlo, no se, pondr´3e posteo a petición de @unmanquequierevocaloid, y yata. Edit: el ilo se llama: alguien sabe hacer cantar al jaws?

~msgScore~: +0

Zuletzt geändert von Ren_Yamamoto, Oct 2 2023 15:11:17

3822. PolloGuerrero, Oct 2 2023 15:22:18

Ahora mismo la página de BlindHelp está en mantenimiento.

~msgScore~: +0

3823. Zagreus, Oct 2 2023 15:25:32

talvez no les interese mucho, pero existe alter/ego. está bastante interesante, y es algo como un vocaloid, pero gratis, y se tiene que usar dentro de un daw, como reaper. aquí paso algo que yo hice, haciendo el cober de una canción:
https://1drv.ms/u/s!AgS04Pl7iLp2gdwLZJFKIE-NGxn38w?e=wCKohn
https://www.plogue.com/products/alter-ego.html
no me juzguen, fue de las primeras cosas que hice con esto. quedó mejor de lo que esperé.

~msgScore~: +0

3824. clapmauricio, Oct 3 2023 13:31:41

Cuando intenté usar Alter/Ego, no logré activar el botón para añadir una voz, tanpoco comprendí donde se escribe cada sílaba. Hay un addon o algo así para la accesibilidad?

~msgScore~: +0

3825. kanji-tatsumi, Oct 8 2023 17:48:48

Estuve probando XTTS y está bastante genial, no te dejará la voz exactamente igual pero es divertido xD. Alguien sabe cómo se puede hacer tu propia página sin limitaciones de caracteres? Porque la página dice que se pueden hacer versiones personales.

~msgScore~: +0

Zuletzt geändert von kanji-tatsumi, Oct 8 2023 17:50:57

3826. El-Megalovano, Oct 20 2023 10:34:23

Se que quizá alguien posteó aquí, pero de sintetizadores de hace 2 décadas recuerdo a Rhetorical TTS que soportaba voces multilíngües a poco no lo conocían?

~msgScore~: +0

3827. PolloGuerrero, Oct 20 2023 13:51:00

Yo lo conocía, pero nadie de nosotros lo pudo usar. Por dar un poco más de info, las voces eran buenísimas y eran el antecesor de lo que luego era scansofft.

~msgScore~: +0

3828. El-Megalovano, Oct 20 2023 20:51:54

A lo mejor eran màs para uso empresarial que para el consumidor, asì como pasa actualmente con las actuales voces de Cerence o RealSpeaker. No estoy seguro ya que yo no lo conocì hasta por allà del 2014.

~msgScore~: +0

3829. Caracolito, Oct 20 2023 22:11:07

Ooh sí, creo recordar que la dicción era algo exajerada, como marcando mucho algunas consonantes, pero sonaban muy bien.
Y una pregunta: ¿alguien tiene la versión 4 de las voces de Cepstral? Creo que esa era la mejorcita, en la 5 como que Miguel suena demasiado apagado...

~msgScore~: +0

3830. El-Megalovano, Oct 22 2023 04:40:41

Yo no las tengo desafortunadamente.
Volviendo a Piper y se que publiqué el registro en el hilo asociado al tema, pero me da un error al intentar hacer una voz multi-speaker mientras elijo una finetuned voice. O estoy haciendo algo mal? O las frases coinciden con otros locutores? O algunas pasaron el límite de 15 segundos?
Y habrá una posibilidad que Piper añada soporte para voces multilíngües a lo Rhetorical?

~msgScore~: +0

3831. FrancoBattiato, Oct 24 2023 07:02:25

Hola, buenas.
Oigan, hace poco vi un vídeo en el que mediante inteligencia artificial, hicieron cantar al presidente de México, entre otras personas famosas. Alguien tiene idea de como hacer eso? Me gustaría aprender como se hace eso.

~msgScore~: +0

3832. El-Megalovano, Oct 24 2023 15:30:11

Yo pensaba en hacer lo mismo con la voz de skibidi dob dob yes yes...

~msgScore~: +0

3833. Borja , Oct 24 2023 15:36:19

No se, pero con omero jimiendo ya me traumé. Esto se fue al carajo.

~msgScore~: +0

3834. PolloGuerrero, Oct 24 2023 16:04:03

Ah no, esto ya es demasiado.
No, lo de hacer cantar y tal es con modelos de voice to voice, no tts. es lo que se habla en el hilo este de hacer covers con IA.

~msgScore~: +0

3835. El-Megalovano, Oct 24 2023 21:48:50

Ah pues nos equivocamos? Um perdón perdón...
Alguna solución con lo del problema de Piper?

~msgScore~: +0

3836. FrancoBattiato, Oct 24 2023 22:36:39

Homero gimiendo? Donde se puede escuchar eso?

~msgScore~: +0

3837. Laositadepeluche , Oct 24 2023 22:45:35

juas como así? omero gimiendo? lóóóóóóóóóóóóól eso ni me lo esperaba! ups perdón por ese tipo de bromas jajaja mejor me dejo de bromas juas. enserio, donde se puede escuchar eso jajaja?

~msgScore~: +0

3838. FrancoBattiato, Oct 25 2023 06:26:15

@Osita, está en YouTube, ahí lo escuché

~msgScore~: +0

3839. PolloGuerrero, Oct 25 2023 13:36:13

Cuando lo encuentre y lo escuche, si me doy cuenta les digo, pero por ahora no se alarmen tanto. No creo que sea más que un audio de alguien gimiento transformado mediante vtv con la voz de Homero. Ya sería como demasiado recontra lol si también con TTS se llega a esto, cosa que no estamos tan lejos si tenemos en cuenta qué hace un TTS que funciona más o menos tipo GPT 3.5. Recordemos cómo se puede ir al carajo el coso en ElevenLabs cuando a ciertas voces le ponemos la estabilidad en 0.

~msgScore~: +0

3840. Caracolito, Oct 31 2023 18:39:23

Hola! No sé si este mensaje corresponde para el hilo de NVDA o este, pero allá vamos.
Estoy queriendo probar la nueva versión de Piper para NVDA, pero se queda mudo. En el registro me sale lo siguiente:
ERROR - external:synthDrivers.piper_neural_voices._process_speech_sequence (13:27:01.166) - piper4nvda_asyncio (7172):
Failed to execute speech task <synthDrivers.piper_neural_voices.SpeechTask object at 0x057AD148>
Traceback (most recent call last):
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices__init__.py", line 132, in _process_speech_sequence
await callable()
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices__init__.py", line 104, in __call__
async for wave_samples in stream:
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\tts_system.py", line 186, in synthesize
async for ret in stream:
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\grpc_client__init__.py", line 148, in speak
yield ret
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 573, in __aexit__
raise exc_val
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 563, in __aexit__
await self._maybe_finish()
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 533, in _maybe_finish
await self.recv_trailing_metadata()
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 497, in recv_trailing_metadata
self._raise_for_grpc_status(status, message, details)
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 356, in _raise_for_grpc_status
raise GRPCError(status, message, details)
grpclib.exceptions.GRPCError: (<Status.UNKNOWN: 2>, 'Failed to obtain results', None)
Se lo envié por email al desarrollador del complemento, pero se lo muestro a ustedes por si alguno sabe cómo arreglarlo o le pasa lo mismo.

~msgScore~: +0

4339 Nachrichten, 145 Seiten: 1…; 126 127128 129 130…; 145 ↖ Zurück zur Themenliste

Nach oben springen ↑
Zum Inhalt springen ↑

Auf das Thema antworten

Sie müssen angemeldet sein, um posten zu können