691. AlexGasch,
Hola chic@s. Yo sigo sin entender como hacer funcionar replay, porque lo probé con NVDA y ni modo, no me funciona. Tienen un tutorial de como hacerlo funcionar? Miré el de gera, y no me aclaré xd
Score: +0
889 messages, 30 pages: 1…; 22 2324 25 26…; 30 ↖ Retour à la liste des sujets
Score: +16
Hola chic@s. Yo sigo sin entender como hacer funcionar replay, porque lo probé con NVDA y ni modo, no me funciona. Tienen un tutorial de como hacerlo funcionar? Miré el de gera, y no me aclaré xd
Score: +0
bueno bueno! al fin he logrado crear mi propio modelo de voz, y más encima a la primera. ahora, dentro de la carpeta que nos has obsequiado y o compartido tan amablemente estimado grego, tenemos replay. la pregunta es: ¿Cómo inserto mi modelo de voz en dicho programa? he revisado todas las opciones pero no encuentro un apartado donde me permita añadirlo. obviamente, la pregunta también va para aquellos que ya han trabajado con este programa.
Score: +0
chiquilines, en replay puedo crear mi propio modelo de voz?
Score: +0
kaladin-bendito-por-la-tormenta: sefirot, hay alguna forma de quitarle la respiración al tema que grabaste? digo, por cada vez que comenzaba...: ayer 21:10 17 de 28: ¿Cómo así?
Score: +0
bueno, se pone silencio donde respire y debería quedar, Creo yo.
Claro, eso en un editor de audio. Aunque si respira, quiero pensar que así es el tema original, no creo que le quite o le ponga algo.
Score: +0
La primera vez que se abre el replay, va a pedir que descargues algo. Para eso es mejor utilizar el narrador. Ya con las actualizaciones, el OCR del NVDA resuelve. Para Anita, no... replay solamente es para hacer las inferencias
Score: +0
va, jajjajajaj. cual página recomiendan para eso mis chicuelos?
Score: +0
anna_fiufiu: holis, tengo una consulta. pues, por ejemplo. quiero hacer cantar una de las voces de Microsoft. hmm,...: ayer 21:03 12 de 28: sí se Puede, todas las voces que he clonado, exceptuando a Valeria, son Voces en Inglés, clonadas a partir de Audios en Inglés, y aquí están, cantando en español
Score: +0
Dernière édition par Sephiroth, 21.01.2024 17:50
ea, gracias! pero otro problema... estuve escuchando el tutorial de grego. y al momento de buscar la celda 2, presiono la letra b para poder irme al botón que dice, ejecutar celda. pero, no pasa nada...
Score: +0
Dernière édition par anna_ffiuffiu , 21.01.2024 18:01
he instalado la última versión de replay. he utilizado narrador pero no lee nada. también he recurrido al modo OCR pero no logra leer, puesto que me dice que el contenido no está disponible. ahora, según entiendo por lo que leo, este programa solo sirve para hacer las insidencias, sea lo que sea. pero, si quiero utilizar el modelo de voz creado, ¿dónde lo utilizo? he de ir a algún sitio web? leí como 3 páginas más atrás, pero hignoro si alguien ha escrito algún tutorial con el paso a paso. edito el mensaje para realizar un pequeño alcance. ingresé a voicemi.ai, y no hay forma en que logre iniciar sesión. ni con correo, ni con Google, ni cambiando de navegador. el sitio tiene problemas o no se. si alguien tiene algún otro sitio que sea útil, se lo agradecería. y sigo sin saber como utilizar el modelo de voz creado. :v
Score: +0
Dernière édition par kaladin-bendito-por-la-tormenta, 22.01.2024 03:42
chicos chicos vamos a la calma. Paso a explicar lo de replay por que hay cosas que no las lee así nomas.
Hace un tiempo atrás se hizo un tutorial referente a esto.
para aquellos que tengan NVDA o JAWS, tienen que usar OCR por que la primera vez tienen que descargar algunas cosas y maximizar la ventana.
ahora les vengo con una novedad para no enrrollarse tanto con replay.
Resulta que IA hispano actualizó el colab, y también el applio a la versión v3.
les voy a pasar el colab que es mucho más rápido, para aquellos que no les funciona el replay, aquí tienen.
link:
https://colab.research.google.com/github/iahispano/applio/blob/master/assets/Applio.ipynb
aquí una demo:
https://drive.google.com/file/d/1uyH0YhpnoURJkQvEu_LE7gnBmuvRI5oo/view?usp=sharing
Score: +0
Dernière édition par grekmusic33, 22.01.2024 12:35
bueeena grego!. caray, no me había fijado en ese detallito. sí, ahora si me lee. no sabía que se podía maximizar la ventana, creía que venía por defecto. en estos momentos estoy descargando la data. de todos modos, descargaré el archivo de más arriba, por si acontece cualquier cosa.
Score: +0
tengan cuidado con google colab ya que a google no le gusta para nada todo lo que tenga que ver con rvc y les pueden banear la cuenta
lo más recomendable es utilizar una cuenta secundaria. a menos que pagues la versión pro ay menos probabilidades que te baneen pero no estoy seguro
Score: +0
mira, que interesante. lo que es yo, quería preguntarles. alguien tiene problemas para iniciar el servidor en el cuaderno de entrenamiento? denante pude conectar pero, tuve que reiniciar el compu. al rato después al ejecutar el link, solo se queda cargando. por lo cual, no se puede ejecutar la celda 0, ya que al presionar en ejecutar, esta no carga. ojalá se arregle pronto. borré mi modelo anterior, ya que ese solo tenía uno scuantos segundos de mi voz. solo unos 39 segundos. el de ahora tiene más de 40 minutos así que...
Score: +0
@gregodejesus32, gracias amigo, por otro lado, estos programas que mencionas ocupan mucho espacio en disco? Mi lap es de 8 de ram, pero ahora tiene poca memoria en disco
Score: +0
eaea, al fin. he terminado con mi modelito. le tomó una hora con 50 minutitos! terminan pesando como 1.9 gb los modelos. ahora vamo a velrlrl que tal suena con ese entrenamiento intensivo! ya estoy trabajando en una pista xd. edito mensaje para informar. pos bueno, el archivo pth que es el modelo de voz, terminó pesando poco más de 53 megas. en el replay, veo que hay modelos más pesados. ósea de mejor calidad. como soy nuevo en esto, supongo que tendré que ir viendo como va el asunto. ahora, creo un tema cambiando la voz, y resulta que en los tonos altos como que se rompe. vamos, como si estuviese atragantado. sería genial si los compañeros compartiesen los parámetros asignados en cada configuración aplicada en replay, aparte de que me suena algo baja la voz. y ni siquiera se me parece! jojoj
Score: +0
Dernière édition par kaladin-bendito-por-la-tormenta, 23.01.2024 05:04
FrancoBattiato: para el replay se necesita máximo 8 de ram. Para el colab puedes entrenar o hacer inferencias (con el colab mas actualizado voy a investigar como entrenar) sin problemas
Score: +0
Para @Kaladin. Hay que tomar varias cosas en cuenta a la hora de entrenar un modelo para evitar lo del trapo en la boca: Primero, mientras más cantidad de palabras diferentes haya en los audios, mucho mejor. Segundo: Procura que la voz que vayas a utilizar para hacer tu inferencia, tenga el menor ruido posible de instrumentos o lo que sea. eso también daña la cosa. Y ese giga y pico que te pesa el modelo es porque incluye archivos de respaldo. Pero los dos archivos que se utilizan no suelen pasar de los 300 megas y algo juntos. El tiempo que pueda durar cuando solo tenemos la CPU, dependerá de que tipo tengamos. Por Ejemplo, En un Intel Celeron CPU 1007U @ 1.50GHz con dos núcleos y 6 GB de ram, una inferencia de tres minutos, el proceso me dura una hora. Mientras que en otro I7 con tres GHZ y algo más que no recuerdo de ocho núcleos y 8 de ram, el proceso solo dura de 20 a 25 minutos para una inferencia de 4 minutos. Otra cosita: Siempre pongan las épocas que por lo menos lleguen a las 150. Yo para evitar que se me acabe el tiempo, pongo entre 170 y 180. unas 3 horas y tantito que me permite terminar bien
Score: +0
Dernière édition par El-Loro-Azul, 23.01.2024 09:51
otro colab para hacer inferencias:
https://colab.research.google.com/drive/1Gj6UTf2gicndUW_tVheVhTXIIYpFTYc7?usp=sharing
Score: +0
no puedo hacer que ese colab se me egecute, sale error, o se termina desconectando.
Score: +0
hola muchachos, nuevamente por aquí, pero en esta oportunidad para brindar unos tips, por si les interesa. después de tanto probar modelo a modelo, y minutos de larga espera aunque allá acortado los audios al mínimo con solo muestras de 25 minutos, en ir probando cada cosa al final, fue consumiendo tiempo. en fin, así son las cosas. la mejor forma de crear nuestras propias pistas con nuestra voz, es usando replay, obviamente. ahora, en las configuraciones, les recomiendo esto. va para aquellos que lo usen por primera vez o, que no sepan bien como usarlo a aquellos que ya se mueven con él. en las configuraciones, dejar desmarcadas la primer casilla y la segunda. la primera es para convertir todo pero sin cambios en la voz. y la segunda, solo retira todos los instrumentos, dejando el audio de la voz solamente. ahora si, lo interesante. como decía, he probado todos los modelos o parámetros para elegir el mejor. el que no se corte, el que no genere vocalizaciones estrañas y, que no se rompa al momento de subir de tono mientras se canta. lo primero, es que en el apartado donde dice relative pich, eso ha de quedar en menos 1. por qué se los digo, más que nada por la cercanía al tono apropiado de las conciones. si lo dejan muy bajo, cantará ronco. hacia la izquierda dejándole en menos 12, será una voz masculina profunda. demasiado en mi caso, ya que yo ya poseo voz de ese tipo. y lo mismo con el mas 12, que hace la voz más fina. demasiado en este caso. el valor 0 podría ser, para voces que son más acordes. respecto a música no se como se les llama. no sabría definir entre tener, falsete y así, pero a mi me queda bien con menos 1. eso por un lado. ahí jugueteen con ella por si quieren algo más acorde. ahora si! me doy muchas vueltas jaja. bueno, lo importante. stem audio o el tipo de modelo de stem. hay 11. por desgracia, solo 4 funcionan si no mal lo recuerdo y el resto no sirven puesto que hay que bajarlos pero, el que yo les recomiendo es este: ✅ UVR-MDX-NET Karaoke y en el siguiente apartado donde escogimos un modelo o más bien el método para detectar el tono, lo dejaremos en pm. el rpe es bueno, pero no deja los audios tan limpios como uno quisiera. yo lo dejé en pm con menos 1, y jamás se rompió la voz cuando subía o bajaba de tono. pos eso, espero les sirva por lo menos, ya que con tanta prueba y error uno termina rompiendo algo, o solucionando algo. saludos.
Score: +0
a carai que no el pm era malo?
Score: +0
edito el mensaje. esto es un asco! me creé una cuenta nueva. al parecer, tendré que comprar colab pro, ya que esta cosa cuando le colocas mas de 200 se desconecta. de echo, está desconectado pero sigue trabajando recién va en el entrenamiento 109 y sigue trabajando pero no saco nada con esperar a que finalice si, al final cuando quiera conectar no podré guardar el proceso. cada vez que lo intenté me tiraba un error. habrá otro cuaderno que no sea tan tikismikis?
Score: +0
Dernière édition par kaladin-bendito-por-la-tormenta, 25.01.2024 18:08
alguien sabe usar ultimate vocal remover?
Suena interesante, no vendría mal un pequeño tutorial.
Score: +0
que cuaderno utilizaste para el entrenamiento? kaladin-bendito-por-la-tormenta: edito el mensaje. esto es un asco! me creé una cuenta nueva. al parecer, tendré que comprar colab pro,...: ayer 03:57
Score: +0
En el canal reaper español hay un tutorial de ese vocal remover. Y para Kaladin, lo que pasa es que solo puedes hacer un modelo por día. Creo que te dan cinco horas por cada ejecución. Una vez termines un modelo, lo mejor es no usar el tiempo que sobre, y esperar al día siguiente justo una hora después de que terminaste. Yo lo hago así
Score: +0
aa... ok, tendré que checarlo.
Score: +0
hola una pregunta , alguna página que deje crear cobers? pero que no sean limitados como la de cobers ia , algo así
Score: +0
Hola chicos, yo aquí apareciendo nuevamente con otro cover echo con replay. Esta voz es la de rosie tts. Espero les guste: https://www.dropbox.com/scl/fi/k5bqnrugrouibp2g8a3f2/rosie-cobarde-cover-IA.mp3?rlkey=ah622ar53n1gumjbd4aji0lgs&dl=0
Score: +0
para angel19. sí, utilizo el cuaderno que nos dejó gregodejesus en el rar que nos compartió. gracias a firetunes, por la explicación. ya se, que puedo seguir utilizando el cuaderno. extendiendo un poco más la explicación para ángel, resulta que, al final si pude crear mi modelo con 200 entrenamientos. sucede que, efectivamente se desconecta, pero al finalizar se conecta solo. la otra vez que perdí la información fue, porque dejé demasiado tiempo la página en espera, provocando que no se pudiese conectar. lo que si me llama la atención, es que gracias al usuario rovertino21, hay algo que me deja pensativo. el cober me encantó. de donde extraen esos tts? suenan clarísimos. respecto a mi voz, no logro entender porqué la IA me pone demasiados efectos si, en replay no figura nada de eso. le mete demasiado autotune, si lo pudiese decir de otra forma. no se si será por mi tipo de voz, pero. solo las canciones que son de notas bajas suenan bien, aunque siguen teniendo ese vizo de voz tts entre lector de pantalla y algo de efecto. y al final, pese a los 200 entrenamientos, la calidad sigue baja con una voz baja. siendo que, con el último proyecto le aumenté un poco el volumen. he visto modelos que están para descargarse, que pesan muchísimo lo cual me da la idea de que son mejores. ahora, al ser un programa de uso gratuito, supongo que la calidad de conversión no es la mejor. siempre y cuando, el cuaderno que estoy usando tienda a crear modelos con ese tipo de calidad. hay una chica que no recuerdo su nombre, que creo que hizo una pista con su voz. quedé maravillado por la potencia, la claridad y el proceso llevado a cabo. no puedo ahcer que mi voz sea de una calidad superior. a menos que, el micrófono de mis audífonos gamer no sean tan buenos. por lo menos se, que cuando escucho mi voz con dicho micrófono, la escucho bien, pero no perfecta como con los micrófonos profesionales que tengo. y no lo he echo, de pura flojera. grabar por mucho tiempo sin nada que decir en particular o leer un libro, creo que me afiebra un poco. ahora, si cantara mientras grabo, será posible que, mejore mucho más la pronunciación y, que desaparezca esa forma de ser una voz sintetizada? perdón si me extiendo pero necesitaba explicarme bien. ahora, hay unos cobers de los que estoy francamente enamorado. no tienen nada que ver, con los que he visto aquí. los que nos han presentado son buenísimos, pero el que he escuchado en YouTube con la voz de Luis miguel interpretando openings de dragon ball son una pasada pero monumental. ahora, he estado averiguando y, resulta que para tener algo así, hay que pagar. y mucho, ojo. he visto planes astronómicos. alguien conoce algún programa, cuaderno o sitio que, ofrezca estas prestaciones? es curioso que, con los planes premium, suponiendo que fuese por ello, las voces no tienen respiraciones, rupturas en los cambios de notas, ni efectos aberrantes, como los que se suelen oír en los entrenamientos con el cuaderno de colav o con replay.
Score: +0
889 messages, 30 pages: 1…; 22 2324 25 26…; 30 ↖ Retour à la liste des sujets
Vous devez être connecté pour pouvoir poster.