ElevenLabs, sintetizador de voz con calidad insuperable, añadió soporte multilíngüe

168 messages, 6 pages:  1; 3 45 6 ↖ Retour à la liste des sujets

Score: +4

121. kirito,

creo que puede implementarse en un lector de pantalla, pero cobra por x cantidad de carácteres. Usarlo para un lector te saldría carísimo.

Score: +0

122. alfred,

Jamás veran esto en un lector de pantalla, a no ser que las PCs evolucionen tanto, que puedan ejecutar procesos de Inteligencia artificial, en tiempo real, con gráficas potentes, a un precio ascequible.

Score: +0

123. Braille_and_Speak2000,

Confirmo. Podríamos tener una GPU compatible y ejecutar con suerte un modelo reducido (si lo hicieran y no fuera este mismo que usamos en la nube) pero como mcho podríamos leer más o menos algo puntual bajo Sapi. Yo tengo un sintetizador japonés nada que ver a elevenLabs pero también usa vna IA neuronal para generar la síntesis, y se ejecuta en local, por GPU, que puede tomar un par de segunditos en generar el audio, y CPU (más lenta aun). Tiene su versión para Sapi pero no logré andarla.
Volviendo a elevenLabs, ¿alguien se animó a probar la futura clonación de voz por entrenamiento profesional?

Score: +0

124. proyecto_winter,

122. alfred, 26.05.2023 04:05
Jamás veran esto en un lector de pantalla, a no ser que las PCs evolucionen tanto, que puedan ejecutar procesos de Inteligencia artificial, en tiempo real, con gráficas potentes, a un precio ascequible.
pero esque Seleccionar Sintetizador diálogo. Sintetizador: cuadro combinado Piper Neural Voices contraído Alt+s

Score: +0

Dernière édition par proyecto_winter, 10.09.2023 06:20

125. alfred,

Que velocidad?

Score: +0

126. Dherhion,

¿Entrenamiento profesional? ¿cómo es eso?

Score: +0

127. Braille_and_Speak2000,

No recuerdo si mostré cómo quedó mi voz clonada de dicha forma. Acá tengo un audio: https://drive.google.com/file/d/1tSl0SCvM5M9ZyR7r34CTezBzFbVrPDCu/view?usp=drive_link
Hubo un formulario (que no sé si siga abierto) para probar esta funcionalidad de forma gratuita por 3 meses a partir del plan creators. en pocas palabras, tenemos que mandar mínimo media hora de audios de solo nuestra voz. ellos dan por óptimo 3 horas, pero solo habré grabado 30 minutos o poco más y a mi gusto quedó tal como esperaba.
Al proceso de entrenamiento supongo lo harán los muchachos (no sé hasta dónde es automático o manual el asunto) pero antes de eso tenemos que verificar que es nuestra voz la que grabamos. No podemos leer en pantalla lo que nos pone el sistema para leer durante la verificación, pero si se trata de personas ciegas ellos verifican manualmente.
Lo que puedo decir de todo esto es que me encantó mientras pude probarlo.

Score: +0

128. Dherhion,

¿Es verdad que es indistinguible de una IA? ¿hablas así de verdad?

Score: +0

129. Braille_and_Speak2000,

esa es mi voz, tal cuál. Lo único que sí sin duda es una modificación propia de la IA es esa forma de leer como si tuviera un ojo tan agudo, pero respeta mi timbre, entonación, acento...

Score: +0

130. alfred,

Mal acento en olvidó.

Score: +0

131. Braille_and_Speak2000,

Se viene algo groso por parte de ElevenLabs, chicos.
Nueva herramienta de doblaje automático en múltiples idiomas. ¿qué tal?
Y no hay que hacer otra cosa que subir un archivo, o insertar URL de YouTube, Tiktok o lo que venga, aparte de elegir sobre todo e lidioma destino. Obviamente, no esperen algo perfecto ya que sobre todo a la hora del canto ahí la IA o se va al carajo, o a veces lo deja en el idioma original, o a veces logra cantar algunas notas. Lo que sí, es que hace bastantes cosas detrás de escena. También conserva música y sonidos que puedan haber en el audio original. no creo que lo puedan usar de forma gratuita, y no me extraña que estuviese para los planes más caros nomás.

Score: +0

132. El-Megalovano,

Quizá es una respuesta a Rask y o a Heigen, aunque me equivoco ya que la de rask es cara...

Score: +0

133. alfred,

Estoy pagando eleven labs para un Proyecto que no sé si funcionará en términos económicos. Siento que debería ser más barato, ya que muchas veces hay que volver a generar la misma frase hasta que lo diga con la entonación apropiada. También el usarlo en español tiene el inconveniente de que a veces se le escapa a la voz un acento de norteamericano aprendiendo a hablar en español, y es ahí cuando hay que volver a generar.
A demás, las palabras en español usan más caracteres, por lo que quedamos dos veces discriminados.
Es una tecnología en fase beta. En probar y aprender a usar bien todas sus características, se te fueron los caracteres.
Por ejemplo el text to speech. Le da más emoción a las voces, pero te cobran el triple creo de caracteres. Ni lo uso por no gastar mis 100k. Hay que asegurarse de hablar bien o pasarle un buen audio, y aun así te puede generar algo peor que sin el STS.
Lamentablemente tienen el monopolio de ser de lejos las mejores voces.

Score: +0

134. Master_Jensen,

Para eso te piratiás la voz del Chat GPT, te conseguís una manera medio chunga de grabar el sonido interno del celular y tenés para rato jajajajaj… el problema es lo del acento de Norteamérica que es casi imposible de sacar

Score: +0

135. Braille_and_Speak2000,

Cómo pirateás el sintetizador de Open AI exacto? Lo más cercano que conozco, aunque después no me hago responsable por las repercusiones legales que puedan haber es, agarrarse una API Key agena, ya pagada, usar el complemento este para NVDA y generar lo que se te cante con el tts de Open AI. Otra manera no conozco, salvo que haya alguna web de esas tantas con tts en línea que integrara ese tts.

Score: +0

136. Baxcalibur,

alguien me aclara si son 10000 caracteres por mes, o son 10000 por cuenta.

Score: +0

137. Braille_and_Speak2000,

Por mes, en el plan gratuito.

Score: +0

138. alfred,

Piratear está bien si solo quieres jugar.

Score: +0

139. Baxcalibur,

Genial. con 10000 me alcanza, por ahora... jejeje.

Score: +0

140. Braille_and_Speak2000,

Che, ustedes encuentran lo que conocíamos como VoiceLabs? Porque yo no. a saber a dónde lo movieron.

Score: +0

141. Andytalecorner,

necesito una voz grave y neutra para un spot retro.
que voz de todas las que hay me recomiendan que use.

Score: +0

142. anna_ffiuffiu ,

holis. chicos, tengo una duda. en la página de eleven labs, como le hago para crear mi propio modelo de voz? quiero por ejemplo probar con la voz de Microsoft anna, pero no sé como crear el modelo en la página

Score: +0

143. alfred,

Para crear voces, si no estoy mal, hay qe contratar el modelo Creator, que está 22 dólares.

Score: +0

144. Aisanne,

oigan, para clonar mi propia voz de una manera óptima, que me recomiendan hacer?

Score: +0

145. Dherhion,

Irte a un estudio de grabación y grabar lo necesario en calidad decente con un equipo decente. el resto será basura.

Score: +0

146. anna_ffiuffiu ,

aaa bueno😱, que mal, es de pago, x, d...😢 pero bueno chic@s, gracias por aclarar mi duda. 🎤

Score: +0

147. Braille_and_Speak2000,

¿En serio? Y cómo logré yo una voz tan buena? jajaja, no lo digo por ser yo, sino que es realmente así.
Podemos clonar voces de forma instantánera (aunue hay que ir a un apartado que ahora mismo no sé dónde quedó) pero no va a quedar exactamente como debería.

Score: +0

148. El_oso_manzanoso,

estas voces se pueden usar para síntesis de voz en mac? O no.

Score: +0

149. Braille_and_Speak2000,

es en línea y solo en línea para todas las plataformas, es decir, como mucho se puede intentar algo con la API pero nada en plataforma local. La web en sí debería andar bien en MAC.

Score: +0

150. Aisanne,

joder derion tío, pues nada. de aquí a que me valla a un estudio, mejor desisto por que pa que. para que usar el micrófono del iPhone que grava en buena calidad si total... es una mierda eso también? :V

Score: +0

168 messages, 6 pages:  1; 3 45 6 ↖ Retour à la liste des sujets

Répondre au sujet

Vous devez être connecté pour pouvoir poster.

Mot de passe perdu ? Créer un compte