Hilo de ElevenLabs, un sintetizador de voz con calidad insuperable y procesador de sonidos

189 poruka, 7 stranica: 1…; 3 45 6 7 ↖ Vrati se nazad na listu tema

Skor: +5

121. kirito, 26 May 2023 03:59:10

creo que puede implementarse en un lector de pantalla, pero cobra por x cantidad de carácteres. Usarlo para un lector te saldría carísimo.

Skor: +0

122. alfred, 26 May 2023 04:05:44

Jamás veran esto en un lector de pantalla, a no ser que las PCs evolucionen tanto, que puedan ejecutar procesos de Inteligencia artificial, en tiempo real, con gráficas potentes, a un precio ascequible.

Skor: +0

123. PolloGuerrero, 5 Jun 2023 01:26:28

Confirmo. Podríamos tener una GPU compatible y ejecutar con suerte un modelo reducido (si lo hicieran y no fuera este mismo que usamos en la nube) pero como mcho podríamos leer más o menos algo puntual bajo Sapi. Yo tengo un sintetizador japonés nada que ver a elevenLabs pero también usa vna IA neuronal para generar la síntesis, y se ejecuta en local, por GPU, que puede tomar un par de segunditos en generar el audio, y CPU (más lenta aun). Tiene su versión para Sapi pero no logré andarla.
Volviendo a elevenLabs, ¿alguien se animó a probar la futura clonación de voz por entrenamiento profesional?

Skor: +0

124. Ren_Yamamoto, 10 Sep 2023 06:17:12

122. alfred, 26.05.2023 04:05
Jamás veran esto en un lector de pantalla, a no ser que las PCs evolucionen tanto, que puedan ejecutar procesos de Inteligencia artificial, en tiempo real, con gráficas potentes, a un precio ascequible.
pero esque Seleccionar Sintetizador diálogo. Sintetizador: cuadro combinado Piper Neural Voices contraído Alt+s

Skor: +0

Poslednja izmena od strane Ren_Yamamoto, 10 Sep 2023 06:20:41

125. alfred, 10 Sep 2023 11:21:35

Que velocidad?

Skor: +0

126. Dherhion, 10 Sep 2023 12:18:35

¿Entrenamiento profesional? ¿cómo es eso?

Skor: +0

127. PolloGuerrero, 10 Sep 2023 15:34:24

No recuerdo si mostré cómo quedó mi voz clonada de dicha forma. Acá tengo un audio: https://drive.google.com/file/d/1tSl0SCvM5M9ZyR7r34CTezBzFbVrPDCu/view?usp=drive_link
Hubo un formulario (que no sé si siga abierto) para probar esta funcionalidad de forma gratuita por 3 meses a partir del plan creators. en pocas palabras, tenemos que mandar mínimo media hora de audios de solo nuestra voz. ellos dan por óptimo 3 horas, pero solo habré grabado 30 minutos o poco más y a mi gusto quedó tal como esperaba.
Al proceso de entrenamiento supongo lo harán los muchachos (no sé hasta dónde es automático o manual el asunto) pero antes de eso tenemos que verificar que es nuestra voz la que grabamos. No podemos leer en pantalla lo que nos pone el sistema para leer durante la verificación, pero si se trata de personas ciegas ellos verifican manualmente.
Lo que puedo decir de todo esto es que me encantó mientras pude probarlo.

Skor: +0

128. Dherhion, 10 Sep 2023 15:45:58

¿Es verdad que es indistinguible de una IA? ¿hablas así de verdad?

Skor: +0

129. PolloGuerrero, 10 Sep 2023 17:34:25

esa es mi voz, tal cuál. Lo único que sí sin duda es una modificación propia de la IA es esa forma de leer como si tuviera un ojo tan agudo, pero respeta mi timbre, entonación, acento...

Skor: +0

130. alfred, 10 Sep 2023 18:36:59

Mal acento en olvidó.

Skor: +0

131. PolloGuerrero, 13 Oct 2023 04:04:08

Se viene algo groso por parte de ElevenLabs, chicos.
Nueva herramienta de doblaje automático en múltiples idiomas. ¿qué tal?
Y no hay que hacer otra cosa que subir un archivo, o insertar URL de YouTube, Tiktok o lo que venga, aparte de elegir sobre todo e lidioma destino. Obviamente, no esperen algo perfecto ya que sobre todo a la hora del canto ahí la IA o se va al carajo, o a veces lo deja en el idioma original, o a veces logra cantar algunas notas. Lo que sí, es que hace bastantes cosas detrás de escena. También conserva música y sonidos que puedan haber en el audio original. no creo que lo puedan usar de forma gratuita, y no me extraña que estuviese para los planes más caros nomás.

Skor: +0

132. El-Megalovano, 13 Oct 2023 14:14:09

Quizá es una respuesta a Rask y o a Heigen, aunque me equivoco ya que la de rask es cara...

Skor: +0

133. alfred, 26 Jan 2024 23:36:11

Estoy pagando eleven labs para un Proyecto que no sé si funcionará en términos económicos. Siento que debería ser más barato, ya que muchas veces hay que volver a generar la misma frase hasta que lo diga con la entonación apropiada. También el usarlo en español tiene el inconveniente de que a veces se le escapa a la voz un acento de norteamericano aprendiendo a hablar en español, y es ahí cuando hay que volver a generar.
A demás, las palabras en español usan más caracteres, por lo que quedamos dos veces discriminados.
Es una tecnología en fase beta. En probar y aprender a usar bien todas sus características, se te fueron los caracteres.
Por ejemplo el text to speech. Le da más emoción a las voces, pero te cobran el triple creo de caracteres. Ni lo uso por no gastar mis 100k. Hay que asegurarse de hablar bien o pasarle un buen audio, y aun así te puede generar algo peor que sin el STS.
Lamentablemente tienen el monopolio de ser de lejos las mejores voces.

Skor: +0

134. Deggial, 27 Jan 2024 04:04:51

Para eso te piratiás la voz del Chat GPT, te conseguís una manera medio chunga de grabar el sonido interno del celular y tenés para rato jajajajaj… el problema es lo del acento de Norteamérica que es casi imposible de sacar

Skor: +0

135. PolloGuerrero, 27 Jan 2024 15:03:52

Cómo pirateás el sintetizador de Open AI exacto? Lo más cercano que conozco, aunque después no me hago responsable por las repercusiones legales que puedan haber es, agarrarse una API Key agena, ya pagada, usar el complemento este para NVDA y generar lo que se te cante con el tts de Open AI. Otra manera no conozco, salvo que haya alguna web de esas tantas con tts en línea que integrara ese tts.

Skor: +0

136. Kyurem, 27 Jan 2024 16:34:16

alguien me aclara si son 10000 caracteres por mes, o son 10000 por cuenta.

Skor: +0

137. PolloGuerrero, 27 Jan 2024 17:08:59

Por mes, en el plan gratuito.

Skor: +0

138. alfred, 27 Jan 2024 19:03:43

Piratear está bien si solo quieres jugar.

Skor: +0

139. Kyurem, 27 Jan 2024 20:46:51

Genial. con 10000 me alcanza, por ahora... jejeje.

Skor: +0

140. PolloGuerrero, 27 Jan 2024 23:20:33

Che, ustedes encuentran lo que conocíamos como VoiceLabs? Porque yo no. a saber a dónde lo movieron.

Skor: +0

141. Chuy , 28 Jan 2024 00:41:41

necesito una voz grave y neutra para un spot retro.
que voz de todas las que hay me recomiendan que use.

Skor: +0

142. anna_ffiuffiu , 28 Jan 2024 04:18:30

holis. chicos, tengo una duda. en la página de eleven labs, como le hago para crear mi propio modelo de voz? quiero por ejemplo probar con la voz de Microsoft anna, pero no sé como crear el modelo en la página

Skor: +0

143. alfred, 28 Jan 2024 09:07:55

Para crear voces, si no estoy mal, hay qe contratar el modelo Creator, que está 22 dólares.

Skor: +0

144. el-prevoste, 28 Jan 2024 09:48:24

oigan, para clonar mi propia voz de una manera óptima, que me recomiendan hacer?

Skor: +0

145. Dherhion, 28 Jan 2024 10:01:12

Irte a un estudio de grabación y grabar lo necesario en calidad decente con un equipo decente. el resto será basura.

Skor: +0

146. anna_ffiuffiu , 28 Jan 2024 13:17:25

aaa bueno😱, que mal, es de pago, x, d...😢 pero bueno chic@s, gracias por aclarar mi duda. 🎤

Skor: +0

147. PolloGuerrero, 28 Jan 2024 20:03:58

¿En serio? Y cómo logré yo una voz tan buena? jajaja, no lo digo por ser yo, sino que es realmente así.
Podemos clonar voces de forma instantánera (aunue hay que ir a un apartado que ahora mismo no sé dónde quedó) pero no va a quedar exactamente como debería.

Skor: +0

148. Ricochet, 28 Jan 2024 20:05:58

estas voces se pueden usar para síntesis de voz en mac? O no.

Skor: +0

149. PolloGuerrero, 28 Jan 2024 22:42:12

es en línea y solo en línea para todas las plataformas, es decir, como mucho se puede intentar algo con la API pero nada en plataforma local. La web en sí debería andar bien en MAC.

Skor: +0

150. el-prevoste, 29 Jan 2024 14:19:16

joder derion tío, pues nada. de aquí a que me valla a un estudio, mejor desisto por que pa que. para que usar el micrófono del iPhone que grava en buena calidad si total... es una mierda eso también? :V

Skor: +0

189 poruka, 7 stranica: 1…; 3 45 6 7 ↖ Vrati se nazad na listu tema

Skoči na vrh ↑
Skoči na sadržaj ↑

Odgovori na temu

Morate da se prijavite kako biste mogli da pišete