Deportes

El nuevo modelo de personaje. AI genera videos interactivos usando imagen y audio

El nuevo modelo de personaje. AI genera videos interactivos usando imagen y audio
La nueva característica funciona con un transformador de difusión

¿Cuál es la historia?

Personaje.ai, un GoogleLa puesta en marcha de propiedad de propiedad, ha lanzado un modelo de IA de vanguardia llamado TalkingMachines. La tecnología innovadora permite a los usuarios generar videos interactivos simplemente proporcionando una imagen y entrada de audio. La nueva característica funciona con un transformador de difusión (DIT), que emplea la destilación de conocimiento asimétrico para convertir modelos de video bidireccionales de alta calidad en generadores rápidos en tiempo real.

Avance tecnológico

Cómo funciona el modelo de TalkingMachines

El modelo TalkingMachines escucha audio y anima partes de la cara de un personaje, como la boca, la cabeza y los ojos. Esto se hace sincronizado con cada palabra, pausa y entonación. El personaje.Ai está utilizando un módulo de audio de parámetro 1.2b personalizado para la voz, capaz de capturar el habla y el silencio. La compañía afirma que este nuevo modelo puede generar videos de alta calidad sin comprometer la consistencia o la calidad de la imagen. Apoya una variedad de estilos, desde humanos fotorrealistas hasta personajes de anime y avatares 3D.

Protección del usuario

Función de llamadas para conversaciones de voz

En respuesta a las críticas pasadas sobre la seguridad del usuario, el carácter. AI ha introducido nuevas herramientas de supervisión para proteger a los usuarios menores de 18 años. La compañía también ha agregado constantemente nuevas características como Avatarfx, escenas y transmisiones. Después OpadaiEl modo de voz avanzado, el inicio incluso introdujo una función de llamadas que permite a los usuarios tener conversaciones de voz con sus personajes elegidos para un compromiso mejorado.

Enlace de origen

Publicaciones relacionadas

Botón volver arriba