Avatar Lip Sync 3D

Aplicación Flutter para sincronización labial de avatar 3D con audio en tiempo real.

Descripción

Esta aplicación permite sincronizar los movimientos labiales de un avatar 3D con audio en tiempo real o pregrabado. Utiliza técnicas avanzadas de análisis fonético, control facial y transiciones suaves para lograr una sincronización labial realista y natural.

Características Principales

1. Análisis Fonético del Audio

Detección de 25 fonemas mapeados a 15 visemas específicos
Ajuste dinámico de intensidad según el nivel de audio
Simulación de análisis espectral para determinar fonemas

2. Control Facial Avanzado

Sistema de blendshapes para control preciso de expresiones faciales
Parpadeo natural con timing variable y aleatorio
Micro-expresiones faciales sincronizadas con el habla
Movimientos coordinados de mandíbula, mejillas y lengua

3. Interpolación Suave entre Visemas

Transiciones adaptativas según el contexto fonético
Sistema de anticipación para movimientos más naturales
Curvas de aceleración para animaciones orgánicas
Proyección de tendencias basada en historial de visemas

Requisitos

Flutter 2.10.0 o superior
Dart 2.16.0 o superior
Dispositivo con soporte para renderizado 3D (OpenGL ES 3.0 o superior)
Espacio de almacenamiento: 100MB mínimo

Instalación

Clona este repositorio:

git clone https://github.com/webmasterscity/avatar_lip_sync.git

Navega al directorio del proyecto:

cd avatar_lip_sync

Instala las dependencias:

flutter pub get

Ejecuta la aplicación:

flutter run

Uso

Modo Básico

Inicia la aplicación
Selecciona un archivo de audio o utiliza el micrófono
Observa cómo el avatar mueve los labios sincronizados con el audio

Modo Avanzado

Navega a la pantalla "Avatar 3D con Lipsync Avanzado"
Ajusta los parámetros de sincronización:
- Duración de transición (50-200ms)
- Factor de anticipación (0-50%)
Selecciona un archivo de audio o utiliza el micrófono
Observa la sincronización labial avanzada con transiciones suaves

Personalización

Avatar Personalizado

Puedes crear tu propio avatar 3D realista visitando Ready Player Me:

Crea un avatar personalizado (con foto o manualmente)
Descarga el modelo en formato GLB
Reemplaza el archivo assets/avatar.glb en el proyecto

Ajustes de Sincronización

Modifica los parámetros en lib/controllers/advanced_lipsync_controller.dart:

baseTransitionDuration: Duración base de transición entre visemas
anticipationFactor: Factor de anticipación para movimientos naturales
Mapeo de fonemas a visemas en PhoneticAnalyzer.phonemeToViseme

Arquitectura

La aplicación está estructurada en tres capas principales:

Capa de UI: Widgets y pantallas para la interfaz de usuario
- lib/screens/: Pantallas principales
- lib/widgets/: Componentes reutilizables
Capa de Control: Lógica de sincronización labial
- lib/controllers/phonetic_lipsync_controller.dart: Análisis fonético básico
- lib/controllers/advanced_lipsync_controller.dart: Interpolación y control avanzado
Capa de Modelo: Datos y estructuras
- lib/models/: Definiciones de datos y estructuras

Limitaciones Actuales

La detección de fonemas es simulada; una implementación real requeriría análisis de audio avanzado
No todos los modelos GLB tienen los mismos blendshapes, lo que puede afectar la calidad
El rendimiento puede variar en dispositivos de gama baja
La integración JavaScript para control de blendshapes puede tener limitaciones en algunas plataformas

Próximos Pasos

Implementar análisis de audio real con FFT
Integrar modelo ML para detección precisa de fonemas
Optimizar rendimiento con procesamiento en isolates
Mejorar compatibilidad con diferentes estructuras de modelos 3D

Documentación Adicional

Licencia

Este proyecto está licenciado bajo la Licencia MIT - ver el archivo LICENSE para más detalles.

Créditos

Avatar 3D: Ready Player Me
Modelo de visemas: Basado en investigaciones de Disney y Carnegie Mellon University
Implementación Flutter: Desarrollado por Manus Agent

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
android		android
assets		assets
docs		docs
ios		ios
lib		lib
linux		linux
macos		macos
test		test
web		web
windows		windows
.gitignore		.gitignore
.metadata		.metadata
README.md		README.md
analysis_options.yaml		analysis_options.yaml
pubspec.lock		pubspec.lock
pubspec.yaml		pubspec.yaml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Avatar Lip Sync 3D

Descripción

Características Principales

1. Análisis Fonético del Audio

2. Control Facial Avanzado

3. Interpolación Suave entre Visemas

Requisitos

Instalación

Uso

Modo Básico

Modo Avanzado

Personalización

Avatar Personalizado

Ajustes de Sincronización

Arquitectura

Limitaciones Actuales

Próximos Pasos

Documentación Adicional

Licencia

Créditos

About

Uh oh!

Releases

Packages

Uh oh!

Languages

webmasterscity/avatar_lip_sync

Folders and files

Latest commit

History

Repository files navigation

Avatar Lip Sync 3D

Descripción

Características Principales

1. Análisis Fonético del Audio

2. Control Facial Avanzado

3. Interpolación Suave entre Visemas

Requisitos

Instalación

Uso

Modo Básico

Modo Avanzado

Personalización

Avatar Personalizado

Ajustes de Sincronización

Arquitectura

Limitaciones Actuales

Próximos Pasos

Documentación Adicional

Licencia

Créditos

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages