Eine fortschrittliche Chat-Benutzeroberfläche mit KI-Avatar, Spracherkennung, Text-zu-Sprache und erweiterten 3D-Funktionen.
- Web Speech API Integration
- Unterstützung für mehrere Sprachen (Deutsch, Englisch, Französisch, Spanisch)
- Echtzeit-Transkription mit visueller Rückmeldung
- Mikrofon-Button mit Recording-Indikator
- OpenAI-kompatible TTS-Engines
- Detaillierte Diagnostics für TTS-Probleme
- Geschwindigkeitseinstellungen (0.25x - 4.0x)
- Mehrere Stimmen unterstützt
- Audio-Wiedergabe mit Fehlerbehandlung
- 2D Avatar: Erweiterte Emotionen, Atmung, Augenzwinkern
- 3D Avatar: Three.js Integration, Morphing, Animationen
- Emotion-Engine: 6 verschiedene Emotionen
- Qualitätseinstellungen: Low, Medium, High
- Echtzeit-Switching zwischen 2D/3D
- Verbesserte OpenWebUI Anbindung
- Conversation History mit 20 Nachrichten
- System Prompts für Avatar-Persönlichkeit
- Streaming Support vorbereitet
- Error Recovery und Retry-Logic
- Umfangreiche TTS-Tests mit Audio-Output
- OpenWebUI Connectivity Tests
- Real-time Diagnostics Grid
- Enhanced Logging mit Rotation
- Model Discovery für TTS
- Message Formatting (Bold, Italic, Code)
- Status-Nachrichten mit Auto-Dismiss
- Conversation Export/Import
- Keyboard Shortcuts (Ctrl+1/2/D)
- Connection Monitoring
- Node.js >= 14.0.0
- NPM >= 6.0.0
- Moderner Browser mit WebGL-Supportgit clone https://github.com/baefthde/Avatar-beta.git
cd Avatar-beta
chmod +x install.sh
./install.sh
npm start# Dependencies installieren
cd backend && npm install
# Server starten
npm start
# Browser öffnen
open http://localhost:3000- URL: Ihre OpenWebUI-Instanz (z.B.
https://localhost:443) - API Key: Ihr OpenWebUI API-Schlüssel
- Model: Standard-Modell (z.B.
gpt-4o-mini)
- Engine URL: OpenAI-kompatible TTS-Engine
- API Key: TTS-API-Schlüssel
- Model: TTS-Modell (z.B.
tts-1) - Voice: Stimme (alloy, echo, fable, onyx, nova, shimmer)
- Typ: 2D oder 3D Avatar wählen
- Qualität: Low/Medium/High für 3D
- Erscheinung: Haut-/Haarfarbe anpassen
- Persönlichkeit: System-Prompt definieren
- Text eingeben und Enter drücken
- Mikrofon-Button für Spracheingabe
- Avatar reagiert auf Emotionen
- TTS spielt Antworten ab
- Ctrl+1: Systemeinstellungen öffnen
- Ctrl+2: Avatar-Einstellungen öffnen
- Ctrl+D: Unterhaltung löschen
- Esc: Panels schließen
- Test OpenWebUI: Verbindung testen
- Test TTS: Audio-Ausgabe testen
- TTS Modelle: Verfügbare Modelle anzeigen
- Logs anzeigen: System- oder All-Logs
Avatar-beta/
├── backend/
│ ├── server.js # Express Server
│ ├── api.js # API Routen (Enhanced)
│ ├── config.json # Konfiguration (Enhanced)
│ ├── package.json # Dependencies (Enhanced)
│ ├── system.log # System Logs
│ └── all.log # All Logs
├── frontend/
│ ├── index.html # Hauptseite (Enhanced)
│ ├── css/
│ │ └── style.css # Styles (Enhanced)
│ ├── js/
│ │ ├── main.js # Hauptlogik (Enhanced)
│ │ ├── avatar2d.js # 2D Avatar (Enhanced)
│ │ └── avatar3d.js # 3D Avatar (Enhanced)
│ └── assets/
│ └── avatars/
│ └── 3d/ # 3D Modelle
├── install.sh # Installation Script
└── README.md # Diese Datei
backend/api.js- TTS-Endpoint erweitern- OpenAI-kompatible API implementieren
- Diagnostics für neue Engine hinzufügen
POST /api/chat
Content-Type: application/json
{
"message": "Hallo Avatar",
"model": "gpt-4o-mini",
"conversation_id": "12345",
"history": [...]
}GET /api/config
POST /api/configGET /api/logs/system
GET /api/logs/all
POST /api/log/system
POST /api/log/all- Web Speech API funktioniert nur über HTTPS
- Mikrofon-Zugriff erfordert sichere Verbindung
- Service Worker für Offline-Funktionalität
- Umgebungsvariablen für Produktionseinsatz
- Rate Limiting aktivieren
- CORS konfigurieren
- Lokale Speicherung von Einstellungen
- Keine Audioaufzeichnung auf Server
- Conversation History optional
- OpenWebUI: Test-Button verwenden
- TTS: Audio-Output prüfen
- Speech: Mikrofon-Test durchführen
- Avatar: Emotion-Preview nutzen
# Unit Tests (geplant)
npm test
# API Tests (geplant)
npm run test:api
# Frontend Tests (geplant)
npm run test:frontend- Hauptentwicklung: Avatar Chat UI Team
- 3D Graphics: Three.js Community
- TTS Integration: OpenAI API
- UI/UX Design: Community Contributors
- Three.js für 3D-Engine
- OpenWebUI für AI-Integration
- Web Speech API für Browser-Features
- Community für Feedback und Beiträge
Made with ❤️ for the AI Avatar Community