VOX

An open-source, sophisticated multi-model AI audio generation platform

Integrating state-of-the-art voice conversion, SFX generation, and text-to-audio models into a seamless, high-fidelity experience.

Overview

VOX is a modular open-source AI audio platform that brings together state-of-the-art models for:

Voice conversion & cloning
Multilingual text-to-speech
Text-to-audio & sound effects generation

Quick Start

One command sets up everything — environments, model weights, dependencies, and database:

chmod +x init.sh
./init.sh

Tech Stack

Frontend

Next.js 15 (App Router)
TypeScript
Tailwind CSS
Zustand
Tanstack Query

Backend

Node.js 20+
Drizzle ORM
p-queue

AI Models

Seed-VC — Zero-shot voice conversion & cloning
Make-An-Audio — Text-to-audio generation
XTTS-v2 — High-quality multilingual TTS

Automation

Bash orchestration
Python-based environment & model manager

Project Structure

├── packages/
│   ├── app/          # Next.js frontend
│   └── server/       # Backend API & database
├── models/
│   ├── seed-vc/      # Voice conversion
│   ├── make-an-audio/# Audio generation
│   └── xtts-v2/      # Text-to-speech
├── data/             # Audio assets & outputs
└── init.sh           # One-command setup

System Requirements

OS: macOS (MPS) or Linux (CUDA)
Python: 3.10+
Node.js: 20+
GPU: Recommended (CPU supported with reduced performance)

License

MIT — free to use, modify, and distribute.

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.vscode		.vscode
data/target		data/target
demo		demo
models		models
packages		packages
.gitignore		.gitignore
.prettierignore		.prettierignore
.prettierrc		.prettierrc
README.md		README.md
init.sh		init.sh
nx.json		nx.json
package-lock.json		package-lock.json
package.json		package.json
tsconfig.base.json		tsconfig.base.json
tsconfig.json		tsconfig.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VOX

Overview

Quick Start

Tech Stack

Frontend

Backend

AI Models

Automation

Project Structure

System Requirements

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

VOX

Overview

Quick Start

Tech Stack

Frontend

Backend

AI Models

Automation

Project Structure

System Requirements

License

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages