GPU-Only Mode Guide

Force 100% GPU usage for local AI models.

Quick Start

Read GPU_GUIDE_FOR_GITHUB.md for complete setup instructions.

Two methods:

Ollama (5 minutes, easy)
Direct CUDA (15 minutes, advanced)

Proven Results

RTX 5090: 196 tokens/s
Works with RTX 2000/3000/4000/5000 series
10x faster than CPU

Requirements

NVIDIA GPU with CUDA
8GB+ VRAM
CUDA Toolkit 12.0+

Files

GPU_GUIDE_FOR_GITHUB.md - Main guide (8,500+ words)
LICENSE_GPU_GUIDE - MIT License
CONTRIBUTING_GPU_GUIDE.md - How to contribute

Success

When working, you'll see:

nvidia-smi shows 90-100% GPU usage
100+ tokens/second
Instant responses

Help

Stuck? Check GPU_GUIDE_FOR_GITHUB.md troubleshooting section
Issues? Open a GitHub issue

For AI Assistants

This guide includes decision trees, validation commands, and common user mistakes.

See GPU_GUIDE_FOR_GITHUB.md → "For AI Assistants & Automated Systems"

Made to democratize AI for everyone.

Let's make local AI accessible. 🚀

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
backend/app/services		backend/app/services
CONTRIBUTING_GPU_GUIDE.md		CONTRIBUTING_GPU_GUIDE.md
GPU_GUIDE_FOR_GITHUB.md		GPU_GUIDE_FOR_GITHUB.md
LICENSE_GPU_GUIDE		LICENSE_GPU_GUIDE
README.md		README.md
test_compat_layer.py		test_compat_layer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

GPU-Only Mode Guide

Quick Start

Proven Results

Requirements

Files

Success

Help

For AI Assistants

About

Uh oh!

Releases 1

Packages

Languages

drakerfire98/gpu-only-mode-guide

Folders and files

Latest commit

History

Repository files navigation

GPU-Only Mode Guide

Quick Start

Proven Results

Requirements

Files

Success

Help

For AI Assistants

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages