GitHub - EricCui2005/treehacks-2025: TreeHacks 2025 2nd, Most Creative Use of OpenAI API; TreeTrash leverages computer vision to analyze images of a trash bin and determine which items were misplaced and what the environmental impact of misplacing those items using a custom AI-powered search and analysis pipeline.

Technical Overview

TreeTrash implements a multi-model, multi-modal AI pipeline for real-time waste analysis and environmental impact assessment. Our system architecture combines computer vision, large language models, and vector search capabilities to create a comprehensive waste management solution.

Core Architecture

Computer Vision Pipeline

Primary Vision Model: Leveraged YOLOv8 for real-time object detection, fine-tuned on custom labeled dataset
Frame Processing: Utilizes OpenCV for image preprocessing, including noise reduction and contrast enhancement
Temporal Analysis: Implements a sliding window to track objects across multiple frames, enabling detection of newly added items

AI Model Integration

LLM: GPT-4o: for waste classification and initial analysis
Secondary Models:
- Perplexity AI for environmental impact research
- GPT-4o-mini for structured data transformation and report generation
- Gemini Pro as a VLM to post-process Vespa.ai RAG outputs
Custom Prompt Engineering: Developed specialized prompts to improve classification accuracy

RAG Implementation

Vector Database: Vespa.ai for storing and retrieving sustainability documentation
Embedding Model: ColPali (Efficient Document Retrieval with Vision Language Models)

Data Pipeline

Image Capture & Processing
- Resolution: 1920x1080 @ 30fps
- Format: JPEG with quality preservation
- Preprocessing: Gaussian blur (σ=1.5) for noise reduction
Object Detection & Classification
- Model Architecture: YOLOv8 backbone with custom head
- Inference Time: <50ms per frame
- GPU Optimization: CUDA acceleration with TensorRT
Environmental Impact Analysis
- Custom API integration with Perplexity
- Structured output parsing using regex and NLP
- Carbon footprint calculation using standardized metrics
Report Generation
- Vector similarity search
- Dynamic template generation
- PDF export with visualizations

Future Technical Enhancements

LLM enhancements

Improved prompting with DsPy for automated, bootstrapped prompt engineering
Applying techniques like in-context learning

RAG System Optimization

Implementing hybrid search combining sparse and dense retrievers
Adding cross-encoder reranking
Developing custom embedding models for waste management domain

Computer Vision Improvements

Transfer learning from larger vision models
Implementation of instance segmentation
Real-time optical character recognition for packaging

Robotic Integration

ROS2 implementation for robotic arm control
Computer vision-guided path planning

Name		Name	Last commit message	Last commit date
Latest commit History 68 Commits
.vscode		.vscode
camera		camera
colpalidemodev		colpalidemodev
hardware		hardware
output		output
pdfs		pdfs
report-render		report-render
report		report
sample-images		sample-images
.gitattributes		.gitattributes
.gitignore		.gitignore
0.50.0		0.50.0
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Technical Overview

Core Architecture

Computer Vision Pipeline

AI Model Integration

RAG Implementation

Data Pipeline

Future Technical Enhancements

LLM enhancements

RAG System Optimization

Computer Vision Improvements

Robotic Integration

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

Languages

EricCui2005/treehacks-2025

Folders and files

Latest commit

History

Repository files navigation

Technical Overview

Core Architecture

Computer Vision Pipeline

AI Model Integration

RAG Implementation

Data Pipeline

Future Technical Enhancements

LLM enhancements

RAG System Optimization

Computer Vision Improvements

Robotic Integration

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Languages

Packages