PRISM: Privacy-Preserving Human Action Recognition via ε-Differential Private Spatial-Temporal Graph Networks

Project Overview

PRISM is a novel framework for privacy-preserving human action recognition that integrates ε-differential privacy with spatial-temporal graph convolutional networks (ST-GCNs). The project addresses the critical privacy-utility tradeoff in pose-based action recognition by providing provable privacy guarantees while maintaining competitive classification performance.

Key Features

Differential Privacy: Provable ε-differential privacy guarantees using DP-SGD
Spatial-Temporal Graph Networks: Advanced ST-GCN architecture for pose sequence analysis
Kinematic Feature Extraction: Dimensionality reduction while preserving movement semantics
Comprehensive Benchmarking: Rigorous evaluation across multiple performance metrics
Model Optimization: Post-training quantization and TorchScript export for deployment
Real-World Ready: Designed for sensitive applications like healthcare and clinical diagnostics

Scientific Contributions

One of the first Application of differential privacy to spatial-temporal graph networks for action recognition
Novel Kinematic Pipeline that reduces data dimensionality while preserving movement semantics
Comprehensive Evaluation Framework demonstrating privacy-utility tradeoffs
Open-Source Implementation enabling reproducible research and practical deployment

Quick Start

Installation

Clone the repository:

git clone https://github.com/your-username/prism.git
cd prism

Create a virtual environment:

python -m venv prism_env
source prism_env/bin/activate  # On Windows: prism_env\Scripts\activate

Install dependencies:

pip install -r requirements.txt

Verify installation:

python -c "import torch; import torch_geometric; import opacus; print('Installation successful!')"

Basic Usage

1. Data Processing

from data_pipeline import extract_and_normalize_pose_with_kinematics, PRISMDataset

# Extract pose and kinematic features from video
pose_data, kinematic_features = extract_and_normalize_pose_with_kinematics("path/to/video.mp4")

# Create dataset
dataset = PRISMDataset("data/", use_kinematics=True, sequence_length=30)

2. Model Training

from models import STGCN_PRISM
from privacy_module import PrivacyPreservingTrainer, create_privacy_config

# Create model
model = STGCN_PRISM(num_joints=33, in_channels=4, num_classes=101)

# Configure privacy
privacy_config = create_privacy_config(epsilon=1.0, delta=1e-5)

# Train with privacy
trainer = PrivacyPreservingTrainer(model, privacy_config)
results = trainer.train(train_loader, val_loader, num_epochs=50)

3. Model Evaluation

from benchmarks import run_comprehensive_benchmark

# Run complete benchmark
benchmark_results = run_comprehensive_benchmark(
    lstm_model, stgcn_model, dp_model, test_loader,
    privacy_epsilon=1.0, privacy_delta=1e-5
)

4. Model Optimization

from optimization import optimize_stgcn_model

# Optimize and export model
optimization_results = optimize_stgcn_model(
    stgcn_model, calibration_data, test_loader,
    model_name="PRISM_optimized"
)

Benchmark Results

Performance Comparison

Model	Accuracy	F1-Score	Precision	Recall	Cohen's Kappa	Privacy ε
LSTM Baseline	82.3%	81.5%	82.1%	81.9%	80.1%	N/A
STGCN (No DP)	89.1%	88.7%	88.9%	88.5%	87.2%	N/A
STGCN + DP (ε=1.0)	84.7%	84.1%	84.4%	83.8%	82.3%	1.0
STGCN + DP (ε=0.1)	81.2%	80.6%	81.0%	80.8%	79.4%	0.1
STGCN + DP (ε=10.0)	88.3%	87.9%	88.1%	87.7%	86.4%	10.0

Inference Performance

Model	Mean Latency (ms)	P95 Latency (ms)	Throughput (FPS)	Model Size (MB)
LSTM Baseline	12.3	16.8	81.3	15.2
STGCN (No DP)	18.7	25.1	53.5	23.8
STGCN + DP	19.2	26.3	52.1	23.8
STGCN Quantized	10.4	13.9	96.2	10.3

Privacy-Utility Tradeoff Analysis

High Privacy (ε=0.1): 8.2% accuracy reduction, maximum privacy protection
Medium Privacy (ε=1.0): 4.4% accuracy reduction, balanced tradeoff
Low Privacy (ε=10.0): 1.1% accuracy reduction, higher utility

Project Structure

prism/
├── README.md                          # This file
├── requirements.txt                   # Python dependencies
├── setup.py                          # Packages installation
├── LICENSE                           # MIT License
├── .gitignore                        # Git ignore rules
│
├── src/                              # Source code
│   ├── data_pipeline.py             # Pose extraction and kinematic features
│   ├── models.py                    # Neural network architectures
│   ├── privacy_module.py            # Differential privacy implementation
│   ├── benchmarks.py                # Evaluation and benchmarking
│   └── optimization.py              # Model quantization and export
│
├── examples/                         # Example scripts
│   ├── train_example.py             # Training examples
│   ├── privacy_training_example.py  # Privacy-preserving training
│   ├── kinematic_features_example.py # Kinematic features demo
│   ├── benchmark_example.py         # Benchmarking examples
│   └── optimization_example.py      # Model optimization demo
│
├── tests/                           # Unit tests
│   ├── test_data_pipeline.py
│   ├── test_models.py
│   ├── test_privacy_module.py
│   └── test_benchmarks.py
│
├── docs/                            # Documentation
│   ├── PRIVACY_README.md            # Privacy module documentation
│   ├── PRISM_Paper_Template.md      # Scientific paper template
│   └── API_Reference.md             # API documentation
│
├── data/                            # Data directory (create locally)
│   ├── raw/                         # Raw video files
│   ├── processed/                   # Processed pose data
│   └── features/                    # Kinematic features
│
├── models/                          # Model checkpoints
│   ├── baseline/                    # LSTM/GRU models
│   ├── stgcn/                       # ST-GCN models
│   └── optimized/                   # Quantized models
│
└── results/                         # Experimental results
    ├── benchmarks/                  # Benchmark results
    ├── privacy_analysis/            # Privacy evaluation
    └── optimization/                # Optimization results

Research Applications

Current Capabilities

Healthcare Monitoring: Privacy-preserving patient movement analysis
Clinical Diagnostics: Anonymous gait and posture assessment
Rehabilitation: Secure physical therapy progress tracking
Security Systems: Privacy-compliant surveillance and monitoring
Human-Computer Interaction: Private gesture recognition system

Real-World Deployment Examples

Hospital Patient Monitoring: Track patient mobility while preserving medical privacy
Elderly Care Facilities: Monitor daily activities without compromising dignity
Physical Therapy Clinics: Assess rehabilitation progress with privacy protection
Workplace Safety: Monitor ergonomic compliance while protecting employee privacy
Smart Home Systems: Enable gesture control without data collection concerns

Future Research and RSI Goals

Immediate Research Extensions (6-12 months)

1. Multi-Modal Privacy-Preserving Learning

RGB + Pose Fusion: Integrate visual and skeletal data while maintaining privacy
Depth Sensor Integration: Add 3D depth information for enhanced accuracy
Audio-Visual Fusion: Combine speech and movement patterns for comprehensive analysis

2. Advanced Privacy Mechanisms

Local Differential Privacy: Enable privacy-preserving learning on edge devices
Secure Multi-Party Computation: Allow collaborative learning across institutions
Homomorphic Encryption: Enable computation on encrypted pose data

3. Real-Time Clinical Diagnostics

Live Patient Monitoring: Real-time privacy-preserving health assessment
Automated Fall Detection: Instantaneous fall risk evaluation with privacy protection
Gait Analysis: Continuous mobility assessment for neurological conditions

Medium-Term Research Vision (1-2 years)

1. Federated Learning Integration

Cross-Institutional Training: Train models across multiple hospitals without data sharing
Privacy-Preserving Aggregation: Secure model updates from distributed sources
Incentive Mechanisms: Design systems for collaborative privacy-preserving learning

2. Advanced Graph Learning

Dynamic Graph Construction: Learn optimal graph structures for different individuals
Hierarchical Graph Networks: Multi-scale spatial-temporal modeling
Attention Mechanisms: Focus on relevant body parts for specific actions

3. Clinical Decision Support

Automated Diagnosis: AI-assisted clinical decision making with privacy guarantees
Treatment Recommendation: Personalized therapy suggestions based on movement analysis
Risk Stratification: Early identification of health risks through movement patterns

Long-Term Research Infrastructure (2-5 years)

1. PRISM Research Software Infrastructure (RSI)

Core Platform Components:

Unified API: Standardized interface for privacy-preserving action recognition
Model Zoo: Pre-trained models for different privacy budgets and applications
Benchmark Suite: Comprehensive evaluation datasets and metrics
Privacy Analysis Tools: Automated privacy auditing and compliance verification

Deployment Infrastructure:

Cloud Platform: Scalable deployment for healthcare institutions
Edge Computing: Local processing for real-time applications
Mobile SDK: Integration with mobile health applications
API Gateway: Secure access to privacy-preserving services

2. Clinical Integration Platform

Healthcare Workflow Integration:

Electronic Health Records: Seamless integration with existing EHR systems
Clinical Decision Support: Real-time alerts and recommendations
Patient Portal: Privacy-preserving patient access to movement data
Provider Dashboard: Clinician interface for monitoring and analysis

Regulatory Compliance:

HIPAA Compliance: Built-in healthcare privacy protection
GDPR Compliance: European data protection regulation support
FDA Approval: Medical device certification pathway
Clinical Validation: Evidence-based performance validation

3. Research Community Platform

Open Science Initiative:

Shared Datasets: Privacy-preserving datasets for research collaboration
Reproducible Experiments: Standardized evaluation protocols
Open Source Tools: Community-driven development and maintenance
Educational Resources: Training materials and workshops

Industry Partnerships:

Technology Transfer: Commercialization pathways for research outcomes
Clinical Trials: Large-scale validation studies
Regulatory Guidance: Policy development for privacy-preserving AI in healthcare
International Collaboration: Global research network for privacy-preserving AI

Specific RSI Development Goals

Phase 1: Foundation (Months 1-6)

Complete PRISM framework implementation
Develop comprehensive test suite
Create detailed API documentation
Establish continuous integration pipeline

Phase 2: Extension (Months 7-12)

Implement multi-modal privacy-preserving learning
Develop federated learning capabilities
Create clinical integration modules
Launch beta testing program

Phase 3: Scale (Months 13-24)

Deploy production-ready platform
Establish clinical partnerships
Conduct large-scale validation studies
Develop commercial licensing framework

Phase 4: Impact (Months 25-36)

Achieve regulatory approval for clinical use
Establish international research network
Launch educational programs
Measure real-world impact metrics

Contributing

We welcome contributions from the research community! Please see our Contributing Guidelines for details on:

Code style and standards
Testing requirements
Documentation guidelines
Pull request process
Issue reporting

Development Setup

Fork the repository
Create a feature branch: git checkout -b feature/amazing-feature
Make your changes and add tests
Run the test suite: python -m pytest tests/
Commit your changes: git commit -m 'Add amazing feature'
Push to the branch: git push origin feature/amazing-feature
Open a Pull Request

License

This project is licensed under the MIT License - see the LICENSE file for details.

Citation

If you use PRISM in your research, please cite our paper:

@article{prism2024,
  title={PRISM: Privacy-Preserving Human Action Recognition via ε-Differential Private Spatial-Temporal Graph Networks},
  author={[Author Names]},
  journal={[Journal Name]},
  year={2024},
  doi={[DOI]}
}

Contact

Project Lead: [Yusufbek Abdurakhimov] ([abduyusufbek.2@gmail.com])
GitHub Issues: Create an issue
Discussions: Join the discussion

Acknowledgments

We thank the open-source community for the excellent tools and libraries that made this work possible, including PyTorch, PyTorch Geometric, Opacus, and MediaPipe. We also acknowledge the support of [Funding Sources] and [Institution].

PRISM: Advancing Privacy-Preserving AI for Human Behavior Analysis 🚀🔒🧠

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
.github/workflows		.github/workflows
config		config
data		data
docs		docs
examples		examples
models		models
scripts		scripts
src		src
tests		tests
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
EXPERIMENTS.md		EXPERIMENTS.md
LICENSE		LICENSE
MODEL_ZOO.md		MODEL_ZOO.md
PROJECT_SUMMARY.md		PROJECT_SUMMARY.md
README.md		README.md
ROADMAP.md		ROADMAP.md
requirements.txt		requirements.txt
setup.py		setup.py

License

Abduep53/PRISM-2.0

Folders and files

Latest commit

History

Repository files navigation

PRISM: Privacy-Preserving Human Action Recognition via ε-Differential Private Spatial-Temporal Graph Networks

Project Overview

Key Features

Scientific Contributions

Quick Start

Installation

Basic Usage

1. Data Processing

2. Model Training

3. Model Evaluation

4. Model Optimization

Benchmark Results

Performance Comparison

Inference Performance

Privacy-Utility Tradeoff Analysis

Project Structure

Research Applications

Current Capabilities

Real-World Deployment Examples

Future Research and RSI Goals

Immediate Research Extensions (6-12 months)

1. Multi-Modal Privacy-Preserving Learning

2. Advanced Privacy Mechanisms

3. Real-Time Clinical Diagnostics

Medium-Term Research Vision (1-2 years)

1. Federated Learning Integration

2. Advanced Graph Learning

3. Clinical Decision Support

Long-Term Research Infrastructure (2-5 years)

1. PRISM Research Software Infrastructure (RSI)

2. Clinical Integration Platform

3. Research Community Platform

Specific RSI Development Goals

Phase 1: Foundation (Months 1-6)

Phase 2: Extension (Months 7-12)

Phase 3: Scale (Months 13-24)

Phase 4: Impact (Months 25-36)

Contributing

Development Setup

License

Citation

Contact

Acknowledgments

About

Resources

License

Code of conduct

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages