GitHub

A GenAI-powered email classification system that uses fine-tuned LLMs and a Streamlit chatbot interface to classify Microsoft Outlook emails by category (Finance, HR, Legal, Admin) and priority (High, Medium, Low).

Features

Fine-tuned sentence-transformers/all-MiniLM-L12-v2 using LoRA adapters.

Parameter Efficient Fine Tuning with LoRA

Dual-headed classification (category & priority)

Lightweight Streamlit UI with:

Support for .eml and .msg uploads and parsing

Manual text input

Chat interaction using Groq or OpenAI for email summaries and alt classifiers

OOP architecture will be added at a later time

Model Training Summary

Dataset: Sampled 12,000 emails from Enron corpus

Heuristic Labeling Spam Detection: Applied keyword-based heuristics to label emails as spam (e.g., 'offer', 'win', 'urgent') and filtered to ~5% to avoid skewing training.

Category & Priority Labels: Where explicit labels were not available, category and priority were inferred using logical keyword matching and subject/body context.

Note: As this is a weakly supervised setup, final evaluation metrics may reflect some noise in the labels. Manual labeling or active learning could improve this in future iterations.

Balanced by class using upsampling/downsampling

Fine-tuned with LoRA to reduce memory footprint

Evaluated with accuracy, F1, and confusion matrix

Quick Start

Clone repo

git clone https://github.com/your-username/enron-email-classifier.git cd enron-email-classifier

Install dependencies

pip install -r requirements.txt

Run the app

streamlit run chatbot_ui.py

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
fine_tuned_minilm_category		fine_tuned_minilm_category
fine_tuned_minilm_priority/checkpoint-800		fine_tuned_minilm_priority/checkpoint-800
.DS_Store		.DS_Store
.gitignore		.gitignore
Cross-Entropy Loss, Accuracy and F1.xlsx		Cross-Entropy Loss, Accuracy and F1.xlsx
Mini Slide Presentation for MatrixDna Email Classifer Agent.pptx		Mini Slide Presentation for MatrixDna Email Classifer Agent.pptx
README.md		README.md
chatbot_ui.py		chatbot_ui.py
email_classifier.py		email_classifier.py
email_parser.py		email_parser.py
kaggle.json		kaggle.json
requirements.txt		requirements.txt
training.ipynb		training.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

About

Uh oh!

Releases

Packages

Languages

RodneyFinkel/email_classifier_agent

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages