Skip to content

MoKangMedical/medi-pharma

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

47 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

💊 MediPharma

AI驱动的药物发现平台 — 基于ChEMBL 2.4M化合物数据和OpenTargets靶点信息,AI预测药物活性和ADMET性质。

Python License ChEMBL OpenTargets


🎯 核心功能

功能 描述
🧬 化合物数据库 ChEMBL 2.4M化合物检索,支持SMILES、InChIKey、名称搜索
🎯 靶点分析 OpenTargets靶点-疾病关联分析,druggability评估
🔬 虚拟筛选 AI模型(GNN/Transformer)筛选候选化合物,对接打分
💉 ADMET预测 吸收、分布、代谢、排泄、毒性全性质预测
⚗️ 分子优化 基于AI的分子结构优化,先导化合物优化
📊 可视化 分子3D可视化、结合位点展示、活性热图

🏗️ 技术栈

  • 语言: Python 3.9+
  • 化学信息学: RDKit, ChEMBL_WEBRESOURCE_CLIENT
  • 深度学习: PyTorch, PyTorch Geometric, DGL
  • Web框架: Streamlit, FastAPI
  • 数据源: ChEMBL 34, OpenTargets Platform API
  • 部署: Docker, Docker Compose

🚀 快速开始

安装

# 克隆仓库
git clone https://github.com/MoKangMedical/medi-pharma.git
cd medi-pharma

# 创建虚拟环境
python -m venv venv
source venv/bin/activate  # Linux/Mac
# venv\Scripts\activate   # Windows

# 安装依赖
pip install -r requirements.txt

运行

# 启动 Streamlit 前端
streamlit run main.py

# 或启动 FastAPI 后端
uvicorn backend.api:app --reload --host 0.0.0.0 --port 8000

Docker 部署

docker-compose up -d

📁 项目结构

medi-pharma/
├── main.py                  # Streamlit 主入口
├── backend/                 # FastAPI 后端
├── data/
│   ├── sample-compounds.json   # 50个热门药物分子数据
│   └── targets.json            # 20个热门靶点数据
├── src/
│   ├── screening.py         # 虚拟筛选模块
│   ├── admet.py             # ADMET预测模块
│   └── compound_search.py   # 化合物检索模块
├── admet_prediction/        # ADMET预测模型
├── virtual_screening/       # 虚拟筛选引擎
├── target_discovery/        # 靶点发现模块
├── molecular_generation/    # 分子生成模块
├── lead_optimization/       # 先导化合物优化
├── drug_recommend/          # 药物推荐系统
├── knowledge_engine/        # 知识图谱引擎
├── agents/                  # AI Agent 模块
├── orchestrator/            # 编排器
├── integrations/            # 外部API集成
├── examples/                # 使用案例
├── tests/                   # 测试
├── docs/                    # 文档
└── scripts/                 # 工具脚本

📖 API 文档

启动后端服务后访问:

  • Swagger UI: http://localhost:8000/docs
  • ReDoc: http://localhost:8000/redoc

主要 API 端点

GET  /api/v1/compounds/search?q={query}     # 化合物搜索
GET  /api/v1/compounds/{chembl_id}           # 化合物详情
POST /api/v1/screening/virtual               # 虚拟筛选
POST /api/v1/admet/predict                   # ADMET预测
GET  /api/v1/targets/{target_id}             # 靶点信息
GET  /api/v1/targets/{target_id}/diseases    # 靶点-疾病关联
POST /api/v1/molecule/optimize               # 分子优化

示例请求

# 搜索化合物
curl "http://localhost:8000/api/v1/compounds/search?q=aspirin"

# ADMET预测
curl -X POST "http://localhost:8000/api/v1/admet/predict" \
  -H "Content-Type: application/json" \
  -d '{"smiles": "CC(=O)OC1=CC=CC=C1C(=O)O"}'

# 虚拟筛选
curl -X POST "http://localhost:8000/api/v1/screening/virtual" \
  -H "Content-Type: application/json" \
  -d '{"target": "EGFR", "num_results": 10}'

📊 数据来源

数据源 版本 规模
ChEMBL 34 2.4M+ 化合物
OpenTargets 2024.02 60K+ 靶点-疾病关联
PDB - 200K+ 蛋白质结构

🤝 贡献

欢迎贡献!请查看 CONTRIBUTING.md 了解详情。


🔗 相关项目

项目 定位
OPC Platform 一人公司全链路学习平台
Digital Sage 与100位智者对话
Cloud Memorial AI思念亲人平台
天眼 Tianyan 市场预测平台
MediChat-RD 罕病诊断平台
MedRoundTable 临床科研圆桌会
DrugMind 药物研发数字孪生
MediPharma AI药物发现平台
Minder AI知识管理平台
Biostats 生物统计分析平台

📄 许可证

本项目采用 MIT License 开源许可证。

📮 联系方式


⭐ 如果这个项目对你有帮助,请给个 Star!

🔬 核心算法

分子对接

基于力场的分子对接算法,预测小分子与靶点蛋白的结合模式和亲和力。

ADMET预测

集成5大类20+个ADMET性质预测模型,支持类药性评估和安全性评分。

先导化合物优化

多参数优化(MPO)算法,自动生成结构修饰建议。

📊 性能指标

功能 准确率 速度
结合亲和力预测 R²=0.72 100分子/秒
ADMET预测 AUC=0.85 500分子/秒
类药性评估 准确率92% 1000分子/秒

🏭 应用案例

  1. 抗肿瘤药物发现 — 从100万化合物中筛选出50个候选分子
  2. 药物重定位 — 发现老药新适应症,节省80%研发成本
  3. 毒性早期预警 — 在临床前阶段排除90%有毒化合物

📈 最新进展

  • 2026.04: 完成分子对接模块开发
  • 2026.04: ADMET预测模型训练完成
  • 2026.04: 先导化合物优化算法上线