AI驱动的药物发现平台 — 基于ChEMBL 2.4M化合物数据和OpenTargets靶点信息,AI预测药物活性和ADMET性质。
| 功能 | 描述 |
|---|---|
| 🧬 化合物数据库 | ChEMBL 2.4M化合物检索,支持SMILES、InChIKey、名称搜索 |
| 🎯 靶点分析 | OpenTargets靶点-疾病关联分析,druggability评估 |
| 🔬 虚拟筛选 | AI模型(GNN/Transformer)筛选候选化合物,对接打分 |
| 💉 ADMET预测 | 吸收、分布、代谢、排泄、毒性全性质预测 |
| ⚗️ 分子优化 | 基于AI的分子结构优化,先导化合物优化 |
| 📊 可视化 | 分子3D可视化、结合位点展示、活性热图 |
- 语言: Python 3.9+
- 化学信息学: RDKit, ChEMBL_WEBRESOURCE_CLIENT
- 深度学习: PyTorch, PyTorch Geometric, DGL
- Web框架: Streamlit, FastAPI
- 数据源: ChEMBL 34, OpenTargets Platform API
- 部署: Docker, Docker Compose
# 克隆仓库
git clone https://github.com/MoKangMedical/medi-pharma.git
cd medi-pharma
# 创建虚拟环境
python -m venv venv
source venv/bin/activate # Linux/Mac
# venv\Scripts\activate # Windows
# 安装依赖
pip install -r requirements.txt# 启动 Streamlit 前端
streamlit run main.py
# 或启动 FastAPI 后端
uvicorn backend.api:app --reload --host 0.0.0.0 --port 8000docker-compose up -dmedi-pharma/
├── main.py # Streamlit 主入口
├── backend/ # FastAPI 后端
├── data/
│ ├── sample-compounds.json # 50个热门药物分子数据
│ └── targets.json # 20个热门靶点数据
├── src/
│ ├── screening.py # 虚拟筛选模块
│ ├── admet.py # ADMET预测模块
│ └── compound_search.py # 化合物检索模块
├── admet_prediction/ # ADMET预测模型
├── virtual_screening/ # 虚拟筛选引擎
├── target_discovery/ # 靶点发现模块
├── molecular_generation/ # 分子生成模块
├── lead_optimization/ # 先导化合物优化
├── drug_recommend/ # 药物推荐系统
├── knowledge_engine/ # 知识图谱引擎
├── agents/ # AI Agent 模块
├── orchestrator/ # 编排器
├── integrations/ # 外部API集成
├── examples/ # 使用案例
├── tests/ # 测试
├── docs/ # 文档
└── scripts/ # 工具脚本
启动后端服务后访问:
- Swagger UI:
http://localhost:8000/docs - ReDoc:
http://localhost:8000/redoc
GET /api/v1/compounds/search?q={query} # 化合物搜索
GET /api/v1/compounds/{chembl_id} # 化合物详情
POST /api/v1/screening/virtual # 虚拟筛选
POST /api/v1/admet/predict # ADMET预测
GET /api/v1/targets/{target_id} # 靶点信息
GET /api/v1/targets/{target_id}/diseases # 靶点-疾病关联
POST /api/v1/molecule/optimize # 分子优化
# 搜索化合物
curl "http://localhost:8000/api/v1/compounds/search?q=aspirin"
# ADMET预测
curl -X POST "http://localhost:8000/api/v1/admet/predict" \
-H "Content-Type: application/json" \
-d '{"smiles": "CC(=O)OC1=CC=CC=C1C(=O)O"}'
# 虚拟筛选
curl -X POST "http://localhost:8000/api/v1/screening/virtual" \
-H "Content-Type: application/json" \
-d '{"target": "EGFR", "num_results": 10}'| 数据源 | 版本 | 规模 |
|---|---|---|
| ChEMBL | 34 | 2.4M+ 化合物 |
| OpenTargets | 2024.02 | 60K+ 靶点-疾病关联 |
| PDB | - | 200K+ 蛋白质结构 |
欢迎贡献!请查看 CONTRIBUTING.md 了解详情。
| 项目 | 定位 |
|---|---|
| OPC Platform | 一人公司全链路学习平台 |
| Digital Sage | 与100位智者对话 |
| Cloud Memorial | AI思念亲人平台 |
| 天眼 Tianyan | 市场预测平台 |
| MediChat-RD | 罕病诊断平台 |
| MedRoundTable | 临床科研圆桌会 |
| DrugMind | 药物研发数字孪生 |
| MediPharma | AI药物发现平台 |
| Minder | AI知识管理平台 |
| Biostats | 生物统计分析平台 |
本项目采用 MIT License 开源许可证。
- Issues: GitHub Issues
- Discussions: GitHub Discussions
⭐ 如果这个项目对你有帮助,请给个 Star!
基于力场的分子对接算法,预测小分子与靶点蛋白的结合模式和亲和力。
集成5大类20+个ADMET性质预测模型,支持类药性评估和安全性评分。
多参数优化(MPO)算法,自动生成结构修饰建议。
| 功能 | 准确率 | 速度 |
|---|---|---|
| 结合亲和力预测 | R²=0.72 | 100分子/秒 |
| ADMET预测 | AUC=0.85 | 500分子/秒 |
| 类药性评估 | 准确率92% | 1000分子/秒 |
- 抗肿瘤药物发现 — 从100万化合物中筛选出50个候选分子
- 药物重定位 — 发现老药新适应症,节省80%研发成本
- 毒性早期预警 — 在临床前阶段排除90%有毒化合物
- 2026.04: 完成分子对接模块开发
- 2026.04: ADMET预测模型训练完成
- 2026.04: 先导化合物优化算法上线