本项目提供医疗报告结构化处理功能,包含两个核心模块:
MedicalReportStructurizer:基于Java的医疗报告结构化处理库(Maven项目)Page:基于Python的可视化操作界面
- Java 17+(用于MedicalReportStructurizer模块)
- Python 3.8+(用于Page模块)
- Maven 3.6+(用于Java模块构建)
- 数据库环境要求:MySQL 5.7+
- 创建数据库及用户(可选):
CREATE DATABASE medical_report_db DEFAULT CHARSET utf8mb4; CREATE USER 'medical_user'@'localhost' IDENTIFIED BY 'your_password'; GRANT ALL PRIVILEGES ON medical_report_db.* TO 'medical_user'@'localhost'; FLUSH PRIVILEGES;
- 执行SQL脚本:
mysql -u medical_user -p medical_report_db < SQL/medical_report.sql
- 进入模块目录:
cd MedicalReportStructurizer - 构建项目:
mvn clean package(生成的JAR包位于target/medicalreportstructurizer-1.0.0.jar) - 运行程序:
java -jar target/medicalreportstructurizer-1.0.0.jar
- 进入模块目录:
cd Page - 安装依赖:
pip install -r requirements.txt - 启动界面:
python main.py - 浏览器访问网址:
http://localhost:6024
- 前后端程序都启动后,在浏览器中访问
http://localhost:6024,即可进入使用页面:
- 点击
Examples中的案例,文本输入框中会自动加载案例内容,点击解析按钮,即可结构化处理:
- 服务器响应一条文本信息的时间约20到35秒,点击
下载链接,即可下载结构化结果文件:
- 点击
Excel上传按钮:
- 可以通过
拖放或者手动上传方式上传Excel文件:
- 点击
批量生成结肠癌结构化报告,即可开始批量处理:
- 点击
下载链接,即可下载结构化结果文件
- 采用并行处理的方式,大大缩减了每一个条目的执行时间,采用文本输入提交时,平均每生成一条结构化报告需要花费20到35秒,而采用Excel上传方式,平均每条记录仅需花费5到10秒,执行时间与服务器性能相关,但要注意当文件过大时,生成过程也会比较慢,此时不要关闭网页,耐心等待生成完成即可,生成的zip压缩包内容如下:
如有问题或建议,请通过GitHub Issues提交反馈。








