感谢您出色且慷慨的开源工作! 我按照说明在服务器环境中完成了配置并尝试复现实验,但目前得到的结果(4卡)与论文中报告的性能仍存在较大差距。 请问您是否有一些复现方面的建议可以分享?不胜感激。 **复现的结果**: <img width="624" height="370" alt="Image" src="https://github.com/user-attachments/assets/bd0e804e-4aa8-4886-921e-7466ae55f689" /> **对比论文报告结果**: <img width="1077" height="77" alt="Image" src="https://github.com/user-attachments/assets/c2293981-7461-4c4b-b2ae-52008eef12d5" />