请问您处理后的DeepCom数据集的训练集验证集与测试集分别包含多少例子呢？ #3

walt676 · 2021-11-04T07:15:46Z

感谢您分享您的代码！
我注意到Deepcom中测试集有20000个样例，您预处理后的测试集中有13238个样例，是否一些样例在数据集生成时被筛选掉了？

ZhichaoOuyang · 2021-11-06T05:22:25Z

感谢您分享您的代码！我注意到Deepcom中测试集有20000个样例，您预处理后的测试集中有13238个样例，是否一些样例在数据集生成时被筛选掉了？

可以看下论文里有说把测试集里面与训练集有重复的样例做了过滤，并且一些无法生成小ast的样例也做了过滤。

walt676 · 2021-11-11T08:43:15Z

@ZhichaoOuyang 感谢回复！我刚注意到我似乎没有用到‘Tree-LSTM_pretrain’ 里的内容进行预训练，而是直接在'BASTS'子文件夹中进行预处理与训练过程，请问预训练好的文件是否包含在BASTS子文件夹下，还是我这样做使得性能降低了呢

walt676 closed this as completed Nov 4, 2021

walt676 reopened this Nov 4, 2021

Provide feedback