hi 请教一个小问题 文献说这个网络 work on 1024 x 1024 image patches, 这个1024x1024分辨率是指 数据预处理之后,通过pytorch dataloader 送入网络的张量size ? 还是说在 patch embedding阶段后,打算送入swin-tiny 的backbone 的张量size 是1024x1024 ? 多谢
hi 请教一个小问题
文献说这个网络 work on 1024 x 1024 image patches, 这个1024x1024分辨率是指 数据预处理之后,通过pytorch dataloader 送入网络的张量size ? 还是说在 patch embedding阶段后,打算送入swin-tiny 的backbone 的张量size 是1024x1024 ?
多谢