Does it support causal mask for GPT2-esque models? #7

Open

opened

For models with only Decoder-stacks, how to apply causal mask?

Metadata

Assignees

No one assigned

Labels

No labels

No labels

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests