support layernorm int8 by tpoisonooo · Pull Request #4132 · Tencent/ncnn

tpoisonooo · 2022-08-11T09:44:17Z

基于 PR #4096 接着写。

根据 FQViT 论文实现了 int8 layernorm
- imagenet1k 数据集，只量化 LN 精度 - 0.3%；量化 LN+Conv+Gemm+mha + bias correlation 精度 -0.9%
- ncnn2int8 开发了 layernorm requant 功能，匹配 layernorm_int --> ( mha_int8 | conv_int8 | gemm_int8 ) 模式
- 更新了 operators.md 文档
- 更新了对应的 testcase
example 增加 vision_transformer_int8，模型下载路径在注释里了
多个 layer 都写了一次的 float2int8 放到了公共的 mathfunction.h 里

失败的尝试，已经 revert 掉了：

尝试 int8 binaryop ，精度下降严重
由于 innerproduct_int8 没实现 requant，导致图优化做得很烂、int8 binaryop 没加速效果

feat(src/layer): add mha int8

…into improve-mha-int8

…into full-integer-vit

…o/ncnn into vit-add-layernorm-int8

codecov-commenter · 2022-08-11T09:58:10Z

Codecov Report

Merging #4132 (81a1149) into master (b4ba207) will decrease coverage by 1.91%.
The diff coverage is 94.67%.

@@             Coverage Diff             @@
##           master    #4132       +/-   ##
===========================================
- Coverage   94.42%   92.51%    -1.92%     
===========================================
  Files         747      374      -373     
  Lines      178769    66122   -112647     
===========================================
- Hits       168811    61173   -107638     
+ Misses       9958     4949     -5009

Impacted Files	Coverage Δ
src/layer/convolution.cpp	`94.24% <ø> (-0.22%)`	⬇️
src/layer/layernorm.cpp	`93.08% <85.52%> (-5.13%)`	⬇️
src/layer/multiheadattention.cpp	`98.53% <98.77%> (+5.30%)`	⬆️
src/layer/mathfun.h	`100.00% <100.00%> (ø)`
src/layer/arm/convolution_winograd_transform.h	`0.00% <0.00%> (-100.00%)`	⬇️
...c/layer/arm/convolution_winograd_transform_bf16s.h	`0.00% <0.00%> (-98.31%)`	⬇️
src/layer/arm/flatten_arm.cpp	`35.74% <0.00%> (-63.46%)`	⬇️
src/layer/arm/packing_arm.cpp	`64.53% <0.00%> (-31.76%)`	⬇️
src/layer/arm/slice_arm.cpp	`80.32% <0.00%> (-17.15%)`	⬇️
src/layer/arm/concat_arm.cpp	`80.32% <0.00%> (-16.25%)`	⬇️
... and 491 more

Help us with your feedback. Take ten seconds to tell us how you rate us. Have a feature suggestion? Share it here.

lgtm-com · 2022-08-11T10:32:00Z

This pull request introduces 1 alert when merging 9277a1f into acbaaa6 - view on LGTM.com

new alerts:

1 for FIXME comment

tpoisonooo and others added 30 commits July 28, 2022 18:22

feat(tools/quantize): support .ini format

66d1104

feat(src/layer): add mha int8

apply code-format changes

e0a0ca6

fix(CI): rebase error

7565af0

Merge branch 'improve-mha-int8' of https://github.com/tpoisonooo/ncnn …

7a3841f

…into improve-mha-int8

apply code-format changes

d5f7835

fix(CI): test mha exceeding

fa8b0bc

improvement(src/mha): add file structure

9d3fb10

apply code-format changes

f38ca73

improvement(src/layer/mha): add const fold

4a05da2

Merge branch 'improve-mha-int8' of https://github.com/tpoisonooo/ncnn …

8b9c6a7

…into improve-mha-int8

apply code-format changes

49cbb14

improvement(src/layer/mha): update

37848f1

Merge branch 'improve-mha-int8' of https://github.com/tpoisonooo/ncnn …

d76eb0d

…into improve-mha-int8

fix(src/layer/mha): miss convert weight to int8

95692d7

fix(src/layer/x86/mha): update int8

07a1424

apply code-format changes

9c1c2c9

improvement(src/x86/mha): int8 optimization

9454c51

apply code-format changes

42ad426

feat(src/layer): layernorm support int8

6854ef7

apply code-format changes

9bd2ac4

feat(src/layer/layernorm.cpp): add int8 support

a6a818c

apply code-format changes

ac0d745

fix(src/layer): update layernorm OMP option

4d19507

Merge branch 'full-integer-vit' of https://github.com/tpoisonooo/ncnn …

fa00976

…into full-integer-vit

feat(src/layer): binaryop support int8

6ddf7cc

feat(src/layer): test add int8 failed

5727e19

feat(src/layer): revert int8 BinaryOp

86148bd

apply code-format changes

e7f84d0

feat(src/layer/x86): revert binaryop

4588921

Merge branch 'vit-add-layernorm-int8' of https://github.com/tpoisonoo…

a544565

…o/ncnn into vit-add-layernorm-int8

tpoisonooo changed the title ~~Vit add layernorm int8~~ support layernorm int8 Aug 11, 2022

docs(src): update docs

9277a1f

tpoisonooo added 10 commits August 15, 2022 10:50

fix(CI): layernorm int8 build error

a666997

fix(src/layer): fixme warning

8226eee

fix(CI): sse2 run error

259ca0b

fix(CI): build error

2c1d9b0

fix(CI): test_layernorm

45f9207

fix(CI): test_layernorm

a2c48aa

fix(CI): add hook

102e1dd

fix(layernorm): add debug hook

4c9c906

fix(CI): update

e9c6792

fix(test): update

81a1149

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

support layernorm int8#4132

support layernorm int8#4132
tpoisonooo wants to merge 41 commits intoTencent:masterfrom
tpoisonooo:vit-add-layernorm-int8

tpoisonooo commented Aug 11, 2022 •

edited

Loading

Uh oh!

codecov-commenter commented Aug 11, 2022 •

edited

Loading

Uh oh!

lgtm-com bot commented Aug 11, 2022

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

tpoisonooo commented Aug 11, 2022 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

codecov-commenter commented Aug 11, 2022 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Codecov Report

Uh oh!

lgtm-com bot commented Aug 11, 2022

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

tpoisonooo commented Aug 11, 2022 •

edited

Loading

codecov-commenter commented Aug 11, 2022 •

edited

Loading