feat: support custom onnx file and update model signatures #761

ZiniuYu · 2022-06-27T10:08:39Z

This PR allows the user to set filepath for pretrained custom onnx model and unify the signature of tensorrt, onnx, and huggingface clip runtime.
We also add md5 verification to make sure users download the latest and correct models.
Since tensorrt models are extremely picky for many dependencies, we no longer support tensorrt model hosting, which means that it will first download the latest onnx model and convert to trt during runtime and save for it later use.

TODO:

Add parameters to allow user select custom pretrained onnx model
Convert existing models to have updated signatures
Modify other executors to be compatible with the new structure
Add MD5 verification for downloaded model

codecov · 2022-06-27T10:11:24Z

Codecov Report

Merging #761 (94008ac) into main (ed1b92d) will increase coverage by 0.71%.
The diff coverage is 100.00%.

@@            Coverage Diff             @@
##             main     #761      +/-   ##
==========================================
+ Coverage   78.31%   79.03%   +0.71%     
==========================================
  Files          17       17              
  Lines        1213     1240      +27     
==========================================
+ Hits          950      980      +30     
+ Misses        263      260       -3

Flag	Coverage Δ
cas	`79.03% <100.00%> (+0.71%)`	⬆️

Flags with carried forward coverage won't be shown. Click here to find out more.

Impacted Files	Coverage Δ
server/clip_server/executors/clip_torch.py	`87.03% <ø> (ø)`
server/clip_server/executors/clip_onnx.py	`85.48% <100.00%> (ø)`
server/clip_server/executors/helper.py	`100.00% <100.00%> (ø)`
server/clip_server/model/clip.py	`65.60% <100.00%> (+6.31%)`	⬆️
server/clip_server/model/clip_onnx.py	`96.96% <100.00%> (+0.96%)`	⬆️
server/clip_server/model/clip_trt.py	`92.10% <100.00%> (-0.21%)`	⬇️

Continue to review full report at Codecov.

Legend - Click here to learn more
Δ = absolute <relative> (impact), ø = not affected, ? = missing data
Powered by Codecov. Last update ed1b92d...94008ac. Read the comment docs.

server/clip_server/model/clip_onnx.py

server/clip_server/executors/clip_onnx.py

server/clip_server/model/clip_onnx.py

tests/conftest.py

server/clip_server/model/clip_onnx.py

server/clip_server/model/clip.py

numb3r3 · 2022-07-01T07:53:16Z

server/clip_server/model/clip.py

@@ -335,6 +336,7 @@ def tokenize(
    eot_token = _tokenizer.encoder['<|endoftext|>']
    all_tokens = [[sot_token] + _tokenizer.encode(text) + [eot_token] for text in texts]
    result = torch.zeros(len(all_tokens), context_length, dtype=torch.long)
+    attention_masks = torch.zeros(len(all_tokens), context_length, dtype=torch.long)


I think we need to support variable input length here.

this is blocked

server/clip_server/model/model.py

server/clip_server/executors/helper.py

server/clip_server/model/clip_onnx.py

server/clip_server/model/clip_trt.py

server/clip_server/model/clip.py

server/clip_server/executors/helper.py

server/clip_server/model/clip.py

server/clip_server/model/clip_trt.py

server/clip_server/tensorrt-flow.yml

server/clip_server/model/clip.py

server/clip_server/model/clip_onnx.py

server/clip_server/model/clip_trt.py

github-actions · 2022-07-12T02:35:44Z

📝 Docs are deployed on https://ft-improve_onnx--jina-docs.netlify.app 🎉

feat: allow custom onnx file

7fbb041

github-actions bot added size/s component/server labels Jun 27, 2022

fix: path name

10dd4f5

numb3r3 requested changes Jun 28, 2022

View reviewed changes

server/clip_server/model/clip_onnx.py Outdated Show resolved Hide resolved

server/clip_server/executors/clip_onnx.py Outdated Show resolved Hide resolved

numb3r3 reviewed Jun 28, 2022

View reviewed changes

server/clip_server/model/clip_onnx.py Outdated Show resolved Hide resolved

ZiniuYu added 3 commits June 28, 2022 11:17

fix: validate model path

bcad79c

chore: improve error message

1e8ea3b

test: add custom path unit test

9039b8f

github-actions bot added the area/testing label Jun 28, 2022

test: add test cases

5c874a1

numb3r3 requested changes Jun 28, 2022

View reviewed changes

server/clip_server/model/clip_onnx.py Outdated Show resolved Hide resolved

tests/conftest.py Show resolved Hide resolved

test: add test cases

6413f74

numb3r3 requested changes Jun 28, 2022

View reviewed changes

server/clip_server/model/clip_onnx.py Outdated Show resolved Hide resolved

ZiniuYu added 2 commits June 28, 2022 18:03

test: add test cases

8cff7ba

fix: reindent

7affea9

numb3r3 requested changes Jun 29, 2022

View reviewed changes

server/clip_server/model/clip_onnx.py Show resolved Hide resolved

server/clip_server/model/clip_onnx.py Outdated Show resolved Hide resolved

ZiniuYu added 2 commits June 30, 2022 18:12

fix: change type to int32

fc3a41f

fix: modify text input

5592455

github-actions bot added size/m and removed size/s labels Jul 1, 2022

chore: format code

14da62b

github-actions bot added the area/docs label Jul 1, 2022

ZiniuYu added 3 commits July 1, 2022 15:30

chore: update model links

1dd7589

fix: update links

6802d25

fix: typo

6242203

numb3r3 requested changes Jul 1, 2022

View reviewed changes

ZiniuYu added 2 commits July 1, 2022 18:55

fix: add attention mask for onnx

3b9e917

fix: trt text encode key

e704242

test: add path test

8ab7e89

numb3r3 requested changes Jul 7, 2022

View reviewed changes

ZiniuYu added 2 commits July 7, 2022 14:31

fix: house keeping

d20785b

fix: house keeping

3bd3b5d

ZiniuYu force-pushed the improve_onnx branch from 68cf0c3 to 3bd3b5d Compare July 7, 2022 06:33

ZiniuYu added 4 commits July 7, 2022 14:35

fix: house keeping

f3a059e

fix: md5 test case

21c857c

fix: modify visual signature

8d63465

fix: modify visual signature

7868308

numb3r3 requested changes Jul 7, 2022

View reviewed changes

fix: improve download retry

25c8fdc

github-actions bot added size/l and removed size/m labels Jul 7, 2022

fix: trt timeout 30 min

4e02508

numb3r3 requested changes Jul 8, 2022

View reviewed changes

server/clip_server/model/clip.py Outdated Show resolved Hide resolved

server/clip_server/model/clip.py Outdated Show resolved Hide resolved

ZiniuYu added 2 commits July 10, 2022 22:09

fix: modify download logic

dfcd82c

docs: update trt

6bea114

numb3r3 requested changes Jul 11, 2022

View reviewed changes

server/clip_server/model/clip_trt.py Show resolved Hide resolved

ZiniuYu and others added 5 commits July 11, 2022 13:43

fix: validation

cd631c5

fix: polish download with md5

e63cb46

fix: polish download with md5

45fb0f6

fix: stop with max retires

f6facd0

fix: use forloop

56d0dd3

numb3r3 closed this Jul 11, 2022

numb3r3 reopened this Jul 11, 2022

test: none regular file

94008ac

numb3r3 merged commit ee7da10 into main Jul 12, 2022

numb3r3 deleted the improve_onnx branch July 12, 2022 03:21

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat: support custom onnx file and update model signatures #761

feat: support custom onnx file and update model signatures #761

ZiniuYu commented Jun 27, 2022 •

edited

Loading

codecov bot commented Jun 27, 2022 •

edited

Loading

numb3r3 Jul 1, 2022

ZiniuYu Jul 1, 2022

github-actions bot commented Jul 12, 2022

feat: support custom onnx file and update model signatures #761

feat: support custom onnx file and update model signatures #761

Conversation

ZiniuYu commented Jun 27, 2022 • edited Loading

codecov bot commented Jun 27, 2022 • edited Loading

Codecov Report

numb3r3 Jul 1, 2022

Choose a reason for hiding this comment

ZiniuYu Jul 1, 2022

Choose a reason for hiding this comment

github-actions bot commented Jul 12, 2022

ZiniuYu commented Jun 27, 2022 •

edited

Loading

codecov bot commented Jun 27, 2022 •

edited

Loading