[Tokenizer] Fix tokenizer of llama3.3 #9641

DrownFish19 · 2024-12-16T08:36:34Z

PR types

Bug fixes

PR changes

Others

Description

Fix tokenizer of llama3.3

paddle-bot · 2024-12-16T08:36:39Z

Thanks for your contribution!

codecov · 2024-12-16T09:10:54Z

Codecov Report

Attention: Patch coverage is 66.66667% with 2 lines in your changes missing coverage. Please review.

Project coverage is 52.80%. Comparing base (dc0ca03) to head (9315125).
Report is 1 commits behind head on develop.

Files with missing lines	Patch %	Lines
paddlenlp/transformers/llama/modeling.py	0.00%	2 Missing ⚠️

Additional details and impacted files

@@             Coverage Diff             @@
##           develop    #9641      +/-   ##
===========================================
+ Coverage    52.76%   52.80%   +0.04%     
===========================================
  Files          710      710              
  Lines       111231   111234       +3     
===========================================
+ Hits         58688    58742      +54     
+ Misses       52543    52492      -51

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

…nizer

…ish19/PaddleNLP into dev_20241216_fix_llama3_tokenizer

DrownFish19 · 2024-12-17T05:46:57Z

paddlenlp/transformers/llama/modeling.py

@@ -1601,7 +1601,8 @@ def _prepare_decoder_attention_mask(attention_mask, input_shape, past_key_values
            expanded_attn_mask = expanded_attn_mask.astype(dtype)
            expanded_attn_mask = paddle.where(expanded_attn_mask, x, y).astype(dtype)
        else:
-            expanded_attn_mask = paddle.where(expanded_attn_mask, 0.0, paddle.finfo(dtype).min).astype(dtype)
+            expanded_attn_mask = paddle.where(expanded_attn_mask.cast("bool"), 0.0, paddle.finfo(dtype).min)
+            expanded_attn_mask = expanded_attn_mask.astype(dtype)


这里PaddleNLP-CI已经验证

fix tokenizer of llama3 and add test case

3239a47

DrownFish19 added 3 commits December 16, 2024 21:11

Merge branch 'PaddlePaddle:develop' into dev_20241216_fix_llama3_toke…

7b0550e

…nizer

fix paddle.where

d87aafb

Merge branch 'dev_20241216_fix_llama3_tokenizer' of github.com:DrownF…

9315125

…ish19/PaddleNLP into dev_20241216_fix_llama3_tokenizer

DrownFish19 commented Dec 17, 2024

View reviewed changes

ZHUI merged commit 9eb3cfe into PaddlePaddle:develop Dec 17, 2024
9 of 12 checks passed

DrownFish19 deleted the dev_20241216_fix_llama3_tokenizer branch December 17, 2024 06:09

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Tokenizer] Fix tokenizer of llama3.3 #9641

[Tokenizer] Fix tokenizer of llama3.3 #9641

DrownFish19 commented Dec 16, 2024

paddle-bot bot commented Dec 16, 2024

codecov bot commented Dec 16, 2024 •

edited

Loading

DrownFish19 Dec 17, 2024

[Tokenizer] Fix tokenizer of llama3.3 #9641

[Tokenizer] Fix tokenizer of llama3.3 #9641

Conversation

DrownFish19 commented Dec 16, 2024

PR types

PR changes

Description

paddle-bot bot commented Dec 16, 2024

codecov bot commented Dec 16, 2024 • edited Loading

Codecov Report

DrownFish19 Dec 17, 2024

Choose a reason for hiding this comment

codecov bot commented Dec 16, 2024 •

edited

Loading