Cubic sampling w/ curve param by kalomaze · Pull Request #5551 · oobabooga/textgen

kalomaze · 2024-02-20T00:31:25Z

This adds upon the original Quadratic Sampling method with an additional parameter that I've labeled "smoothing_curve".

The idea is to enable even lower smoothing_factor values than ~0.25ish to work well; we do this by applying a cubic transformation to compensate, which seems to make the falloff steeper.

Not ready to merge yet, needs empirical testing from users. My hope is that you can fully avoid having to use truncation schemes and go for a fully "smooth" transformation to the distribution across different models.

The higher the smoothing_curve, the steeper the fall off (so it becomes harsher).

2024-02-19_15-42-06.mp4

Brief tests on a 7b are showing that it does in fact help to make lower smoothing_factor values coherent in practice (so far at least).

1.0 smoothing_curve is the "old" behavior and has no effect.

Merge dev branch

Merge dev branch (oobabooga#5257)

Merge dev branch

BadisG · 2024-02-21T11:55:03Z

When you go for 3 or higher on the smoothing_curve, it doesn't work anymore

Merge dev branch

kalomaze · 2024-03-01T04:02:49Z

When you go for 3 or higher on the smoothing_curve, it doesn't work anymore

I can't reproduce this issue, through llama.cpp_HF at least.

Myobu1 · 2024-03-02T00:31:33Z

When you go for 3 or higher on the smoothing_curve, it doesn't work anymore

I can't reproduce this issue, through llama.cpp_HF at least.

I have the exact same issue on Ooba. Setting smoothing curve to lower than 3, it works fine. The moment I go at or above it, I start getting errors regarding RuntimeError: probability tensor contains either inf, nan or element < 0 and inability to output replies after 5 attempts on Silly.

Edit: Apparently if you have any banned tokens the issue will occur.

Ph0rk0z · 2024-03-02T00:57:58Z

I get nan error as well. using exl2_HF. utils.py line 2734

Its a problem from transformers.

next_tokens = torch.multinomial(probs, num_samples=1).squeeze(1)

2.99 is the highest I can go before this error. But so far I was able to get the factor down to .05 with that value.

Ph0rk0z · 2024-03-02T14:53:07Z

I only got 2 braincells to knock together, but to me

k = (3 - self.smoothing_curve) / 2

3-3 is 0 and then thats 0/2 which makes NaN

Btw: Changing it to 10 did fix it for me, up to 9.99 ofc. I am getting best results with .20-.2X and 1.04 because all I can do is watch the PR video go by token distribution pictured. Also .02 and 4.82-5.6 was another decent point. Otherwise this removes too many tokens and gets very deterministic.

oobabooga · 2024-03-03T16:20:10Z

The nan error was caused by making operations with -inf^3. I solved it by keeping scores with -inf value unchanged.

Ph0rk0z · 2024-03-03T16:31:42Z

Will retest.

works but back to square one on how to set it.

oobabooga added 30 commits December 14, 2023 22:39

Merge pull request oobabooga#4927 from oobabooga/dev

c3e0fcf

Merge dev branch

Merge pull request oobabooga#4937 from oobabooga/dev

443be39

Merge dev branch

Merge pull request oobabooga#4961 from oobabooga/dev

7be0983

Merge dev branch

Merge pull request oobabooga#4980 from oobabooga/dev

b28020a

Merge dev branch

Merge pull request oobabooga#4988 from oobabooga/dev

781367b

Merge dev branch

Merge pull request oobabooga#5002 from oobabooga/dev

71eb744

Merge dev branch

Merge pull request oobabooga#5005 from oobabooga/dev

5b791ca

Merge dev branch

Merge pull request oobabooga#5011 from oobabooga/dev

c1f78db

Merge dev branch

Merge pull request oobabooga#5012 from oobabooga/dev

489f4a2

Merge dev branch

Merge pull request oobabooga#5022 from oobabooga/dev

11288d1

Merge dev branch

Merge pull request oobabooga#5039 from oobabooga/dev

4b25acf

Merge dev branch

Merge pull request oobabooga#5073 from oobabooga/dev

af87609

Merge dev branch

Merge pull request oobabooga#5078 from oobabooga/dev

19d1374

Merge dev branch

Merge pull request oobabooga#5100 from oobabooga/dev

3fd7073

Merge dev branch

Merge pull request oobabooga#5132 from oobabooga/dev

3e3a66e

Merge dev branch

Merge pull request oobabooga#5152 from oobabooga/dev

3f28925

Merge dev branch

Merge pull request oobabooga#5163 from oobabooga/dev

c54d1da

Merge dev branch

Merge pull request oobabooga#5181 from oobabooga/dev

8ea3f31

Merge dev branch

Merge pull request oobabooga#5195 from oobabooga/dev

e169993

Merge dev branch

Merge pull request oobabooga#5199 from oobabooga/dev

ad1ff53

Merge dev branch

Merge pull request oobabooga#5220 from oobabooga/dev

2dc8db8

Merge dev branch

Merge pull request oobabooga#5253 from oobabooga/dev

61e4bfe

Merge dev branch

Merge pull request oobabooga#5266 from oobabooga/dev

d8c3a5b

Merge dev branch (oobabooga#5257)

Merge pull request oobabooga#5347 from oobabooga/dev

1343aa3

Merge dev branch

Merge pull request oobabooga#5348 from oobabooga/dev

837bd88

Merge dev branch

Merge pull request oobabooga#5379 from oobabooga/dev

e7a760e

Merge dev branch

Merge pull request oobabooga#5404 from oobabooga/dev

4f3fdf1

Merge dev branch

Merge pull request oobabooga#5452 from oobabooga/dev

a329db0

Merge dev branch

Merge pull request oobabooga#5453 from oobabooga/dev

0f134bf

Merge dev branch

Merge pull request oobabooga#5496 from oobabooga/dev

dc6adef

Merge dev branch

oobabooga and others added 5 commits February 14, 2024 11:32

Merge pull request oobabooga#5502 from oobabooga/dev

771c592

Merge dev branch

Merge pull request oobabooga#5530 from oobabooga/dev

dd46229

Merge dev branch

Merge pull request oobabooga#5534 from oobabooga/dev

7838075

Merge dev branch

Merge pull request oobabooga#5549 from oobabooga/dev

d6bb6e7

Merge dev branch

Cubic sampling w/ curve param

76c73f7

Merge pull request oobabooga#5574 from oobabooga/dev

ba85271

Merge dev branch

kalomaze mentioned this pull request Mar 1, 2024

smoothing_curve UI support SillyTavern/SillyTavern#1875

Merged

Merge branch 'oobabooga:main' into curve-test

021a410

igorbarshteyn mentioned this pull request Mar 1, 2024

[Feature Request] Dynamic temperature sampling for better coherence / creativity ggml-org/llama.cpp#3483

Closed

oobabooga added 3 commits March 3, 2024 08:08

Minor changes

b7ca63c

Prevent numerical overflow with -inf values

bb30014

Change a comment

be5a9ab

oobabooga changed the base branch from main to dev March 3, 2024 16:20

oobabooga merged commit cfb25c9 into oobabooga:dev Mar 3, 2024

AlpinDale mentioned this pull request Mar 3, 2024

feat: quadratic + cubic sampling vllm-project/vllm#3167

Closed

kalomaze mentioned this pull request Apr 2, 2024

Smooth Sampling / Quadratic Sampling support ggml-org/llama.cpp#6445

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Cubic sampling w/ curve param#5551

Cubic sampling w/ curve param#5551
oobabooga merged 40 commits into
oobabooga:devfrom
kalomaze:curve-test

kalomaze commented Feb 20, 2024 •

edited

Loading

Uh oh!

BadisG commented Feb 21, 2024 •

edited

Loading

Uh oh!

kalomaze commented Mar 1, 2024 •

edited

Loading

Uh oh!

Myobu1 commented Mar 2, 2024 •

edited

Loading

Uh oh!

Ph0rk0z commented Mar 2, 2024 •

edited

Loading

Uh oh!

Ph0rk0z commented Mar 2, 2024 •

edited

Loading

Uh oh!

oobabooga commented Mar 3, 2024

Uh oh!

Ph0rk0z commented Mar 3, 2024 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants

Conversation

kalomaze commented Feb 20, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

BadisG commented Feb 21, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

kalomaze commented Mar 1, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Myobu1 commented Mar 2, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Ph0rk0z commented Mar 2, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Ph0rk0z commented Mar 2, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

oobabooga commented Mar 3, 2024

Uh oh!

Ph0rk0z commented Mar 3, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants

kalomaze commented Feb 20, 2024 •

edited

Loading

BadisG commented Feb 21, 2024 •

edited

Loading

kalomaze commented Mar 1, 2024 •

edited

Loading

Myobu1 commented Mar 2, 2024 •

edited

Loading

Ph0rk0z commented Mar 2, 2024 •

edited

Loading

Ph0rk0z commented Mar 2, 2024 •

edited

Loading

Ph0rk0z commented Mar 3, 2024 •

edited

Loading