Call `model.eval()` before generating? #16

gustavdelius · 2023-04-23T21:46:23Z

I understand why we have to call model.eval() before calculating the average loss in estimate_loss(). But should we not similarly call model.eval() before we start generating from the model?

The text was updated successfully, but these errors were encountered:

manudwd · 2023-05-14T16:00:16Z

You should be calling model.eval() at the time of inference, that is, if you want to set the affect of weights post normalization and dropout. Without setting model.eval() there is no effect of dropout and normalization at the time of testing. I believe that is just something that was forgotten.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Call `model.eval()` before generating? #16

Call `model.eval()` before generating? #16

gustavdelius commented Apr 23, 2023

manudwd commented May 14, 2023

Call model.eval() before generating? #16

Call model.eval() before generating? #16

Comments

gustavdelius commented Apr 23, 2023

manudwd commented May 14, 2023

Call `model.eval()` before generating? #16

Call `model.eval()` before generating? #16