Lower the default learning rate for albert #1786

mattdangerw · 2024-08-19T23:13:37Z

Just noticed while porting #1767 that the default learning rate for our classifier does not work for albert pretrained checkpoints. Let's lower it for this model

Fixes #831

Just noticed while porting keras-team#1767 that the default learning rate for our classifier does not work for albert pretrained checkpoints. Let's lower it for this model

mattdangerw requested a review from SamanehSaadat August 19, 2024 23:13

SamanehSaadat approved these changes Aug 19, 2024

View reviewed changes

Lower the default learning rate for albert

964bce1

Just noticed while porting keras-team#1767 that the default learning rate for our classifier does not work for albert pretrained checkpoints. Let's lower it for this model

mattdangerw force-pushed the albert-learning-rate branch from 558ac3f to 964bce1 Compare August 19, 2024 23:58

mattdangerw merged commit 4931eae into keras-team:master Aug 20, 2024
8 of 11 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Lower the default learning rate for albert #1786

Lower the default learning rate for albert #1786

mattdangerw commented Aug 19, 2024 •

edited

Loading

Lower the default learning rate for albert #1786

Lower the default learning rate for albert #1786

Conversation

mattdangerw commented Aug 19, 2024 • edited Loading

mattdangerw commented Aug 19, 2024 •

edited

Loading