New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

Conformer Modules #58

Merged

albertz merged 33 commits into main from zeineldeen_conformer

Nov 9, 2021

Member

mmz33 commented Nov 4, 2021

Fix #54.

This is a draft now. It still requires the implementation of MultiHeadSelfAttention from #52.

mmz33 requested review from Atticus1806 and albertz and removed request for Atticus1806

November 4, 2021 10:43

Member Author

mmz33 commented Nov 4, 2021 •

edited

Loading

The parameters names still need to be changed to be consistent with #53, #55.

albertz reviewed

View reviewed changes

nn/conformer.py Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/math_.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

Member

albertz commented Nov 4, 2021

See also my other comments (they don't show up in the "Files changed" view because they got outdated due to the changed indent). Mark them as "resolved" when you resolved them.

Member

albertz commented Nov 4, 2021

Btw, as usual, also see failing tests.

albertz reviewed

View reviewed changes

nn/math_.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

mmz33 force-pushed the zeineldeen_conformer branch from c0a1f78 to 6e3a651 Compare

November 4, 2021 15:27

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved

mmz33 added 10 commits

November 9, 2021 13:46


          fix batch norm

fae6c9c


          remove layer suffix from convsubsample module

614b9bb


          better list compr

40e9ad1


          add axis as param for glu func

6b1166b


          set None by default for optional params

a626bbb


          remove default val for dropout

a0b3980


          fix bn + conformer encoder

8ec724d


          fix indent

0f11719


          add docs + make classes public

c4d1a44


          fix docs

ef51266

mmz33 force-pushed the zeineldeen_conformer branch from 6989cea to ef51266 Compare

November 9, 2021 12:47

mmz33 added 2 commits

November 9, 2021 19:57


          add self att

687a6f7


          cleanup

c3d605f

albertz reviewed

View reviewed changes

nn/conformer.py Outdated Show resolved Hide resolved


          Update nn/conformer.py

89bc71b

albertz marked this pull request as ready for review

November 9, 2021 19:45

albertz merged commit 8355dea into main

albertz deleted the zeineldeen_conformer branch

November 9, 2021 19:46

Member

albertz commented Nov 9, 2021

Merged now. Let's further improve this in later PRs or commits.

Member

albertz commented Apr 22, 2022

A question on the ConformerConvSubsample: I think this is not exactly described in the original paper, right? So where is it exactly described? Where did you base this on?

Member Author

mmz33 commented Apr 22, 2022

Yes, in the original paper it is not described. The one implemented here was based on ESPNet code. See here:

Member

albertz commented Apr 22, 2022

But in the original paper, there were some references to other paper they referred to on the preprocessing. I think it is explained in those other papers, or not?

Also, in your implementation here, you use maxpooling as far as I see. But this is different to ESPnet. In ESPnet, they don't use any pooling but just striding instead. Where do you have the pooling from?

Member

albertz commented Apr 22, 2022

Also, in ESPnet there are some other variants, including VGG2L (and I think VGG-style was also mentioned in the Conformer paper, or the one it refers to?). VGG2L looks also similar to @christophmluscher 's hybrid baseline?

Member

albertz commented Apr 23, 2022

Further, in ESPnet (ConformerEncoder), there is pos encoding at the end of the preprocessing block: here

This is usually RelPositionalEncoding (e.g. in train_asr_conformer10_hop_length160).

Then, for the self-attention, it usually uses RelPositionMultiHeadedAttention.

Member

albertz commented Apr 23, 2022 •

edited

Loading

Also related: espnet/espnet#2816, espnet/espnet#2684

Member Author

mmz33 commented Apr 23, 2022 •

edited

Loading

Where do you have the pooling from?

Ok then it is not exactly the same. you are right they use striding instead.

albertz mentioned this pull request

Create good Conformer baselines #233

Open

This was referenced May 5, 2023

Implement ConformerFeedForwardV1 Part rwth-i6/i6_models#6

Merged

Implement conformer convolution part rwth-i6/i6_models#4

Merged

add MHSA module rwth-i6/i6_models#7

Merged

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet