Add large variations of electra in presets

pranavvp16 · pranavvp16 · commit 04111518a26e · 2024-03-24T02:38:07.000+05:30
diff --git a/keras_nlp/models/electra/electra_presets.py b/keras_nlp/models/electra/electra_presets.py
@@ -25,7 +25,7 @@
             "path": "electra",
             "model_card": "https://github.com/google-research/electra",
         },
-        "kaggle_handle": "kaggle://pranavprajapati16/electra/keras/electra_base_discriminator_en/1",
+        "kaggle_handle": "kaggle://keras/electra/keras/electra_base_discriminator_en/1",
     },
     "electra_small_discriminator_en": {
         "metadata": {
@@ -38,7 +38,7 @@
             "path": "electra",
             "model_card": "https://github.com/google-research/electra",
         },
-        "kaggle_handle": "kaggle://pranavprajapati16/electra/keras/electra_small_discriminator_en/1",
+        "kaggle_handle": "kaggle://keras/electra/keras/electra_small_discriminator_en/1",
     },
     "electra_small_generator_en": {
         "metadata": {
@@ -51,7 +51,7 @@
             "path": "electra",
             "model_card": "https://github.com/google-research/electra",
         },
-        "kaggle_handle": "kaggle://pranavprajapati16/electra/keras/electra_small_generator_en/1",
+        "kaggle_handle": "kaggle://keras/electra/keras/electra_small_generator_en/1",
     },
     "electra_base_generator_en": {
         "metadata": {
@@ -64,6 +64,32 @@
             "path": "electra",
             "model_card": "https://github.com/google-research/electra",
         },
-        "kaggle_handle": "kaggle://pranavprajapati16/electra/keras/electra_base_generator_en/1",
+        "kaggle_handle": "kaggle://keras/electra/keras/electra_base_generator_en/1",
+    },
+    "electra_large_generator_en": {
+        "metadata": {
+            "description": (
+                "ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators"
+                "This is large generator model with 24 layers."
+            ),
+            "params": 51065344,
+            "official_name": "ELECTRA",
+            "path": "electra",
+            "model_card": "https://github.com/google-research/electra",
+        },
+        "kaggle_handle": "kaggle://pranavprajapati16/electra/keras/electra_large_generator_en/1",
+    },
+    "electra_large_discriminator_en": {
+        "metadata": {
+            "description": (
+                "ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators"
+                "This is large discriminator model with 24 layers."
+            ),
+            "params": 335141888,
+            "official_name": "ELECTRA",
+            "path": "electra",
+            "model_card": "https://github.com/google-research/electra",
+        },
+        "kaggle_handle": "kaggle://pranavprajapati16/electra/keras/electra_large_discriminator_en/1",
     },
 }
diff --git a/tools/checkpoint_conversion/convert_electra_checkpoints.py b/tools/checkpoint_conversion/convert_electra_checkpoints.py
@@ -37,6 +37,8 @@
     "electra_small_generator_en": "google/electra-small-generator",
     "electra_base_discriminator_en": "google/electra-base-discriminator",
     "electra_small_discriminator_en": "google/electra-small-discriminator",
+    "electra_large_discriminator_en": "google/electra-large-discriminator",
+    "electra_large_generator_en": "google/electra-large-generator",
 }
 
 EXTRACT_DIR = "./model"

Original file line number	Diff line number	Diff line change
`@@ -37,6 +37,8 @@`
`37`	`37`	`"electra_small_generator_en": "google/electra-small-generator",`
`38`	`38`	`"electra_base_discriminator_en": "google/electra-base-discriminator",`
`39`	`39`	`"electra_small_discriminator_en": "google/electra-small-discriminator",`
	`40`	`+ "electra_large_discriminator_en": "google/electra-large-discriminator",`
	`41`	`+ "electra_large_generator_en": "google/electra-large-generator",`
`40`	`42`	`}`
`41`	`43`
`42`	`44`	`EXTRACT_DIR = "./model"`