ggml-org · slaren · Aug 25, 2023 · Aug 24, 2023 · Aug 24, 2023 · Aug 24, 2023
diff --git a/convert.py b/convert.py
@@ -105,6 +105,7 @@ class Params:
     f_norm_eps: float
 
     f_rope_freq_base: Optional[float] = None
+    f_rope_scale: Optional[float] = None
 
     ftype: Optional[GGMLFileType] = None
 
@@ -160,13 +161,18 @@ def guessed(model: 'LazyModel') -> 'Params':
     def loadHFTransformerJson(model: 'LazyModel', config_path: 'Path') -> 'Params':
         config = json.load(open(config_path))
 
-        n_vocab    = config["vocab_size"]
-        n_embd     = config["hidden_size"]
-        n_layer    = config["num_hidden_layers"]
-        n_ff       = config["intermediate_size"]
-        n_head     = config["num_attention_heads"]
-        n_head_kv  = config["num_key_value_heads"] if "num_key_value_heads" in config else n_head
-        f_norm_eps = config["rms_norm_eps"]
+        n_vocab      = config["vocab_size"]
+        n_embd       = config["hidden_size"]
+        n_layer      = config["num_hidden_layers"]
+        n_ff         = config["intermediate_size"]
+        n_head       = config["num_attention_heads"]
+        n_head_kv    = config["num_key_value_heads"] if "num_key_value_heads" in config else n_head
+        f_norm_eps   = config["rms_norm_eps"]
+
+        if "rope_scaling" in config and config["rope_scaling"].get("type") == "linear":
+            f_rope_scale = config["rope_scaling"].get("factor")
+        else:
+            f_rope_scale = None
 
         n_mult = Params.find_n_mult(n_ff, n_embd)
 
@@ -179,15 +185,16 @@ def loadHFTransformerJson(model: 'LazyModel', config_path: 'Path') -> 'Params':
                             "Suggestion: provide 'config.json' of the model in the same directory containing model files.")
 
         return Params(
-            n_vocab    = n_vocab,
-            n_embd     = n_embd,
-            n_mult     = n_mult,
-            n_layer    = n_layer,
-            n_ctx      = n_ctx,
-            n_ff       = n_ff,
-            n_head     = n_head,
-            n_head_kv  = n_head_kv,
-            f_norm_eps = f_norm_eps,
+            n_vocab      = n_vocab,
+            n_embd       = n_embd,
+            n_mult       = n_mult,
+            n_layer      = n_layer,
+            n_ctx        = n_ctx,
+            n_ff         = n_ff,
+            n_head       = n_head,
+            n_head_kv    = n_head_kv,
+            f_norm_eps   = f_norm_eps,
+            f_rope_scale = f_rope_scale,
         )
 
     # LLaMA v2 70B params.json
@@ -771,6 +778,9 @@ def add_meta_arch(self, params: Params) -> None:
         if params.f_rope_freq_base:
             self.gguf.add_rope_freq_base(params.f_rope_freq_base)
 
+        if params.f_rope_scale:
+            self.gguf.add_rope_scale_linear(params.f_rope_scale)
+
         if params.ftype:
             self.gguf.add_file_type(params.ftype)