@@ -483,7 +483,9 @@ class MODEL_TENSOR(IntEnum):
483483 V_ENC_EMBD_PATCH = auto ()
484484 V_ENC_EMBD_POS = auto ()
485485 V_ENC_ATTN_Q = auto ()
486+ V_ENC_ATTN_Q_NORM = auto ()
486487 V_ENC_ATTN_K = auto ()
488+ V_ENC_ATTN_K_NORM = auto ()
487489 V_ENC_ATTN_V = auto ()
488490 V_ENC_INPUT_NORM = auto ()
489491 V_ENC_OUTPUT = auto ()
@@ -742,7 +744,9 @@ class MODEL_TENSOR(IntEnum):
742744 MODEL_TENSOR .V_ENC_EMBD_PATCH : "v.patch_embd" ,
743745 MODEL_TENSOR .V_ENC_EMBD_POS : "v.position_embd" ,
744746 MODEL_TENSOR .V_ENC_ATTN_Q : "v.blk.{bid}.attn_q" ,
747+ MODEL_TENSOR .V_ENC_ATTN_Q_NORM : "v.blk.{bid}.attn_q_norm" ,
745748 MODEL_TENSOR .V_ENC_ATTN_K : "v.blk.{bid}.attn_k" ,
749+ MODEL_TENSOR .V_ENC_ATTN_K_NORM : "v.blk.{bid}.attn_k_norm" ,
746750 MODEL_TENSOR .V_ENC_ATTN_V : "v.blk.{bid}.attn_v" ,
747751 MODEL_TENSOR .V_ENC_INPUT_NORM : "v.blk.{bid}.ln1" ,
748752 MODEL_TENSOR .V_ENC_OUTPUT : "v.blk.{bid}.attn_out" ,
@@ -782,7 +786,9 @@ class MODEL_TENSOR(IntEnum):
782786 MODEL_TENSOR .V_ENC_EMBD_PATCH ,
783787 MODEL_TENSOR .V_ENC_EMBD_POS ,
784788 MODEL_TENSOR .V_ENC_ATTN_Q ,
789+ MODEL_TENSOR .V_ENC_ATTN_Q_NORM ,
785790 MODEL_TENSOR .V_ENC_ATTN_K ,
791+ MODEL_TENSOR .V_ENC_ATTN_K_NORM ,
786792 MODEL_TENSOR .V_ENC_ATTN_V ,
787793 MODEL_TENSOR .V_ENC_INPUT_NORM ,
788794 MODEL_TENSOR .V_ENC_OUTPUT ,
0 commit comments