@@ -343,6 +343,7 @@ class MODEL_ARCH(IntEnum):
343343 WAVTOKENIZER_DEC = auto ()
344344 PLM = auto ()
345345 BAILINGMOE = auto ()
346+ DOTS1 = auto ()
346347 ARCEE = auto ()
347348
348349
@@ -624,6 +625,7 @@ class MODEL_TENSOR(IntEnum):
624625 MODEL_ARCH .WAVTOKENIZER_DEC : "wavtokenizer-dec" ,
625626 MODEL_ARCH .PLM : "plm" ,
626627 MODEL_ARCH .BAILINGMOE : "bailingmoe" ,
628+ MODEL_ARCH .DOTS1 : "dots1" ,
627629 MODEL_ARCH .ARCEE : "arcee" ,
628630}
629631
@@ -2046,6 +2048,30 @@ class MODEL_TENSOR(IntEnum):
20462048 MODEL_TENSOR .FFN_DOWN_SHEXP ,
20472049 MODEL_TENSOR .FFN_UP_SHEXP ,
20482050 ],
2051+ MODEL_ARCH .DOTS1 : [
2052+ MODEL_TENSOR .TOKEN_EMBD ,
2053+ MODEL_TENSOR .OUTPUT_NORM ,
2054+ MODEL_TENSOR .OUTPUT ,
2055+ MODEL_TENSOR .ATTN_NORM ,
2056+ MODEL_TENSOR .ATTN_Q ,
2057+ MODEL_TENSOR .ATTN_Q_NORM ,
2058+ MODEL_TENSOR .ATTN_K ,
2059+ MODEL_TENSOR .ATTN_K_NORM ,
2060+ MODEL_TENSOR .ATTN_V ,
2061+ MODEL_TENSOR .ATTN_OUT ,
2062+ MODEL_TENSOR .FFN_EXP_PROBS_B ,
2063+ MODEL_TENSOR .FFN_NORM ,
2064+ MODEL_TENSOR .FFN_GATE ,
2065+ MODEL_TENSOR .FFN_GATE_EXP ,
2066+ MODEL_TENSOR .FFN_GATE_INP ,
2067+ MODEL_TENSOR .FFN_GATE_SHEXP ,
2068+ MODEL_TENSOR .FFN_DOWN ,
2069+ MODEL_TENSOR .FFN_DOWN_EXP ,
2070+ MODEL_TENSOR .FFN_DOWN_SHEXP ,
2071+ MODEL_TENSOR .FFN_UP ,
2072+ MODEL_TENSOR .FFN_UP_EXP ,
2073+ MODEL_TENSOR .FFN_UP_SHEXP ,
2074+ ],
20492075 MODEL_ARCH .ARCEE : [
20502076 MODEL_TENSOR .TOKEN_EMBD ,
20512077 MODEL_TENSOR .OUTPUT_NORM ,
@@ -2057,14 +2083,9 @@ class MODEL_TENSOR(IntEnum):
20572083 MODEL_TENSOR .ATTN_V ,
20582084 MODEL_TENSOR .ATTN_OUT ,
20592085 MODEL_TENSOR .ATTN_ROT_EMBD ,
2060- MODEL_TENSOR .FFN_GATE_INP ,
20612086 MODEL_TENSOR .FFN_NORM ,
2062- MODEL_TENSOR .FFN_GATE ,
20632087 MODEL_TENSOR .FFN_DOWN ,
20642088 MODEL_TENSOR .FFN_UP ,
2065- MODEL_TENSOR .FFN_GATE_EXP ,
2066- MODEL_TENSOR .FFN_DOWN_EXP ,
2067- MODEL_TENSOR .FFN_UP_EXP ,
20682089 ],
20692090 # TODO
20702091}
0 commit comments