Skip to content

Commit aa0fc43

Browse files
committed
LoongArch64: Update LA464 -2
All lapack-test passed
1 parent cfa8b07 commit aa0fc43

File tree

3 files changed

+141
-141
lines changed

3 files changed

+141
-141
lines changed

kernel/Makefile.L3

Lines changed: 112 additions & 112 deletions
Original file line numberDiff line numberDiff line change
@@ -1110,151 +1110,151 @@ else
11101110
$(CC) $(CFLAGS) -c -DTRMMKERNEL -UDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
11111111
endif
11121112

1113-
$(KDIR)ztrmm_kernel_LN$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1114-
ifeq ($(OS), AIX)
1115-
$(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o - > ztrmm_kernel_ln.s
1116-
$(M4_AIX) ztrmm_kernel_ln.s > ztrmm_kernel_ln_nomacros.s
1117-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN ztrmm_kernel_ln_nomacros.s -o $@
1118-
rm ztrmm_kernel_ln.s ztrmm_kernel_ln_nomacros.s
1119-
else ifeq ($(CORE), SANDYBRIDGE)
1120-
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o $@
1121-
else
1122-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o $@
1123-
endif
1124-
1125-
$(KDIR)ztrmm_kernel_LT$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1126-
ifeq ($(OS), AIX)
1127-
$(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o - > ztrmm_kernel_lt.s
1128-
$(M4_AIX) ztrmm_kernel_lt.s > ztrmm_kernel_lt_nomacros.s
1129-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN ztrmm_kernel_lt_nomacros.s -o $@
1130-
rm ztrmm_kernel_lt.s ztrmm_kernel_lt_nomacros.s
1131-
else ifeq ($(CORE), SANDYBRIDGE)
1132-
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o $@
1133-
else
1134-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o $@
1135-
endif
1136-
1137-
$(KDIR)ztrmm_kernel_LR$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1138-
ifeq ($(OS), AIX)
1139-
$(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o - > ztrmm_kernel_lr.s
1140-
$(M4_AIX) ztrmm_kernel_lr.s > ztrmm_kernel_lr_nomacros.s
1141-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN ztrmm_kernel_lr_nomacros.s -o $@
1142-
rm ztrmm_kernel_lr.s ztrmm_kernel_lr_nomacros.s
1143-
else ifeq ($(CORE), SANDYBRIDGE)
1144-
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o $@
1145-
else
1146-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o $@
1147-
endif
1148-
1149-
$(KDIR)ztrmm_kernel_LC$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1150-
ifeq ($(OS), AIX)
1151-
$(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o - > ztrmm_kernel_lc.s
1152-
$(M4_AIX) ztrmm_kernel_lc.s >ztrmm_kernel_lc_nomacros.s
1153-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN ztrmm_kernel_lc_nomacros.s -o $@
1154-
rm ztrmm_kernel_lc.s ztrmm_kernel_lc_nomacros.s
1155-
else ifeq ($(CORE), SANDYBRIDGE)
1156-
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o $@
1157-
else
1158-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o $@
1159-
endif
1160-
1161-
$(KDIR)ztrmm_kernel_RN$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1162-
ifeq ($(OS), AIX)
1163-
$(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o - > ztrmm_kernel_rn.s
1164-
$(M4_AIX) ztrmm_kernel_rn.s > ztrmm_kernel_rn_nomacros.s
1165-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN ztrmm_kernel_rn_nomacros.s -o $@
1166-
rm ztrmm_kernel_rn.s ztrmm_kernel_rn_nomacros.s
1167-
else ifeq ($(CORE), SANDYBRIDGE)
1168-
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o $@
1169-
else
1170-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o $@
1171-
endif
1172-
1173-
$(KDIR)ztrmm_kernel_RT$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1174-
ifeq ($(OS), AIX)
1175-
$(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o - > ztrmm_kernel_rt.s
1176-
$(M4_AIX) ztrmm_kernel_rt.s > ztrmm_kernel_rt_nomacros.s
1177-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN ztrmm_kernel_rt_nomacros.s -o $@
1178-
rm ztrmm_kernel_rt.s ztrmm_kernel_rt_nomacros.s
1179-
else ifeq ($(CORE), SANDYBRIDGE)
1180-
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o $@
1181-
else
1182-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o $@
1183-
endif
1184-
1185-
$(KDIR)ztrmm_kernel_RR$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1186-
ifeq ($(OS), AIX)
1187-
$(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o - > ztrmm_kernel_rr.s
1188-
$(M4_AIX) ztrmm_kernel_rr.s > ztrmm_kernel_rr_nomacros.s
1189-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC ztrmm_kernel_rr_nomacros.s -o $@
1190-
rm ztrmm_kernel_rr.s ztrmm_kernel_rr_nomacros.s
1191-
else ifeq ($(CORE), SANDYBRIDGE)
1192-
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o $@
1193-
else
1194-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o $@
1195-
endif
1196-
1197-
$(KDIR)ztrmm_kernel_RC$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1198-
ifeq ($(OS), AIX)
1199-
$(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o - > ztrmm_kernel_rc.s
1200-
$(M4_AIX) ztrmm_kernel_rc.s > ztrmm_kernel_rc_nomacros.s
1201-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC ztrmm_kernel_rc_nomacros.s -o $@
1202-
rm ztrmm_kernel_rc.s ztrmm_kernel_rc_nomacros.s
1203-
else ifeq ($(CORE), SANDYBRIDGE)
1204-
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
1205-
else
1206-
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
1207-
endif
1208-
1209-
#$(KDIR)ztrmm_kernel_LN$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1210-
#ifeq ($(CORE),SANDYBRIDGE)
1113+
#$(KDIR)ztrmm_kernel_LN$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1114+
#ifeq ($(OS), AIX)
1115+
# $(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o - > ztrmm_kernel_ln.s
1116+
# $(M4_AIX) ztrmm_kernel_ln.s > ztrmm_kernel_ln_nomacros.s
1117+
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN ztrmm_kernel_ln_nomacros.s -o $@
1118+
# rm ztrmm_kernel_ln.s ztrmm_kernel_ln_nomacros.s
1119+
#else ifeq ($(CORE), SANDYBRIDGE)
12111120
# $(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o $@
12121121
#else
12131122
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o $@
12141123
#endif
12151124
#
1216-
#$(KDIR)ztrmm_kernel_LT$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1217-
#ifeq ($(CORE),SANDYBRIDGE)
1125+
#$(KDIR)ztrmm_kernel_LT$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1126+
#ifeq ($(OS), AIX)
1127+
# $(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o - > ztrmm_kernel_lt.s
1128+
# $(M4_AIX) ztrmm_kernel_lt.s > ztrmm_kernel_lt_nomacros.s
1129+
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN ztrmm_kernel_lt_nomacros.s -o $@
1130+
# rm ztrmm_kernel_lt.s ztrmm_kernel_lt_nomacros.s
1131+
#else ifeq ($(CORE), SANDYBRIDGE)
12181132
# $(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o $@
12191133
#else
12201134
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o $@
12211135
#endif
1222-
#$(KDIR)ztrmm_kernel_LR$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1223-
#ifeq ($(CORE),SANDYBRIDGE)
1136+
#
1137+
#$(KDIR)ztrmm_kernel_LR$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1138+
#ifeq ($(OS), AIX)
1139+
# $(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o - > ztrmm_kernel_lr.s
1140+
# $(M4_AIX) ztrmm_kernel_lr.s > ztrmm_kernel_lr_nomacros.s
1141+
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN ztrmm_kernel_lr_nomacros.s -o $@
1142+
# rm ztrmm_kernel_lr.s ztrmm_kernel_lr_nomacros.s
1143+
#else ifeq ($(CORE), SANDYBRIDGE)
12241144
# $(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o $@
12251145
#else
12261146
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o $@
12271147
#endif
1228-
#$(KDIR)ztrmm_kernel_LC$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1229-
#ifeq ($(CORE),SANDYBRIDGE)
1148+
#
1149+
#$(KDIR)ztrmm_kernel_LC$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1150+
#ifeq ($(OS), AIX)
1151+
# $(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o - > ztrmm_kernel_lc.s
1152+
# $(M4_AIX) ztrmm_kernel_lc.s >ztrmm_kernel_lc_nomacros.s
1153+
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN ztrmm_kernel_lc_nomacros.s -o $@
1154+
# rm ztrmm_kernel_lc.s ztrmm_kernel_lc_nomacros.s
1155+
#else ifeq ($(CORE), SANDYBRIDGE)
12301156
# $(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o $@
12311157
#else
12321158
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o $@
12331159
#endif
1234-
#$(KDIR)ztrmm_kernel_RN$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1235-
#ifeq ($(CORE),SANDYBRIDGE)
1160+
#
1161+
#$(KDIR)ztrmm_kernel_RN$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1162+
#ifeq ($(OS), AIX)
1163+
# $(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o - > ztrmm_kernel_rn.s
1164+
# $(M4_AIX) ztrmm_kernel_rn.s > ztrmm_kernel_rn_nomacros.s
1165+
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN ztrmm_kernel_rn_nomacros.s -o $@
1166+
# rm ztrmm_kernel_rn.s ztrmm_kernel_rn_nomacros.s
1167+
#else ifeq ($(CORE), SANDYBRIDGE)
12361168
# $(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o $@
12371169
#else
12381170
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o $@
12391171
#endif
1240-
#$(KDIR)ztrmm_kernel_RT$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1241-
#ifeq ($(CORE),SANDYBRIDGE)
1172+
#
1173+
#$(KDIR)ztrmm_kernel_RT$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1174+
#ifeq ($(OS), AIX)
1175+
# $(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o - > ztrmm_kernel_rt.s
1176+
# $(M4_AIX) ztrmm_kernel_rt.s > ztrmm_kernel_rt_nomacros.s
1177+
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN ztrmm_kernel_rt_nomacros.s -o $@
1178+
# rm ztrmm_kernel_rt.s ztrmm_kernel_rt_nomacros.s
1179+
#else ifeq ($(CORE), SANDYBRIDGE)
12421180
# $(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o $@
12431181
#else
12441182
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o $@
12451183
#endif
1246-
#$(KDIR)ztrmm_kernel_RR$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1247-
#ifeq ($(CORE),SANDYBRIDGE)
1184+
#
1185+
#$(KDIR)ztrmm_kernel_RR$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1186+
#ifeq ($(OS), AIX)
1187+
# $(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o - > ztrmm_kernel_rr.s
1188+
# $(M4_AIX) ztrmm_kernel_rr.s > ztrmm_kernel_rr_nomacros.s
1189+
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC ztrmm_kernel_rr_nomacros.s -o $@
1190+
# rm ztrmm_kernel_rr.s ztrmm_kernel_rr_nomacros.s
1191+
#else ifeq ($(CORE), SANDYBRIDGE)
12481192
# $(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o $@
12491193
#else
12501194
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o $@
12511195
#endif
1252-
#$(KDIR)ztrmm_kernel_RC$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1253-
#ifeq ($(CORE),SANDYBRIDGE)
1196+
#
1197+
#$(KDIR)ztrmm_kernel_RC$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZTRMMKERNEL)
1198+
#ifeq ($(OS), AIX)
1199+
# $(CC) $(CFLAGS) -S -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o - > ztrmm_kernel_rc.s
1200+
# $(M4_AIX) ztrmm_kernel_rc.s > ztrmm_kernel_rc_nomacros.s
1201+
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC ztrmm_kernel_rc_nomacros.s -o $@
1202+
# rm ztrmm_kernel_rc.s ztrmm_kernel_rc_nomacros.s
1203+
#else ifeq ($(CORE), SANDYBRIDGE)
12541204
# $(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
12551205
#else
12561206
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
12571207
#endif
1208+
1209+
$(KDIR)ztrmm_kernel_LN$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1210+
ifeq ($(CORE),SANDYBRIDGE)
1211+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o $@
1212+
else
1213+
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o $@
1214+
endif
1215+
1216+
$(KDIR)ztrmm_kernel_LT$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1217+
ifeq ($(CORE),SANDYBRIDGE)
1218+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o $@
1219+
else
1220+
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o $@
1221+
endif
1222+
$(KDIR)ztrmm_kernel_LR$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1223+
ifeq ($(CORE),SANDYBRIDGE)
1224+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o $@
1225+
else
1226+
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o $@
1227+
endif
1228+
$(KDIR)ztrmm_kernel_LC$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1229+
ifeq ($(CORE),SANDYBRIDGE)
1230+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o $@
1231+
else
1232+
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o $@
1233+
endif
1234+
$(KDIR)ztrmm_kernel_RN$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1235+
ifeq ($(CORE),SANDYBRIDGE)
1236+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o $@
1237+
else
1238+
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o $@
1239+
endif
1240+
$(KDIR)ztrmm_kernel_RT$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1241+
ifeq ($(CORE),SANDYBRIDGE)
1242+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o $@
1243+
else
1244+
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o $@
1245+
endif
1246+
$(KDIR)ztrmm_kernel_RR$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1247+
ifeq ($(CORE),SANDYBRIDGE)
1248+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o $@
1249+
else
1250+
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o $@
1251+
endif
1252+
$(KDIR)ztrmm_kernel_RC$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1253+
ifeq ($(CORE),SANDYBRIDGE)
1254+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
1255+
else
1256+
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
1257+
endif
12581258
#
12591259
#$(KDIR)ctrmm_kernel_LN$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(CGEMMKERNEL)
12601260
# $(CC) $(CFLAGS) -c -DTRMMKERNEL -UDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o $@

kernel/loongarch64/KERNEL.LA464

Lines changed: 27 additions & 27 deletions
Original file line numberDiff line numberDiff line change
@@ -27,11 +27,11 @@ CGEMMOTCOPY = ../generic/zgemm_tcopy_2.c
2727
CGEMMONCOPYOBJ = cgemm_oncopy$(TSUFFIX).$(SUFFIX)
2828
CGEMMOTCOPYOBJ = cgemm_otcopy$(TSUFFIX).$(SUFFIX)
2929

30-
ZGEMMKERNEL = ../generic/zgemmkernel_2x2.c
31-
ZGEMMONCOPY = ../generic/zgemm_ncopy_2.c
32-
ZGEMMOTCOPY = ../generic/zgemm_tcopy_2.c
33-
ZGEMMONCOPYOBJ = zgemm_oncopy$(TSUFFIX).$(SUFFIX)
34-
ZGEMMOTCOPYOBJ = zgemm_otcopy$(TSUFFIX).$(SUFFIX)
30+
#ZGEMMKERNEL = ../generic/zgemmkernel_2x2.c
31+
#ZGEMMONCOPY = ../generic/zgemm_ncopy_2.c
32+
#ZGEMMOTCOPY = ../generic/zgemm_tcopy_2.c
33+
#ZGEMMONCOPYOBJ = zgemm_oncopy$(TSUFFIX).$(SUFFIX)
34+
#ZGEMMOTCOPYOBJ = zgemm_otcopy$(TSUFFIX).$(SUFFIX)
3535

3636
STRSMKERNEL_LN = ../generic/trsm_kernel_LN.c
3737
STRSMKERNEL_LT = ../generic/trsm_kernel_LT.c
@@ -136,14 +136,14 @@ SGEMVNKERNEL = ../arm/gemv_n.c
136136
ifndef DGEMVNKERNEL
137137
DGEMVNKERNEL = ../arm/gemv_n.c
138138
endif
139-
CGEMVNKERNEL = ../arm/zgemv_n.c
139+
#CGEMVNKERNEL = ../arm/zgemv_n.c
140140
#ZGEMVNKERNEL = ../arm/zgemv_n.c
141141

142142
SGEMVTKERNEL = ../arm/gemv_t.c
143143
ifndef DGEMVTKERNEL
144144
DGEMVTKERNEL = ../arm/gemv_t.c
145145
endif
146-
CGEMVTKERNEL = ../arm/zgemv_t.c
146+
#CGEMVTKERNEL = ../arm/zgemv_t.c
147147
#ZGEMVTKERNEL = ../arm/zgemv_t.c
148148

149149
SSYMV_U_KERNEL = ../generic/symv_k.c
@@ -298,23 +298,23 @@ SGEMMOTCOPYOBJ = sgemm_otcopy$(TSUFFIX).$(SUFFIX)
298298
#CGEMMONCOPYOBJ = cgemm_oncopy$(TSUFFIX).$(SUFFIX)
299299
#CGEMMOTCOPYOBJ = cgemm_otcopy$(TSUFFIX).$(SUFFIX)
300300
#
301-
#CGEMVNKERNEL = cgemv_n_8_lasx.S
302-
#CGEMVTKERNEL = cgemv_t_8_lasx.S
301+
CGEMVNKERNEL = cgemv_n_8_lasx.S
302+
CGEMVTKERNEL = cgemv_t_8_lasx.S
303303
#
304304
#CTRSMKERNEL_LN = ../generic/trsm_kernel_LN.c
305305
#CTRSMKERNEL_LT = ../generic/trsm_kernel_LT.c
306306
#CTRSMKERNEL_RN = ../generic/trsm_kernel_RN.c
307307
#CTRSMKERNEL_RT = ../generic/trsm_kernel_RT.c
308308
#
309-
#ZGEMMKERNEL = zgemm_kernel_8x4_lasx.S
310-
#ZGEMMINCOPY = zgemm_ncopy_8_lasx.S
311-
#ZGEMMITCOPY = zgemm_tcopy_8_lasx.S
312-
#ZGEMMONCOPY = zgemm_ncopy_4_lasx.S
313-
#ZGEMMOTCOPY = zgemm_tcopy_4_lasx.S
314-
#ZGEMMINCOPYOBJ = zgemm_incopy$(TSUFFIX).$(SUFFIX)
315-
#ZGEMMITCOPYOBJ = zgemm_itcopy$(TSUFFIX).$(SUFFIX)
316-
#ZGEMMONCOPYOBJ = zgemm_oncopy$(TSUFFIX).$(SUFFIX)
317-
#ZGEMMOTCOPYOBJ = zgemm_otcopy$(TSUFFIX).$(SUFFIX)
309+
ZGEMMKERNEL = zgemm_kernel_8x4_lasx.S
310+
ZGEMMINCOPY = zgemm_ncopy_8_lasx.S
311+
ZGEMMITCOPY = zgemm_tcopy_8_lasx.S
312+
ZGEMMONCOPY = zgemm_ncopy_4_lasx.S
313+
ZGEMMOTCOPY = zgemm_tcopy_4_lasx.S
314+
ZGEMMINCOPYOBJ = zgemm_incopy$(TSUFFIX).$(SUFFIX)
315+
ZGEMMITCOPYOBJ = zgemm_itcopy$(TSUFFIX).$(SUFFIX)
316+
ZGEMMONCOPYOBJ = zgemm_oncopy$(TSUFFIX).$(SUFFIX)
317+
ZGEMMOTCOPYOBJ = zgemm_otcopy$(TSUFFIX).$(SUFFIX)
318318
#
319319
ZGEMVNKERNEL = zgemv_n_4_lasx.S
320320
ZGEMVTKERNEL = zgemv_t_4_lasx.S
@@ -334,15 +334,15 @@ DTRSMKERNEL_RT = trsm_kernel_RT_UNROLLN6.c
334334
#STRSMKERNEL_RN = ../generic/trsm_kernel_RN.c
335335
#STRSMKERNEL_RT = ../generic/trsm_kernel_RT.c
336336
#
337-
#DGEMM_SMALL_M_PERMIT = dgemm_small_matrix_permit.c
338-
#DGEMM_SMALL_K_NN = dgemm_small_kernel_nn_lasx.S
339-
#DGEMM_SMALL_K_B0_NN = dgemm_small_kernel_nn_lasx.S
340-
#DGEMM_SMALL_K_NT = dgemm_small_kernel_nt_lasx.S
341-
#DGEMM_SMALL_K_B0_NT = dgemm_small_kernel_nt_lasx.S
342-
#DGEMM_SMALL_K_TN = dgemm_small_kernel_tn_lasx.S
343-
#DGEMM_SMALL_K_B0_TN = dgemm_small_kernel_tn_lasx.S
344-
#DGEMM_SMALL_K_TT = dgemm_small_kernel_tt_lasx.S
345-
#DGEMM_SMALL_K_B0_TT = dgemm_small_kernel_tt_lasx.S
337+
DGEMM_SMALL_M_PERMIT = dgemm_small_matrix_permit.c
338+
DGEMM_SMALL_K_NN = dgemm_small_kernel_nn_lasx.S
339+
DGEMM_SMALL_K_B0_NN = dgemm_small_kernel_nn_lasx.S
340+
DGEMM_SMALL_K_NT = dgemm_small_kernel_nt_lasx.S
341+
DGEMM_SMALL_K_B0_NT = dgemm_small_kernel_nt_lasx.S
342+
DGEMM_SMALL_K_TN = dgemm_small_kernel_tn_lasx.S
343+
DGEMM_SMALL_K_B0_TN = dgemm_small_kernel_tn_lasx.S
344+
DGEMM_SMALL_K_TT = dgemm_small_kernel_tt_lasx.S
345+
DGEMM_SMALL_K_B0_TT = dgemm_small_kernel_tt_lasx.S
346346
#
347347
SOMATCOPY_RT = somatcopy_rt_lasx.c
348348
SOMATCOPY_RN = somatcopy_rn_lasx.c

param.h

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -2862,8 +2862,8 @@ USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
28622862
#define SGEMM_DEFAULT_UNROLL_M 16
28632863
#define CGEMM_DEFAULT_UNROLL_N 2
28642864
#define CGEMM_DEFAULT_UNROLL_M 2
2865-
#define ZGEMM_DEFAULT_UNROLL_N 2
2866-
#define ZGEMM_DEFAULT_UNROLL_M 2
2865+
#define ZGEMM_DEFAULT_UNROLL_N 4
2866+
#define ZGEMM_DEFAULT_UNROLL_M 8
28672867
#define DGEMM_DEFAULT_UNROLL_MN 96
28682868
#endif
28692869

0 commit comments

Comments
 (0)