|
49 | 49 | ifeq ($(ARCH),POWER) |
50 | 50 | FLOP+=-maltivec -DPOWER |
51 | 51 | VECSRC=vec_fma_hp.o vec_fma_sp.o vec_fma_dp.o vec_nonfma_hp.o vec_nonfma_sp.o vec_nonfma_dp.o |
52 | | - VEC=-maltivec -O0 -DPOWER |
53 | | - VEC_FMA=-maltivec -O0 -DPOWER |
54 | | - VEC_ALL=$(VEC) -O0 -DPOWER |
| 52 | + VEC=-maltivec -DPOWER |
| 53 | + VEC_FMA=-maltivec -DPOWER |
| 54 | + VEC_ALL=$(VEC) -DPOWER |
55 | 55 | endif |
56 | 56 | ifeq ($(ARCH),ARM) |
57 | 57 | FLOP+=-march=armv8.2-a+fp16 -DARM |
@@ -109,58 +109,58 @@ weak_symbols.o: weak_symbols.c vec.h |
109 | 109 | -$(CC) -c $(CFLAGS) weak_symbols.c |
110 | 110 |
|
111 | 111 | vec.o: vec.c vec.h |
112 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) -D$(ARCH) $(VEC_META) vec.c |
| 112 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) -D$(ARCH) $(VEC_META) vec.c |
113 | 113 |
|
114 | 114 | vec_scalar_verify.o: vec_scalar_verify.c vec_scalar_verify.h cat_arch.h |
115 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC_ALL) vec_scalar_verify.c |
| 115 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC_ALL) vec_scalar_verify.c |
116 | 116 |
|
117 | 117 | vec_fma_hp.o: vec_fma_hp.c vec_scalar_verify.h |
118 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC_FMA) vec_fma_hp.c |
| 118 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC_FMA) vec_fma_hp.c |
119 | 119 |
|
120 | 120 | vec_fma_hp: vec_fma_hp.c vec_scalar_verify.h |
121 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128_FMA) vec_fma_hp.c -o vec_fma_hp-128B.o |
122 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256_FMA) vec_fma_hp.c -o vec_fma_hp-256B.o |
123 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512_FMA) vec_fma_hp.c -o vec_fma_hp-512B.o |
| 121 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128_FMA) vec_fma_hp.c -o vec_fma_hp-128B.o |
| 122 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256_FMA) vec_fma_hp.c -o vec_fma_hp-256B.o |
| 123 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512_FMA) vec_fma_hp.c -o vec_fma_hp-512B.o |
124 | 124 |
|
125 | 125 | vec_fma_sp.o: vec_fma_sp.c vec_scalar_verify.h |
126 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC_FMA) vec_fma_sp.c |
| 126 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC_FMA) vec_fma_sp.c |
127 | 127 |
|
128 | 128 | vec_fma_sp: vec_fma_sp.c vec_scalar_verify.h |
129 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128_FMA) vec_fma_sp.c -o vec_fma_sp-128B.o |
130 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256_FMA) vec_fma_sp.c -o vec_fma_sp-256B.o |
131 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512_FMA) vec_fma_sp.c -o vec_fma_sp-512B.o |
| 129 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128_FMA) vec_fma_sp.c -o vec_fma_sp-128B.o |
| 130 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256_FMA) vec_fma_sp.c -o vec_fma_sp-256B.o |
| 131 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512_FMA) vec_fma_sp.c -o vec_fma_sp-512B.o |
132 | 132 |
|
133 | 133 | vec_fma_dp.o: vec_fma_dp.c vec_scalar_verify.h |
134 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC_FMA) vec_fma_dp.c |
| 134 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC_FMA) vec_fma_dp.c |
135 | 135 |
|
136 | 136 | vec_fma_dp: vec_fma_dp.c vec_scalar_verify.h |
137 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128_FMA) vec_fma_dp.c -o vec_fma_dp-128B.o |
138 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256_FMA) vec_fma_dp.c -o vec_fma_dp-256B.o |
139 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512_FMA) vec_fma_dp.c -o vec_fma_dp-512B.o |
| 137 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128_FMA) vec_fma_dp.c -o vec_fma_dp-128B.o |
| 138 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256_FMA) vec_fma_dp.c -o vec_fma_dp-256B.o |
| 139 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512_FMA) vec_fma_dp.c -o vec_fma_dp-512B.o |
140 | 140 |
|
141 | 141 | vec_nonfma_hp.o: vec_nonfma_hp.c vec_scalar_verify.h |
142 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC) vec_nonfma_hp.c |
| 142 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC) vec_nonfma_hp.c |
143 | 143 |
|
144 | 144 | vec_nonfma_hp: vec_nonfma_hp.c vec_scalar_verify.h |
145 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128) vec_nonfma_hp.c -o vec_nonfma_hp-128B.o |
146 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256) vec_nonfma_hp.c -o vec_nonfma_hp-256B.o |
147 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512) vec_nonfma_hp.c -o vec_nonfma_hp-512B.o |
| 145 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128) vec_nonfma_hp.c -o vec_nonfma_hp-128B.o |
| 146 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256) vec_nonfma_hp.c -o vec_nonfma_hp-256B.o |
| 147 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512) vec_nonfma_hp.c -o vec_nonfma_hp-512B.o |
148 | 148 |
|
149 | 149 | vec_nonfma_sp.o: vec_nonfma_sp.c vec_scalar_verify.h |
150 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC) vec_nonfma_sp.c |
| 150 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC) vec_nonfma_sp.c |
151 | 151 |
|
152 | 152 | vec_nonfma_sp: vec_nonfma_sp.c vec_scalar_verify.h |
153 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128) vec_nonfma_sp.c -o vec_nonfma_sp-128B.o |
154 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256) vec_nonfma_sp.c -o vec_nonfma_sp-256B.o |
155 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512) vec_nonfma_sp.c -o vec_nonfma_sp-512B.o |
| 153 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128) vec_nonfma_sp.c -o vec_nonfma_sp-128B.o |
| 154 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256) vec_nonfma_sp.c -o vec_nonfma_sp-256B.o |
| 155 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512) vec_nonfma_sp.c -o vec_nonfma_sp-512B.o |
156 | 156 |
|
157 | 157 | vec_nonfma_dp.o: vec_nonfma_dp.c vec_scalar_verify.h |
158 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC) vec_nonfma_dp.c |
| 158 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC) vec_nonfma_dp.c |
159 | 159 |
|
160 | 160 | vec_nonfma_dp: vec_nonfma_dp.c vec_scalar_verify.h |
161 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC128) vec_nonfma_dp.c -o vec_nonfma_dp-128B.o |
162 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC256) vec_nonfma_dp.c -o vec_nonfma_dp-256B.o |
163 | | - -$(CC) -c $(CFLAGS) $(INCFLAGS) $(VEC512) vec_nonfma_dp.c -o vec_nonfma_dp-512B.o |
| 161 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC128) vec_nonfma_dp.c -o vec_nonfma_dp-128B.o |
| 162 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC256) vec_nonfma_dp.c -o vec_nonfma_dp-256B.o |
| 163 | + -$(CC) -c $(CFLAGS) $(OPT1) $(INCFLAGS) $(VEC512) vec_nonfma_dp.c -o vec_nonfma_dp-512B.o |
164 | 164 |
|
165 | 165 | cat_collect: |
166 | 166 | $(CC) $(CFLAGS) -fopenmp $(INCFLAGS) main.c $(wildcard *.o) -o cat_collect $(LDFLAGS) |
|
0 commit comments