@@ -32,8 +32,8 @@ define i8 @mul8_low_A0_B0(i8 %in0, i8 %in1) {
3232 %In0Hi = lshr i8 %in0 , 4
3333 %In1Lo = and i8 %in1 , 15
3434 %In1Hi = lshr i8 %in1 , 4
35- %m10 = mul i8 %In1Hi , %In0Lo
36- %m01 = mul i8 %In1Lo , %In0Hi
35+ %m10 = mul i8 %In1Hi , %in0
36+ %m01 = mul i8 %In0Hi , %in1
3737 %m00 = mul i8 %In1Lo , %In0Lo
3838 %addc = add i8 %m10 , %m01
3939 %shl = shl i8 %addc , 4
@@ -59,8 +59,8 @@ define i8 @mul8_low_A0_B1(i8 %in0, i8 %in1) {
5959 %In0Hi = lshr i8 %in0 , 4
6060 %In1Lo = and i8 %in1 , 15
6161 %In1Hi = lshr i8 %in1 , 4
62- %m10 = mul i8 %In1Hi , %In0Lo
63- %m01 = mul i8 %In1Lo , %In0Hi
62+ %m10 = mul i8 %In1Hi , %in0
63+ %m01 = mul i8 %In0Hi , %in1
6464 %m00 = mul i8 %In1Lo , %In0Lo
6565 %addc = add i8 %m10 , %m01
6666 %shl = shl i8 %addc , 4
@@ -86,8 +86,8 @@ define i8 @mul8_low_A0_B2(i8 %in0, i8 %in1) {
8686 %In0Hi = lshr i8 %in0 , 4
8787 %In1Lo = and i8 %in1 , 15
8888 %In1Hi = lshr i8 %in1 , 4
89- %m10 = mul i8 %In1Hi , %In0Lo
90- %m01 = mul i8 %In1Lo , %In0Hi
89+ %m10 = mul i8 %In1Hi , %in0
90+ %m01 = mul i8 %In0Hi , %in1
9191 %m00 = mul i8 %In1Lo , %In0Lo
9292 %addc = add i8 %m01 , %m10
9393 %shl = shl i8 %addc , 4
@@ -113,8 +113,8 @@ define i8 @mul8_low_A0_B3(i8 %in0, i8 %in1) {
113113 %In0Hi = lshr i8 %in0 , 4
114114 %In1Lo = and i8 %in1 , 15
115115 %In1Hi = lshr i8 %in1 , 4
116- %m10 = mul i8 %In1Hi , %In0Lo
117- %m01 = mul i8 %In1Lo , %In0Hi
116+ %m10 = mul i8 %In1Hi , %in0
117+ %m01 = mul i8 %In0Hi , %in1
118118 %m00 = mul i8 %In1Lo , %In0Lo
119119 %addc = add i8 %m01 , %m10
120120 %shl = shl i8 %addc , 4
@@ -269,7 +269,7 @@ define i32 @mul32_low_A2_B0(i32 %in0, i32 %in1) {
269269 %In1Hi = lshr i32 %in1 , 16
270270 %m10 = mul i32 %In1Hi , %In0Lo
271271 call void @use32 (i32 %m10 )
272- %m01 = mul i32 %In0Hi , %In1Lo
272+ %m01 = mul i32 %In0Hi , %in1
273273 %m00 = mul i32 %In1Lo , %In0Lo
274274 %addc = add i32 %m10 , %m01
275275 %shl = shl i32 %addc , 16
@@ -298,7 +298,7 @@ define i32 @mul32_low_A2_B1(i32 %in0, i32 %in1) {
298298 %In1Hi = lshr i32 %in1 , 16
299299 %m10 = mul i32 %In1Hi , %In0Lo
300300 call void @use32 (i32 %m10 )
301- %m01 = mul i32 %In0Hi , %In1Lo
301+ %m01 = mul i32 %In0Hi , %in1
302302 %m00 = mul i32 %In1Lo , %In0Lo
303303 %addc = add i32 %m10 , %m01
304304 %shl = shl i32 %addc , 16
@@ -327,7 +327,7 @@ define i32 @mul32_low_A2_B2(i32 %in0, i32 %in1) {
327327 %In1Hi = lshr i32 %in1 , 16
328328 %m10 = mul i32 %In1Hi , %In0Lo
329329 call void @use32 (i32 %m10 )
330- %m01 = mul i32 %In0Hi , %In1Lo
330+ %m01 = mul i32 %In0Hi , %in1
331331 %m00 = mul i32 %In1Lo , %In0Lo
332332 %addc = add i32 %m01 , %m10
333333 %shl = shl i32 %addc , 16
@@ -356,7 +356,7 @@ define i32 @mul32_low_A2_B3(i32 %in0, i32 %in1) {
356356 %In1Hi = lshr i32 %in1 , 16
357357 %m10 = mul i32 %In1Hi , %In0Lo
358358 call void @use32 (i32 %m10 )
359- %m01 = mul i32 %In0Hi , %In1Lo
359+ %m01 = mul i32 %In0Hi , %in1
360360 %m00 = mul i32 %In1Lo , %In0Lo
361361 %addc = add i32 %m01 , %m10
362362 %shl = shl i32 %addc , 16
@@ -384,7 +384,7 @@ define i64 @mul64_low_A3_B0(i64 %in0, i64 %in1) {
384384 %In0Hi = lshr i64 %in0 , 32
385385 %In1Lo = and i64 %in1 , 4294967295
386386 %In1Hi = lshr i64 %in1 , 32
387- %m10 = mul i64 %In0Lo , %In1Hi
387+ %m10 = mul i64 %In1Hi , %in0
388388 %m01 = mul i64 %In0Hi , %In1Lo
389389 call void @use64 (i64 %m01 )
390390 %m00 = mul i64 %In1Lo , %In0Lo
@@ -413,7 +413,7 @@ define i64 @mul64_low_A3_B1(i64 %in0, i64 %in1) {
413413 %In0Hi = lshr i64 %in0 , 32
414414 %In1Lo = and i64 %in1 , 4294967295
415415 %In1Hi = lshr i64 %in1 , 32
416- %m10 = mul i64 %In0Lo , %In1Hi
416+ %m10 = mul i64 %In1Hi , %in0
417417 %m01 = mul i64 %In0Hi , %In1Lo
418418 call void @use64 (i64 %m01 )
419419 %m00 = mul i64 %In1Lo , %In0Lo
@@ -442,7 +442,7 @@ define i64 @mul64_low_A3_B2(i64 %in0, i64 %in1) {
442442 %In0Hi = lshr i64 %in0 , 32
443443 %In1Lo = and i64 %in1 , 4294967295
444444 %In1Hi = lshr i64 %in1 , 32
445- %m10 = mul i64 %In0Lo , %In1Hi
445+ %m10 = mul i64 %In1Hi , %in0
446446 %m01 = mul i64 %In0Hi , %In1Lo
447447 call void @use64 (i64 %m01 )
448448 %m00 = mul i64 %In1Lo , %In0Lo
@@ -471,7 +471,7 @@ define i64 @mul64_low_A3_B3(i64 %in0, i64 %in1) {
471471 %In0Hi = lshr i64 %in0 , 32
472472 %In1Lo = and i64 %in1 , 4294967295
473473 %In1Hi = lshr i64 %in1 , 32
474- %m10 = mul i64 %In0Lo , %In1Hi
474+ %m10 = mul i64 %In1Hi , %in0
475475 %m01 = mul i64 %In0Hi , %In1Lo
476476 call void @use64 (i64 %m01 )
477477 %m00 = mul i64 %In1Lo , %In0Lo
0 commit comments