[clang][AArch64] Use .i16.f16 intrinsic formats for vcvth*_[s|u]16_f16 (#156029)

mrkajetanp · web-flow · commit b96fa9f3ac57 · 2025-09-02T11:38:37.000+01:00
Use .i16.f16 intrinsic formats for intrinsics like vcvth_s16_f16. Avoids issues with incorrect saturation that arise when using .i32.f16 formats for the same conversions. Fixes #154343. Signed-off-by: Kajetan Puchalski <kajetan.puchalski@arm.com>
diff --git a/clang/lib/CodeGen/TargetBuiltins/ARM.cpp b/clang/lib/CodeGen/TargetBuiltins/ARM.cpp
@@ -5847,7 +5847,7 @@ Value *CodeGenFunction::EmitAArch64BuiltinExpr(unsigned BuiltinID,
   case NEON::BI__builtin_neon_vcvtph_s16_f16:
   case NEON::BI__builtin_neon_vcvth_s16_f16: {
     unsigned Int;
-    llvm::Type* InTy = Int32Ty;
+    llvm::Type *InTy = Int16Ty;
     llvm::Type* FTy  = HalfTy;
     llvm::Type *Tys[2] = {InTy, FTy};
     Ops.push_back(EmitScalarExpr(E->getArg(0)));
@@ -5874,8 +5874,7 @@ Value *CodeGenFunction::EmitAArch64BuiltinExpr(unsigned BuiltinID,
     case NEON::BI__builtin_neon_vcvth_s16_f16:
       Int = Intrinsic::aarch64_neon_fcvtzs; break;
     }
-    Ops[0] = EmitNeonCall(CGM.getIntrinsic(Int, Tys), Ops, "fcvt");
-    return Builder.CreateTrunc(Ops[0], Int16Ty);
+    return EmitNeonCall(CGM.getIntrinsic(Int, Tys), Ops, "fcvt");
   }
   case NEON::BI__builtin_neon_vcaleh_f16:
   case NEON::BI__builtin_neon_vcalth_f16:
diff --git a/clang/test/CodeGen/AArch64/v8.2a-fp16-intrinsics-constrained.c b/clang/test/CodeGen/AArch64/v8.2a-fp16-intrinsics-constrained.c
@@ -105,9 +105,8 @@ float16_t test_vcvth_f16_u64 (uint64_t a) {
 }
 
 // COMMON-LABEL: test_vcvth_s16_f16
-// COMMONIR:       [[VCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtzs.i32.f16(half %a)
-// COMMONIR:       [[TRUNC:%.*]] = trunc i32 [[VCVT]] to i16
-// COMMONIR:       ret i16 [[TRUNC]]
+// COMMONIR:       [[VCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtzs.i16.f16(half %a)
+// COMMONIR:       ret i16 [[VCVT]]
 int16_t test_vcvth_s16_f16 (float16_t a) {
   return vcvth_s16_f16(a);
 }
@@ -127,9 +126,8 @@ int64_t test_vcvth_s64_f16 (float16_t a) {
 }
 
 // COMMON-LABEL: test_vcvth_u16_f16
-// COMMONIR:       [[VCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtzu.i32.f16(half %a)
-// COMMONIR:       [[TRUNC:%.*]] = trunc i32 [[VCVT]] to i16
-// COMMONIR:       ret i16 [[TRUNC]]
+// COMMONIR:       [[VCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtzu.i16.f16(half %a)
+// COMMONIR:       ret i16 [[VCVT]]
 uint16_t test_vcvth_u16_f16 (float16_t a) {
   return vcvth_u16_f16(a);
 }
diff --git a/clang/test/CodeGen/AArch64/v8.2a-fp16-intrinsics.c b/clang/test/CodeGen/AArch64/v8.2a-fp16-intrinsics.c
@@ -97,9 +97,8 @@ float16_t test_vcvth_f16_u64 (uint64_t a) {
 }
 
 // CHECK-LABEL: test_vcvth_s16_f16
-// CHECK:  [[VCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtzs.i32.f16(half %a)
-// CHECK:  [[TRUNC:%.*]] = trunc i32 [[VCVT]] to i16
-// CHECK:  ret i16 [[TRUNC]]
+// CHECK:  [[VCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtzs.i16.f16(half %a)
+// CHECK:  ret i16 [[VCVT]]
 int16_t test_vcvth_s16_f16 (float16_t a) {
   return vcvth_s16_f16(a);
 }
@@ -119,9 +118,8 @@ int64_t test_vcvth_s64_f16 (float16_t a) {
 }
 
 // CHECK-LABEL: test_vcvth_u16_f16
-// CHECK:  [[VCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtzu.i32.f16(half %a)
-// CHECK:  [[TRUNC:%.*]] = trunc i32 [[VCVT]] to i16
-// CHECK:  ret i16 [[TRUNC]]
+// CHECK:  [[VCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtzu.i16.f16(half %a)
+// CHECK:  ret i16 [[VCVT]]
 uint16_t test_vcvth_u16_f16 (float16_t a) {
   return vcvth_u16_f16(a);
 }
@@ -141,9 +139,8 @@ uint64_t test_vcvth_u64_f16 (float16_t a) {
 }
 
 // CHECK-LABEL: test_vcvtah_s16_f16
-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtas.i32.f16(half %a)
-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16
-// CHECK: ret i16 [[RET]]
+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtas.i16.f16(half %a)
+// CHECK: ret i16 [[FCVT]]
 int16_t test_vcvtah_s16_f16 (float16_t a) {
   return vcvtah_s16_f16(a);
 }
@@ -163,9 +160,8 @@ int64_t test_vcvtah_s64_f16 (float16_t a) {
 }
 
 // CHECK-LABEL: test_vcvtah_u16_f16
-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtau.i32.f16(half %a)
-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16
-// CHECK: ret i16 [[RET]]
+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtau.i16.f16(half %a)
+// CHECK: ret i16 [[FCVT]]
 uint16_t test_vcvtah_u16_f16 (float16_t a) {
   return vcvtah_u16_f16(a);
 }
@@ -185,9 +181,8 @@ uint64_t test_vcvtah_u64_f16 (float16_t a) {
 }
 
 // CHECK-LABEL: test_vcvtmh_s16_f16
-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtms.i32.f16(half %a)
-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16
-// CHECK: ret i16 [[RET]]
+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtms.i16.f16(half %a)
+// CHECK: ret i16 [[FCVT]]
 int16_t test_vcvtmh_s16_f16 (float16_t a) {
   return vcvtmh_s16_f16(a);
 }
@@ -207,9 +202,8 @@ int64_t test_vcvtmh_s64_f16 (float16_t a) {
 }
 
 // CHECK-LABEL: test_vcvtmh_u16_f16
-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtmu.i32.f16(half %a)
-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16
-// CHECK: ret i16 [[RET]]
+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtmu.i16.f16(half %a)
+// CHECK: ret i16 [[FCVT]]
 uint16_t test_vcvtmh_u16_f16 (float16_t a) {
   return vcvtmh_u16_f16(a);
 }
@@ -229,9 +223,8 @@ uint64_t test_vcvtmh_u64_f16 (float16_t a) {
 }
 
 // CHECK-LABEL: test_vcvtnh_s16_f16
-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtns.i32.f16(half %a)
-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16
-// CHECK: ret i16 [[RET]]
+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtns.i16.f16(half %a)
+// CHECK: ret i16 [[FCVT]]
 int16_t test_vcvtnh_s16_f16 (float16_t a) {
   return vcvtnh_s16_f16(a);
 }
@@ -251,9 +244,8 @@ int64_t test_vcvtnh_s64_f16 (float16_t a) {
 }
 
 // CHECK-LABEL: test_vcvtnh_u16_f16
-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtnu.i32.f16(half %a)
-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16
-// CHECK: ret i16 [[RET]]
+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtnu.i16.f16(half %a)
+// CHECK: ret i16 [[FCVT]]
 uint16_t test_vcvtnh_u16_f16 (float16_t a) {
   return vcvtnh_u16_f16(a);
 }
@@ -273,9 +265,8 @@ uint64_t test_vcvtnh_u64_f16 (float16_t a) {
 }
 
 // CHECK-LABEL: test_vcvtph_s16_f16
-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtps.i32.f16(half %a)
-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16
-// CHECK: ret i16 [[RET]]
+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtps.i16.f16(half %a)
+// CHECK: ret i16 [[FCVT]]
 int16_t test_vcvtph_s16_f16 (float16_t a) {
   return vcvtph_s16_f16(a);
 }
@@ -295,9 +286,8 @@ int64_t test_vcvtph_s64_f16 (float16_t a) {
 }
 
 // CHECK-LABEL: test_vcvtph_u16_f16
-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtpu.i32.f16(half %a)
-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16
-// CHECK: ret i16 [[RET]]
+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtpu.i16.f16(half %a)
+// CHECK: ret i16 [[FCVT]]
 uint16_t test_vcvtph_u16_f16 (float16_t a) {
   return vcvtph_u16_f16(a);
 }

Original file line number	Diff line number	Diff line change
`@@ -105,9 +105,8 @@ float16_t test_vcvth_f16_u64 (uint64_t a) {`
`105`	`105`	`}`
`106`	`106`
`107`	`107`	`// COMMON-LABEL: test_vcvth_s16_f16`
`108`		`-// COMMONIR: [[VCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtzs.i32.f16(half %a)`
`109`		`-// COMMONIR: [[TRUNC:%.*]] = trunc i32 [[VCVT]] to i16`
`110`		`-// COMMONIR: ret i16 [[TRUNC]]`
	`108`	`+// COMMONIR: [[VCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtzs.i16.f16(half %a)`
	`109`	`+// COMMONIR: ret i16 [[VCVT]]`
`111`	`110`	`int16_t test_vcvth_s16_f16 (float16_t a) {`
`112`	`111`	`return vcvth_s16_f16(a);`
`113`	`112`	`}`
`@@ -127,9 +126,8 @@ int64_t test_vcvth_s64_f16 (float16_t a) {`
`127`	`126`	`}`
`128`	`127`
`129`	`128`	`// COMMON-LABEL: test_vcvth_u16_f16`
`130`		`-// COMMONIR: [[VCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtzu.i32.f16(half %a)`
`131`		`-// COMMONIR: [[TRUNC:%.*]] = trunc i32 [[VCVT]] to i16`
`132`		`-// COMMONIR: ret i16 [[TRUNC]]`
	`129`	`+// COMMONIR: [[VCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtzu.i16.f16(half %a)`
	`130`	`+// COMMONIR: ret i16 [[VCVT]]`
`133`	`131`	`uint16_t test_vcvth_u16_f16 (float16_t a) {`
`134`	`132`	`return vcvth_u16_f16(a);`
`135`	`133`	`}`
Original file line number	Diff line number	Diff line change
`@@ -97,9 +97,8 @@ float16_t test_vcvth_f16_u64 (uint64_t a) {`
`97`	`97`	`}`
`98`	`98`
`99`	`99`	`// CHECK-LABEL: test_vcvth_s16_f16`
`100`		`-// CHECK: [[VCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtzs.i32.f16(half %a)`
`101`		`-// CHECK: [[TRUNC:%.*]] = trunc i32 [[VCVT]] to i16`
`102`		`-// CHECK: ret i16 [[TRUNC]]`
	`100`	`+// CHECK: [[VCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtzs.i16.f16(half %a)`
	`101`	`+// CHECK: ret i16 [[VCVT]]`
`103`	`102`	`int16_t test_vcvth_s16_f16 (float16_t a) {`
`104`	`103`	`return vcvth_s16_f16(a);`
`105`	`104`	`}`
`@@ -119,9 +118,8 @@ int64_t test_vcvth_s64_f16 (float16_t a) {`
`119`	`118`	`}`
`120`	`119`
`121`	`120`	`// CHECK-LABEL: test_vcvth_u16_f16`
`122`		`-// CHECK: [[VCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtzu.i32.f16(half %a)`
`123`		`-// CHECK: [[TRUNC:%.*]] = trunc i32 [[VCVT]] to i16`
`124`		`-// CHECK: ret i16 [[TRUNC]]`
	`121`	`+// CHECK: [[VCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtzu.i16.f16(half %a)`
	`122`	`+// CHECK: ret i16 [[VCVT]]`
`125`	`123`	`uint16_t test_vcvth_u16_f16 (float16_t a) {`
`126`	`124`	`return vcvth_u16_f16(a);`
`127`	`125`	`}`
`@@ -141,9 +139,8 @@ uint64_t test_vcvth_u64_f16 (float16_t a) {`
`141`	`139`	`}`
`142`	`140`
`143`	`141`	`// CHECK-LABEL: test_vcvtah_s16_f16`
`144`		`-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtas.i32.f16(half %a)`
`145`		`-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16`
`146`		`-// CHECK: ret i16 [[RET]]`
	`142`	`+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtas.i16.f16(half %a)`
	`143`	`+// CHECK: ret i16 [[FCVT]]`
`147`	`144`	`int16_t test_vcvtah_s16_f16 (float16_t a) {`
`148`	`145`	`return vcvtah_s16_f16(a);`
`149`	`146`	`}`
`@@ -163,9 +160,8 @@ int64_t test_vcvtah_s64_f16 (float16_t a) {`
`163`	`160`	`}`
`164`	`161`
`165`	`162`	`// CHECK-LABEL: test_vcvtah_u16_f16`
`166`		`-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtau.i32.f16(half %a)`
`167`		`-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16`
`168`		`-// CHECK: ret i16 [[RET]]`
	`163`	`+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtau.i16.f16(half %a)`
	`164`	`+// CHECK: ret i16 [[FCVT]]`
`169`	`165`	`uint16_t test_vcvtah_u16_f16 (float16_t a) {`
`170`	`166`	`return vcvtah_u16_f16(a);`
`171`	`167`	`}`
`@@ -185,9 +181,8 @@ uint64_t test_vcvtah_u64_f16 (float16_t a) {`
`185`	`181`	`}`
`186`	`182`
`187`	`183`	`// CHECK-LABEL: test_vcvtmh_s16_f16`
`188`		`-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtms.i32.f16(half %a)`
`189`		`-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16`
`190`		`-// CHECK: ret i16 [[RET]]`
	`184`	`+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtms.i16.f16(half %a)`
	`185`	`+// CHECK: ret i16 [[FCVT]]`
`191`	`186`	`int16_t test_vcvtmh_s16_f16 (float16_t a) {`
`192`	`187`	`return vcvtmh_s16_f16(a);`
`193`	`188`	`}`
`@@ -207,9 +202,8 @@ int64_t test_vcvtmh_s64_f16 (float16_t a) {`
`207`	`202`	`}`
`208`	`203`
`209`	`204`	`// CHECK-LABEL: test_vcvtmh_u16_f16`
`210`		`-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtmu.i32.f16(half %a)`
`211`		`-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16`
`212`		`-// CHECK: ret i16 [[RET]]`
	`205`	`+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtmu.i16.f16(half %a)`
	`206`	`+// CHECK: ret i16 [[FCVT]]`
`213`	`207`	`uint16_t test_vcvtmh_u16_f16 (float16_t a) {`
`214`	`208`	`return vcvtmh_u16_f16(a);`
`215`	`209`	`}`
`@@ -229,9 +223,8 @@ uint64_t test_vcvtmh_u64_f16 (float16_t a) {`
`229`	`223`	`}`
`230`	`224`
`231`	`225`	`// CHECK-LABEL: test_vcvtnh_s16_f16`
`232`		`-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtns.i32.f16(half %a)`
`233`		`-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16`
`234`		`-// CHECK: ret i16 [[RET]]`
	`226`	`+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtns.i16.f16(half %a)`
	`227`	`+// CHECK: ret i16 [[FCVT]]`
`235`	`228`	`int16_t test_vcvtnh_s16_f16 (float16_t a) {`
`236`	`229`	`return vcvtnh_s16_f16(a);`
`237`	`230`	`}`
`@@ -251,9 +244,8 @@ int64_t test_vcvtnh_s64_f16 (float16_t a) {`
`251`	`244`	`}`
`252`	`245`
`253`	`246`	`// CHECK-LABEL: test_vcvtnh_u16_f16`
`254`		`-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtnu.i32.f16(half %a)`
`255`		`-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16`
`256`		`-// CHECK: ret i16 [[RET]]`
	`247`	`+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtnu.i16.f16(half %a)`
	`248`	`+// CHECK: ret i16 [[FCVT]]`
`257`	`249`	`uint16_t test_vcvtnh_u16_f16 (float16_t a) {`
`258`	`250`	`return vcvtnh_u16_f16(a);`
`259`	`251`	`}`
`@@ -273,9 +265,8 @@ uint64_t test_vcvtnh_u64_f16 (float16_t a) {`
`273`	`265`	`}`
`274`	`266`
`275`	`267`	`// CHECK-LABEL: test_vcvtph_s16_f16`
`276`		`-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtps.i32.f16(half %a)`
`277`		`-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16`
`278`		`-// CHECK: ret i16 [[RET]]`
	`268`	`+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtps.i16.f16(half %a)`
	`269`	`+// CHECK: ret i16 [[FCVT]]`
`279`	`270`	`int16_t test_vcvtph_s16_f16 (float16_t a) {`
`280`	`271`	`return vcvtph_s16_f16(a);`
`281`	`272`	`}`
`@@ -295,9 +286,8 @@ int64_t test_vcvtph_s64_f16 (float16_t a) {`
`295`	`286`	`}`
`296`	`287`
`297`	`288`	`// CHECK-LABEL: test_vcvtph_u16_f16`
`298`		`-// CHECK: [[FCVT:%.*]] = call i32 @llvm.aarch64.neon.fcvtpu.i32.f16(half %a)`
`299`		`-// CHECK: [[RET:%.*]] = trunc i32 [[FCVT]] to i16`
`300`		`-// CHECK: ret i16 [[RET]]`
	`289`	`+// CHECK: [[FCVT:%.*]] = call i16 @llvm.aarch64.neon.fcvtpu.i16.f16(half %a)`
	`290`	`+// CHECK: ret i16 [[FCVT]]`
`301`	`291`	`uint16_t test_vcvtph_u16_f16 (float16_t a) {`
`302`	`292`	`return vcvtph_u16_f16(a);`
`303`	`293`	`}`