Add support for sm101 target architecture (Tegra Blackwell)

Sebastian Jodlowski · Sebastian Jodlowski · commit a55c76bac1bd · 2025-02-14T01:34:16.000-08:00
diff --git a/clang/include/clang/Basic/BuiltinsNVPTX.td b/clang/include/clang/Basic/BuiltinsNVPTX.td
@@ -21,6 +21,10 @@ class SM<string version, list<SMFeatures> newer_list> : SMFeatures {
                         !strconcat(f, "|", newer.Features));
 }
 
+let Features = "sm_101a" in def SM_101a : SMFeatures;
+
+def SM_101 : SM<"101", [SM_101a]>;
+
 let Features = "sm_100a" in def SM_100a : SMFeatures;
 
 def SM_100 : SM<"100", [SM_100a]>;
diff --git a/clang/include/clang/Basic/Cuda.h b/clang/include/clang/Basic/Cuda.h
@@ -82,6 +82,8 @@ enum class OffloadArch {
   SM_90a,
   SM_100,
   SM_100a,
+  SM_101,
+  SM_101a,
   GFX600,
   GFX601,
   GFX602,
diff --git a/clang/lib/Basic/Cuda.cpp b/clang/lib/Basic/Cuda.cpp
@@ -100,6 +100,8 @@ static const OffloadArchToStringMap arch_names[] = {
     SM(90a),                         // Hopper
     SM(100),                         // Blackwell
     SM(100a),                        // Blackwell
+    SM(101),                         // Blackwell
+    SM(101a),                        // Blackwell
     GFX(600),  // gfx600
     GFX(601),  // gfx601
     GFX(602),  // gfx602
@@ -230,6 +232,8 @@ CudaVersion MinVersionForOffloadArch(OffloadArch A) {
     return CudaVersion::CUDA_120;
   case OffloadArch::SM_100:
   case OffloadArch::SM_100a:
+  case OffloadArch::SM_101:
+  case OffloadArch::SM_101a:
     return CudaVersion::CUDA_128;
   default:
     llvm_unreachable("invalid enum");
diff --git a/clang/lib/Basic/Targets/NVPTX.cpp b/clang/lib/Basic/Targets/NVPTX.cpp
@@ -292,6 +292,9 @@ void NVPTXTargetInfo::getTargetDefines(const LangOptions &Opts,
       case OffloadArch::SM_100:
       case OffloadArch::SM_100a:
         return "1000";
+      case OffloadArch::SM_101:
+      case OffloadArch::SM_101a:
+         return "1010";
       }
       llvm_unreachable("unhandled OffloadArch");
     }();
@@ -300,6 +303,8 @@ void NVPTXTargetInfo::getTargetDefines(const LangOptions &Opts,
       Builder.defineMacro("__CUDA_ARCH_FEAT_SM90_ALL", "1");
     if (GPU == OffloadArch::SM_100a)
       Builder.defineMacro("__CUDA_ARCH_FEAT_SM100_ALL", "1");
+    if (GPU == OffloadArch::SM_101a)
+      Builder.defineMacro("__CUDA_ARCH_FEAT_SM101_ALL", "1");
   }
 }
 
diff --git a/clang/lib/CodeGen/CGOpenMPRuntimeGPU.cpp b/clang/lib/CodeGen/CGOpenMPRuntimeGPU.cpp
@@ -2278,6 +2278,8 @@ void CGOpenMPRuntimeGPU::processRequiresDirective(const OMPRequiresDecl *D) {
       case OffloadArch::SM_90a:
       case OffloadArch::SM_100:
       case OffloadArch::SM_100a:
+      case OffloadArch::SM_101:
+      case OffloadArch::SM_101a:
       case OffloadArch::GFX600:
       case OffloadArch::GFX601:
       case OffloadArch::GFX602:
diff --git a/clang/test/Misc/target-invalid-cpu-note/nvptx.c b/clang/test/Misc/target-invalid-cpu-note/nvptx.c
@@ -28,6 +28,8 @@
 // CHECK-SAME: {{^}}, sm_90a
 // CHECK-SAME: {{^}}, sm_100
 // CHECK-SAME: {{^}}, sm_100a
+// CHECK-SAME: {{^}}, sm_101
+// CHECK-SAME: {{^}}, sm_101a
 // CHECK-SAME: {{^}}, gfx600
 // CHECK-SAME: {{^}}, gfx601
 // CHECK-SAME: {{^}}, gfx602

Original file line number	Diff line number	Diff line change
`@@ -21,6 +21,10 @@ class SM<string version, list<SMFeatures> newer_list> : SMFeatures {`
`21`	`21`	`!strconcat(f, "\|", newer.Features));`
`22`	`22`	`}`
`23`	`23`
	`24`	`+let Features = "sm_101a" in def SM_101a : SMFeatures;`
	`25`	`+`
	`26`	`+def SM_101 : SM<"101", [SM_101a]>;`
	`27`	`+`
`24`	`28`	`let Features = "sm_100a" in def SM_100a : SMFeatures;`
`25`	`29`
`26`	`30`	`def SM_100 : SM<"100", [SM_100a]>;`
Original file line number	Diff line number	Diff line change
`@@ -292,6 +292,9 @@ void NVPTXTargetInfo::getTargetDefines(const LangOptions &Opts,`
`292`	`292`	`case OffloadArch::SM_100:`
`293`	`293`	`case OffloadArch::SM_100a:`
`294`	`294`	`return "1000";`
	`295`	`+ case OffloadArch::SM_101:`
	`296`	`+ case OffloadArch::SM_101a:`
	`297`	`+ return "1010";`
`295`	`298`	`}`
`296`	`299`	`llvm_unreachable("unhandled OffloadArch");`
`297`	`300`	`}();`
`@@ -300,6 +303,8 @@ void NVPTXTargetInfo::getTargetDefines(const LangOptions &Opts,`
`300`	`303`	`Builder.defineMacro("__CUDA_ARCH_FEAT_SM90_ALL", "1");`
`301`	`304`	`if (GPU == OffloadArch::SM_100a)`
`302`	`305`	`Builder.defineMacro("__CUDA_ARCH_FEAT_SM100_ALL", "1");`
	`306`	`+ if (GPU == OffloadArch::SM_101a)`
	`307`	`+ Builder.defineMacro("__CUDA_ARCH_FEAT_SM101_ALL", "1");`
`303`	`308`	`}`
`304`	`309`	`}`
`305`	`310`