Add unittests for cuSub

jysh1214 · jysh1214 · commit 56cf145d63e1 · 2025-09-07T19:23:25.000+08:00
diff --git a/tests/gpu/CMakeLists.txt b/tests/gpu/CMakeLists.txt
@@ -17,6 +17,7 @@ add_executable(
   linalg_test/Abs_test.cpp
   linalg_test/Add_test.cpp
   linalg_test/Mul_test.cpp
+  linalg_test/Sub_test.cpp
   linalg_test/Det_test.cpp
   linalg_test/Directsum_test.cpp
   linalg_test/ExpH_test.cpp
diff --git a/tests/gpu/linalg_test/Sub_test.cpp b/tests/gpu/linalg_test/Sub_test.cpp
@@ -0,0 +1,203 @@
+#include "gtest/gtest.h"
+
+#include "gpu_test_tools.h"
+#include "cytnx.hpp"
+
+namespace SubTest {
+
+  ::testing::AssertionResult CheckSubResult(const cytnx::Tensor& gpu_result,
+                                            const cytnx::Tensor& left_tensor,
+                                            const cytnx::Tensor& right_tensor);
+
+  ::testing::AssertionResult CheckSubScalarResult(const cytnx::Tensor& gpu_result,
+                                                  const cytnx::Tensor& tensor,
+                                                  const cytnx::cytnx_double& scalar,
+                                                  bool scalar_left = false);
+
+  std::vector<std::vector<cytnx::cytnx_uint64>> GetTestShapes();
+
+  cytnx::cytnx_double GetTolerance(const unsigned int& dtype);
+
+  class SubTestAllShapes : public ::testing::TestWithParam<std::vector<cytnx::cytnx_uint64>> {};
+
+  // Test tensor-to-tensor subtraction
+  TEST_P(SubTestAllShapes, gpu_tensor_sub_tensor_all_types) {
+    const std::vector<cytnx::cytnx_uint64>& shape = GetParam();
+
+    for (auto dtype : cytnx::TestTools::dtype_list) {
+      if (dtype == cytnx::Type.Bool) {
+        continue;
+      }
+
+      SCOPED_TRACE("Testing Sub(tensor, tensor) with shape: " + ::testing::PrintToString(shape) +
+                   " and dtype: " + std::to_string(dtype));
+
+      cytnx::Tensor gpu_tensor1 = cytnx::Tensor(shape, dtype).to(cytnx::Device.cuda);
+      cytnx::Tensor gpu_tensor2 = cytnx::Tensor(shape, dtype).to(cytnx::Device.cuda);
+      cytnx::TestTools::InitTensorUniform(gpu_tensor1);
+      cytnx::TestTools::InitTensorUniform(gpu_tensor2);
+
+      cytnx::Tensor gpu_result = cytnx::linalg::Sub(gpu_tensor1, gpu_tensor2);
+      EXPECT_TRUE(CheckSubResult(gpu_result, gpu_tensor1, gpu_tensor2));
+
+      cytnx::Tensor gpu_result_member = gpu_tensor1.Sub(gpu_tensor2);
+      EXPECT_TRUE(CheckSubResult(gpu_result_member, gpu_tensor1, gpu_tensor2));
+
+      cytnx::Tensor gpu_result_operator = gpu_tensor1 - gpu_tensor2;
+      EXPECT_TRUE(CheckSubResult(gpu_result_operator, gpu_tensor1, gpu_tensor2));
+    }
+  }
+
+  // Test scalar-to-tensor subtraction
+  TEST_P(SubTestAllShapes, gpu_scalar_sub_tensor_all_types) {
+    const std::vector<cytnx::cytnx_uint64>& shape = GetParam();
+
+    for (auto dtype : cytnx::TestTools::dtype_list) {
+      if (dtype == cytnx::Type.Bool) {
+        continue;
+      }
+
+      SCOPED_TRACE("Testing Sub(scalar, tensor) with shape: " + ::testing::PrintToString(shape) +
+                   " and dtype: " + std::to_string(dtype));
+
+      cytnx::Tensor gpu_tensor = cytnx::Tensor(shape, dtype).to(cytnx::Device.cuda);
+      cytnx::TestTools::InitTensorUniform(gpu_tensor);
+      cytnx::cytnx_double scalar = 2.3;
+
+      cytnx::Tensor gpu_result = cytnx::linalg::Sub(scalar, gpu_tensor);
+      EXPECT_TRUE(CheckSubScalarResult(gpu_result, gpu_tensor, scalar, true));
+
+      cytnx::Tensor gpu_result_operator = scalar - gpu_tensor;
+      EXPECT_TRUE(CheckSubScalarResult(gpu_result_operator, gpu_tensor, scalar, true));
+    }
+  }
+
+  // Test tensor-to-scalar subtraction
+  TEST_P(SubTestAllShapes, gpu_tensor_sub_scalar_all_types) {
+    const std::vector<cytnx::cytnx_uint64>& shape = GetParam();
+
+    for (auto dtype : cytnx::TestTools::dtype_list) {
+      if (dtype == cytnx::Type.Bool) {
+        continue;
+      }
+
+      SCOPED_TRACE("Testing Sub(tensor, scalar) with shape: " + ::testing::PrintToString(shape) +
+                   " and dtype: " + std::to_string(dtype));
+
+      cytnx::Tensor gpu_tensor = cytnx::Tensor(shape, dtype).to(cytnx::Device.cuda);
+      cytnx::TestTools::InitTensorUniform(gpu_tensor);
+      cytnx::cytnx_double scalar = 2.3;
+
+      cytnx::Tensor gpu_result = cytnx::linalg::Sub(gpu_tensor, scalar);
+      EXPECT_TRUE(CheckSubScalarResult(gpu_result, gpu_tensor, scalar, false));
+
+      cytnx::Tensor gpu_result_member = gpu_tensor.Sub(scalar);
+      EXPECT_TRUE(CheckSubScalarResult(gpu_result_member, gpu_tensor, scalar, false));
+
+      cytnx::Tensor gpu_result_operator = gpu_tensor - scalar;
+      EXPECT_TRUE(CheckSubScalarResult(gpu_result_operator, gpu_tensor, scalar, false));
+    }
+  }
+
+  // Test in-place tensor subtraction
+  TEST_P(SubTestAllShapes, gpu_tensor_isub_all_types) {
+    const std::vector<cytnx::cytnx_uint64>& shape = GetParam();
+
+    for (auto dtype : cytnx::TestTools::dtype_list) {
+      if (dtype == cytnx::Type.Bool) {
+        continue;
+      }
+
+      SCOPED_TRACE("Testing iSub(tensor, tensor) with shape: " + ::testing::PrintToString(shape) +
+                   " and dtype: " + std::to_string(dtype));
+
+      cytnx::Tensor gpu_tensor1 = cytnx::Tensor(shape, dtype).to(cytnx::Device.cuda);
+      cytnx::Tensor gpu_tensor2 = cytnx::Tensor(shape, dtype).to(cytnx::Device.cuda);
+      cytnx::TestTools::InitTensorUniform(gpu_tensor1);
+      cytnx::TestTools::InitTensorUniform(gpu_tensor2);
+
+      cytnx::Tensor original_gpu_tensor1 = gpu_tensor1.clone();
+      cytnx::Tensor original_gpu_tensor2 = gpu_tensor2.clone();
+
+      cytnx::linalg::iSub(gpu_tensor1, gpu_tensor2);
+      EXPECT_TRUE(CheckSubResult(gpu_tensor1, original_gpu_tensor1, original_gpu_tensor2));
+
+      cytnx::Tensor gpu_tensor1_op = original_gpu_tensor1.clone();
+      gpu_tensor1_op -= original_gpu_tensor2;
+      EXPECT_TRUE(CheckSubResult(gpu_tensor1_op, original_gpu_tensor1, original_gpu_tensor2));
+    }
+  }
+
+  INSTANTIATE_TEST_SUITE_P(SubTests, SubTestAllShapes, ::testing::ValuesIn(GetTestShapes()));
+
+  ::testing::AssertionResult CheckSubResult(const cytnx::Tensor& gpu_result,
+                                            const cytnx::Tensor& left_tensor,
+                                            const cytnx::Tensor& right_tensor) {
+    // Compare CUDA Sub result against CPU Sub result
+    cytnx::Tensor left_cpu = left_tensor.to(cytnx::Device.cpu);
+    cytnx::Tensor right_cpu = right_tensor.to(cytnx::Device.cpu);
+    cytnx::Tensor expected_cpu = cytnx::linalg::Sub(left_cpu, right_cpu);
+    cytnx::Tensor gpu_result_cpu = gpu_result.to(cytnx::Device.cpu);
+
+    cytnx::cytnx_double tolerance = GetTolerance(gpu_result.dtype());
+
+    if (!cytnx::TestTools::AreNearlyEqTensor(gpu_result_cpu, expected_cpu, tolerance)) {
+      return ::testing::AssertionFailure()
+             << "Sub result mismatch: CUDA Sub result differs from CPU Sub result. "
+             << "Left dtype: " << left_tensor.dtype() << ", Right dtype: " << right_tensor.dtype()
+             << ", tolerance used: " << tolerance;
+    }
+
+    return ::testing::AssertionSuccess();
+  }
+
+  ::testing::AssertionResult CheckSubScalarResult(const cytnx::Tensor& gpu_result,
+                                                  const cytnx::Tensor& tensor,
+                                                  const cytnx::cytnx_double& scalar,
+                                                  bool scalar_left) {
+    // Compare CUDA Sub result against CPU Sub result
+    cytnx::Tensor tensor_cpu = tensor.to(cytnx::Device.cpu);
+    cytnx::Tensor expected_cpu;
+
+    if (scalar_left) {
+      expected_cpu = cytnx::linalg::Sub(scalar, tensor_cpu);
+    } else {
+      expected_cpu = cytnx::linalg::Sub(tensor_cpu, scalar);
+    }
+
+    cytnx::Tensor gpu_result_cpu = gpu_result.to(cytnx::Device.cpu);
+
+    cytnx::cytnx_double tolerance = GetTolerance(gpu_result.dtype());
+
+    if (!cytnx::TestTools::AreNearlyEqTensor(gpu_result_cpu, expected_cpu, tolerance)) {
+      return ::testing::AssertionFailure()
+             << "Sub scalar result mismatch: CUDA Sub result differs from CPU Sub result. "
+             << "Tensor dtype: " << tensor.dtype() << ", scalar: " << scalar
+             << ", scalar_left: " << scalar_left << ", tolerance used: " << tolerance;
+    }
+
+    return ::testing::AssertionSuccess();
+  }
+
+  std::vector<std::vector<cytnx::cytnx_uint64>> GetTestShapes() {
+    std::vector<std::vector<cytnx::cytnx_uint64>> all_shapes;
+
+    auto shapes_1d = cytnx::TestTools::GenerateTestShapes(1, 1, 1024, 4);
+    auto shapes_2d = cytnx::TestTools::GenerateTestShapes(2, 1, 512, 4);
+    auto shapes_3d = cytnx::TestTools::GenerateTestShapes(3, 1, 64, 4);
+    auto shapes_4d = cytnx::TestTools::GenerateTestShapes(4, 1, 32, 4);
+
+    all_shapes.insert(all_shapes.end(), shapes_1d.begin(), shapes_1d.end());
+    all_shapes.insert(all_shapes.end(), shapes_2d.begin(), shapes_2d.end());
+    all_shapes.insert(all_shapes.end(), shapes_3d.begin(), shapes_3d.end());
+    all_shapes.insert(all_shapes.end(), shapes_4d.begin(), shapes_4d.end());
+
+    return all_shapes;
+  }
+
+  cytnx::cytnx_double GetTolerance(const unsigned int& dtype) {
+    cytnx::cytnx_double tolerance = 1e-6;
+    return tolerance;
+  }
+
+}  // namespace SubTest