PyLops
diff --git a/‎pylops_mpi/utils/_nccl.py‎
Lines changed: 15 additions & 5 deletions b/‎pylops_mpi/utils/_nccl.py‎
Lines changed: 15 additions & 5 deletions
diff --git a/‎tests_nccl/test_blockdiag_nccl.py‎
Lines changed: 4 additions & 4 deletions b/‎tests_nccl/test_blockdiag_nccl.py‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎tests_nccl/test_derivative_nccl.py‎
Lines changed: 54 additions & 138 deletions b/‎tests_nccl/test_derivative_nccl.py‎
Lines changed: 54 additions & 138 deletions
@@ -25,6 +25,9 @@
     "int8": nccl.NCCL_INT8,
     "uint32": nccl.NCCL_UINT32,
     "uint64": nccl.NCCL_UINT64,
+    # sending complex array as float with 2x size
+    "complex64": nccl.NCCL_FLOAT32,
+    "complex128": nccl.NCCL_FLOAT64,
 }
 
 
@@ -35,6 +38,13 @@ class NcclOp(IntEnum):
     MIN = nccl.NCCL_MIN
 
 
+def _nccl_buf_size(buf, count=None):
+    if buf.dtype in ['complex64', 'complex128']:
+        return 2 * count if count else 2 * buf.size
+    else:
+        return count if count else buf.size
+
+
 def mpi_op_to_nccl(mpi_op) -> NcclOp:
     """ Map MPI reduction operation to NCCL equivalent
 
@@ -155,7 +165,7 @@ def nccl_allgather(nccl_comm, send_buf, recv_buf=None) -> cp.ndarray:
     nccl_comm.allGather(
         send_buf.data.ptr,
         recv_buf.data.ptr,
-        send_buf.size,
+        _nccl_buf_size(send_buf),
         cupy_to_nccl_dtype[str(send_buf.dtype)],
         cp.cuda.Stream.null.ptr,
     )
@@ -193,7 +203,7 @@ def nccl_allreduce(nccl_comm, send_buf, recv_buf=None, op: MPI.Op = MPI.SUM) ->
     nccl_comm.allReduce(
         send_buf.data.ptr,
         recv_buf.data.ptr,
-        send_buf.size,
+        _nccl_buf_size(send_buf),
         cupy_to_nccl_dtype[str(send_buf.dtype)],
         mpi_op_to_nccl(op),
         cp.cuda.Stream.null.ptr,
@@ -220,7 +230,7 @@ def nccl_bcast(nccl_comm, local_array, index, value) -> None:
         local_array[index] = value
     nccl_comm.bcast(
         local_array[index].data.ptr,
-        local_array[index].size,
+        _nccl_buf_size(local_array[index]),
         cupy_to_nccl_dtype[str(local_array[index].dtype)],
         0,
         cp.cuda.Stream.null.ptr,
@@ -302,7 +312,7 @@ def nccl_send(nccl_comm, send_buf, dest, count):
         Number of elements to send from `send_buf`.
     """
     nccl_comm.send(send_buf.data.ptr,
-                   count,
+                   _nccl_buf_size(send_buf, count),
                    cupy_to_nccl_dtype[str(send_buf.dtype)],
                    dest,
                    cp.cuda.Stream.null.ptr
@@ -325,7 +335,7 @@ def nccl_recv(nccl_comm, recv_buf, source, count=None):
         Number of elements to receive.
     """
     nccl_comm.recv(recv_buf.data.ptr,
-                   count,
+                   _nccl_buf_size(recv_buf, count),
                    cupy_to_nccl_dtype[str(recv_buf.dtype)],
                    source,
                    cp.cuda.Stream.null.ptr
 
@@ -18,15 +18,15 @@
 nccl_comm = initialize_nccl_comm()
 
 par1 = {'ny': 101, 'nx': 101, 'dtype': np.float64}
-# par1j = {'ny': 101, 'nx': 101, 'dtype': np.complex128}
+par1j = {'ny': 101, 'nx': 101, 'dtype': np.complex128}
 par2 = {'ny': 301, 'nx': 101, 'dtype': np.float64}
-# par2j = {'ny': 301, 'nx': 101, 'dtype': np.complex128}
+par2j = {'ny': 301, 'nx': 101, 'dtype': np.complex128}
 
 np.random.seed(42)
 
 
 @pytest.mark.mpi(min_size=2)
-@pytest.mark.parametrize("par", [(par1), (par2)])
+@pytest.mark.parametrize("par", [(par1), (par1j), (par2), (par2j)])
 def test_blockdiag_nccl(par):
     """Test the MPIBlockDiag with NCCL"""
     size = MPI.COMM_WORLD.Get_size()
@@ -71,7 +71,7 @@ def test_blockdiag_nccl(par):
 
 
 @pytest.mark.mpi(min_size=2)
-@pytest.mark.parametrize("par", [(par1), (par2)])
+@pytest.mark.parametrize("par", [(par1), (par1j), (par2), (par2j)])
 def test_stacked_blockdiag_nccl(par):
     """Tests for MPIStackedBlogDiag with NCCL"""
     size = MPI.COMM_WORLD.Get_size()
 
@@ -38,13 +38,13 @@
     "partition": pylops_mpi.Partition.BROADCAST,
 }
 
-# par1j = {
-#     "nz": 600,
-#     "dz": 1.0,
-#     "edge": False,
-#     "dtype": np.complex128,
-#     "partition": pylops_mpi.Partition.SCATTER
-# }
+par1j = {
+    "nz": 600,
+    "dz": 1.0,
+    "edge": False,
+    "dtype": np.complex128,
+    "partition": pylops_mpi.Partition.SCATTER
+}
 
 par1e = {
     "nz": 600,
@@ -70,13 +70,13 @@
     "partition": pylops_mpi.Partition.BROADCAST,
 }
 
-# par2j = {
-#     "nz": (100, 151),
-#     "dz": 1.0,
-#     "edge": False,
-#     "dtype": np.complex128,
-#     "partition": pylops_mpi.Partition.SCATTER
-# }
+par2j = {
+    "nz": (100, 151),
+    "dz": 1.0,
+    "edge": False,
+    "dtype": np.complex128,
+    "partition": pylops_mpi.Partition.SCATTER
+}
 
 par2e = {
     "nz": (100, 151),
@@ -102,13 +102,13 @@
     "partition": pylops_mpi.Partition.BROADCAST,
 }
 
-# par3j = {
-#     "nz": (101, 51, 100),
-#     "dz": 0.4,
-#     "edge": True,
-#     "dtype": np.complex128,
-#     "partition": pylops_mpi.Partition.SCATTER
-# }
+par3j = {
+    "nz": (101, 51, 100),
+    "dz": 0.4,
+    "edge": True,
+    "dtype": np.complex128,
+    "partition": pylops_mpi.Partition.SCATTER
+}
 
 par3e = {
     "nz": (101, 51, 100),
@@ -134,13 +134,13 @@
     "partition": pylops_mpi.Partition.BROADCAST,
 }
 
-# par4j = {
-#     "nz": (79, 101, 50),
-#     "dz": 0.4,
-#     "edge": True,
-#     "dtype": np.complex128,
-#     "partition": pylops_mpi.Partition.SCATTER
-# }
+par4j = {
+    "nz": (79, 101, 50),
+    "dz": 0.4,
+    "edge": True,
+    "dtype": np.complex128,
+    "partition": pylops_mpi.Partition.SCATTER
+}
 
 par4e = {
     "nz": (79, 101, 50),
@@ -188,24 +188,10 @@
 
 
 @pytest.mark.mpi(min_size=2)
-@pytest.mark.parametrize(
-    "par",
-    [
-        (par1),
-        (par1b),
-        (par1e),
-        (par2),
-        (par2b),
-        (par2e),
-        (par3),
-        (par3b),
-        (par3e),
-        (par4),
-        (par4b),
-        (par4e),
-    ],
-)
-def test_first_derivative_forward(par):
+@pytest.mark.parametrize("par", [(par1), (par1b), (par1j), (par1e), (par2), (par2b),
+                                 (par2j), (par2e), (par3), (par3b), (par3j), (par3e),
+                                 (par4), (par4b), (par4j), (par4e)])
+def test_first_derivative_forward_nccl(par):
     """MPIFirstDerivative operator (forward stencil)"""
     Fop_MPI = pylops_mpi.MPIFirstDerivative(
         dims=par["nz"],
@@ -250,24 +236,10 @@ def test_first_derivative_forward(par):
 
 
 @pytest.mark.mpi(min_size=2)
-@pytest.mark.parametrize(
-    "par",
-    [
-        (par1),
-        (par1b),
-        (par1e),
-        (par2),
-        (par2b),
-        (par2e),
-        (par3),
-        (par3b),
-        (par3e),
-        (par4),
-        (par4b),
-        (par4e),
-    ],
-)
-def test_first_derivative_backward(par):
+@pytest.mark.parametrize("par", [(par1), (par1b), (par1j), (par1e), (par2), (par2b),
+                                 (par2j), (par2e), (par3), (par3b), (par3j), (par3e),
+                                 (par4), (par4b), (par4j), (par4e)])
+def test_first_derivative_backward_nccl(par):
     """MPIFirstDerivative operator (backward stencil)"""
     Fop_MPI = pylops_mpi.MPIFirstDerivative(
         dims=par["nz"],
@@ -311,24 +283,10 @@ def test_first_derivative_backward(par):
 
 
 @pytest.mark.mpi(min_size=2)
-@pytest.mark.parametrize(
-    "par",
-    [
-        (par1),
-        (par1b),
-        (par1e),
-        (par2),
-        (par2b),
-        (par2e),
-        (par3),
-        (par3b),
-        (par3e),
-        (par4),
-        (par4b),
-        (par4e),
-    ],
-)
-def test_first_derivative_centered(par):
+@pytest.mark.parametrize("par", [(par1), (par1b), (par1j), (par1e), (par2), (par2b),
+                                 (par2j), (par2e), (par3), (par3b), (par3j), (par3e),
+                                 (par4), (par4b), (par4j), (par4e)])
+def test_first_derivative_centered_nccl(par):
     """MPIFirstDerivative operator (centered stencil)"""
     for order in [3, 5]:
         Fop_MPI = pylops_mpi.MPIFirstDerivative(
@@ -375,24 +333,10 @@ def test_first_derivative_centered(par):
 
 
 @pytest.mark.mpi(min_size=2)
-@pytest.mark.parametrize(
-    "par",
-    [
-        (par1),
-        (par1b),
-        (par1e),
-        (par2),
-        (par2b),
-        (par2e),
-        (par3),
-        (par3b),
-        (par3e),
-        (par4),
-        (par4b),
-        (par4e),
-    ],
-)
-def test_second_derivative_forward(par):
+@pytest.mark.parametrize("par", [(par1), (par1b), (par1j), (par1e), (par2), (par2b),
+                                 (par2j), (par2e), (par3), (par3b), (par3j), (par3e),
+                                 (par4), (par4b), (par4j), (par4e)])
+def test_second_derivative_forward_nccl(par):
     """MPISecondDerivative operator (forward stencil)"""
     Sop_MPI = pylops_mpi.basicoperators.MPISecondDerivative(
         dims=par["nz"],
@@ -436,24 +380,10 @@ def test_second_derivative_forward(par):
 
 
 @pytest.mark.mpi(min_size=2)
-@pytest.mark.parametrize(
-    "par",
-    [
-        (par1),
-        (par1b),
-        (par1e),
-        (par2),
-        (par2b),
-        (par2e),
-        (par3),
-        (par3b),
-        (par3e),
-        (par4),
-        (par4b),
-        (par4e),
-    ],
-)
-def test_second_derivative_backward(par):
+@pytest.mark.parametrize("par", [(par1), (par1b), (par1j), (par1e), (par2), (par2b),
+                                 (par2j), (par2e), (par3), (par3b), (par3j), (par3e),
+                                 (par4), (par4b), (par4j), (par4e)])
+def test_second_derivative_backward_nccl(par):
     """MPISecondDerivative operator (backward stencil)"""
     Sop_MPI = pylops_mpi.basicoperators.MPISecondDerivative(
         dims=par["nz"],
@@ -497,24 +427,10 @@ def test_second_derivative_backward(par):
 
 
 @pytest.mark.mpi(min_size=2)
-@pytest.mark.parametrize(
-    "par",
-    [
-        (par1),
-        (par1b),
-        (par1e),
-        (par2),
-        (par2b),
-        (par2e),
-        (par3),
-        (par3b),
-        (par3e),
-        (par4),
-        (par4b),
-        (par4e),
-    ],
-)
-def test_second_derivative_centered(par):
+@pytest.mark.parametrize("par", [(par1), (par1b), (par1j), (par1e), (par2), (par2b),
+                                 (par2j), (par2e), (par3), (par3b), (par3j), (par3e),
+                                 (par4), (par4b), (par4j), (par4e)])
+def test_second_derivative_centered_nccl(par):
     """MPISecondDerivative operator (centered stencil)"""
     Sop_MPI = pylops_mpi.basicoperators.MPISecondDerivative(
         dims=par["nz"],
@@ -559,7 +475,7 @@ def test_second_derivative_centered(par):
 
 @pytest.mark.mpi(min_size=2)
 @pytest.mark.parametrize("par", [(par5), (par5e), (par6), (par6e)])
-def test_laplacian(par):
+def test_laplacian_nccl(par):
     """MPILaplacian Operator"""
     for kind in ["forward", "backward", "centered"]:
         Lop_MPI = pylops_mpi.basicoperators.MPILaplacian(
@@ -607,7 +523,7 @@ def test_laplacian(par):
 
 @pytest.mark.mpi(min_size=2)
 @pytest.mark.parametrize("par", [(par5), (par5e), (par6), (par6e)])
-def test_gradient(par):
+def test_gradient_nccl(par):
     """MPIGradient Operator"""
     for kind in ["forward", "backward", "centered"]:
         Gop_MPI = pylops_mpi.basicoperators.MPIGradient(