multi gpu update

rusty1s · rusty1s · commit 20a7cd3c6843 · 2019-03-06T15:57:48.000+01:00
diff --git a/cuda/scatter_kernel.cu b/cuda/scatter_kernel.cu
@@ -43,6 +43,7 @@ scatter_mul_kernel(at::cuda::detail::TensorInfo<scalar_t, int64_t> src,
 
 void scatter_mul_cuda(at::Tensor src, at::Tensor index, at::Tensor out,
                       int64_t dim) {
+  cudaSetDevice(src.get_device());
   AT_DISPATCH_ALL_TYPES(src.type(), "scatter_mul_kernel", [&] {
     KERNEL_RUN(scatter_mul_kernel, index.dim(), index.numel(),
                at::cuda::detail::getTensorInfo<scalar_t, int64_t>(src),
@@ -69,6 +70,7 @@ scatter_div_kernel(at::cuda::detail::TensorInfo<scalar_t, int64_t> src,
 
 void scatter_div_cuda(at::Tensor src, at::Tensor index, at::Tensor out,
                       int64_t dim) {
+  cudaSetDevice(src.get_device());
   AT_DISPATCH_ALL_TYPES(src.type(), "scatter_div_kernel", [&] {
     KERNEL_RUN(scatter_div_kernel, index.dim(), index.numel(),
                at::cuda::detail::getTensorInfo<scalar_t, int64_t>(src),
@@ -114,6 +116,7 @@ scatter_max_kernel(at::cuda::detail::TensorInfo<scalar_t, int64_t> src,
 
 void scatter_max_cuda(at::Tensor src, at::Tensor index, at::Tensor out,
                       at::Tensor arg, int64_t dim) {
+  cudaSetDevice(src.get_device());
   AT_DISPATCH_ALL_TYPES(src.type(), "scatter_max_kernel", [&] {
     auto src_info = at::cuda::detail::getTensorInfo<scalar_t, int64_t>(src);
     auto index_info = at::cuda::detail::getTensorInfo<int64_t, int64_t>(index);
@@ -144,6 +147,7 @@ scatter_min_kernel(at::cuda::detail::TensorInfo<scalar_t, int64_t> src,
 
 void scatter_min_cuda(at::Tensor src, at::Tensor index, at::Tensor out,
                       at::Tensor arg, int64_t dim) {
+  cudaSetDevice(src.get_device());
   AT_DISPATCH_ALL_TYPES(src.type(), "scatter_min_kernel", [&] {
     auto src_info = at::cuda::detail::getTensorInfo<scalar_t, int64_t>(src);
     auto index_info = at::cuda::detail::getTensorInfo<int64_t, int64_t>(index);
@@ -179,6 +183,7 @@ index_backward_kernel(at::cuda::detail::TensorInfo<scalar_t, int64_t> grad,
 
 void index_backward_cuda(at::Tensor grad, at::Tensor index, at::Tensor arg,
                          at::Tensor out, int64_t dim) {
+  cudaSetDevice(grad.get_device());
   AT_DISPATCH_ALL_TYPES(grad.type(), "index_backward_kernel", [&] {
     KERNEL_RUN(index_backward_kernel, index.dim(), index.numel(),
                at::cuda::detail::getTensorInfo<scalar_t, int64_t>(grad),
diff --git a/setup.py b/setup.py
@@ -20,7 +20,7 @@
                       ['cuda/scatter.cpp', 'cuda/scatter_kernel.cu'])
     ]
 
-__version__ = '1.1.1'
+__version__ = '1.1.2'
 url = 'https://github.com/rusty1s/pytorch_scatter'
 
 install_requires = []
diff --git a/test/test_multi_gpu.py b/test/test_multi_gpu.py
@@ -0,0 +1,12 @@
+import pytest
+import torch
+from torch_scatter import scatter_max
+
+
+@pytest.mark.skipif(not torch.cuda.is_available(), reason='CUDA not available')
+@pytest.mark.skipif(torch.cuda.device_count() < 2, reason='No multiple GPUS')
+def test_multi_gpu():
+    device = torch.device('cuda:1')
+    src = torch.tensor([2.0, 3.0, 4.0, 5.0], device=device)
+    index = torch.tensor([0, 0, 1, 1], device=device)
+    assert scatter_max(src, index)[0].tolist() == [3, 5]
diff --git a/torch_scatter/__init__.py b/torch_scatter/__init__.py
@@ -7,7 +7,7 @@
 from .max import scatter_max
 from .min import scatter_min
 
-__version__ = '1.1.1'
+__version__ = '1.1.2'
 
 __all__ = [
     'scatter_add',

Original file line number	Diff line number	Diff line change
`@@ -20,7 +20,7 @@`
`20`	`20`	`['cuda/scatter.cpp', 'cuda/scatter_kernel.cu'])`
`21`	`21`	`]`
`22`	`22`
`23`		`-__version__ = '1.1.1'`
	`23`	`+__version__ = '1.1.2'`
`24`	`24`	`url = 'https://github.com/rusty1s/pytorch_scatter'`
`25`	`25`
`26`	`26`	`install_requires = []`