IntelPython
diff --git a/‎conda-recipe/meta.yaml
Lines changed: 3 additions & 2 deletions b/‎conda-recipe/meta.yaml
Lines changed: 3 additions & 2 deletions
diff --git a/‎dpnp/backend/include/dpnp_iface.hpp
Lines changed: 20 additions & 19 deletions b/‎dpnp/backend/include/dpnp_iface.hpp
Lines changed: 20 additions & 19 deletions
diff --git a/‎dpnp/backend/kernels/dpnp_krnl_common.cpp
Lines changed: 0 additions & 1 deletion b/‎dpnp/backend/kernels/dpnp_krnl_common.cpp
Lines changed: 0 additions & 1 deletion
diff --git a/‎dpnp/backend/kernels/dpnp_krnl_elemwise.cpp
Lines changed: 2 additions & 2 deletions b/‎dpnp/backend/kernels/dpnp_krnl_elemwise.cpp
Lines changed: 2 additions & 2 deletions
diff --git a/‎dpnp/backend/kernels/dpnp_krnl_fft.cpp
Lines changed: 6 additions & 7 deletions b/‎dpnp/backend/kernels/dpnp_krnl_fft.cpp
Lines changed: 6 additions & 7 deletions
diff --git a/‎dpnp/backend/kernels/dpnp_krnl_indexing.cpp
Lines changed: 11 additions & 2 deletions b/‎dpnp/backend/kernels/dpnp_krnl_indexing.cpp
Lines changed: 11 additions & 2 deletions
diff --git a/‎dpnp/backend/kernels/dpnp_krnl_random.cpp
Lines changed: 10 additions & 30 deletions b/‎dpnp/backend/kernels/dpnp_krnl_random.cpp
Lines changed: 10 additions & 30 deletions
diff --git a/‎dpnp/backend/kernels/dpnp_krnl_sorting.cpp
Lines changed: 10 additions & 10 deletions b/‎dpnp/backend/kernels/dpnp_krnl_sorting.cpp
Lines changed: 10 additions & 10 deletions
@@ -8,7 +8,7 @@ requirements:
     host:
       - python
       - setuptools
-      - numpy-devel >=1.18
+      - numpy >=1.15
       - cython
       - cmake >=3.16.5
       - dpctl >=0.5.0a0
@@ -22,6 +22,7 @@ requirements:
       - dpcpp_cpp_rt >=2021.1.1
       - mkl >=2021.1.1
       - mkl-dpcpp >=2021.1.1
+      - numpy >=1.15
 
 build:
     number: {{ GIT_DESCRIBE_NUMBER }}
@@ -44,7 +45,7 @@ test:
     commands:
       - python -c "import dpnp"
       - conda list
-      - pytest
+      - pytest -s
 
 about:
     home: https://github.com/IntelPython/dpnp
 
@@ -233,15 +233,15 @@ INP_DLLEXPORT void dpnp_elemwise_absolute_c(void* array1_in, void* result1, size
  */
 template <typename _DataType_output, typename _DataType_input1, typename _DataType_input2>
 INP_DLLEXPORT void dpnp_dot_c(void* result_out,
-                                const void* input1_in,
-                                const size_t input1_size,
-                                const size_t* input1_shape,
-                                const size_t input1_shape_ndim,
-                                const void* input2_in,
-                                const size_t input2_size,
-                                const size_t* input2_shape,
-                                const size_t input2_shape_ndim,
-                                const size_t* where);
+                              const void* input1_in,
+                              const size_t input1_size,
+                              const size_t* input1_shape,
+                              const size_t input1_shape_ndim,
+                              const void* input2_in,
+                              const size_t input2_size,
+                              const size_t* input2_shape,
+                              const size_t input2_shape_ndim,
+                              const size_t* where);
 
 /**
  * @ingroup BACKEND_API
@@ -336,7 +336,8 @@ INP_DLLEXPORT void dpnp_sum_c(void* result_out,
  * @param [in]  ndim        Number of elements in shape.
  */
 template <typename _DataType>
-INP_DLLEXPORT void dpnp_partition_c(void* array, void* array2, void* result, const size_t kth, const size_t* shape, const size_t ndim);
+INP_DLLEXPORT void
+    dpnp_partition_c(void* array, void* array2, void* result, const size_t kth, const size_t* shape, const size_t ndim);
 
 /**
  * @ingroup BACKEND_API
@@ -485,15 +486,15 @@ INP_DLLEXPORT void dpnp_cholesky_c(void* array1_in, void* result1, const size_t
  */
 template <typename _DataType_output, typename _DataType_input1, typename _DataType_input2>
 INP_DLLEXPORT void dpnp_correlate_c(void* result_out,
-                                const void* input1_in,
-                                const size_t input1_size,
-                                const size_t* input1_shape,
-                                const size_t input1_shape_ndim,
-                                const void* input2_in,
-                                const size_t input2_size,
-                                const size_t* input2_shape,
-                                const size_t input2_shape_ndim,
-                                const size_t* where);
+                                    const void* input1_in,
+                                    const size_t input1_size,
+                                    const size_t* input1_shape,
+                                    const size_t input1_shape_ndim,
+                                    const void* input2_in,
+                                    const size_t input2_size,
+                                    const size_t* input2_shape,
+                                    const size_t input2_shape_ndim,
+                                    const size_t* where);
 
 /**
  * @ingroup BACKEND_API
 
@@ -86,7 +86,6 @@ void dpnp_dot_c(void* result_out,
                 const size_t input2_shape_ndim,
                 const size_t* where)
 {
-
     (void)input1_shape;
     (void)input1_shape_ndim;
     (void)input2_size;
 
@@ -370,8 +370,8 @@ static void func_map_init_elemwise_1arg_1type(func_map_t& fmap)
         _DataType_input2* input2_data = reinterpret_cast<_DataType_input2*>(const_cast<void*>(input2_in));             \
         _DataType_output* result = reinterpret_cast<_DataType_output*>(result_out);                                    \
                                                                                                                        \
-        std::vector<size_t> result_shape = get_result_shape(input1_shape, input1_shape_ndim,                           \
-                                                            input2_shape, input2_shape_ndim);                          \
+        std::vector<size_t> result_shape =                                                                             \
+            get_result_shape(input1_shape, input1_shape_ndim, input2_shape, input2_shape_ndim);                        \
                                                                                                                        \
         DPNPC_id<_DataType_input1>* input1_it;                                                                         \
         const size_t input1_it_size_in_bytes = sizeof(DPNPC_id<_DataType_input1>);                                     \
 
@@ -67,7 +67,6 @@ void dpnp_fft_fft_c(const void* array1_in,
     long* output_shape_offsets = reinterpret_cast<long*>(dpnp_memory_alloc_c(shape_size * sizeof(long)));
     long* input_shape_offsets = reinterpret_cast<long*>(dpnp_memory_alloc_c(shape_size * sizeof(long)));
     // must be a thread local storage.
-    long* xyz = reinterpret_cast<long*>(dpnp_memory_alloc_c(result_size * shape_size * sizeof(long)));
     long* axis_iterator = reinterpret_cast<long*>(dpnp_memory_alloc_c(result_size * shape_size * sizeof(long)));
 
     get_shape_offsets_inkernel<long>(output_shape, shape_size, output_shape_offsets);
@@ -79,14 +78,14 @@ void dpnp_fft_fft_c(const void* array1_in,
 
         double sum_real = 0.0;
         double sum_imag = 0.0;
-        // need to replace these arrays by thread local storage
-        long* xyz_thread = xyz + (output_id * shape_size);
+        // need to replace this array by thread local storage
         long* axis_iterator_thread = axis_iterator + (output_id * shape_size);
 
-        get_xyz_by_id_inkernel(output_id, output_shape_offsets, shape_size, xyz_thread);
+        size_t xyz_id;
         for (size_t i = 0; i < shape_size; ++i)
         {
-            axis_iterator_thread[i] = xyz_thread[i];
+            xyz_id = get_xyz_id_by_id_inkernel(output_id, output_shape_offsets, shape_size, i);
+            axis_iterator_thread[i] = xyz_id;
         }
 
         const long axis_length = input_boundarie;
@@ -114,7 +113,8 @@ void dpnp_fft_fft_c(const void* array1_in,
                 }
             }
 
-            const size_t output_local_id = xyz_thread[axis];
+            xyz_id = get_xyz_id_by_id_inkernel(output_id, output_shape_offsets, shape_size, axis);
+            const size_t output_local_id = xyz_id;
             const double angle = 2.0 * kernel_pi * it * output_local_id / axis_length;
 
             const double angle_cos = cl::sycl::cos(angle);
@@ -153,7 +153,6 @@ void dpnp_fft_fft_c(const void* array1_in,
     dpnp_memory_free_c(input_shape_offsets);
     dpnp_memory_free_c(output_shape_offsets);
     dpnp_memory_free_c(axis_iterator);
-    dpnp_memory_free_c(xyz);
 
     return;
 }
 
@@ -254,14 +254,23 @@ void dpnp_put_c(
     size_t* ind = reinterpret_cast<size_t*>(ind_in);
     _DataType* v = reinterpret_cast<_DataType*>(v_in);
 
+    if ((array_1 == nullptr) || (ind == nullptr) || (v == nullptr))
+    {
+        return;
+    }
+
+    if (size_v == 0)
+    {
+        return;
+    }
+
     for (size_t i = 0; i < size; ++i)
     {
         for (size_t j = 0; j < size_ind; ++j)
         {
-            if (i == ind[j])
+            if (i == ind[j] || (i == (size + ind[j])))
             {
                 array_1[i] = v[j % size_v];
-                break;
             }
         }
     }
 
@@ -548,27 +548,9 @@ void dpnp_rng_multivariate_normal_c(void* result,
     // `size1` is a number of random values to be generated for each dimension.
     size_t size1 = size / dimen;
 
-    if (dpnp_queue_is_cpu_c())
-    {
-        mkl_rng::gaussian_mv<_DataType> distribution(dimen, mean, cov);
-        auto event_out = mkl_rng::generate(distribution, DPNP_RNG_ENGINE, size1, result1);
-        event_out.wait();
-    }
-    else
-    {
-        int errcode = vdRngGaussianMV(VSL_RNG_METHOD_GAUSSIANMV_BOXMULLER2,
-                                      get_rng_stream(),
-                                      size1,
-                                      result1,
-                                      dimen,
-                                      VSL_MATRIX_STORAGE_FULL,
-                                      mean_vector,
-                                      cov_vector);
-        if (errcode != VSL_STATUS_OK)
-        {
-            throw std::runtime_error("DPNP RNG Error: dpnp_rng_multivariate_normal_c() failed.");
-        }
-    }
+    mkl_rng::gaussian_mv<_DataType> distribution(dimen, mean, cov);
+    auto event_out = mkl_rng::generate(distribution, DPNP_RNG_ENGINE, size1, result1);
+    event_out.wait();
 }
 
 template <typename _DataType>
@@ -1086,11 +1068,10 @@ void dpnp_rng_standard_normal_c(void* result, size_t size)
 template <typename _DataType>
 void dpnp_rng_standard_t_c(void* result, const _DataType df, const size_t size)
 {
-    if (!size)
+    if (!size || !result)
     {
         return;
     }
-    cl::sycl::vector_class<cl::sycl::event> no_deps;
 
     _DataType* result1 = reinterpret_cast<_DataType*>(result);
     const _DataType d_zero = 0.0, d_one = 1.0;
@@ -1100,18 +1081,17 @@ void dpnp_rng_standard_t_c(void* result, const _DataType df, const size_t size)
     if (dpnp_queue_is_cpu_c())
     {
         mkl_rng::gamma<_DataType> gamma_distribution(shape, d_zero, 1.0 / shape);
-        auto event_out = mkl_rng::generate(gamma_distribution, DPNP_RNG_ENGINE, size, result1);
-        event_out.wait();
-        event_out = mkl_vm::invsqrt(DPNP_QUEUE, size, result1, result1, no_deps, mkl_vm::mode::ha);
-        event_out.wait();
+        auto gamma_distr_event = mkl_rng::generate(gamma_distribution, DPNP_RNG_ENGINE, size, result1);
+
+        auto invsqrt_event = mkl_vm::invsqrt(DPNP_QUEUE, size, result1, result1, {gamma_distr_event}, mkl_vm::mode::ha);
 
         sn = reinterpret_cast<_DataType*>(dpnp_memory_alloc_c(size * sizeof(_DataType)));
 
         mkl_rng::gaussian<_DataType> gaussian_distribution(d_zero, d_one);
-        event_out = mkl_rng::generate(gaussian_distribution, DPNP_RNG_ENGINE, size, sn);
-        event_out.wait();
+        auto gaussian_distr_event = mkl_rng::generate(gaussian_distribution, DPNP_RNG_ENGINE, size, sn);
 
-        event_out = mkl_vm::mul(DPNP_QUEUE, size, result1, sn, result1, no_deps, mkl_vm::mode::ha);
+        auto event_out = mkl_vm::mul(
+            DPNP_QUEUE, size, result1, sn, result1, {invsqrt_event, gaussian_distr_event}, mkl_vm::mode::ha);
         dpnp_memory_free_c(sn);
         event_out.wait();
     }
 
@@ -87,7 +87,8 @@ template <typename _DataType>
 class dpnp_partition_c_kernel;
 
 template <typename _DataType>
-void dpnp_partition_c(void* array1_in, void* array2_in, void* result1, const size_t kth, const size_t* shape_, const size_t ndim)
+void dpnp_partition_c(
+    void* array1_in, void* array2_in, void* result1, const size_t kth, const size_t* shape_, const size_t ndim)
 {
     _DataType* arr = reinterpret_cast<_DataType*>(array1_in);
     _DataType* arr2 = reinterpret_cast<_DataType*>(array2_in);
@@ -109,7 +110,7 @@ void dpnp_partition_c(void* array1_in, void* array2_in, void* result1, const siz
         size *= shape_[i];
     }
 
-    size_t size_ = size/shape_[ndim-1];
+    size_t size_ = size / shape_[ndim - 1];
 
     if (size_ == 0)
     {
@@ -121,29 +122,29 @@ void dpnp_partition_c(void* array1_in, void* array2_in, void* result1, const siz
 
     for (size_t i = 0; i < size_; ++i)
     {
-        size_t ind_begin = i * shape_[ndim-1];
-        size_t ind_end = (i + 1) * shape_[ndim-1] - 1;
+        size_t ind_begin = i * shape_[ndim - 1];
+        size_t ind_end = (i + 1) * shape_[ndim - 1] - 1;
 
-        _DataType matrix[shape_[ndim-1]];
+        _DataType matrix[shape_[ndim - 1]];
         for (size_t j = ind_begin; j < ind_end + 1; ++j)
         {
             size_t ind = j - ind_begin;
             matrix[ind] = arr2[j];
         }
-        std::partial_sort(matrix, matrix + shape_[ndim-1], matrix + shape_[ndim-1]);
+        std::partial_sort(matrix, matrix + shape_[ndim - 1], matrix + shape_[ndim - 1]);
         for (size_t j = ind_begin; j < ind_end + 1; ++j)
         {
             size_t ind = j - ind_begin;
             arr2[j] = matrix[ind];
         }
     }
 
-    size_t* shape = reinterpret_cast<size_t*>(dpnp_memory_alloc_c(ndim * sizeof(size_t)));
+    size_t* shape = reinterpret_cast<size_t*>(dpnp_memory_alloc_c(ndim * sizeof(size_t)));
     auto memcpy_event = DPNP_QUEUE.memcpy(shape, shape_, ndim * sizeof(size_t));
 
     memcpy_event.wait();
 
-    cl::sycl::range<2> gws(size_, kth+1);
+    cl::sycl::range<2> gws(size_, kth + 1);
     auto kernel_parallel_for_func = [=](cl::sycl::id<2> global_id) {
         size_t j = global_id[0];
         size_t k = global_id[1];
@@ -160,7 +161,6 @@ void dpnp_partition_c(void* array1_in, void* array2_in, void* result1, const siz
                 result[j * shape[ndim - 1] + i] = change_val2;
             }
         }
-
     };
 
     auto kernel_func = [&](cl::sycl::handler& cgh) {
@@ -172,7 +172,7 @@ void dpnp_partition_c(void* array1_in, void* array2_in, void* result1, const siz
 
     event.wait();
 
-    dpnp_memory_free_c(shape);
+    dpnp_memory_free_c(shape);
 }
 
 template <typename _DataType>
Original file line number	Diff line number	Diff line change
`@@ -86,7 +86,6 @@ void dpnp_dot_c(void* result_out,`
`86`	`86`	`const size_t input2_shape_ndim,`
`87`	`87`	`const size_t* where)`
`88`	`88`	`{`
`89`		`-`
`90`	`89`	`(void)input1_shape;`
`91`	`90`	`(void)input1_shape_ndim;`
`92`	`91`	`(void)input2_size;`
Original file line number	Diff line number	Diff line change
`@@ -370,8 +370,8 @@ static void func_map_init_elemwise_1arg_1type(func_map_t& fmap)`
`370`	`370`	`_DataType_input2* input2_data = reinterpret_cast<_DataType_input2>(const_cast<void>(input2_in)); \`
`371`	`371`	`_DataType_output* result = reinterpret_cast<_DataType_output*>(result_out); \`
`372`	`372`	`\`
`373`		`- std::vector<size_t> result_shape = get_result_shape(input1_shape, input1_shape_ndim, \`
`374`		`- input2_shape, input2_shape_ndim); \`
	`373`	`+ std::vector<size_t> result_shape = \`
	`374`	`+ get_result_shape(input1_shape, input1_shape_ndim, input2_shape, input2_shape_ndim); \`
`375`	`375`	`\`
`376`	`376`	`DPNPC_id<_DataType_input1>* input1_it; \`
`377`	`377`	`const size_t input1_it_size_in_bytes = sizeof(DPNPC_id<_DataType_input1>); \`
Original file line number	Diff line number	Diff line change
`@@ -254,14 +254,23 @@ void dpnp_put_c(`
`254`	`254`	`size_t* ind = reinterpret_cast<size_t*>(ind_in);`
`255`	`255`	`_DataType* v = reinterpret_cast<_DataType*>(v_in);`
`256`	`256`
	`257`	`+ if ((array_1 == nullptr) \|\| (ind == nullptr) \|\| (v == nullptr))`
	`258`	`+ {`
	`259`	`+ return;`
	`260`	`+ }`
	`261`	`+`
	`262`	`+ if (size_v == 0)`
	`263`	`+ {`
	`264`	`+ return;`
	`265`	`+ }`
	`266`	`+`
`257`	`267`	`for (size_t i = 0; i < size; ++i)`
`258`	`268`	`{`
`259`	`269`	`for (size_t j = 0; j < size_ind; ++j)`
`260`	`270`	`{`
`261`		`- if (i == ind[j])`
	`271`	`+ if (i == ind[j] \|\| (i == (size + ind[j])))`
`262`	`272`	`{`
`263`	`273`	`array_1[i] = v[j % size_v];`
`264`		`- break;`
`265`	`274`	`}`
`266`	`275`	`}`
`267`	`276`	`}`
Original file line number	Diff line number	Diff line change
`@@ -87,7 +87,8 @@ template <typename _DataType>`
`87`	`87`	`class dpnp_partition_c_kernel;`
`88`	`88`
`89`	`89`	`template <typename _DataType>`
`90`		`-void dpnp_partition_c(void* array1_in, void* array2_in, void* result1, const size_t kth, const size_t* shape_, const size_t ndim)`
	`90`	`+void dpnp_partition_c(`
	`91`	`+ void* array1_in, void* array2_in, void* result1, const size_t kth, const size_t* shape_, const size_t ndim)`
`91`	`92`	`{`
`92`	`93`	`_DataType* arr = reinterpret_cast<_DataType*>(array1_in);`
`93`	`94`	`_DataType* arr2 = reinterpret_cast<_DataType*>(array2_in);`
`@@ -109,7 +110,7 @@ void dpnp_partition_c(void* array1_in, void* array2_in, void* result1, const siz`
`109`	`110`	`size *= shape_[i];`
`110`	`111`	`}`
`111`	`112`
`112`		`- size_t size_ = size/shape_[ndim-1];`
	`113`	`+ size_t size_ = size / shape_[ndim - 1];`
`113`	`114`
`114`	`115`	`if (size_ == 0)`
`115`	`116`	`{`
`@@ -121,29 +122,29 @@ void dpnp_partition_c(void* array1_in, void* array2_in, void* result1, const siz`
`121`	`122`
`122`	`123`	`for (size_t i = 0; i < size_; ++i)`
`123`	`124`	`{`
`124`		`- size_t ind_begin = i * shape_[ndim-1];`
`125`		`- size_t ind_end = (i + 1) * shape_[ndim-1] - 1;`
	`125`	`+ size_t ind_begin = i * shape_[ndim - 1];`
	`126`	`+ size_t ind_end = (i + 1) * shape_[ndim - 1] - 1;`
`126`	`127`
`127`		`- _DataType matrix[shape_[ndim-1]];`
	`128`	`+ _DataType matrix[shape_[ndim - 1]];`
`128`	`129`	`for (size_t j = ind_begin; j < ind_end + 1; ++j)`
`129`	`130`	`{`
`130`	`131`	`size_t ind = j - ind_begin;`
`131`	`132`	`matrix[ind] = arr2[j];`
`132`	`133`	`}`
`133`		`- std::partial_sort(matrix, matrix + shape_[ndim-1], matrix + shape_[ndim-1]);`
	`134`	`+ std::partial_sort(matrix, matrix + shape_[ndim - 1], matrix + shape_[ndim - 1]);`
`134`	`135`	`for (size_t j = ind_begin; j < ind_end + 1; ++j)`
`135`	`136`	`{`
`136`	`137`	`size_t ind = j - ind_begin;`
`137`	`138`	`arr2[j] = matrix[ind];`
`138`	`139`	`}`
`139`	`140`	`}`
`140`	`141`
`141`		`- size_t* shape = reinterpret_cast<size_t>(dpnp_memory_alloc_c(ndim sizeof(size_t)));`
	`142`	`+ size_t* shape = reinterpret_cast<size_t>(dpnp_memory_alloc_c(ndim sizeof(size_t)));`
`142`	`143`	`auto memcpy_event = DPNP_QUEUE.memcpy(shape, shape_, ndim * sizeof(size_t));`
`143`	`144`
`144`	`145`	`memcpy_event.wait();`
`145`	`146`
`146`		`- cl::sycl::range<2> gws(size_, kth+1);`
	`147`	`+ cl::sycl::range<2> gws(size_, kth + 1);`
`147`	`148`	`auto kernel_parallel_for_func = [=](cl::sycl::id<2> global_id) {`
`148`	`149`	`size_t j = global_id[0];`
`149`	`150`	`size_t k = global_id[1];`
`@@ -160,7 +161,6 @@ void dpnp_partition_c(void* array1_in, void* array2_in, void* result1, const siz`
`160`	`161`	`result[j * shape[ndim - 1] + i] = change_val2;`
`161`	`162`	`}`
`162`	`163`	`}`
`163`		`-`
`164`	`164`	`};`
`165`	`165`
`166`	`166`	`auto kernel_func = [&](cl::sycl::handler& cgh) {`
`@@ -172,7 +172,7 @@ void dpnp_partition_c(void* array1_in, void* array2_in, void* result1, const siz`
`172`	`172`
`173`	`173`	`event.wait();`
`174`	`174`
`175`		`- dpnp_memory_free_c(shape);`
	`175`	`+ dpnp_memory_free_c(shape);`
`176`	`176`	`}`
`177`	`177`
`178`	`178`	`template <typename _DataType>`