fix: update implementation to preserve signed zeros

kgryte · kgryte · commit 4f0b1cadad99 · 2025-05-24T14:11:03.000-07:00
---
type: pre_commit_static_analysis_report
description: Results of running static analysis checks when committing changes.
report:
  - task: lint_filenames
    status: passed
  - task: lint_editorconfig
    status: passed
  - task: lint_markdown
    status: na
  - task: lint_package_json
    status: na
  - task: lint_repl_help
    status: na
  - task: lint_javascript_src
    status: passed
  - task: lint_javascript_cli
    status: na
  - task: lint_javascript_examples
    status: na
  - task: lint_javascript_tests
    status: na
  - task: lint_javascript_benchmarks
    status: na
  - task: lint_python
    status: na
  - task: lint_r
    status: na
  - task: lint_c_src
    status: passed
  - task: lint_c_examples
    status: na
  - task: lint_c_benchmarks
    status: na
  - task: lint_c_tests_fixtures
    status: na
  - task: lint_shell
    status: na
  - task: lint_typescript_declarations
    status: na
  - task: lint_typescript_tests
    status: na
  - task: lint_license_headers
    status: passed
---
diff --git a/lib/node_modules/@stdlib/blas/ext/base/dnansumpw/lib/ndarray.js b/lib/node_modules/@stdlib/blas/ext/base/dnansumpw/lib/ndarray.js
@@ -20,14 +20,13 @@
 
 // MODULES //
 
-var isnan = require( '@stdlib/math/base/assert/is-nan' );
-var floor = require( '@stdlib/math/base/special/floor' );
+var Float64Array = require( '@stdlib/array/float64' );
+var dnannsumpw = require( '@stdlib/blas/ext/base/dnannsumpw' ).ndarray;
 
 
 // VARIABLES //
 
-// Blocksize for pairwise summation (NOTE: decreasing the blocksize decreases rounding error as more pairs are summed, but also decreases performance. Because the inner loop is unrolled eight times, the blocksize is effectively `16`.):
-var BLOCKSIZE = 128;
+var WORKSPACE = new Float64Array( 2 );
 
 
 // MAIN //
@@ -58,95 +57,8 @@ var BLOCKSIZE = 128;
 * // returns 5.0
 */
 function dnansumpw( N, x, strideX, offsetX ) {
-	var ix;
-	var s0;
-	var s1;
-	var s2;
-	var s3;
-	var s4;
-	var s5;
-	var s6;
-	var s7;
-	var M;
-	var s;
-	var n;
-	var i;
-
-	if ( N <= 0 ) {
-		return 0.0;
-	}
-	if ( strideX === 0 ) {
-		if ( isnan( x[ offsetX ] ) ) {
-			return 0.0;
-		}
-		return x[ offsetX ] * N;
-	}
-	ix = offsetX;
-	if ( N < 8 ) {
-		// Use simple summation...
-		s = 0.0;
-		for ( i = 0; i < N; i++ ) {
-			if ( isnan( x[ ix ] ) === false ) {
-				s += x[ ix ];
-			}
-			ix += strideX;
-		}
-		return s;
-	}
-	if ( N <= BLOCKSIZE ) {
-		// Sum a block with 8 accumulators (by loop unrolling, we lower the effective blocksize to 16)...
-		s0 = ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-		ix += strideX;
-		s1 = ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-		ix += strideX;
-		s2 = ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-		ix += strideX;
-		s3 = ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-		ix += strideX;
-		s4 = ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-		ix += strideX;
-		s5 = ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-		ix += strideX;
-		s6 = ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-		ix += strideX;
-		s7 = ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-		ix += strideX;
-
-		M = N % 8;
-		for ( i = 8; i < N-M; i += 8 ) {
-			s0 += ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-			ix += strideX;
-			s1 += ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-			ix += strideX;
-			s2 += ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-			ix += strideX;
-			s3 += ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-			ix += strideX;
-			s4 += ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-			ix += strideX;
-			s5 += ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-			ix += strideX;
-			s6 += ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-			ix += strideX;
-			s7 += ( isnan( x[ ix ] ) ) ? 0.0 : x[ ix ];
-			ix += strideX;
-		}
-		// Pairwise sum the accumulators:
-		s = ( (s0+s1) + (s2+s3)) + ((s4+s5) + (s6+s7) );
-
-		// Clean-up loop...
-		for ( i; i < N; i++ ) {
-			if ( isnan( x[ ix ] ) === false ) {
-				s += x[ ix ];
-			}
-			ix += strideX;
-		}
-		return s;
-	}
-	// Recurse by dividing by two, but avoiding non-multiples of unroll factor...
-	n = floor( N/2 );
-	n -= n % 8;
-	return dnansumpw( n, x, strideX, ix ) + dnansumpw( N-n, x, strideX, ix+(n*strideX) ); // eslint-disable-line max-len
+	dnannsumpw( N, x, strideX, offsetX, WORKSPACE, 1, 0 );
+	return WORKSPACE[ 0 ];
 }
 
 
diff --git a/lib/node_modules/@stdlib/blas/ext/base/dnansumpw/manifest.json b/lib/node_modules/@stdlib/blas/ext/base/dnansumpw/manifest.json
@@ -38,7 +38,7 @@
       "libraries": [],
       "libpath": [],
       "dependencies": [
-        "@stdlib/math/base/assert/is-nan",
+        "@stdlib/blas/ext/base/dnannsumpw",
         "@stdlib/napi/export",
         "@stdlib/napi/argv",
         "@stdlib/napi/argv-int64",
@@ -60,7 +60,7 @@
       "libraries": [],
       "libpath": [],
       "dependencies": [
-        "@stdlib/math/base/assert/is-nan",
+        "@stdlib/blas/ext/base/dnannsumpw",
         "@stdlib/blas/base/shared",
         "@stdlib/strided/base/stride2offset"
       ]
@@ -77,7 +77,7 @@
       "libraries": [],
       "libpath": [],
       "dependencies": [
-        "@stdlib/math/base/assert/is-nan",
+        "@stdlib/blas/ext/base/dnannsumpw",
         "@stdlib/blas/base/shared",
         "@stdlib/strided/base/stride2offset"
       ]
@@ -94,7 +94,7 @@
       "libraries": [],
       "libpath": [],
       "dependencies": [
-        "@stdlib/math/base/assert/is-nan",
+        "@stdlib/blas/ext/base/dnannsumpw",
         "@stdlib/blas/base/shared",
         "@stdlib/strided/base/stride2offset"
       ]
diff --git a/lib/node_modules/@stdlib/blas/ext/base/dnansumpw/src/main.c b/lib/node_modules/@stdlib/blas/ext/base/dnansumpw/src/main.c
@@ -17,7 +17,7 @@
 */
 
 #include "stdlib/blas/ext/base/dnansumpw.h"
-#include "stdlib/math/base/assert/is_nan.h"
+#include "stdlib/blas/ext/base/dnannsumpw.h"
 #include "stdlib/strided/base/stride2offset.h"
 #include "stdlib/blas/base/shared.h"
 
@@ -60,94 +60,6 @@ double API_SUFFIX(stdlib_strided_dnansumpw)( const CBLAS_INT N, const double *X,
 * @return         output value
 */
 double API_SUFFIX(stdlib_strided_dnansumpw_ndarray)( const CBLAS_INT N, const double *X, const CBLAS_INT strideX, const CBLAS_INT offsetX ) {
-	CBLAS_INT ix;
-	CBLAS_INT M;
-	CBLAS_INT n;
-	CBLAS_INT i;
-	double sum;
-	double s0;
-	double s1;
-	double s2;
-	double s3;
-	double s4;
-	double s5;
-	double s6;
-	double s7;
-
-	if ( N <= 0 ) {
-		return 0.0;
-	}
-	if ( strideX == 0 ) {
-		if ( stdlib_base_is_nan( X[ 0 ] ) ) {
-			return 0.0;
-		}
-		return X[ 0 ] * N;
-	}
-	ix = offsetX;
-	if ( N < 8 ) {
-		// Use simple summation...
-		sum = 0.0;
-		for ( i = 0; i < N; i++ ) {
-			if ( !stdlib_base_is_nan( X[ ix ] ) ) {
-				sum += X[ ix ];
-			}
-			ix += strideX;
-		}
-		return sum;
-	}
-	// Blocksize for pairwise summation: 128 (NOTE: decreasing the blocksize decreases rounding error as more pairs are summed, but also decreases performance. Because the inner loop is unrolled eight times, the blocksize is effectively `16`.)
-	if ( N <= 128 ) {
-		// Sum a block with 8 accumulators (by loop unrolling, we lower the effective blocksize to 16)...
-		s0 = ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-		ix += strideX;
-		s1 = ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-		ix += strideX;
-		s2 = ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-		ix += strideX;
-		s3 = ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-		ix += strideX;
-		s4 = ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-		ix += strideX;
-		s5 = ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-		ix += strideX;
-		s6 = ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-		ix += strideX;
-		s7 = ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-		ix += strideX;
-
-		M = N % 8;
-		for ( i = 8; i < N-M; i += 8 ) {
-			s0 += ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-			ix += strideX;
-			s1 += ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-			ix += strideX;
-			s2 += ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-			ix += strideX;
-			s3 += ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-			ix += strideX;
-			s4 += ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-			ix += strideX;
-			s5 += ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-			ix += strideX;
-			s6 += ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-			ix += strideX;
-			s7 += ( stdlib_base_is_nan( X[ ix ] ) ) ? 0.0 : X[ ix ];
-			ix += strideX;
-		}
-		// Pairwise sum the accumulators:
-		sum = ( (s0+s1) + (s2+s3)) + ((s4+s5) + (s6+s7) );
-
-		// Clean-up loop...
-		for (; i < N; i++ ) {
-			if ( !stdlib_base_is_nan( X[ ix ] ) ) {
-				sum += X[ ix ];
-			}
-			ix += strideX;
-		}
-		return sum;
-	}
-	// Recurse by dividing by two, but avoiding non-multiples of unroll factor...
-	n = N / 2;
-	n -= n % 8;
-	return API_SUFFIX(stdlib_strided_dnansumpw_ndarray)( n, X, strideX, ix ) + API_SUFFIX(stdlib_strided_dnansumpw_ndarray)( N-n, X, strideX, ix+(n*strideX) );
+	CBLAS_INT n = 0;
+	return API_SUFFIX(stdlib_strided_dnannsumpw_ndarray)( N, X, strideX, offsetX, &n );
 }