Fix string-to-number conversion to match MySQL behavior

elianddb · claude · elianddb · commit 7736f6b5ef90 · 2025-08-04T09:36:41.000-07:00
* Update regex pattern to support scientific notation and signs * Implement MySQL-compatible string truncation for all numeric types * Convert invalid strings to 0 instead of throwing errors * Add comprehensive tests for string truncation edge cases * Fix existing test to match MySQL behavior Fixes dolthub/dolt#7128 🤖 Generated with [Claude Code](https://claude.ai/code) Co-Authored-By: Claude <noreply@anthropic.com>
diff --git a/sql/types/number.go b/sql/types/number.go
@@ -84,7 +84,7 @@ var (
 	numberFloat32ValueType = reflect.TypeOf(float32(0))
 	numberFloat64ValueType = reflect.TypeOf(float64(0))
 
-	numre = regexp.MustCompile(`^[ ]*[0-9]*\.?[0-9]+`)
+	numre = regexp.MustCompile(`^[ \t\n\r]*[+-]?([0-9]+\.?[0-9]*|\.[0-9]+)([eE][+-]?[0-9]+)?`)
 )
 
 const (
@@ -1004,7 +1004,15 @@ func convertToInt64(t NumberTypeImpl_, v interface{}) (int64, sql.ConvertInRange
 		// If that fails, try as a float and truncate it to integral
 		f, err := strconv.ParseFloat(v, 64)
 		if err != nil {
-			return 0, sql.OutOfRange, sql.ErrInvalidValue.New(v, t.String())
+			// Use same truncation logic as float conversion for MySQL compatibility
+			s := numre.FindString(v)
+			if s != "" {
+				f, _ = strconv.ParseFloat(s, 64)
+				f = math.Round(f)
+				return int64(f), sql.InRange, nil
+			}
+			// If no valid number found, return 0 (MySQL behavior for pure non-numeric strings)
+			return 0, sql.InRange, nil
 		}
 		f = math.Round(f)
 		return int64(f), sql.InRange, nil
@@ -1190,7 +1198,17 @@ func convertToUint64(t NumberTypeImpl_, v interface{}) (uint64, sql.ConvertInRan
 				return val, inRange, err
 			}
 		}
-		return 0, sql.OutOfRange, sql.ErrInvalidValue.New(v, t.String())
+		// Use same truncation logic as float conversion for MySQL compatibility
+		s := numre.FindString(v)
+		if s != "" {
+			if f, err := strconv.ParseFloat(s, 64); err == nil {
+				if val, inRange, err := convertToUint64(t, f); err == nil {
+					return val, inRange, err
+				}
+			}
+		}
+		// If no valid number found, return 0 (MySQL behavior for pure non-numeric strings)
+		return 0, sql.InRange, nil
 	case bool:
 		if v {
 			return 1, sql.InRange, nil
@@ -1290,7 +1308,17 @@ func convertToUint32(t NumberTypeImpl_, v interface{}) (uint32, sql.ConvertInRan
 				return val, inRange, err
 			}
 		}
-		return 0, sql.OutOfRange, sql.ErrInvalidValue.New(v, t.String())
+		// Use same truncation logic as float conversion for MySQL compatibility
+		s := numre.FindString(v)
+		if s != "" {
+			if f, err := strconv.ParseFloat(s, 64); err == nil {
+				if val, inRange, err := convertToUint32(t, f); err == nil {
+					return val, inRange, err
+				}
+			}
+		}
+		// If no valid number found, return 0 (MySQL behavior for pure non-numeric strings)
+		return 0, sql.InRange, nil
 	case bool:
 		if v {
 			return 1, sql.InRange, nil
@@ -1386,7 +1414,17 @@ func convertToUint16(t NumberTypeImpl_, v interface{}) (uint16, sql.ConvertInRan
 				return val, inRange, err
 			}
 		}
-		return 0, sql.OutOfRange, sql.ErrInvalidValue.New(v, t.String())
+		// Use same truncation logic as float conversion for MySQL compatibility
+		s := numre.FindString(v)
+		if s != "" {
+			if f, err := strconv.ParseFloat(s, 64); err == nil {
+				if val, inRange, err := convertToUint16(t, f); err == nil {
+					return val, inRange, err
+				}
+			}
+		}
+		// If no valid number found, return 0 (MySQL behavior for pure non-numeric strings)
+		return 0, sql.InRange, nil
 	case bool:
 		if v {
 			return 1, sql.InRange, nil
@@ -1486,7 +1524,17 @@ func convertToUint8(t NumberTypeImpl_, v interface{}) (uint8, sql.ConvertInRange
 				return val, inRange, err
 			}
 		}
-		return 0, sql.OutOfRange, sql.ErrInvalidValue.New(v, t.String())
+		// Use same truncation logic as float conversion for MySQL compatibility
+		s := numre.FindString(v)
+		if s != "" {
+			if f, err := strconv.ParseFloat(s, 64); err == nil {
+				if val, inRange, err := convertToUint8(t, f); err == nil {
+					return val, inRange, err
+				}
+			}
+		}
+		// If no valid number found, return 0 (MySQL behavior for pure non-numeric strings)
+		return 0, sql.InRange, nil
 	case bool:
 		if v {
 			return 1, sql.InRange, nil
@@ -1542,8 +1590,12 @@ func convertToFloat64(t NumberTypeImpl_, v interface{}) (float64, error) {
 		if err != nil {
 			// parse the first longest valid numbers
 			s := numre.FindString(v)
-			i, _ = strconv.ParseFloat(s, 64)
-			return i, sql.ErrInvalidValue.New(v, t.String())
+			if s != "" {
+				i, _ = strconv.ParseFloat(s, 64)
+				return i, nil
+			}
+			// If no valid number found, return 0 (MySQL behavior for pure non-numeric strings)
+			return 0, nil
 		}
 		return i, nil
 	case bool:
diff --git a/sql/types/number_test.go b/sql/types/number_test.go
@@ -236,6 +236,61 @@ func TestNumberConvert(t *testing.T) {
 	}
 }
 
+func TestFloat64StringTruncation(t *testing.T) {
+	ctx := sql.NewEmptyContext()
+	tests := []struct {
+		name     string
+		input    interface{}
+		expected float64
+		err      bool
+		inRange  sql.ConvertInRange
+	}{
+		// Basic truncation cases
+		{name: "numeric with invalid suffix", input: "123.456abc", expected: 123.456, err: false, inRange: sql.InRange},
+		{name: "integer with invalid suffix", input: "123abc", expected: 123, err: false, inRange: sql.InRange},
+		{name: "negative with invalid suffix", input: "-123.456abc", expected: -123.456, err: false, inRange: sql.InRange},
+		{name: "positive sign with invalid suffix", input: "+123.456abc", expected: 123.456, err: false, inRange: sql.InRange},
+		
+		// Scientific notation cases
+		{name: "scientific notation with suffix", input: "1.5e2abc", expected: 150, err: false, inRange: sql.InRange},
+		{name: "scientific notation negative exponent", input: "1e-4", expected: 0.0001, err: false, inRange: sql.InRange},
+		{name: "uppercase E notation", input: "1.5E2abc", expected: 150, err: false, inRange: sql.InRange},
+		{name: "positive exponent with suffix", input: "2.5e+3xyz", expected: 2500, err: false, inRange: sql.InRange},
+		
+		// Edge cases that become 0
+		{name: "pure non-numeric", input: "abc", expected: 0, err: false, inRange: sql.InRange},
+		{name: "single letter", input: "a", expected: 0, err: false, inRange: sql.InRange},
+		{name: "empty string", input: "", expected: 0, err: false, inRange: sql.InRange},
+		
+		// Whitespace handling
+		{name: "leading spaces", input: "   123.456abc", expected: 123.456, err: false, inRange: sql.InRange},
+		{name: "leading tabs", input: "\t123.456abc", expected: 123.456, err: false, inRange: sql.InRange},
+		{name: "mixed whitespace", input: " \t\n\r123.456abc", expected: 123.456, err: false, inRange: sql.InRange},
+		{name: "only whitespace", input: "   \t\n\r", expected: 0, err: false, inRange: sql.InRange},
+		
+		// Decimal point variations
+		{name: "decimal without leading digit", input: ".5abc", expected: 0.5, err: false, inRange: sql.InRange},
+		{name: "decimal without trailing digits", input: "123.abc", expected: 123, err: false, inRange: sql.InRange},
+		
+		// Multiple decimal points (should stop at first invalid)
+		{name: "multiple decimal points", input: "1.2.3abc", expected: 1.2, err: false, inRange: sql.InRange},
+	}
+
+	for _, test := range tests {
+		t.Run(test.name, func(t *testing.T) {
+			val, inRange, err := Float64.Convert(ctx, test.input)
+			if test.err {
+				assert.Error(t, err)
+			} else {
+				require.NoError(t, err)
+				assert.Equal(t, test.expected, val)
+				assert.Equal(t, test.inRange, inRange)
+				assert.Equal(t, Float64.ValueType(), reflect.TypeOf(val))
+			}
+		})
+	}
+}
+
 func TestNumberSQL_BooleanFromBoolean(t *testing.T) {
 	val, err := Boolean.SQL(sql.NewEmptyContext(), nil, true)
 	require.NoError(t, err)
@@ -247,13 +302,14 @@ func TestNumberSQL_BooleanFromBoolean(t *testing.T) {
 }
 
 func TestNumberSQL_NumberFromString(t *testing.T) {
+	// MySQL converts invalid strings to 0 when used in numeric contexts
 	val, err := Int64.SQL(sql.NewEmptyContext(), nil, "not a number")
 	require.NoError(t, err)
-	assert.Equal(t, "not a number", val.ToString())
+	assert.Equal(t, "0", val.ToString())
 
 	val, err = Float64.SQL(sql.NewEmptyContext(), nil, "also not a number")
 	require.NoError(t, err)
-	assert.Equal(t, "also not a number", val.ToString())
+	assert.Equal(t, "0", val.ToString())
 }
 
 func TestNumberString(t *testing.T) {