Fixed bug in Conv2D tiling constraints and reduced some code duplication. Added CI tests for 2D Float Conv with bias and reduced L1 size for non-bias test to force input tiling

diaconuccalin · diaconuccalin · commit a73b7c46cf93 · 2025-11-13T20:21:54.000Z
diff --git a/.github/workflows/ci-platform-siracusa-tiled.yml b/.github/workflows/ci-platform-siracusa-tiled.yml
@@ -47,7 +47,11 @@ jobs:
           {"name":"Hardswish","L1":[750]},
           {"name":"RQHardswish","L1":[750]},
           {"name":"testFloatGEMM","L1":[8000]},
-          {"name":"testFloat2DConvolution","L1":[8000]},
+
+          {"name":"testFloat2DConvolution","L1":[3000]},
+          {"name":"testFloat2DConvolutionBias","L1":[8000]},
+          {"name":"testFloat2DConvolutionZeroBias","L1":[8000]},
+          
           {"name":"testFloatLayerNorm","L1":[2000]},
           {"name":"testFloatRelu","L1":[2000]},
           {"name":"testFloatMaxPool","L1":[2000]},
diff --git a/Deeploy/Targets/PULPOpen/TileConstraints/ConvTileConstraint.py b/Deeploy/Targets/PULPOpen/TileConstraints/ConvTileConstraint.py
@@ -312,9 +312,9 @@ def addGeometricalConstraint(tilerModel: TilerModel, parseDict: Dict, ctxt: Netw
         effectiveWidth = inputWidthVar + ((pads[1] + pads[3]) * (inputWidthVar == inputBuffer.shape[2]))
 
         tilerModel.addConstraint(
-            (outputHeightVar == (effectiveHeight - dilations[0] * (weightHeightVar - 1) - 1) // strides[0] + 1))
+            (outputHeightVar == (effectiveHeight - dilations[0] * (weightHeightVar - 1) - 1) // strides[0]))
         tilerModel.addConstraint(
-            (outputWidthVar == (effectiveWidth - dilations[1] * (weightWidthVar - 1) - 1) // strides[1] + 1))
+            (outputWidthVar == (effectiveWidth - dilations[1] * (weightWidthVar - 1) - 1) // strides[1]))
 
         #   Add constraint for input channel size match
         #   (Depends on weight output channel and conv grouping)
@@ -417,20 +417,16 @@ def computeInputCube(
         inputHOffset = max(outputHOffset * strideH - padTop, 0)
         inputWOffset = max(outputWOffset * strideW - padLeft, 0)
 
-        if inputDims is not None:
-            # Compute input dimensions according to procedure described in PyTorch's Conv2D documentation
-            # Assuming worst case (cutting of (stride - 1) elements at the end of each dimension)
-            inputHSize = outputHSize * strideH + kernelShape[0] - (tilePadTop + tilePadBottom) - 1
-            inputWSize = outputWSize * strideW + kernelShape[1] - (tilePadLeft + tilePadRight) - 1
+        # Compute input dimensions according to procedure described in PyTorch's Conv2D documentation
+        # Assuming worst case (cutting of (stride - 1) elements at the end of each dimension)
+        inputHSize = outputHSize * strideH + (kernelShape[0] - 1) - (tilePadTop + tilePadBottom)
+        inputWSize = outputWSize * strideW + (kernelShape[1] - 1) - (tilePadLeft + tilePadRight)
 
+        if inputDims is not None:
             # Clamp to remaining input size from the current offset
             # This prevents reading beyond input boundaries for edge tiles
             inputHSize = min(inputHSize, inputDims[1] - inputHOffset)
             inputWSize = min(inputWSize, inputDims[2] - inputWOffset)
-        else:
-            # Use previous version, compatible with RQ layers
-            inputHSize = outputHSize * strideH + (kernelShape[0] - 1) - (tilePadTop + tilePadBottom)
-            inputWSize = outputWSize * strideW + (kernelShape[1] - 1) - (tilePadLeft + tilePadRight)
 
         InCube = HyperRectangle((outputBatchOffset, inputHOffset, inputWOffset, 0),
                                 (outputBatchSize, inputHSize, inputWSize, inputCSize))