pulp-platform
diff --git a/‎CHANGELOG.md‎
Lines changed: 6 additions & 0 deletions b/‎CHANGELOG.md‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎Deeploy/CommonExtensions/NetworkDeployers/NetworkDeployerWrapper.py‎
Lines changed: 1 addition & 6 deletions b/‎Deeploy/CommonExtensions/NetworkDeployers/NetworkDeployerWrapper.py‎
Lines changed: 1 addition & 6 deletions
diff --git a/‎Deeploy/MemoryLevelExtension/MemoryLevels.py‎
Lines changed: 1 addition & 61 deletions b/‎Deeploy/MemoryLevelExtension/MemoryLevels.py‎
Lines changed: 1 addition & 61 deletions
diff --git a/‎Deeploy/MemoryLevelExtension/NetworkDeployers/MemoryLevelDeployer.py‎
Lines changed: 13 additions & 48 deletions b/‎Deeploy/MemoryLevelExtension/NetworkDeployers/MemoryLevelDeployer.py‎
Lines changed: 13 additions & 48 deletions
diff --git a/‎Deeploy/Targets/Neureka/Bindings.py‎
Lines changed: 0 additions & 28 deletions b/‎Deeploy/Targets/Neureka/Bindings.py‎
Lines changed: 0 additions & 28 deletions
diff --git a/‎Deeploy/Targets/Neureka/Engine.py‎
Lines changed: 9 additions & 19 deletions b/‎Deeploy/Targets/Neureka/Engine.py‎
Lines changed: 9 additions & 19 deletions
@@ -4,6 +4,7 @@ This file contains the changelog for the Deeploy project. The changelog is divid
 ## Unreleased (Planned Release Target: v0.2.1)
 
 ### List of Pull Requests
+- Remove memory-aware node bindings [#123](https://github.com/pulp-platform/Deeploy/pull/123)
 - Fix missing const's layout transformation and refactor NCHWtoNHWC passes [#122](https://github.com/pulp-platform/Deeploy/pull/122)
 - Fix aliasing [#125](https://github.com/pulp-platform/Deeploy/pull/125)
 - Support for 1D Autoencoder [#98](https://github.com/pulp-platform/Deeploy/pull/98)
@@ -49,6 +50,7 @@ This file contains the changelog for the Deeploy project. The changelog is divid
 - Buffer utilities: `checkNumLevels` validation and `sizeInBytes` method
 - Per–memory-level usage tracking and worst-case reporting in `NetworkContext`
 - Memory/I/O summaries and input/output logging in deployers
+- RequantHelpers.py for Neureka's TileConstraints
 
 ### Changed
 - Replaced platform-specific tags (`*-amd64`, `*-arm64`) with direct digest references in `Noelware/docker-manifest-action`.
@@ -80,6 +82,9 @@ This file contains the changelog for the Deeploy project. The changelog is divid
 - Refactored `hoistConstant`
 - Refactored TransientBuffer's `__init__`
 - Refactor of the NCHWtoNHWC passes
+- Removed NodeMemoryLevelChecker, MemoryAwareNodeBinding
+- Removed _parseNode from MemoryNetworkDeployer since we don't need the annotations before typeChecking anymore
+- Removed Wmem variants of bindings and tile constraints from Neureka
 
 ### Fixed
 - Prevent node duplication for graphs generated via GraphSurgeon
@@ -92,6 +97,7 @@ This file contains the changelog for the Deeploy project. The changelog is divid
 - Fixed `Unsqueeze` Op. when using ONNX opset 13 or higher (from attribute to input)
 - Fixed aliasing
 - Missing layout transformation of the const's (bias, mul, add, shift in Conv/RequantizedConv)
+- Keep mul/add rank of requantized Neureka tile constraints
 
 ### Removed
 - Delete outdated and unused `.gitlab-ci.yml` file
 
@@ -2,7 +2,7 @@
 #
 # SPDX-License-Identifier: Apache-2.0
 
-from typing import Any, Tuple, Union
+from typing import Any, Union
 
 import onnx_graphsurgeon as gs
 
@@ -63,11 +63,6 @@ def lower(self, graph: gs.Graph) -> gs.Graph:
     def codeTransform(self, verbose: CodeGenVerbosity = _NoVerbosity):
         return self._innerObject.codeTransform(verbose)
 
-    # MemoryAwareDeployer augment
-    def _parseNode(self, node: ONNXLayer, ctxt: NetworkContext,
-                   default_channels_first: bool) -> Tuple[NetworkContext, bool]:
-        return self._innerObject._parseNode(node, ctxt, default_channels_first)
-
     # PULPDeployer augment
     def generateBufferAllocationCode(self) -> str:
         return self._innerObject.generateBufferAllocationCode()
 
@@ -2,12 +2,7 @@
 #
 # SPDX-License-Identifier: Apache-2.0
 
-from typing import Dict, List, Optional, Sequence, Tuple
-
-import onnx_graphsurgeon as gs
-
-from Deeploy.DeeployTypes import CodeTransformation, NetworkContext, NodeBinding, NodeTemplate, NodeTypeChecker, \
-    OperatorRepresentation
+from typing import Dict, List, Optional
 
 
 class MemoryLevel():
@@ -109,58 +104,3 @@ def getDefaultMemoryLevel(self):
         if self._defaultMemoryLevel is None:
             raise ValueError('defaultMemoryLevel level not set!')
         return self._defaultMemoryLevel
-
-
-class NodeMemoryLevelChecker():
-
-    def __init__(self, inputMemoryLevels: Sequence[Optional[str]], outputMemoryLevels: Sequence[Optional[str]]):
-        self.inputMemoryLevels = inputMemoryLevels
-        self.outputMemoryLevels = outputMemoryLevels
-
-    def _memEq(self, memoryLevel: str, annotatedMemoryLevel: str) -> bool:
-        if memoryLevel is None:
-            return True
-        else:
-            return memoryLevel == annotatedMemoryLevel
-
-    def _checkMemoryLevels(self, ctxt: NetworkContext, memoryLevels: Sequence[str],
-                           tensors: Sequence[gs.Tensor]) -> bool:
-        buffers = [ctxt.lookup(tensor.name) for tensor in tensors]
-        if not all(hasattr(buffer, "_memoryLevel") for buffer in buffers):
-            return False
-
-        annotatedMemoryLevels = [buffer._memoryLevel for buffer in buffers]
-        if all(
-                self._memEq(memoryLevel, annotatedMemoryLevel)
-                for memoryLevel, annotatedMemoryLevel in zip(memoryLevels, annotatedMemoryLevels)):
-            return True
-        else:
-            return False
-
-    def check(self, ctxt: NetworkContext, node: gs.Node, operatorRepresentation) -> Tuple[NetworkContext, bool]:
-        if self._checkMemoryLevels(ctxt, self.inputMemoryLevels, node.inputs) and self._checkMemoryLevels(
-                ctxt, self.outputMemoryLevels, node.outputs):
-            return ctxt, True
-        else:
-            return ctxt, False
-
-
-class MemoryAwareNodeBinding(NodeBinding):
-
-    def __init__(self, typeChecker: NodeTypeChecker, memoryLevelChecker: NodeMemoryLevelChecker, template: NodeTemplate,
-                 codeTransformer: CodeTransformation):
-        super().__init__(typeChecker, template, codeTransformer)
-        self.memoryLevelChecker = memoryLevelChecker
-
-    def typeCheck(self, ctxt: NetworkContext, node: gs.Node,
-                  operatorRepresentation: OperatorRepresentation) -> Tuple[NetworkContext, bool]:
-        newCtxt, ret = self.memoryLevelChecker.check(ctxt, node, operatorRepresentation)
-        if ret:
-            return super().typeCheck(newCtxt, node, operatorRepresentation)
-
-        return ctxt, False
-
-
-def memoryAwareNodeBindingExtension(binding: NodeBinding,
-                                    memoryLevelChecker: NodeMemoryLevelChecker) -> MemoryAwareNodeBinding:
-    return MemoryAwareNodeBinding(binding.typeChecker, memoryLevelChecker, binding.template, binding.codeTransformer)
@@ -11,7 +11,7 @@
 from Deeploy.CommonExtensions.NetworkDeployers.NetworkDeployerWrapper import NetworkDeployerWrapper
 from Deeploy.CommonExtensions.NetworkDeployers.SignPropDeployer import SignPropDeployer
 from Deeploy.DeeployTypes import CodeGenVerbosity, ConstantBuffer, DeploymentEngine, DeploymentPlatform, \
-    NetworkContext, NetworkDeployer, NetworkOptimizationPass, NetworkOptimizer, ONNXLayer, Schedule, StructBuffer, \
+    NetworkContext, NetworkDeployer, NetworkOptimizationPass, NetworkOptimizer, Schedule, StructBuffer, \
     TopologyOptimizer, TransientBuffer, VariableBuffer, _NoVerbosity
 from Deeploy.Logging import DEFAULT_LOGGER as log
 from Deeploy.MemoryLevelExtension.MemoryLevels import MemoryHierarchy, MemoryLevel
@@ -128,25 +128,16 @@ def getTargetMemoryLevelMapping(self) -> TargetMemoryLevelMapping:
             f"Platform should be a MemoryPlatform or MemoryPlatformWrapper! Got {type(self.Platform).__name__}"
         return TargetMemoryLevelMapping(self.graph, self.Platform, self.ctxt)
 
-    def _parseNode(self, node: ONNXLayer, ctxt: NetworkContext,
-                   default_channels_first: bool) -> Tuple[NetworkContext, bool]:
-
-        newCtxt, parsePass = super()._parseNode(node, ctxt, default_channels_first)
-
-        if not parsePass:
-            return ctxt, False
-
-        newCtxt, self.graph = self.memoryLevelAnnotationOptimizer.optimize(newCtxt, self.graph)
-
-        return newCtxt, parsePass
-
     def bind(self):
+        log.info("- Perform Memory Level Annotation")
+        # LMACAN: Annotate before bind because during binding (specifically alignToContext) templates
+        #         may expect the memoryLevel annotation already.
+        self.ctxt, self.graph = self.memoryLevelAnnotationOptimizer.optimize(self.ctxt, self.graph)
 
         ret = super().bind()
         if not ret:
             return False
 
-        log.info("- Perform Memory Level Annotation")
         # SCHEREMO: There might be hoisting; reassign memoryLevel preferences
         self.ctxt, self.graph = self.memoryLevelAnnotationOptimizer.optimize(self.ctxt, self.graph)
 
@@ -181,29 +172,16 @@ def getTargetMemoryLevelMapping(self) -> TargetMemoryLevelMapping:
             f"Platform should be a MemoryPlatform or MemoryPlatformWrapper! Got {type(self.Platform).__name__}"
         return TargetMemoryLevelMapping(self.graph, self.Platform, self.ctxt)
 
-    def _parseNode(self, node: ONNXLayer, ctxt: NetworkContext,
-                   default_channels_first: bool) -> Tuple[NetworkContext, bool]:
-
-        newCtxt, parsePass = node.parse(ctxt.copy(), default_channels_first)
-
-        if not parsePass:
-            return ctxt, False
-
-        newCtxt, self.graph = self.memoryLevelAnnotationOptimizer.optimize(newCtxt, self.graph)
-        newCtxt, LayerBindSuccess = node.typeCheck(newCtxt)
-
-        if not LayerBindSuccess:
-            return ctxt, False
-
-        return newCtxt, True
-
     def bind(self):
+        log.info("- Perform Memory Level Annotation")
+        # LMACAN: Annotate before bind because during binding (specifically alignToContext) templates
+        #         may expect the memoryLevel annotation already.
+        self.ctxt, self.graph = self.memoryLevelAnnotationOptimizer.optimize(self.ctxt, self.graph)
 
         ret = super().bind()
         if not ret:
             return False
 
-        log.info("- Perform Memory Level Annotation")
         # SCHEREMO: There might be hoisting; reassign memoryLevel preferences
         self.ctxt, self.graph = self.memoryLevelAnnotationOptimizer.optimize(self.ctxt, self.graph)
 
@@ -229,29 +207,16 @@ def getTargetMemoryLevelMapping(self) -> TargetMemoryLevelMapping:
             f"Platform should be a MemoryPlatform or MemoryPlatformWrapper! Got {type(self.Platform).__name__}"
         return TargetMemoryLevelMapping(self.graph, self.Platform, self.ctxt)
 
-    def _parseNode(self, node: ONNXLayer, ctxt: NetworkContext,
-                   default_channels_first: bool) -> Tuple[NetworkContext, bool]:
-
-        newCtxt, parsePass = node.parse(ctxt.copy(), default_channels_first)
-
-        if not parsePass:
-            return ctxt, False
-
-        newCtxt, self.graph = self.memoryLevelAnnotationOptimizer.optimize(newCtxt, self.graph)
-        newCtxt, LayerBindSuccess = node.typeCheck(newCtxt)
-
-        if not LayerBindSuccess:
-            return ctxt, False
-
-        return newCtxt, True
-
     def bind(self):
+        log.info("- Perform Memory Level Annotation")
+        # LMACAN: Annotate before bind because during binding (specifically alignToContext) templates
+        #         may expect the memoryLevel annotation already.
+        self.ctxt, self.graph = self.memoryLevelAnnotationOptimizer.optimize(self.ctxt, self.graph)
 
         ret = super().bind()
         if not ret:
             return False
 
-        log.info("- Perform Memory Level Annotation")
         # SCHEREMO: There might be hoisting; reassign memoryLevel preferences
         self.ctxt, self.graph = self.memoryLevelAnnotationOptimizer.optimize(self.ctxt, self.graph)
 
 
@@ -5,7 +5,6 @@
 from Deeploy.AbstractDataTypes import PointerClass
 from Deeploy.CommonExtensions.DataTypes import int8_t, int32_t, uint8_t
 from Deeploy.DeeployTypes import NodeBinding
-from Deeploy.MemoryLevelExtension.MemoryLevels import NodeMemoryLevelChecker, memoryAwareNodeBindingExtension
 from Deeploy.Targets.Generic.TypeCheckers import ConvChecker
 from Deeploy.Targets.Neureka.Templates.ConvTemplate import NeurekaDenseConv2D_Template, NeurekaDWConv2D_Template, \
     NeurekaPWConv2D_Template, NeurekaRqntDenseConv2D_Template, NeurekaRqntDWConv2D_Template, \
@@ -33,15 +32,6 @@
     for weight_type in [uint8_t, int8_t]
 ]
 
-NeurekaWmemRQSPWConv2DBindings = [
-    memoryAwareNodeBindingExtension(binding, NodeMemoryLevelChecker([None, "WeightMemory_SRAM", None, None], [None]))
-    for binding in NeurekaRQSPWConv2DBindings
-]
-NeurekaWmemPWConv2DBindings = [
-    memoryAwareNodeBindingExtension(binding, NodeMemoryLevelChecker([None, "WeightMemory_SRAM"], [None]))
-    for binding in NeurekaPWConv2DBindings
-]
-
 NeurekaRQSDWConv2DBindings = [
     NodeBinding(
         PULPConvChecker(
@@ -62,15 +52,6 @@
     for weight_type in [uint8_t, int8_t]
 ]
 
-NeurekaWmemRQSDWConv2DBindings = [
-    memoryAwareNodeBindingExtension(binding, NodeMemoryLevelChecker([None, "WeightMemory_SRAM", None, None], [None]))
-    for binding in NeurekaRQSDWConv2DBindings
-]
-NeurekaWmemDWConv2DBindings = [
-    memoryAwareNodeBindingExtension(binding, NodeMemoryLevelChecker([None, "WeightMemory_SRAM"], [None]))
-    for binding in NeurekaDWConv2DBindings
-]
-
 NeurekaRQSDenseConv2DBindings = [
     NodeBinding(
         PULPConvChecker(
@@ -91,12 +72,3 @@
     for data_in_type in [uint8_t, int8_t]
     for weight_type in [uint8_t, int8_t]
 ]
-
-NeurekaWmemRQSDenseConv2DBindings = [
-    memoryAwareNodeBindingExtension(binding, NodeMemoryLevelChecker([None, "WeightMemory_SRAM", None, None], [None]))
-    for binding in NeurekaRQSDenseConv2DBindings
-]
-NeurekaWmemDenseConv2DBindings = [
-    memoryAwareNodeBindingExtension(binding, NodeMemoryLevelChecker([None, "WeightMemory_SRAM"], [None]))
-    for binding in NeurekaDenseConv2DBindings
-]
@@ -12,27 +12,17 @@
     NeurekaRQSDenseConv2DParser, NeurekaRQSDWConv2DParser, NeurekaRQSPWConv2DParser
 from Deeploy.Targets.Neureka.Tiler import NeurekaDenseConv2DTilingReadyBindings, NeurekaDWConv2DTilingReadyBindings, \
     NeurekaPWConv2DTilingReadyBindings, NeurekaRQSDenseConv2DTilingReadyBindings, \
-    NeurekaRQSDWConv2DTilingReadyBindings, NeurekaRQSPWConv2DTilingReadyBindings, \
-    NeurekaWmemDenseConv2DTilingReadyBindings, NeurekaWmemDWConv2DTilingReadyBindings, \
-    NeurekaWmemPWConv2DTilingReadyBindings, NeurekaWmemRQSDenseConv2DTilingReadyBindings, \
-    NeurekaWmemRQSDWConv2DTilingReadyBindings, NeurekaWmemRQSPWConv2DTilingReadyBindings
+    NeurekaRQSDWConv2DTilingReadyBindings, NeurekaRQSPWConv2DTilingReadyBindings
 from Deeploy.Targets.PULPOpen.Layers import PULPRQSConvLayer
 
-NeurekaRqntPWConv2DMapper = NodeMapper(
-    NeurekaRQSPWConv2DParser(), NeurekaWmemRQSPWConv2DTilingReadyBindings + NeurekaRQSPWConv2DTilingReadyBindings)
-NeurekaPWConv2DMapper = NodeMapper(NeurekaPWConv2DParser(),
-                                   NeurekaWmemPWConv2DTilingReadyBindings + NeurekaPWConv2DTilingReadyBindings)
-
-NeurekaRqntDWConv2DMapper = NodeMapper(
-    NeurekaRQSDWConv2DParser(), NeurekaWmemRQSDWConv2DTilingReadyBindings + NeurekaRQSDWConv2DTilingReadyBindings)
-NeurekaDWConv2DMapper = NodeMapper(NeurekaDWConv2DParser(),
-                                   NeurekaWmemDWConv2DTilingReadyBindings + NeurekaDWConv2DTilingReadyBindings)
-
-NeurekaRqntDenseConv2DMapper = NodeMapper(
-    NeurekaRQSDenseConv2DParser(),
-    NeurekaWmemRQSDenseConv2DTilingReadyBindings + NeurekaRQSDenseConv2DTilingReadyBindings)
-NeurekaDenseConv2DMapper = NodeMapper(NeurekaDenseConv2DParser(),
-                                      NeurekaWmemDenseConv2DTilingReadyBindings + NeurekaDenseConv2DTilingReadyBindings)
+NeurekaRqntPWConv2DMapper = NodeMapper(NeurekaRQSPWConv2DParser(), NeurekaRQSPWConv2DTilingReadyBindings)
+NeurekaPWConv2DMapper = NodeMapper(NeurekaPWConv2DParser(), NeurekaPWConv2DTilingReadyBindings)
+
+NeurekaRqntDWConv2DMapper = NodeMapper(NeurekaRQSDWConv2DParser(), NeurekaRQSDWConv2DTilingReadyBindings)
+NeurekaDWConv2DMapper = NodeMapper(NeurekaDWConv2DParser(), NeurekaDWConv2DTilingReadyBindings)
+
+NeurekaRqntDenseConv2DMapper = NodeMapper(NeurekaRQSDenseConv2DParser(), NeurekaRQSDenseConv2DTilingReadyBindings)
+NeurekaDenseConv2DMapper = NodeMapper(NeurekaDenseConv2DParser(), NeurekaDenseConv2DTilingReadyBindings)
 
 NeurekaMapping = {
     'RequantizedConv':