fix: address 25 PR review comments — SiLU zero-alloc, arena safety, cleanup

ooples · claude · ooples · commit d8673dae12d5 · 2026-04-05T00:13:42.000-04:00
SiLU derivative optimization (18 files):
- Replaced ones_t tensor allocation + Fill(One) + TensorAdd pattern with
  Engine.TensorAddScalar(x, NumOps.One) — zero allocation for 1+x computation
- ABCLayer, GatedDeltaNet, GatedDeltaProduct, GatedSlotAttention, HGRN2,
  Hedgehog, Hyena, Kimi, LogLinear, MesaNet, MixtureOfMamba/Memories,
  MultiLatentAttention, Rebased, RetNet, Rodimus, TransNormerLLM, TTT

ForwardArena fixes:
- Reset() uses pre-cached keys array instead of allocating List each call
- ShapeKey defensive-copies the shape array to prevent mutation
- Made ForwardArena internal (implementation detail, not public API)

Other fixes:
- RWKV7Block: removed unused TsYt constant
- DiffusionConvLayer: removed duplicate using directive
- S6Scan: eliminated wasted Rent in initialState branch (clone instead)

Co-Authored-By: Claude Opus 4.6 (1M context) &lt;noreply@anthropic.com&gt;
diff --git a/src/Memory/ForwardArena.cs b/src/Memory/ForwardArena.cs
@@ -11,10 +11,11 @@ namespace AiDotNet.Memory;
 /// and GC pressure during the forward pass. Tensors are pre-created during warmup
 /// and recycled across calls.
 /// </summary>
-public sealed class ForwardArena<T>
+internal sealed class ForwardArena<T>
 {
     private readonly Dictionary<ShapeKey, Tensor<T>[]> _slabs = new();
     private readonly Dictionary<ShapeKey, int> _cursors = new();
+    private ShapeKey[]? _cursorKeysCache;
     private const int DefaultSlabSize = 4;
     private const int GrowthFactor = 2;
 
@@ -71,9 +72,12 @@ public Tensor<T> RentUninitialized(int[] shape)
     [MethodImpl(MethodImplOptions.AggressiveInlining)]
     public void Reset()
     {
-        var keys = new List<ShapeKey>(_cursors.Keys);
-        foreach (var key in keys)
-            _cursors[key] = 0;
+        // Use cached keys array to avoid allocation during reset
+        if (_cursorKeysCache is null || _cursorKeysCache.Length != _cursors.Count)
+            _cursorKeysCache = new ShapeKey[_cursors.Count];
+        _cursors.Keys.CopyTo(_cursorKeysCache, 0);
+        for (int i = 0; i < _cursorKeysCache.Length; i++)
+            _cursors[_cursorKeysCache[i]] = 0;
     }
 
     /// <summary>
@@ -136,7 +140,7 @@ private Tensor<T> GrowAndRent(ShapeKey key, int[] shape, bool clear = true)
 
     public ShapeKey(int[] shape)
     {
-        _dims = shape;
+        _dims = (int[])shape.Clone();
         unchecked
         {
             int hash = (int)2166136261;
diff --git a/src/NeuralNetworks/Layers/DiffusionConvLayer.cs b/src/NeuralNetworks/Layers/DiffusionConvLayer.cs
@@ -5,7 +5,6 @@
 using AiDotNet.Enums.AlgorithmTypes;
 using AiDotNet.Interfaces;
 using AiDotNet.Memory;
-using AiDotNet.Interfaces;
 using AiDotNet.Tensors.Engines;
 using AiDotNet.Tensors.Engines.DirectGpu;
 using AiDotNet.Tensors.Engines.Gpu;
diff --git a/src/NeuralNetworks/Layers/SSM/ABCLayer.cs b/src/NeuralNetworks/Layers/SSM/ABCLayer.cs
@@ -478,7 +478,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var onePlusXSig = Engine.TensorAdd(CreateOnesLike(xTimesOneMinusSig), xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/GatedDeltaNetLayer.cs b/src/NeuralNetworks/Layers/SSM/GatedDeltaNetLayer.cs
@@ -470,7 +470,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var onePlusXSig = Engine.TensorAdd(CreateOnesLike(xTimesOneMinusSig), xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/GatedDeltaProductLayer.cs b/src/NeuralNetworks/Layers/SSM/GatedDeltaProductLayer.cs
@@ -609,7 +609,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var onePlusXSig = Engine.TensorAdd(CreateOnesLike(xTimesOneMinusSig), xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/GatedSlotAttentionLayer.cs b/src/NeuralNetworks/Layers/SSM/GatedSlotAttentionLayer.cs
@@ -446,7 +446,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var onePlusXSig = Engine.TensorAdd(CreateOnesLike(xTimesOneMinusSig), xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/HGRN2Layer.cs b/src/NeuralNetworks/Layers/SSM/HGRN2Layer.cs
@@ -392,7 +392,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var onePlusXSig = Engine.TensorAdd(CreateOnesLike(xTimesOneMinusSig), xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/HedgehogLayer.cs b/src/NeuralNetworks/Layers/SSM/HedgehogLayer.cs
@@ -576,8 +576,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/HyenaLayer.cs b/src/NeuralNetworks/Layers/SSM/HyenaLayer.cs
@@ -479,8 +479,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var onesT = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); onesT.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(onesT, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/KimiLinearAttentionLayer.cs b/src/NeuralNetworks/Layers/SSM/KimiLinearAttentionLayer.cs
@@ -373,8 +373,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/LogLinearAttentionLayer.cs b/src/NeuralNetworks/Layers/SSM/LogLinearAttentionLayer.cs
@@ -516,8 +516,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/MesaNetLayer.cs b/src/NeuralNetworks/Layers/SSM/MesaNetLayer.cs
@@ -620,8 +620,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/MixtureOfMambaLayer.cs b/src/NeuralNetworks/Layers/SSM/MixtureOfMambaLayer.cs
@@ -483,8 +483,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/MixtureOfMemoriesLayer.cs b/src/NeuralNetworks/Layers/SSM/MixtureOfMemoriesLayer.cs
@@ -535,8 +535,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/MultiLatentAttentionLayer.cs b/src/NeuralNetworks/Layers/SSM/MultiLatentAttentionLayer.cs
@@ -377,8 +377,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/RWKV7Block.cs b/src/NeuralNetworks/Layers/SSM/RWKV7Block.cs
@@ -346,7 +346,7 @@ private void InitializeParameters()
 
     // Workspace buffer indices — TimeMixing timestep buffers
     private const int TsRInput = 0, TsKInput = 1, TsVInput = 2;
-    private const int TsAInput = 3, TsBInput = 4, TsWkvOut = 5, TsYt = 6;
+    private const int TsAInput = 3, TsBInput = 4, TsWkvOut = 5;
     // Workspace buffer indices — ChannelMixing timestep buffers
     private const int TsCmRInput = 7, TsCmKInput = 8, TsCmKSiLU = 9;
     // Workspace buffer indices — TimeMixing sequence buffers
diff --git a/src/NeuralNetworks/Layers/SSM/RebasedLayer.cs b/src/NeuralNetworks/Layers/SSM/RebasedLayer.cs
@@ -603,8 +603,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/RetNetLayer.cs b/src/NeuralNetworks/Layers/SSM/RetNetLayer.cs
@@ -582,8 +582,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/RodimusLayer.cs b/src/NeuralNetworks/Layers/SSM/RodimusLayer.cs
@@ -487,7 +487,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var onePlusXSig = Engine.TensorAdd(CreateOnesLike(xTimesOneMinusSig), xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/S6Scan.cs b/src/NeuralNetworks/Layers/SSM/S6Scan.cs
@@ -98,13 +98,13 @@ public static (Tensor<T> Output, Tensor<T> HiddenStates) SequentialScanForward(
         Tensor<T> h;
         if (initialState != null)
         {
-            // Copy initial state so we don't mutate the caller's tensor
-            h = TensorAllocator.Rent<T>(new[] { batchSize, innerDimension, stateDimension });
-            h = Engine.TensorAdd(h, initialState);
+            // Clone initial state so we don't mutate the caller's tensor
+            h = new Tensor<T>(initialState.Shape.ToArray());
+            initialState.Data.Span.CopyTo(h.Data.Span);
         }
         else
         {
-            h = TensorAllocator.Rent<T>(new[] { batchSize, innerDimension, stateDimension });
+            h = new Tensor<T>(new[] { batchSize, innerDimension, stateDimension });
         }
 
         // Store all hidden states for backward pass: [batch, seqLen+1, innerDim, stateDim]
diff --git a/src/NeuralNetworks/Layers/SSM/TTTLayer.cs b/src/NeuralNetworks/Layers/SSM/TTTLayer.cs
@@ -623,8 +623,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 
diff --git a/src/NeuralNetworks/Layers/SSM/TransNormerLLMLayer.cs b/src/NeuralNetworks/Layers/SSM/TransNormerLLMLayer.cs
@@ -526,8 +526,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)
         var sig = Engine.Sigmoid(x);
         var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);
         var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);
-        var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);
-        var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);
+        var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);
         return Engine.TensorMultiply(sig, onePlusXSig);
     }
 

Original file line number	Diff line number	Diff line change
`@@ -478,7 +478,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)`
`478`	`478`	`var sig = Engine.Sigmoid(x);`
`479`	`479`	`var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);`
`480`	`480`	`var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);`
`481`		`- var onePlusXSig = Engine.TensorAdd(CreateOnesLike(xTimesOneMinusSig), xTimesOneMinusSig);`
	`481`	`+ var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);`
`482`	`482`	`return Engine.TensorMultiply(sig, onePlusXSig);`
`483`	`483`	`}`
`484`	`484`
Original file line number	Diff line number	Diff line change
`@@ -470,7 +470,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)`
`470`	`470`	`var sig = Engine.Sigmoid(x);`
`471`	`471`	`var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);`
`472`	`472`	`var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);`
`473`		`- var onePlusXSig = Engine.TensorAdd(CreateOnesLike(xTimesOneMinusSig), xTimesOneMinusSig);`
	`473`	`+ var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);`
`474`	`474`	`return Engine.TensorMultiply(sig, onePlusXSig);`
`475`	`475`	`}`
`476`	`476`
Original file line number	Diff line number	Diff line change
`@@ -609,7 +609,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)`
`609`	`609`	`var sig = Engine.Sigmoid(x);`
`610`	`610`	`var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);`
`611`	`611`	`var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);`
`612`		`- var onePlusXSig = Engine.TensorAdd(CreateOnesLike(xTimesOneMinusSig), xTimesOneMinusSig);`
	`612`	`+ var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);`
`613`	`613`	`return Engine.TensorMultiply(sig, onePlusXSig);`
`614`	`614`	`}`
`615`	`615`
Original file line number	Diff line number	Diff line change
`@@ -446,7 +446,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)`
`446`	`446`	`var sig = Engine.Sigmoid(x);`
`447`	`447`	`var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);`
`448`	`448`	`var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);`
`449`		`- var onePlusXSig = Engine.TensorAdd(CreateOnesLike(xTimesOneMinusSig), xTimesOneMinusSig);`
	`449`	`+ var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);`
`450`	`450`	`return Engine.TensorMultiply(sig, onePlusXSig);`
`451`	`451`	`}`
`452`	`452`
Original file line number	Diff line number	Diff line change
`@@ -392,7 +392,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)`
`392`	`392`	`var sig = Engine.Sigmoid(x);`
`393`	`393`	`var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);`
`394`	`394`	`var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);`
`395`		`- var onePlusXSig = Engine.TensorAdd(CreateOnesLike(xTimesOneMinusSig), xTimesOneMinusSig);`
	`395`	`+ var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);`
`396`	`396`	`return Engine.TensorMultiply(sig, onePlusXSig);`
`397`	`397`	`}`
`398`	`398`
Original file line number	Diff line number	Diff line change
`@@ -576,8 +576,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)`
`576`	`576`	`var sig = Engine.Sigmoid(x);`
`577`	`577`	`var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);`
`578`	`578`	`var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);`
`579`		`- var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);`
`580`		`- var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);`
	`579`	`+ var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);`
`581`	`580`	`return Engine.TensorMultiply(sig, onePlusXSig);`
`582`	`581`	`}`
`583`	`582`
Original file line number	Diff line number	Diff line change
`@@ -479,8 +479,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)`
`479`	`479`	`var sig = Engine.Sigmoid(x);`
`480`	`480`	`var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);`
`481`	`481`	`var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);`
`482`		`- var onesT = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); onesT.Fill(NumOps.One);`
`483`		`- var onePlusXSig = Engine.TensorAdd(onesT, xTimesOneMinusSig);`
	`482`	`+ var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);`
`484`	`483`	`return Engine.TensorMultiply(sig, onePlusXSig);`
`485`	`484`	`}`
`486`	`485`
Original file line number	Diff line number	Diff line change
`@@ -373,8 +373,7 @@ private Tensor<T> ComputeSiLUDerivative(Tensor<T> x)`
`373`	`373`	`var sig = Engine.Sigmoid(x);`
`374`	`374`	`var oneMinusSig = Engine.ScalarMinusTensor(NumOps.One, sig);`
`375`	`375`	`var xTimesOneMinusSig = Engine.TensorMultiply(x, oneMinusSig);`
`376`		`- var ones_t = new Tensor<T>(xTimesOneMinusSig.Shape.ToArray()); ones_t.Fill(NumOps.One);`
`377`		`- var onePlusXSig = Engine.TensorAdd(ones_t, xTimesOneMinusSig);`
	`376`	`+ var onePlusXSig = Engine.TensorAddScalar(xTimesOneMinusSig, NumOps.One);`
`378`	`377`	`return Engine.TensorMultiply(sig, onePlusXSig);`
`379`	`378`	`}`
`380`	`379`