brain4j-org
diff --git a/‎brain4j-core/src/main/java/org/brain4j/core/layer/Layer.java‎
Lines changed: 25 additions & 7 deletions b/‎brain4j-core/src/main/java/org/brain4j/core/layer/Layer.java‎
Lines changed: 25 additions & 7 deletions
diff --git a/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/BatchNorm.java‎
Lines changed: 6 additions & 1 deletion b/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/BatchNorm.java‎
Lines changed: 6 additions & 1 deletion
diff --git a/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/DenseLayer.java‎
Lines changed: 17 additions & 7 deletions b/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/DenseLayer.java‎
Lines changed: 17 additions & 7 deletions
diff --git a/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/DropoutLayer.java‎
Lines changed: 7 additions & 1 deletion b/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/DropoutLayer.java‎
Lines changed: 7 additions & 1 deletion
diff --git a/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/LayerNorm.java‎
Lines changed: 6 additions & 1 deletion b/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/LayerNorm.java‎
Lines changed: 6 additions & 1 deletion
diff --git a/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/conv/ConvLayer.java‎
Lines changed: 8 additions & 3 deletions b/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/conv/ConvLayer.java‎
Lines changed: 8 additions & 3 deletions
diff --git a/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/conv/FlattenLayer.java‎
Lines changed: 1 addition & 6 deletions b/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/conv/FlattenLayer.java‎
Lines changed: 1 addition & 6 deletions
diff --git a/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/conv/InputLayer.java‎
Lines changed: 1 addition & 1 deletion b/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/conv/InputLayer.java‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/conv/pooling/AveragePooling.java‎
Lines changed: 1 addition & 1 deletion b/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/conv/pooling/AveragePooling.java‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/conv/pooling/MaxPooling.java‎
Lines changed: 1 addition & 1 deletion b/‎brain4j-core/src/main/java/org/brain4j/core/layer/impl/conv/pooling/MaxPooling.java‎
Lines changed: 1 addition & 1 deletion
@@ -106,18 +106,27 @@ public void deserialize(DataInputStream stream) throws Exception {
         }
     }
 
-    public void compile(WeightInitializer weightInit, LossFunction lossFunction, Optimizer optimizer, Updater updater) {
+    public void compile(
+        WeightInitializer weightInit,
+        Optimizer optimizer,
+        Updater updater
+    ) {
         this.weightInit = weightInit;
-        this.lossFunction = lossFunction;
         this.optimizer = optimizer;
         this.updater = updater;
     }
 
-    public Tensor computeLoss(StatesCache cache, Tensor targets, Tensor outputs, LossFunction lossFunction) {
+    public Tensor computeLoss(
+        int index,
+        StatesCache cache,
+        Tensor targets,
+        Tensor outputs,
+        LossFunction lossFunction
+    ) {
         Tensor error = outputs.minus(targets);
         Tensor derivatives = activation.getDerivative(outputs);
 
-        Tensor input = cache.getInputTensor(this);
+        Tensor input = cache.getInputTensor(index);
         Tensor delta = lossFunction.getDelta(error, derivatives);
 
         Tensor weightsGradient = input.transpose().matmul(delta);
@@ -128,7 +137,11 @@ public Tensor computeLoss(StatesCache cache, Tensor targets, Tensor outputs, Los
         return delta;
     }
 
-    public void connect(Random generator, Layer previous, double bound) {
+    public void connect(
+        Random generator,
+        Layer previous,
+        double bound
+    ) {
         if (previous == null) return;
 
         int input = previous.getTotalNeurons();
@@ -145,9 +158,14 @@ public void connect(Random generator, Layer previous, double bound) {
         }
     }
 
-    public abstract Tensor forward(StatesCache cache, Tensor input, boolean training);
+    public abstract Tensor forward(
+        int index,
+        StatesCache cache,
+        Tensor input,
+        boolean training
+    );
 
-    public Tensor backward(StatesCache cache, Layer previous, Tensor delta) {
+    public Tensor backward(int index, StatesCache cache, Layer previous, Tensor delta) {
         throw new UnsupportedOperationException("Not implemented for " + this.getClass().getSimpleName());
     }
 
 
@@ -52,7 +52,12 @@ public boolean canPropagate() {
     }
 
     @Override
-    public Tensor forward(StatesCache cache, Tensor input, boolean training) {
+    public Tensor forward(
+        int index,
+        StatesCache cache,
+        Tensor input,
+        boolean training
+    ) {
         int batchSize = input.shape()[0];
 
         Tensor transposed = input.transpose(); // [dimension, batch_size]
 
@@ -38,7 +38,12 @@ public String getLayerName() {
     }
 
     @Override
-    public Tensor forward(StatesCache cache, Tensor input, boolean training) {
+    public Tensor forward(
+        int index,
+        StatesCache cache,
+        Tensor input,
+        boolean training
+    ) {
         Tensor Z = input.matmul(weights); // [batch_size, n_out]
 
         int batchSize = Z.shape()[0];
@@ -54,7 +59,7 @@ public Tensor forward(StatesCache cache, Tensor input, boolean training) {
         }
 
         if (nextLayer instanceof LayerNorm layerNorm) {
-            Z = layerNorm.forward(cache, Z, training);
+            Z = layerNorm.forward(index, cache, Z, training);
         }
 
         Tensor activated = activation.activate(Z);
@@ -64,13 +69,18 @@ public Tensor forward(StatesCache cache, Tensor input, boolean training) {
     }
 
     @Override
-    public Tensor backward(StatesCache cache, Layer previous, Tensor delta) {
-        Tensor input = cache.getInputTensor(this);
-        Tensor output = cache.getOutputTensor(this);
+    public Tensor backward(
+        int index,
+        StatesCache cache,
+        Layer previous,
+        Tensor delta
+    ) {
+        Tensor input = cache.getInputTensor(index);
+        Tensor output = cache.getOutputTensor(index);
         Tensor derivative = activation.getDerivative(output); // [batch_size, n_out]
 
-        Tensor weightsNext = previous.getWeights();  // [n_out, n_out_next]
-        Tensor deltaProjected = delta.matmul(weightsNext.transpose());  // [batch_size x n_out]
+        Tensor weightsNext = previous.getWeights(); // [n_out, n_out_next]
+        Tensor deltaProjected = delta.matmul(weightsNext.transpose()); // [batch_size x n_out]
 
         Tensor deltaThisLayer = deltaProjected.mul(derivative); // [batch_size x n_out]
 
 
@@ -67,12 +67,18 @@ public boolean canPropagate() {
      * during training. Meanwhile it will scale the input tensor by {@code 1 - dropout} during inferencing.
      *
      * @param nextLayer
+     * @param index
      * @param input     The input tensor.
      * @param training  If it's called during training.
      * @return The resulting tensor.
      */
     @Override
-    public Tensor forward(StatesCache cache, Tensor input, boolean training) {
+    public Tensor forward(
+        int index,
+        StatesCache cache,
+        Tensor input,
+        boolean training
+    ) {
         if (training) {
             return scale(input);
         }
 
@@ -57,7 +57,12 @@ public boolean canPropagate() {
     }
 
     @Override
-    public Tensor forward(StatesCache cache, Tensor input, boolean training) {
+    public Tensor forward(
+        int index,
+        StatesCache cache,
+        Tensor input,
+        boolean training
+    ) {
         int batchSize = input.shape()[0];
         Tensor result = input.clone();
 
 
@@ -20,7 +20,8 @@ public class ConvLayer extends Layer {
     private int padding;
     private int stride;
 
-    public ConvLayer(Activations activation, int filters, int filtersWidth, int filtersHeight) {
+    public ConvLayer(Activations activation, int filters, int filtersWidth, int filtersHeight
+    ) {
         this(activation.getFunction(), filters, filtersWidth, filtersHeight, 1, 1);
     }
 
@@ -36,7 +37,11 @@ public ConvLayer(Activation activation, int filters, int filtersWidth, int filte
     }
 
     @Override
-    public void connect(Random generator, Layer previous, double bound) {
+    public void connect(
+        Random generator,
+        Layer previous,
+        double bound
+    ) {
         if (previous instanceof ConvLayer convLayer) {
             this.channels = convLayer.getChannels();
         } else if (previous instanceof InputLayer inputLayer) {
@@ -79,7 +84,7 @@ public void deserialize(DataInputStream stream) throws Exception {
     }
 
     @Override
-    public Tensor forward(StatesCache cache, Tensor input, boolean training) {
+    public Tensor forward(int index, StatesCache cache, Tensor input, boolean training) {
         // [batch_size, channels, height, width]
         return input.convolve(weights)
                 .map(x -> activation.activate(x));
 
@@ -7,12 +7,7 @@
 public class FlattenLayer extends Layer {
 
     @Override
-    public int getTotalNeurons() {
-        return super.getTotalNeurons();
-    }
-
-    @Override
-    public Tensor forward(StatesCache cache, Tensor input, boolean training) {
+    public Tensor forward(int index, StatesCache cache, Tensor input, boolean training) {
         return input.reshape(1, input.elements());
     }
 }
@@ -17,7 +17,7 @@ public InputLayer(int width, int height, int channels) {
     }
 
     @Override
-    public Tensor forward(StatesCache cache, Tensor input, boolean training) {
+    public Tensor forward(int index, StatesCache cache, Tensor input, boolean training) {
         return input;
     }
 
 
@@ -26,7 +26,7 @@ public boolean canConnect() {
     }
 
     @Override
-    public Tensor forward(StatesCache cache, Tensor input, boolean training) {
+    public Tensor forward(int index, StatesCache cache, Tensor input, boolean training) {
         return null;
     }
 
 
@@ -26,7 +26,7 @@ public boolean canConnect() {
     }
 
     @Override
-    public Tensor forward(StatesCache cache, Tensor input, boolean training) {
+    public Tensor forward(int index, StatesCache cache, Tensor input, boolean training) {
         return null;
     }
Original file line number	Diff line number	Diff line change
`@@ -7,12 +7,7 @@`
`7`	`7`	`public class FlattenLayer extends Layer {`
`8`	`8`
`9`	`9`	`@Override`
`10`		`- public int getTotalNeurons() {`
`11`		`- return super.getTotalNeurons();`
`12`		`- }`
`13`		`-`
`14`		`- @Override`
`15`		`- public Tensor forward(StatesCache cache, Tensor input, boolean training) {`
	`10`	`+ public Tensor forward(int index, StatesCache cache, Tensor input, boolean training) {`
`16`	`11`	`return input.reshape(1, input.elements());`
`17`	`12`	`}`
`18`	`13`	`}`
Original file line number	Diff line number	Diff line change
`@@ -17,7 +17,7 @@ public InputLayer(int width, int height, int channels) {`
`17`	`17`	`}`
`18`	`18`
`19`	`19`	`@Override`
`20`		`- public Tensor forward(StatesCache cache, Tensor input, boolean training) {`
	`20`	`+ public Tensor forward(int index, StatesCache cache, Tensor input, boolean training) {`
`21`	`21`	`return input;`
`22`	`22`	`}`
`23`	`23`
Original file line number	Diff line number	Diff line change
`@@ -26,7 +26,7 @@ public boolean canConnect() {`
`26`	`26`	`}`
`27`	`27`
`28`	`28`	`@Override`
`29`		`- public Tensor forward(StatesCache cache, Tensor input, boolean training) {`
	`29`	`+ public Tensor forward(int index, StatesCache cache, Tensor input, boolean training) {`
`30`	`30`	`return null;`
`31`	`31`	`}`
`32`	`32`