conv nets fixes

ivan-vasilev · ivan-vasilev · commit c54e4240f958 · 2014-04-26T02:16:14.000+03:00
diff --git a/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/AparapiAveragePooling2D.java b/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/AparapiAveragePooling2D.java
@@ -7,7 +7,6 @@
 import com.github.neuralnetworks.architecture.Subsampling2DConnection;
 import com.github.neuralnetworks.calculation.ConnectionCalculator;
 import com.github.neuralnetworks.calculation.memory.ValuesProvider;
-import com.github.neuralnetworks.util.TensorFactory;
 
 /**
  * Average pooling
@@ -21,7 +20,7 @@ public class AparapiAveragePooling2D implements ConnectionCalculator {
 
     @Override
     public void calculate(List<Connections> connections, ValuesProvider valuesProvider, Layer targetLayer) {
-	if (cc == null || cc.getMiniBatchSize() != TensorFactory.batchSize(valuesProvider)) {
+	if (cc == null || !cc.accept((Subsampling2DConnection) connections.get(0), valuesProvider)) {
 	    cc = new AparapiAveragePooling2DCC((Subsampling2DConnection) connections.get(0), valuesProvider, targetLayer);
 	}
 
diff --git a/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/AparapiConv2D.java b/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/AparapiConv2D.java
@@ -135,6 +135,22 @@ public void run() {
 		outputStartIndex + (id / outputFeatureMapLength) * outputFeatureMapsDistance + ((id % outputFeatureMapLength) / outputColumns) * outputFeatureMapRowsDistance + (id % outputColumns) * outputFeatureMapColumnsDistance);
     }
 
+    public boolean accept(Conv2DConnection c, ValuesProvider valuesProvider) {
+	if (TensorFactory.batchSize(valuesProvider) != miniBatchSize) {
+	    return false;
+	}
+
+	if (TensorFactory.tensor(c.getOutputLayer(), c, valuesProvider).getElements() != output) {
+	    return false;
+	}
+
+	if (TensorFactory.tensor(Util.getOppositeLayer(c, c.getOutputLayer()), c, valuesProvider).getElements() != input) {
+	    return false;
+	}
+
+	return true;
+    }
+
     /**
      * the actual convolution
      * @param weightsStartId
diff --git a/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/AparapiMaxPooling2D.java b/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/AparapiMaxPooling2D.java
@@ -7,7 +7,6 @@
 import com.github.neuralnetworks.architecture.Subsampling2DConnection;
 import com.github.neuralnetworks.calculation.ConnectionCalculator;
 import com.github.neuralnetworks.calculation.memory.ValuesProvider;
-import com.github.neuralnetworks.util.TensorFactory;
 
 /**
  * Max pooling
@@ -20,7 +19,7 @@ public class AparapiMaxPooling2D implements ConnectionCalculator {
 
     @Override
     public void calculate(List<Connections> connections, ValuesProvider valuesProvider, Layer targetLayer) {
-	if (cc == null || cc.getMiniBatchSize() != TensorFactory.batchSize(valuesProvider)) {
+	if (cc == null || !cc.accept((Subsampling2DConnection) connections.get(0), valuesProvider)) {
 	    cc = new AparapiMaxPooling2DCC((Subsampling2DConnection) connections.get(0), valuesProvider, targetLayer);
 	}
 
diff --git a/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/AparapiStochasticPooling2D.java b/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/AparapiStochasticPooling2D.java
@@ -7,7 +7,6 @@
 import com.github.neuralnetworks.architecture.Subsampling2DConnection;
 import com.github.neuralnetworks.calculation.ConnectionCalculator;
 import com.github.neuralnetworks.calculation.memory.ValuesProvider;
-import com.github.neuralnetworks.util.TensorFactory;
 
 /**
  * Stochastic pooling
@@ -20,7 +19,7 @@ public class AparapiStochasticPooling2D implements ConnectionCalculator {
 
     @Override
     public void calculate(List<Connections> connections, ValuesProvider valuesProvider, Layer targetLayer) {
-	if (cc == null || cc.getMiniBatchSize() != TensorFactory.batchSize(valuesProvider)) {
+	if (cc == null || !cc.accept((Subsampling2DConnection) connections.get(0), valuesProvider)) {
 	    cc = new AparapiStochasticPooling2DCC((Subsampling2DConnection) connections.get(0), valuesProvider, targetLayer);
 	}
 
diff --git a/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/AparapiSubsampling2D.java b/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/AparapiSubsampling2D.java
@@ -154,6 +154,22 @@ public void run() {
 		outputStartIndex + fm * outputFeatureMapsDistance + fmRow * outputFeatureMapRowsDistance + fmCol * outputFeatureMapColumnsDistance);
     }
 
+    public boolean accept(Subsampling2DConnection c, ValuesProvider valuesProvider) {
+	if (TensorFactory.batchSize(valuesProvider) != miniBatchSize) {
+	    return false;
+	}
+
+	if (TensorFactory.tensor(c.getOutputLayer(), c, valuesProvider).getElements() != output) {
+	    return false;
+	}
+
+	if (TensorFactory.tensor(Util.getOppositeLayer(c, c.getOutputLayer()), c, valuesProvider).getElements() != input) {
+	    return false;
+	}
+
+	return true;
+    }
+
     /**
      * This is where the subsampling happens
      */
diff --git a/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/ConnectionCalculatorConv.java b/nn-core/src/main/java/com/github/neuralnetworks/calculation/neuronfunctions/ConnectionCalculatorConv.java
@@ -13,8 +13,7 @@
 import com.github.neuralnetworks.util.Util;
 
 /**
- * Default implementation of Connection calculator for convolutional/subsampling
- * layers
+ * Default implementation of Connection calculator for convolutional/subsampling layers
  */
 public class ConnectionCalculatorConv implements ConnectionCalculator {
 
@@ -41,7 +40,7 @@ public void calculate(List<Connections> connections, ValuesProvider valuesProvid
 
 	if (c != null) {
 	    // currently works only as a feedforward (including bp)
-	    if (inputFunction == null || miniBatchSize != TensorFactory.batchSize(valuesProvider)) {
+	    if (inputFunction == null || !inputFunction.accept(c, valuesProvider)) {
 		miniBatchSize = TensorFactory.batchSize(valuesProvider);
 		inputFunction = createInputFunction(c, valuesProvider, targetLayer);
 	    }
diff --git a/nn-core/src/main/java/com/github/neuralnetworks/training/events/LogTrainingListener.java b/nn-core/src/main/java/com/github/neuralnetworks/training/events/LogTrainingListener.java
@@ -65,7 +65,7 @@ public void handleEvent(TrainingEvent event) {
 
 	    StringBuilder sb = new StringBuilder();
 	    sb.append(((finishTime - startTime) / 1000f) + " s  total time" + s);
-	    sb.append((miniBatchTotalTime / (miniBatches * 1000f)) + " s  per minibatch of " + miniBatches + " mini batches" + s);
+	    sb.append((miniBatchTotalTime / (miniBatches * 1000f)) + " s  per minibatch of " + miniBatches + " batches" + s);
 	    if (event instanceof TestingFinishedEvent) {
 		Trainer<?> t = (Trainer<?>) event.getSource();
 		OutputError oe = t.getOutputError();
@@ -83,7 +83,7 @@ public void handleEvent(TrainingEvent event) {
 	    String s = System.getProperty("line.separator");
 
 	    if (miniBatchTime / 5000 > 0 && (logMiniBatches || (isTesting && logTestResults))) {
-		sb.append(miniBatches + " minibatches in " + (miniBatchTotalTime / 1000f) + " s" + s);
+		sb.append(miniBatches + " batches in " + (miniBatchTotalTime / 1000f) + " s" + s);
 		miniBatchTime = 0;
 	    }
 
diff --git a/nn-core/src/test/java/com/github/neuralnetworks/test/CNNTest.java b/nn-core/src/test/java/com/github/neuralnetworks/test/CNNTest.java
@@ -677,35 +677,4 @@ public void testCNNMLPFF() {
 
 	assertTrue(Arrays.equals(cnnvp.get(cnn.getOutputLayer()).getElements(), mlpvp.get(mlp.getOutputLayer()).getElements()));
     }
-
-    @Test
-    public void testCNNMLPBP() {
-	Environment.getInstance().setExecutionMode(EXECUTION_MODE.SEQ);
-
-	Environment.getInstance().setUseDataSharedMemory(false);
-
-	// CNN
-	NeuralNetworkImpl cnn = NNFactory.convNN(new int[][] { { 2, 1, 1 }, { 1, 1 }, {1} }, false);
-	cnn.setLayerCalculator(NNFactory.lcSigmoid(cnn, null));
-	NNFactory.lcMaxPooling(cnn);
-	FullyConnected cnnfc = (FullyConnected) cnn.getOutputLayer().getConnections().get(0);
-	cnnfc.getWeights().set(0.05f, 0, 0);
-	cnnfc.getWeights().set(0.08f, 0, 1);
-
-	// MLP
-	NeuralNetworkImpl mlp = NNFactory.mlpSigmoid(new int[] { 2, 1 }, false);
-	FullyConnected mlpfc = (FullyConnected) mlp.getOutputLayer().getConnections().get(0);
-	mlpfc.getWeights().set(0.05f, 0, 0);
-	mlpfc.getWeights().set(0.08f, 0, 1);
-
-	// compare bp
-	SimpleInputProvider inputProvider = new SimpleInputProvider(new float[][] { { 0.35f, 0.9f }, { 0.8f, 0.2f } }, new float[][] { { 0.5f }, { 0.8f } });
-	BackPropagationTrainer<?> cnnbpt = TrainerFactory.backPropagation(cnn, inputProvider, null, null, null, 1f, 0f, 0f, 0f, 0f, 1, 1, 20);
-	cnnbpt.train();
-
-	BackPropagationTrainer<?> mlpbpt = TrainerFactory.backPropagation(mlp, inputProvider, null, null, null, 1f, 0f, 0f, 0f, 0f, 1, 1, 20);
-	mlpbpt.train();
-
-	assertTrue(Arrays.equals(cnnfc.getWeights().getElements(), mlpfc.getWeights().getElements()));
-    }
 }
diff --git a/nn-samples/src/test/java/com/github/neuralnetworks/samples/test/XorTest.java b/nn-samples/src/test/java/com/github/neuralnetworks/samples/test/XorTest.java
@@ -1,10 +1,14 @@
 package com.github.neuralnetworks.samples.test;
 
 import static org.junit.Assert.assertEquals;
+import static org.junit.Assert.assertTrue;
+
+import java.util.Arrays;
 
 import org.junit.Test;
 
 import com.amd.aparapi.Kernel.EXECUTION_MODE;
+import com.github.neuralnetworks.architecture.FullyConnected;
 import com.github.neuralnetworks.architecture.NeuralNetworkImpl;
 import com.github.neuralnetworks.architecture.types.NNFactory;
 import com.github.neuralnetworks.samples.xor.XorOutputError;
@@ -26,15 +30,20 @@ public void testMLPSigmoidBP() {
 	Environment.getInstance().setExecutionMode(EXECUTION_MODE.SEQ);
 
 	// create multi layer perceptron with one hidden layer and bias
-	Environment.getInstance().setUseWeightsSharedMemory(true);
-	NeuralNetworkImpl mlp = NNFactory.mlpSigmoid(new int[] { 2, 8, 1 }, true);
+	Environment.getInstance().setUseWeightsSharedMemory(false);
+	Environment.getInstance().setUseDataSharedMemory(false);
+	//NeuralNetworkImpl mlp = NNFactory.mlpSigmoid(new int[] { 2, 4, 1 }, false);
+	NeuralNetworkImpl mlp = NNFactory.convNN(new int[][] { { 2, 1, 1 }, { 1, 1 }, { 4 }, {1} }, false);
+	//NeuralNetworkImpl mlp = NNFactory.convNN(new int[][] { {2, 1, 1}, {4}, {1} }, false);
+	mlp.setLayerCalculator(NNFactory.lcSigmoid(mlp, null));
+	NNFactory.lcMaxPooling(mlp);
+
 
 	// create training and testing input providers
-	SimpleInputProvider trainingInput = new SimpleInputProvider(new float[][] { {0, 0}, {0, 1}, {1, 0}, {1, 1} }, new float[][] { {0}, {1}, {1}, {0} });
-	SimpleInputProvider testingInput = new SimpleInputProvider(new float[][] { {0, 0}, {0, 1}, {1, 0}, {1, 1} }, new float[][] { {0}, {1}, {1}, {0} });
+	SimpleInputProvider input = new SimpleInputProvider(new float[][] { {0, 0}, {0, 1}, {1, 0}, {1, 1} }, new float[][] { {0}, {1}, {1}, {0} });
 
 	// create backpropagation trainer for the network
-	BackPropagationTrainer<?> bpt = TrainerFactory.backPropagation(mlp, trainingInput, testingInput, new XorOutputError(), new NNRandomInitializer(new MersenneTwisterRandomInitializer(-0.01f, 0.01f)), 1f, 0.5f, 0f, 0f, 0f, 1, 1, 2500);
+	BackPropagationTrainer<?> bpt = TrainerFactory.backPropagation(mlp, input, input, new XorOutputError(), new NNRandomInitializer(new MersenneTwisterRandomInitializer(-0.01f, 0.01f)), 1f, 0.5f, 0f, 0f, 0f, 1, 1, 50000);
 
 	// add logging
 	bpt.addEventListener(new LogTrainingListener(Thread.currentThread().getStackTrace()[1].getMethodName()));
@@ -50,4 +59,62 @@ public void testMLPSigmoidBP() {
 
 	assertEquals(0, bpt.getOutputError().getTotalNetworkError(), 0.1);
     }
+
+    @Test
+    public void testCNNMLPBP() {
+	Environment.getInstance().setExecutionMode(EXECUTION_MODE.SEQ);
+
+	Environment.getInstance().setUseDataSharedMemory(true);
+	Environment.getInstance().setUseWeightsSharedMemory(true);
+
+	// CNN
+	NeuralNetworkImpl cnn = NNFactory.convNN(new int[][] { { 2, 1, 1 }, { 1, 1 }, { 4 }, {1} }, false);
+	cnn.setLayerCalculator(NNFactory.lcSigmoid(cnn, null));
+	NNFactory.lcMaxPooling(cnn);
+	FullyConnected cnnfci = (FullyConnected) cnn.getOutputLayer().getConnections().get(0).getInputLayer().getConnections().get(0);
+	cnnfci.getWeights().set(0.02f, 0, 0);
+	cnnfci.getWeights().set(0.01f, 1, 0);
+	cnnfci.getWeights().set(0.03f, 2, 0);
+	cnnfci.getWeights().set(0.001f, 3, 0);
+	cnnfci.getWeights().set(0.005f, 0, 1);
+	cnnfci.getWeights().set(0.04f, 1, 1);
+	cnnfci.getWeights().set(0.02f, 2, 1);
+	cnnfci.getWeights().set(0.009f, 3, 1);
+
+	FullyConnected cnnfco = (FullyConnected) cnn.getOutputLayer().getConnections().get(0);
+	cnnfco.getWeights().set(0.05f, 0, 0);
+	cnnfco.getWeights().set(0.08f, 0, 1);
+
+	// MLP
+	NeuralNetworkImpl mlp = NNFactory.mlpSigmoid(new int[] { 2, 4, 1 }, false);
+
+	FullyConnected mlpfci = (FullyConnected) mlp.getOutputLayer().getConnections().get(0).getInputLayer().getConnections().get(0);
+	mlpfci.getWeights().set(0.02f, 0, 0);
+	mlpfci.getWeights().set(0.01f, 1, 0);
+	mlpfci.getWeights().set(0.03f, 2, 0);
+	mlpfci.getWeights().set(0.001f, 3, 0);
+	mlpfci.getWeights().set(0.005f, 0, 1);
+	mlpfci.getWeights().set(0.04f, 1, 1);
+	mlpfci.getWeights().set(0.02f, 2, 1);
+	mlpfci.getWeights().set(0.009f, 3, 1);
+
+	FullyConnected mlpfco = (FullyConnected) mlp.getOutputLayer().getConnections().get(0);
+	mlpfco.getWeights().set(0.05f, 0, 0);
+	mlpfco.getWeights().set(0.08f, 0, 1);
+
+	// compare bp
+	SimpleInputProvider inputProvider = new SimpleInputProvider(new float[][] { {0, 0}, {0, 1}, {1, 0}, {1, 1} }, new float[][] { {0}, {1}, {1}, {0} });
+
+	BackPropagationTrainer<?> mlpbpt = TrainerFactory.backPropagation(mlp, inputProvider, inputProvider, new XorOutputError(), null, 1f, 0f, 0f, 0f, 0f, 1, 1, 10000);
+	mlpbpt.train();
+	mlpbpt.test();
+
+	BackPropagationTrainer<?> cnnbpt = TrainerFactory.backPropagation(cnn, inputProvider, inputProvider, new XorOutputError(), null, 1f, 0f, 0f, 0f, 0f, 1, 1, 10000);
+	cnnbpt.train();
+	cnnbpt.test();
+
+	assertEquals(mlpbpt.getOutputError().getTotalNetworkError(), cnnbpt.getOutputError().getTotalNetworkError(), 0);
+	assertTrue(Arrays.equals(cnnfco.getWeights().getElements(), mlpfco.getWeights().getElements()));
+	assertTrue(Arrays.equals(cnnfci.getWeights().getElements(), mlpfci.getWeights().getElements()));
+    }
 }