Edits following Artidoro review

interesaaat · interesaaat · commit 471053f385f2 · 2019-04-28T12:08:31.000-07:00
diff --git a/Examples/MNIST.cs b/Examples/MNIST.cs
@@ -2,6 +2,7 @@
 using System.Collections.Generic;
 using System.Diagnostics;
 using TorchSharp.Tensor;
+using static TorchSharp.NN.LossFunction;
 
 namespace TorchSharp.Examples
 {
@@ -28,8 +29,8 @@ static void Main(string[] args)
 
                 for (var epoch = 1; epoch <= _epochs; epoch++)
                 {
-                    Train(model, optimizer, train, epoch, _trainBatchSize, train.Size());
-                    Test(model, test, test.Size());
+                    Train(model, optimizer, NLL(), train, epoch, _trainBatchSize, train.Size());
+                    Test(model, NLL(reduction: NN.Reduction.Sum), test, test.Size());
                 }
 
                 sw.Stop();
@@ -79,6 +80,7 @@ public override TorchTensor Forward(TorchTensor input)
         private static void Train(
             NN.Module model, 
             NN.Optimizer optimizer,
+            Loss loss,
             IEnumerable<(TorchTensor, TorchTensor)> dataLoader,
             int epoch,
             long batchSize, 
@@ -92,16 +94,16 @@ private static void Train(
             {
                 optimizer.ZeroGrad();
 
-                using (var output = model.Forward(data))
-                using (var loss = NN.LossFunction.NLL(output, target))
+                using (var prediction = model.Forward(data))
+                using (var output = loss(prediction, target))
                 {
-                    loss.Backward();
+                    output.Backward();
 
                     optimizer.Step();
 
                     if (batchId % _logInterval == 0)
                     {
-                        Console.WriteLine($"\rTrain: epoch {epoch} [{batchId * batchSize} / {size}] Loss: {loss.DataItem<float>()}");
+                        Console.WriteLine($"\rTrain: epoch {epoch} [{batchId * batchSize} / {size}] Loss: {output.DataItem<float>()}");
                     }
 
                     batchId++;
@@ -114,6 +116,7 @@ private static void Train(
 
         private static void Test(
             NN.Module model,
+            Loss loss,
             IEnumerable<(TorchTensor, TorchTensor)> dataLoader,
             long size)
         {
@@ -124,10 +127,10 @@ private static void Test(
 
             foreach (var (data, target) in dataLoader)
             {
-                using (var output = model.Forward(data))
-                using (var loss = NN.LossFunction.NLL(output, target, reduction: NN.Reduction.Sum))
+                using (var prediction = model.Forward(data))
+                using (var output = loss(prediction, target))
                 {
-                    testLoss += loss.DataItem<float>();
+                    testLoss += output.DataItem<float>();
 
                     var pred = output.Argmax(1);
 
diff --git a/Test/TorchSharp/TorchSharp.cs b/Test/TorchSharp/TorchSharp.cs
@@ -431,9 +431,10 @@ public void EvalLossSequence()
             var y = FloatTensor.RandomN(new long[] { 64, 10 }, device: "cpu:0");
 
             var eval = seq.Forward(x);
-            var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.Sum);
+            var loss = NN.LossFunction.MSE(NN.Reduction.Sum);
+            var output = loss(eval, y);
 
-            var result = loss.DataItem<float>();
+            var result = output.DataItem<float>();
             Assert.IsNotNull(result);
         }
 
@@ -444,9 +445,9 @@ public void TestPoissonNLLLoss()
             using (TorchTensor target = FloatTensor.From(new float[] { 1f, 2f, 3f }))
             {
                 var componentWiseLoss = ((TorchTensor)input.Exp()) - target * input;
-                Assert.IsTrue(componentWiseLoss.Equal(NN.LossFunction.PoissonNLL(input, target, reduction: NN.Reduction.None)));
-                Assert.IsTrue(componentWiseLoss.Sum().Equal(NN.LossFunction.PoissonNLL(input, target, reduction: NN.Reduction.Sum)));
-                Assert.IsTrue(componentWiseLoss.Mean().Equal(NN.LossFunction.PoissonNLL(input, target, reduction: NN.Reduction.Mean)));
+                Assert.IsTrue(componentWiseLoss.Equal(NN.LossFunction.PoissonNLL(reduction: NN.Reduction.None)(input, target)));
+                Assert.IsTrue(componentWiseLoss.Sum().Equal(NN.LossFunction.PoissonNLL(reduction: NN.Reduction.Sum)(input, target)));
+                Assert.IsTrue(componentWiseLoss.Mean().Equal(NN.LossFunction.PoissonNLL(reduction: NN.Reduction.Mean)(input, target)));
             }
         }
 
@@ -456,7 +457,7 @@ public void TestPoissonNLLLoss2()
             using (TorchTensor input = FloatTensor.Random(new long[] { 5, 2 }))
             using (TorchTensor target = FloatTensor.Random(new long[] { 5, 2 }))
             {
-                Assert.IsNotNull(NN.LossFunction.PoissonNLL(input, target, true, true));
+                Assert.IsNotNull(NN.LossFunction.PoissonNLL(true, true)(input, target));
             }
         }
 
@@ -481,11 +482,12 @@ public void TestBackward()
             var y = FloatTensor.RandomN(new long[] { 64, 10 }, device: "cpu:0");
 
             var eval = seq.Forward(x);
-            var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.None);
+            var loss = NN.LossFunction.MSE(NN.Reduction.None);
+            var output = loss(eval, y);
 
             seq.ZeroGrad();
 
-            loss.Backward();
+            output.Backward();
         }
 
         [TestMethod]
@@ -499,11 +501,12 @@ public void TestGettingParameters()
             var y = FloatTensor.RandomN(new long[] { 64, 10 }, device: "cpu:0");
 
             var eval = seq.Forward(x);
-            var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.None);
+            var loss = NN.LossFunction.MSE(NN.Reduction.None);
+            var output = loss(eval, y);
 
             seq.ZeroGrad();
 
-            loss.Backward();
+            output.Backward();
 
             foreach (var parm in seq.Parameters())
             {
@@ -522,11 +525,12 @@ public void TestGrad()
             var y = FloatTensor.RandomN(new long[] { 64, 10 }, device: "cpu:0");
 
             var eval = seq.Forward(x);
-            var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.None);
+            var loss = NN.LossFunction.MSE(NN.Reduction.None);
+            var output = loss(eval, y);
 
             seq.ZeroGrad();
 
-            loss.Backward();
+            output.Backward();
 
             foreach (var parm in seq.Parameters())
             {
@@ -658,19 +662,20 @@ public void TestTraining()
 
             float learning_rate = 0.00004f;
             float prevLoss = float.MaxValue;
+            var loss = NN.LossFunction.MSE(NN.Reduction.Sum);
 
             for (int i = 0; i < 10; i++)
             {
                 var eval = seq.Forward(x);
-                var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.Sum);
-                var lossVal = loss.DataItem<float>();
+                var output = loss(eval, y);
+                var lossVal = output.DataItem<float>();
 
                 Assert.IsTrue(lossVal < prevLoss);
                 prevLoss = lossVal;
 
                 seq.ZeroGrad();
 
-                loss.Backward();
+                output.Backward();
 
                 using (var noGrad = new AutoGradMode(false))
                 {
@@ -712,37 +717,6 @@ public void TestTrainingAdam()
             var x = FloatTensor.RandomN(new long[] { 64, 1000 }, device: "cpu:0");
             var y = FloatTensor.RandomN(new long[] { 64, 10 }, device: "cpu:0");
 
-            double learning_rate = 0.00004f;
-            float prevLoss = float.MaxValue;
-            var optimizer = NN.Optimizer.Adam(seq.Parameters(), learning_rate);
-
-            for (int i = 0; i < 10; i++)
-            {
-                var eval = seq.Forward(x);
-                var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.Sum);
-                var lossVal = loss.DataItem<float>();
-
-                Assert.IsTrue(lossVal < prevLoss);
-                prevLoss = lossVal;
-
-                optimizer.ZeroGrad();
-
-                loss.Backward();
-
-                optimizer.Step();
-            }
-        }
-
-        [TestMethod]
-        public void TestTrainingAdam2()
-        {
-            var lin1 = NN.Module.Linear(1000, 100);
-            var lin2 = NN.Module.Linear(100, 10);
-            var seq = NN.Module.Sequential(lin1, NN.Module.Relu(), lin2);
-
-            var x = FloatTensor.RandomN(new long[] { 64, 1000 }, device: "cpu:0");
-            var y = FloatTensor.RandomN(new long[] { 64, 10 }, device: "cpu:0");
-
             double learning_rate = 0.00004f;
             float prevLoss = float.MaxValue;
             var optimizer = NN.Optimizer.Adam(seq.Parameters(), learning_rate);
diff --git a/TorchSharp/NN/LossFunction.cs b/TorchSharp/NN/LossFunction.cs
@@ -14,11 +14,6 @@ public class LossFunction
         [DllImport("libTorchSharp")]
         extern static IntPtr THSNN_lossBCE(IntPtr srct, IntPtr trgt, IntPtr wgt, long reduction);
 
-        public static TorchTensor BCE(TorchTensor src, TorchTensor target, TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)
-        {
-            return new TorchTensor(THSNN_lossBCE(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));
-        }
-
         public static Loss BCE(TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)
         {
             return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossBCE(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));
@@ -27,11 +22,6 @@ public static Loss BCE(TorchTensor? weigths = null, Reduction reduction = Reduct
         [DllImport("libTorchSharp")]
         extern static IntPtr THSNN_lossMSE(IntPtr srct, IntPtr trgt, long reduction);
 
-        public static TorchTensor MSE(TorchTensor src, TorchTensor target, Reduction reduction = Reduction.Mean)
-        {
-            return new TorchTensor(THSNN_lossMSE(src.Handle, target.Handle, (long)reduction));
-        }
-
         public static Loss MSE(Reduction reduction = Reduction.Mean)
         {
             return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossMSE(src.Handle, target.Handle, (long)reduction));
@@ -40,11 +30,6 @@ public static Loss MSE(Reduction reduction = Reduction.Mean)
         [DllImport("libTorchSharp")]
         extern static IntPtr THSNN_lossNLL(IntPtr srct, IntPtr trgt, IntPtr wgt, long reduction);
 
-        public static TorchTensor NLL(TorchTensor src, TorchTensor target, TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)
-        {
-            return new TorchTensor(THSNN_lossNLL(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));
-        }
-
         public static Loss NLL(TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)
         {
             return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossNLL(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));
@@ -53,11 +38,6 @@ public static Loss NLL(TorchTensor? weigths = null, Reduction reduction = Reduct
         [DllImport("libTorchSharp")]
         extern static IntPtr THSNN_lossPoissonNLL(IntPtr srct, IntPtr trgt, bool logInput, bool full, float eps, long reduction);
 
-        public static TorchTensor PoissonNLL(TorchTensor src, TorchTensor target, bool logInput = true, bool full = false, float eps = 1e-8f, Reduction reduction = Reduction.Mean)
-        {
-            return new TorchTensor(THSNN_lossPoissonNLL(src.Handle, target.Handle, logInput, full, eps, (long)reduction));
-        }
-
         public static Loss PoissonNLL(bool logInput = true, bool full = false, float eps = 1e-8f, Reduction reduction = Reduction.Mean)
         {
             return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossPoissonNLL(src.Handle, target.Handle, logInput, full, eps, (long)reduction));

Original file line number	Diff line number	Diff line change
`@@ -2,6 +2,7 @@`
`2`	`2`	`using System.Collections.Generic;`
`3`	`3`	`using System.Diagnostics;`
`4`	`4`	`using TorchSharp.Tensor;`
	`5`	`+using static TorchSharp.NN.LossFunction;`
`5`	`6`
`6`	`7`	`namespace TorchSharp.Examples`
`7`	`8`	`{`
`@@ -28,8 +29,8 @@ static void Main(string[] args)`
`28`	`29`
`29`	`30`	`for (var epoch = 1; epoch <= _epochs; epoch++)`
`30`	`31`	`{`
`31`		`- Train(model, optimizer, train, epoch, _trainBatchSize, train.Size());`
`32`		`- Test(model, test, test.Size());`
	`32`	`+ Train(model, optimizer, NLL(), train, epoch, _trainBatchSize, train.Size());`
	`33`	`+ Test(model, NLL(reduction: NN.Reduction.Sum), test, test.Size());`
`33`	`34`	`}`
`34`	`35`
`35`	`36`	`sw.Stop();`
`@@ -79,6 +80,7 @@ public override TorchTensor Forward(TorchTensor input)`
`79`	`80`	`private static void Train(`
`80`	`81`	`NN.Module model,`
`81`	`82`	`NN.Optimizer optimizer,`
	`83`	`+ Loss loss,`
`82`	`84`	`IEnumerable<(TorchTensor, TorchTensor)> dataLoader,`
`83`	`85`	`int epoch,`
`84`	`86`	`long batchSize,`
`@@ -92,16 +94,16 @@ private static void Train(`
`92`	`94`	`{`
`93`	`95`	`optimizer.ZeroGrad();`
`94`	`96`
`95`		`- using (var output = model.Forward(data))`
`96`		`- using (var loss = NN.LossFunction.NLL(output, target))`
	`97`	`+ using (var prediction = model.Forward(data))`
	`98`	`+ using (var output = loss(prediction, target))`
`97`	`99`	`{`
`98`		`- loss.Backward();`
	`100`	`+ output.Backward();`
`99`	`101`
`100`	`102`	`optimizer.Step();`
`101`	`103`
`102`	`104`	`if (batchId % _logInterval == 0)`
`103`	`105`	`{`
`104`		`- Console.WriteLine($"\rTrain: epoch {epoch} [{batchId * batchSize} / {size}] Loss: {loss.DataItem<float>()}");`
	`106`	`+ Console.WriteLine($"\rTrain: epoch {epoch} [{batchId * batchSize} / {size}] Loss: {output.DataItem<float>()}");`
`105`	`107`	`}`
`106`	`108`
`107`	`109`	`batchId++;`
`@@ -114,6 +116,7 @@ private static void Train(`
`114`	`116`
`115`	`117`	`private static void Test(`
`116`	`118`	`NN.Module model,`
	`119`	`+ Loss loss,`
`117`	`120`	`IEnumerable<(TorchTensor, TorchTensor)> dataLoader,`
`118`	`121`	`long size)`
`119`	`122`	`{`
`@@ -124,10 +127,10 @@ private static void Test(`
`124`	`127`
`125`	`128`	`foreach (var (data, target) in dataLoader)`
`126`	`129`	`{`
`127`		`- using (var output = model.Forward(data))`
`128`		`- using (var loss = NN.LossFunction.NLL(output, target, reduction: NN.Reduction.Sum))`
	`130`	`+ using (var prediction = model.Forward(data))`
	`131`	`+ using (var output = loss(prediction, target))`
`129`	`132`	`{`
`130`		`- testLoss += loss.DataItem<float>();`
	`133`	`+ testLoss += output.DataItem<float>();`
`131`	`134`
`132`	`135`	`var pred = output.Argmax(1);`
`133`	`136`