Merge pull request #18 from interesaaat/LibTorchSharpFirstTest

interesaaat · web-flow · commit ecf6b90cd59b · 2019-04-28T17:08:34.000-07:00
Add the ability to specify loss functions as delegates
diff --git a/Examples/MNIST.cs b/Examples/MNIST.cs
@@ -2,6 +2,7 @@
 using System.Collections.Generic;
 using System.Diagnostics;
 using TorchSharp.Tensor;
+using static TorchSharp.NN.LossFunction;
 
 namespace TorchSharp.Examples
 {
@@ -28,8 +29,8 @@ static void Main(string[] args)
 
                 for (var epoch = 1; epoch <= _epochs; epoch++)
                 {
-                    Train(model, optimizer, train, epoch, _trainBatchSize, train.Size());
-                    Test(model, test, test.Size());
+                    Train(model, optimizer, NLL(), train, epoch, _trainBatchSize, train.Size());
+                    Test(model, NLL(reduction: NN.Reduction.Sum), test, test.Size());
                 }
 
                 sw.Stop();
@@ -79,6 +80,7 @@ public override TorchTensor Forward(TorchTensor input)
         private static void Train(
             NN.Module model, 
             NN.Optimizer optimizer,
+            Loss loss,
             IEnumerable<(TorchTensor, TorchTensor)> dataLoader,
             int epoch,
             long batchSize, 
@@ -92,16 +94,16 @@ private static void Train(
             {
                 optimizer.ZeroGrad();
 
-                using (var output = model.Forward(data))
-                using (var loss = NN.LossFunction.NLL(output, target))
+                using (var prediction = model.Forward(data))
+                using (var output = loss(prediction, target))
                 {
-                    loss.Backward();
+                    output.Backward();
 
                     optimizer.Step();
 
                     if (batchId % _logInterval == 0)
                     {
-                        Console.WriteLine($"\rTrain: epoch {epoch} [{batchId * batchSize} / {size}] Loss: {loss.DataItem<float>()}");
+                        Console.WriteLine($"\rTrain: epoch {epoch} [{batchId * batchSize} / {size}] Loss: {output.DataItem<float>()}");
                     }
 
                     batchId++;
@@ -114,6 +116,7 @@ private static void Train(
 
         private static void Test(
             NN.Module model,
+            Loss loss,
             IEnumerable<(TorchTensor, TorchTensor)> dataLoader,
             long size)
         {
@@ -124,10 +127,10 @@ private static void Test(
 
             foreach (var (data, target) in dataLoader)
             {
-                using (var output = model.Forward(data))
-                using (var loss = NN.LossFunction.NLL(output, target, reduction: NN.Reduction.Sum))
+                using (var prediction = model.Forward(data))
+                using (var output = loss(prediction, target))
                 {
-                    testLoss += loss.DataItem<float>();
+                    testLoss += output.DataItem<float>();
 
                     var pred = output.Argmax(1);
 
diff --git a/Test/TorchSharp/TorchSharp.cs b/Test/TorchSharp/TorchSharp.cs
@@ -431,9 +431,10 @@ public void EvalLossSequence()
             var y = FloatTensor.RandomN(new long[] { 64, 10 }, device: "cpu:0");
 
             var eval = seq.Forward(x);
-            var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.Sum);
+            var loss = NN.LossFunction.MSE(NN.Reduction.Sum);
+            var output = loss(eval, y);
 
-            var result = loss.DataItem<float>();
+            var result = output.DataItem<float>();
             Assert.IsNotNull(result);
         }
 
@@ -444,9 +445,9 @@ public void TestPoissonNLLLoss()
             using (TorchTensor target = FloatTensor.From(new float[] { 1f, 2f, 3f }))
             {
                 var componentWiseLoss = ((TorchTensor)input.Exp()) - target * input;
-                Assert.IsTrue(componentWiseLoss.Equal(NN.LossFunction.PoissonNLL(input, target, reduction: NN.Reduction.None)));
-                Assert.IsTrue(componentWiseLoss.Sum().Equal(NN.LossFunction.PoissonNLL(input, target, reduction: NN.Reduction.Sum)));
-                Assert.IsTrue(componentWiseLoss.Mean().Equal(NN.LossFunction.PoissonNLL(input, target, reduction: NN.Reduction.Mean)));
+                Assert.IsTrue(componentWiseLoss.Equal(NN.LossFunction.PoissonNLL(reduction: NN.Reduction.None)(input, target)));
+                Assert.IsTrue(componentWiseLoss.Sum().Equal(NN.LossFunction.PoissonNLL(reduction: NN.Reduction.Sum)(input, target)));
+                Assert.IsTrue(componentWiseLoss.Mean().Equal(NN.LossFunction.PoissonNLL(reduction: NN.Reduction.Mean)(input, target)));
             }
         }
 
@@ -456,7 +457,7 @@ public void TestPoissonNLLLoss2()
             using (TorchTensor input = FloatTensor.Random(new long[] { 5, 2 }))
             using (TorchTensor target = FloatTensor.Random(new long[] { 5, 2 }))
             {
-                Assert.IsNotNull(NN.LossFunction.PoissonNLL(input, target, true, true));
+                Assert.IsNotNull(NN.LossFunction.PoissonNLL(true, true)(input, target));
             }
         }
 
@@ -481,11 +482,12 @@ public void TestBackward()
             var y = FloatTensor.RandomN(new long[] { 64, 10 }, device: "cpu:0");
 
             var eval = seq.Forward(x);
-            var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.None);
+            var loss = NN.LossFunction.MSE(NN.Reduction.None);
+            var output = loss(eval, y);
 
             seq.ZeroGrad();
 
-            loss.Backward();
+            output.Backward();
         }
 
         [TestMethod]
@@ -499,11 +501,12 @@ public void TestGettingParameters()
             var y = FloatTensor.RandomN(new long[] { 64, 10 }, device: "cpu:0");
 
             var eval = seq.Forward(x);
-            var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.None);
+            var loss = NN.LossFunction.MSE(NN.Reduction.None);
+            var output = loss(eval, y);
 
             seq.ZeroGrad();
 
-            loss.Backward();
+            output.Backward();
 
             foreach (var parm in seq.Parameters())
             {
@@ -522,11 +525,12 @@ public void TestGrad()
             var y = FloatTensor.RandomN(new long[] { 64, 10 }, device: "cpu:0");
 
             var eval = seq.Forward(x);
-            var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.None);
+            var loss = NN.LossFunction.MSE(NN.Reduction.None);
+            var output = loss(eval, y);
 
             seq.ZeroGrad();
 
-            loss.Backward();
+            output.Backward();
 
             foreach (var parm in seq.Parameters())
             {
@@ -658,19 +662,20 @@ public void TestTraining()
 
             float learning_rate = 0.00004f;
             float prevLoss = float.MaxValue;
+            var loss = NN.LossFunction.MSE(NN.Reduction.Sum);
 
             for (int i = 0; i < 10; i++)
             {
                 var eval = seq.Forward(x);
-                var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.Sum);
-                var lossVal = loss.DataItem<float>();
+                var output = loss(eval, y);
+                var lossVal = output.DataItem<float>();
 
                 Assert.IsTrue(lossVal < prevLoss);
                 prevLoss = lossVal;
 
                 seq.ZeroGrad();
 
-                loss.Backward();
+                output.Backward();
 
                 using (var noGrad = new AutoGradMode(false))
                 {
@@ -715,19 +720,20 @@ public void TestTrainingAdam()
             double learning_rate = 0.00004f;
             float prevLoss = float.MaxValue;
             var optimizer = NN.Optimizer.Adam(seq.Parameters(), learning_rate);
+            var loss = NN.LossFunction.MSE(NN.Reduction.Sum);
 
             for (int i = 0; i < 10; i++)
             {
                 var eval = seq.Forward(x);
-                var loss = NN.LossFunction.MSE(eval, y, NN.Reduction.Sum);
-                var lossVal = loss.DataItem<float>();
+                var output = loss(eval, y);
+                var lossVal = output.DataItem<float>();
 
                 Assert.IsTrue(lossVal < prevLoss);
                 prevLoss = lossVal;
 
                 optimizer.ZeroGrad();
 
-                loss.Backward();
+                output.Backward();
 
                 optimizer.Step();
             }
diff --git a/TorchSharp/NN/LossFunction.cs b/TorchSharp/NN/LossFunction.cs
@@ -9,36 +9,38 @@ namespace TorchSharp.NN
     /// </summary>
     public class LossFunction
     {
+        public delegate TorchTensor Loss(TorchTensor source, TorchTensor target);
+
         [DllImport("libTorchSharp")]
         extern static IntPtr THSNN_lossBCE(IntPtr srct, IntPtr trgt, IntPtr wgt, long reduction);
 
-        public static TorchTensor BCE<T, U>(TorchTensor src, TorchTensor target, TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)
+        public static Loss BCE(TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)
         {
-            return new TorchTensor(THSNN_lossBCE(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));
+            return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossBCE(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));
         }
 
         [DllImport("libTorchSharp")]
         extern static IntPtr THSNN_lossMSE(IntPtr srct, IntPtr trgt, long reduction);
 
-        public static TorchTensor MSE(TorchTensor src, TorchTensor target, Reduction reduction = Reduction.Mean)
+        public static Loss MSE(Reduction reduction = Reduction.Mean)
         {
-            return new TorchTensor(THSNN_lossMSE(src.Handle, target.Handle, (long)reduction));
+            return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossMSE(src.Handle, target.Handle, (long)reduction));
         }
 
         [DllImport("libTorchSharp")]
         extern static IntPtr THSNN_lossNLL(IntPtr srct, IntPtr trgt, IntPtr wgt, long reduction);
 
-        public static TorchTensor NLL(TorchTensor src, TorchTensor target, TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)
+        public static Loss NLL(TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)
         {
-            return new TorchTensor(THSNN_lossNLL(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));
+            return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossNLL(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));
         }
 
         [DllImport("libTorchSharp")]
         extern static IntPtr THSNN_lossPoissonNLL(IntPtr srct, IntPtr trgt, bool logInput, bool full, float eps, long reduction);
 
-        public static TorchTensor PoissonNLL(TorchTensor src, TorchTensor target, bool logInput = true, bool full = false, float eps = 1e-8f, Reduction reduction = Reduction.Mean)
+        public static Loss PoissonNLL(bool logInput = true, bool full = false, float eps = 1e-8f, Reduction reduction = Reduction.Mean)
         {
-            return new TorchTensor(THSNN_lossPoissonNLL(src.Handle, target.Handle, logInput, full, eps, (long)reduction));
+            return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossPoissonNLL(src.Handle, target.Handle, logInput, full, eps, (long)reduction));
         }
     }
 

Original file line number	Diff line number	Diff line change
`@@ -2,6 +2,7 @@`
`2`	`2`	`using System.Collections.Generic;`
`3`	`3`	`using System.Diagnostics;`
`4`	`4`	`using TorchSharp.Tensor;`
	`5`	`+using static TorchSharp.NN.LossFunction;`
`5`	`6`
`6`	`7`	`namespace TorchSharp.Examples`
`7`	`8`	`{`
`@@ -28,8 +29,8 @@ static void Main(string[] args)`
`28`	`29`
`29`	`30`	`for (var epoch = 1; epoch <= _epochs; epoch++)`
`30`	`31`	`{`
`31`		`- Train(model, optimizer, train, epoch, _trainBatchSize, train.Size());`
`32`		`- Test(model, test, test.Size());`
	`32`	`+ Train(model, optimizer, NLL(), train, epoch, _trainBatchSize, train.Size());`
	`33`	`+ Test(model, NLL(reduction: NN.Reduction.Sum), test, test.Size());`
`33`	`34`	`}`
`34`	`35`
`35`	`36`	`sw.Stop();`
`@@ -79,6 +80,7 @@ public override TorchTensor Forward(TorchTensor input)`
`79`	`80`	`private static void Train(`
`80`	`81`	`NN.Module model,`
`81`	`82`	`NN.Optimizer optimizer,`
	`83`	`+ Loss loss,`
`82`	`84`	`IEnumerable<(TorchTensor, TorchTensor)> dataLoader,`
`83`	`85`	`int epoch,`
`84`	`86`	`long batchSize,`
`@@ -92,16 +94,16 @@ private static void Train(`
`92`	`94`	`{`
`93`	`95`	`optimizer.ZeroGrad();`
`94`	`96`
`95`		`- using (var output = model.Forward(data))`
`96`		`- using (var loss = NN.LossFunction.NLL(output, target))`
	`97`	`+ using (var prediction = model.Forward(data))`
	`98`	`+ using (var output = loss(prediction, target))`
`97`	`99`	`{`
`98`		`- loss.Backward();`
	`100`	`+ output.Backward();`
`99`	`101`
`100`	`102`	`optimizer.Step();`
`101`	`103`
`102`	`104`	`if (batchId % _logInterval == 0)`
`103`	`105`	`{`
`104`		`- Console.WriteLine($"\rTrain: epoch {epoch} [{batchId * batchSize} / {size}] Loss: {loss.DataItem<float>()}");`
	`106`	`+ Console.WriteLine($"\rTrain: epoch {epoch} [{batchId * batchSize} / {size}] Loss: {output.DataItem<float>()}");`
`105`	`107`	`}`
`106`	`108`
`107`	`109`	`batchId++;`
`@@ -114,6 +116,7 @@ private static void Train(`
`114`	`116`
`115`	`117`	`private static void Test(`
`116`	`118`	`NN.Module model,`
	`119`	`+ Loss loss,`
`117`	`120`	`IEnumerable<(TorchTensor, TorchTensor)> dataLoader,`
`118`	`121`	`long size)`
`119`	`122`	`{`
`@@ -124,10 +127,10 @@ private static void Test(`
`124`	`127`
`125`	`128`	`foreach (var (data, target) in dataLoader)`
`126`	`129`	`{`
`127`		`- using (var output = model.Forward(data))`
`128`		`- using (var loss = NN.LossFunction.NLL(output, target, reduction: NN.Reduction.Sum))`
	`130`	`+ using (var prediction = model.Forward(data))`
	`131`	`+ using (var output = loss(prediction, target))`
`129`	`132`	`{`
`130`		`- testLoss += loss.DataItem<float>();`
	`133`	`+ testLoss += output.DataItem<float>();`
`131`	`134`
`132`	`135`	`var pred = output.Argmax(1);`
`133`	`136`
Original file line number	Diff line number	Diff line change
`@@ -9,36 +9,38 @@ namespace TorchSharp.NN`
`9`	`9`	`/// </summary>`
`10`	`10`	`public class LossFunction`
`11`	`11`	`{`
	`12`	`+ public delegate TorchTensor Loss(TorchTensor source, TorchTensor target);`
	`13`	`+`
`12`	`14`	`[DllImport("libTorchSharp")]`
`13`	`15`	`extern static IntPtr THSNN_lossBCE(IntPtr srct, IntPtr trgt, IntPtr wgt, long reduction);`
`14`	`16`
`15`		`- public static TorchTensor BCE<T, U>(TorchTensor src, TorchTensor target, TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)`
	`17`	`+ public static Loss BCE(TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)`
`16`	`18`	`{`
`17`		`- return new TorchTensor(THSNN_lossBCE(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));`
	`19`	`+ return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossBCE(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));`
`18`	`20`	`}`
`19`	`21`
`20`	`22`	`[DllImport("libTorchSharp")]`
`21`	`23`	`extern static IntPtr THSNN_lossMSE(IntPtr srct, IntPtr trgt, long reduction);`
`22`	`24`
`23`		`- public static TorchTensor MSE(TorchTensor src, TorchTensor target, Reduction reduction = Reduction.Mean)`
	`25`	`+ public static Loss MSE(Reduction reduction = Reduction.Mean)`
`24`	`26`	`{`
`25`		`- return new TorchTensor(THSNN_lossMSE(src.Handle, target.Handle, (long)reduction));`
	`27`	`+ return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossMSE(src.Handle, target.Handle, (long)reduction));`
`26`	`28`	`}`
`27`	`29`
`28`	`30`	`[DllImport("libTorchSharp")]`
`29`	`31`	`extern static IntPtr THSNN_lossNLL(IntPtr srct, IntPtr trgt, IntPtr wgt, long reduction);`
`30`	`32`
`31`		`- public static TorchTensor NLL(TorchTensor src, TorchTensor target, TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)`
	`33`	`+ public static Loss NLL(TorchTensor? weigths = null, Reduction reduction = Reduction.Mean)`
`32`	`34`	`{`
`33`		`- return new TorchTensor(THSNN_lossNLL(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));`
	`35`	`+ return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossNLL(src.Handle, target.Handle, weigths?.Handle ?? IntPtr.Zero, (long)reduction));`
`34`	`36`	`}`
`35`	`37`
`36`	`38`	`[DllImport("libTorchSharp")]`
`37`	`39`	`extern static IntPtr THSNN_lossPoissonNLL(IntPtr srct, IntPtr trgt, bool logInput, bool full, float eps, long reduction);`
`38`	`40`
`39`		`- public static TorchTensor PoissonNLL(TorchTensor src, TorchTensor target, bool logInput = true, bool full = false, float eps = 1e-8f, Reduction reduction = Reduction.Mean)`
	`41`	`+ public static Loss PoissonNLL(bool logInput = true, bool full = false, float eps = 1e-8f, Reduction reduction = Reduction.Mean)`
`40`	`42`	`{`
`41`		`- return new TorchTensor(THSNN_lossPoissonNLL(src.Handle, target.Handle, logInput, full, eps, (long)reduction));`
	`43`	`+ return (TorchTensor src, TorchTensor target) => new TorchTensor(THSNN_lossPoissonNLL(src.Handle, target.Handle, logInput, full, eps, (long)reduction));`
`42`	`44`	`}`
`43`	`45`	`}`
`44`	`46`