Added abstract class to create mixture models

mandar2812 · mandar2812 · commit 0deabc5ce817 · 2017-06-21T19:48:29.000+02:00
diff --git a/dynaml-core/src/main/scala-2.11/io/github/mandar2812/dynaml/models/sgp/ESGPModel.scala b/dynaml-core/src/main/scala-2.11/io/github/mandar2812/dynaml/models/sgp/ESGPModel.scala
@@ -39,12 +39,13 @@ import org.apache.log4j.Logger
 import scala.reflect.ClassTag
 
 /**
-  * @author mandar2812 date: 28/02/2017.
-  *
   * Implementation of Extended Skew-Gaussian Process regression model.
   * This is represented with a finite dimensional [[BlockedMESNRV]]
   * distribution of Adcock and Schutes.
-  */
+  *
+  * @author mandar2812 date 28/02/2017.
+  *
+  * */
 abstract class ESGPModel[T, I: ClassTag](
   cov: LocalScalarKernel[I], n: LocalScalarKernel[I],
   data: T, num: Int, lambda: Double, tau: Double,
diff --git a/dynaml-core/src/main/scala-2.11/io/github/mandar2812/dynaml/models/stp/AbstractSTPRegressionModel.scala b/dynaml-core/src/main/scala-2.11/io/github/mandar2812/dynaml/models/stp/AbstractSTPRegressionModel.scala
@@ -36,9 +36,10 @@ import org.apache.log4j.Logger
 import scala.reflect.ClassTag
 
 /**
-  * @author mandar2812 date 26/08/16.
   * Implementation of a Students' T Regression model.
-  */
+  * @author mandar2812 date 26/08/16.
+  *
+  * */
 abstract class AbstractSTPRegressionModel[T, I](
   mu: Double, cov: LocalScalarKernel[I],
   n: LocalScalarKernel[I],
diff --git a/dynaml-core/src/main/scala-2.11/io/github/mandar2812/dynaml/optimization/GloballyOptimizable.scala b/dynaml-core/src/main/scala-2.11/io/github/mandar2812/dynaml/optimization/GloballyOptimizable.scala
@@ -19,13 +19,13 @@ under the License.
 package io.github.mandar2812.dynaml.optimization
 
 /**
- * @author mandar2812, datum: 23/6/15.
- *
- * We define a common binding
- * characteristic between all "globally optimizable"
- * models i.e. models where hyper-parameters can
- * be optimized/tuned.
- */
+  * A common binding characteristic between all "globally optimizable"
+  * models i.e. models where hyper-parameters can
+  * be optimized/tuned.
+  *
+  * @author mandar2812, date 23/6/15.
+  *
+  * */
 trait GloballyOptimizable {
 
   /**
diff --git a/dynaml-core/src/main/scala-2.11/io/github/mandar2812/dynaml/optimization/MixtureMachine.scala b/dynaml-core/src/main/scala-2.11/io/github/mandar2812/dynaml/optimization/MixtureMachine.scala
@@ -0,0 +1,131 @@
+package io.github.mandar2812.dynaml.optimization
+
+import breeze.linalg.{DenseMatrix, DenseVector}
+import breeze.stats.distributions.{ContinuousDistr, Moments}
+import io.github.mandar2812.dynaml.models.{ContinuousProcessModel, GenContinuousMixtureModel, SecondOrderProcessModel}
+import io.github.mandar2812.dynaml.pipes.{DataPipe, DataPipe2}
+import io.github.mandar2812.dynaml.probability.ContinuousRVWithDistr
+import io.github.mandar2812.dynaml.probability.distributions.HasErrorBars
+
+import scala.reflect.ClassTag
+
+/**
+  * Created by mandar on 21/06/2017.
+  */
+abstract class MixtureMachine[
+T, I: ClassTag, Y, YDomain, YDomainVar,
+BaseDistr <: ContinuousDistr[YDomain]
+  with Moments[YDomain, YDomainVar]
+  with HasErrorBars[YDomain],
+W1 <: ContinuousRVWithDistr[YDomain, BaseDistr],
+BaseProcess <: ContinuousProcessModel[T, I, Y, W1]
+  with SecondOrderProcessModel[T, I, Y, Double, DenseMatrix[Double], W1]
+  with GloballyOptimizable](model: BaseProcess) extends
+  AbstractCSA[BaseProcess, GenContinuousMixtureModel[
+      T, I, Y, YDomain, YDomainVar,
+      BaseDistr, W1, BaseProcess]](model) {
+
+
+  val confToModel: DataPipe[Map[String, Double], BaseProcess]
+
+  val mixturePipe: DataPipe2[
+    Seq[BaseProcess],
+    DenseVector[Double],
+    GenContinuousMixtureModel[
+      T, I, Y, YDomain, YDomainVar,
+      BaseDistr, W1, BaseProcess]]
+
+
+  protected var policy: String = "CSA"
+
+  protected var baselinePolicy: String = "max"
+
+  def _policy = policy
+
+  def setPolicy(p: String): this.type = {
+    if(p == "CSA" || p == "Coupled Simulated Annealing")
+      policy = "CSA"
+    else
+      policy = "GS"
+
+    this
+  }
+
+  def setBaseLinePolicy(p: String): this.type = {
+
+    if(p == "avg" || p == "mean" || p == "average")
+      baselinePolicy = "mean"
+    else if(p == "min")
+      baselinePolicy = "min"
+    else if(p == "max")
+      baselinePolicy = "max"
+    else
+      baselinePolicy = "mean"
+
+    this
+  }
+
+  protected def calculateEnergyLandscape(initialConfig: Map[String, Double], options: Map[String, String]) =
+    if(policy == "CSA") performCSA(initialConfig, options)
+    else getEnergyLandscape(initialConfig, options, meanFieldPrior)
+
+  protected def modelProbabilities = DataPipe(ProbGPCommMachine.calculateModelWeightsSigmoid(baselinePolicy) _)
+
+  override def optimize(
+    initialConfig: Map[String, Double],
+    options: Map[String, String]) = {
+
+    //Find out the blocked hyper parameters and their values
+    val blockedHypParams = system._hyper_parameters.filterNot(initialConfig.contains)
+
+    val blockedState = system._current_state.filterKeys(blockedHypParams.contains)
+
+    val energyLandscape = calculateEnergyLandscape(initialConfig, options)
+
+
+    //Calculate the weights of each configuration
+    val (weights, models) = modelProbabilities(energyLandscape).map(c => {
+
+      val model_state = c._2 ++ blockedState
+
+      val model = confToModel(model_state)
+
+      //Persist the model inference primitives to memory.
+      model.persist(model_state)
+
+      (c._1, model)
+    }).unzip
+
+
+    val configsAndWeights = modelProbabilities(energyLandscape).map(c => (c._1, c._2 ++ blockedState))
+
+    logger.info("===============================================")
+    logger.info("Constructing Gaussian Process Mixture")
+
+    logger.info("Number of model instances = "+weights.length)
+    logger.info("--------------------------------------")
+    logger.info(
+      "Calculated model probabilities/weights are \n"+
+        configsAndWeights.map(wc =>
+          "\nConfiguration: \n"+
+            GlobalOptimizer.prettyPrint(wc._2)+
+            "\nProbability = "+wc._1+"\n"
+        ).reduceLeft((a, b) => a++b)
+    )
+    logger.info("--------------------------------------")
+
+
+
+    (
+      mixturePipe(
+        models, DenseVector(weights.toArray)
+      ),
+      models.map(m => {
+        val model_id = m.toString.split("\\.").last
+        m._current_state.map(c => (model_id+"/"+c._1,c._2))
+      }).reduceLeft((m1, m2) => m1++m2)
+    )
+  }
+
+
+}
diff --git a/dynaml-core/src/main/scala-2.11/io/github/mandar2812/dynaml/optimization/ProbGPMixtureMachine.scala b/dynaml-core/src/main/scala-2.11/io/github/mandar2812/dynaml/optimization/ProbGPMixtureMachine.scala
@@ -1,9 +1,12 @@
 package io.github.mandar2812.dynaml.optimization
 
 import breeze.linalg.DenseVector
+import io.github.mandar2812.dynaml.algebra.{PartitionedPSDMatrix, PartitionedVector}
 import io.github.mandar2812.dynaml.models.StochasticProcessMixtureModel
 import io.github.mandar2812.dynaml.models.gp.{AbstractGPRegressionModel, GaussianProcessMixture}
-import io.github.mandar2812.dynaml.pipes.DataPipe
+import io.github.mandar2812.dynaml.pipes.{DataPipe, DataPipe2}
+import io.github.mandar2812.dynaml.probability.MultGaussianPRV
+import io.github.mandar2812.dynaml.probability.distributions.BlockedMultiVariateGaussian
 
 import scala.reflect.ClassTag
 
@@ -16,104 +19,25 @@ import scala.reflect.ClassTag
   * */
 class ProbGPMixtureMachine[T, I: ClassTag](
   model: AbstractGPRegressionModel[T, I]) extends
-  AbstractCSA[AbstractGPRegressionModel[T, I], GaussianProcessMixture[T, I]](model) {
+  MixtureMachine[T, I, Double, PartitionedVector, PartitionedPSDMatrix, BlockedMultiVariateGaussian,
+    MultGaussianPRV, AbstractGPRegressionModel[T, I]](model) {
 
-  private var policy: String = "CSA"
 
-  private var baselinePolicy: String = "max"
+  val (kernelPipe, noisePipe) = (system.covariance.asPipe, system.noiseModel.asPipe)
 
-  def _policy = policy
+  def blockedHypParams = system.covariance.blocked_hyper_parameters ++ system.noiseModel.blocked_hyper_parameters
 
-  def setPolicy(p: String): this.type = {
-    if(p == "CSA" || p == "Coupled Simulated Annealing")
-      policy = "CSA"
-    else
-      policy = "GS"
+  def blockedState = system._current_state.filterKeys(blockedHypParams.contains)
 
-    this
-  }
+  implicit val transform: DataPipe[T, Seq[(I, Double)]] = DataPipe(system.dataAsSeq _)
 
-  def setBaseLinePolicy(p: String): this.type = {
+  override val confToModel = DataPipe((model_state: Map[String, Double]) =>
+    AbstractGPRegressionModel(
+    kernelPipe(model_state), noisePipe(model_state),
+    system.mean)(system.data, system.npoints))
 
-    if(p == "avg" || p == "mean" || p == "average")
-      baselinePolicy = "mean"
-    else if(p == "min")
-      baselinePolicy = "min"
-    else if(p == "max")
-      baselinePolicy = "max"
-    else
-      baselinePolicy = "mean"
-
-    this
-  }
-
-  private def calculateEnergyLandscape(initialConfig: Map[String, Double], options: Map[String, String]) =
-    if(policy == "CSA") performCSA(initialConfig, options)
-    else getEnergyLandscape(initialConfig, options, meanFieldPrior)
-
-  private def modelProbabilities = DataPipe(ProbGPCommMachine.calculateModelWeightsSigmoid(baselinePolicy) _)
-
-  override def optimize(
-    initialConfig: Map[String, Double],
-    options: Map[String, String]) = {
-
-    //Find out the blocked hyper parameters and their values
-    val blockedHypParams = system.covariance.blocked_hyper_parameters ++ system.noiseModel.blocked_hyper_parameters
-
-    val (kernelPipe, noisePipe) = (system.covariance.asPipe, system.noiseModel.asPipe)
-
-    val blockedState = system._current_state.filterKeys(blockedHypParams.contains)
-
-    val energyLandscape = calculateEnergyLandscape(initialConfig, options)
-
-    val data = system.data
-
-    //Calculate the weights of each configuration
-    val (weights, models) = modelProbabilities(energyLandscape).map(c => {
-
-      val model_state = c._2 ++ blockedState
-
-      implicit val transform = DataPipe(system.dataAsSeq _)
-
-      val model = AbstractGPRegressionModel(
-        kernelPipe(model_state), noisePipe(model_state),
-        system.mean)(
-        data, system.npoints)
-
-      //Persist the model inference primitives to memory.
-      model.persist(model_state)
-
-      (c._1, model)
-    }).unzip
-
-
-    val configsAndWeights = modelProbabilities(energyLandscape).map(c => (c._1, c._2 ++ blockedState))
-
-    logger.info("===============================================")
-    logger.info("Constructing Gaussian Process Mixture")
-
-    logger.info("Number of model instances = "+weights.length)
-    logger.info("--------------------------------------")
-    logger.info(
-      "Calculated model probabilities/weights are \n"+
-        configsAndWeights.map(wc =>
-          "\nConfiguration: \n"+
-            GlobalOptimizer.prettyPrint(wc._2)+
-            "\nProbability = "+wc._1+"\n"
-        ).reduceLeft((a, b) => a++b)
-    )
-    logger.info("--------------------------------------")
-
-
-
-    (
-      StochasticProcessMixtureModel[T, I](
-        models, DenseVector(weights.toArray)
-      ),
-      models.map(m => {
-        val model_id = m.toString.split("\\.").last
-        m._current_state.map(c => (model_id+"/"+c._1,c._2))
-      }).reduceLeft((m1, m2) => m1++m2)
-    )
-  }
+  override val mixturePipe = DataPipe2(
+    (models: Seq[AbstractGPRegressionModel[T, I]], weights: DenseVector[Double]) =>
+    StochasticProcessMixtureModel[T, I](models, weights))
+  
 }