SANSA-Stack
diff --git a/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/inference/RDFGraphInference.scala‎
Lines changed: 13 additions & 14 deletions b/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/inference/RDFGraphInference.scala‎
Lines changed: 13 additions & 14 deletions
diff --git a/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/clustering/BorderFlowClustering.scala‎
Lines changed: 6 additions & 4 deletions b/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/clustering/BorderFlowClustering.scala‎
Lines changed: 6 additions & 4 deletions
diff --git a/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/clustering/RDFByModularityClustering.scala‎
Lines changed: 5 additions & 3 deletions b/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/clustering/RDFByModularityClustering.scala‎
Lines changed: 5 additions & 3 deletions
diff --git a/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/clustering/RDFGraphPIClustering.scala‎
Lines changed: 5 additions & 7 deletions b/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/clustering/RDFGraphPIClustering.scala‎
Lines changed: 5 additions & 7 deletions
diff --git a/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/clustering/SilviaClustering.scala‎
Lines changed: 6 additions & 4 deletions b/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/clustering/SilviaClustering.scala‎
Lines changed: 6 additions & 4 deletions
diff --git a/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/kernel/RDFGraphKernel.scala‎
Lines changed: 2 additions & 3 deletions b/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/kernel/RDFGraphKernel.scala‎
Lines changed: 2 additions & 3 deletions
diff --git a/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/kge/CrossValidation.scala‎
Lines changed: 7 additions & 8 deletions b/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/kge/CrossValidation.scala‎
Lines changed: 7 additions & 8 deletions
diff --git a/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/mining/MineRules.scala‎
Lines changed: 9 additions & 8 deletions b/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/mining/MineRules.scala‎
Lines changed: 9 additions & 8 deletions
diff --git a/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/outliers/anomalydetection/AnomalyDetection.scala‎
Lines changed: 25 additions & 24 deletions b/‎sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/outliers/anomalydetection/AnomalyDetection.scala‎
Lines changed: 25 additions & 24 deletions
@@ -2,16 +2,15 @@ package net.sansa_stack.examples.spark.inference
 
 import java.net.URI
 
-import org.apache.jena.graph.{ Node, NodeFactory }
-import org.apache.spark.SparkConf
-import org.apache.spark.sql.SparkSession
-
 import net.sansa_stack.inference.data.RDFTriple
-import net.sansa_stack.inference.rules.ReasoningProfile._
 import net.sansa_stack.inference.rules.{ RDFSLevel, ReasoningProfile }
+import net.sansa_stack.inference.rules.ReasoningProfile._
 import net.sansa_stack.inference.spark.data.loader.RDFGraphLoader
 import net.sansa_stack.inference.spark.data.writer.RDFGraphWriter
 import net.sansa_stack.inference.spark.forwardchaining.triples.{ForwardRuleReasonerOWLHorst, ForwardRuleReasonerRDFS, TransitiveReasoner}
+import org.apache.jena.graph.{ Node, NodeFactory }
+import org.apache.spark.SparkConf
+import org.apache.spark.sql.SparkSession
 
 object RDFGraphInference {
 
@@ -45,7 +44,7 @@ object RDFGraphInference {
     // create reasoner
     val reasoner = profile match {
       case TRANSITIVE => new TransitiveReasoner(spark.sparkContext, properties, parallelism)
-      case RDFS       => new ForwardRuleReasonerRDFS(spark.sparkContext, parallelism)
+      case RDFS => new ForwardRuleReasonerRDFS(spark.sparkContext, parallelism)
       case RDFS_SIMPLE =>
         val r = new ForwardRuleReasonerRDFS(spark.sparkContext, parallelism)
         r.level = RDFSLevel.SIMPLE
@@ -64,13 +63,13 @@ object RDFGraphInference {
   }
 
   case class Config(
-    in:                Seq[URI]         = Seq(),
-    out:               URI              = new URI("."),
-    properties:        Seq[Node]        = Seq(),
-    profile:           ReasoningProfile = ReasoningProfile.RDFS,
-    writeToSingleFile: Boolean          = false,
-    sortedOutput:      Boolean          = false,
-    parallelism:       Int              = 4)
+    in: Seq[URI] = Seq(),
+    out: URI = new URI("."),
+    properties: Seq[Node] = Seq(),
+    profile: ReasoningProfile = ReasoningProfile.RDFS,
+    writeToSingleFile: Boolean = false,
+    sortedOutput: Boolean = false,
+    parallelism: Int = 4)
 
   // read ReasoningProfile enum
   implicit val profilesRead: scopt.Read[ReasoningProfile.Value] =
@@ -118,4 +117,4 @@ object RDFGraphInference {
       if (c.profile == TRANSITIVE && c.properties.isEmpty) failure("Option --properties must not be empty if profile 'transitive' is set")
       else success)
   }
-}
+}
@@ -1,12 +1,14 @@
 package net.sansa_stack.examples.spark.ml.clustering
 
 import scala.collection.mutable
-import org.apache.spark.sql.SparkSession
-import org.apache.log4j.{ Level, Logger }
+
 import net.sansa_stack.ml.spark.clustering.{ BorderFlow, FirstHardeninginBorderFlow }
-import org.apache.jena.riot.Lang
 import net.sansa_stack.rdf.spark.io._
 import net.sansa_stack.rdf.spark.model.graph._
+import org.apache.jena.riot.Lang
+import org.apache.log4j.{ Level, Logger }
+import org.apache.spark.sql.SparkSession
+
 
 object BorderFlowClustering {
 
@@ -37,7 +39,7 @@ object BorderFlowClustering {
     val graph = triples.asStringGraph()
 
     val borderflow = algName match {
-      case "borderflow"     => BorderFlow(spark, graph, output, outputevlsoft, outputevlhard)
+      case "borderflow" => BorderFlow(spark, graph, output, outputevlsoft, outputevlhard)
       case "firsthardening" => FirstHardeninginBorderFlow(spark, graph, output, outputevlhard)
       case _ =>
         throw new RuntimeException("'" + algName + "' - Not supported, yet.")
 
@@ -1,9 +1,11 @@
 package net.sansa_stack.examples.spark.ml.clustering
 
 import scala.collection.mutable
-import org.apache.spark.sql.SparkSession
-import org.apache.log4j.{ Level, Logger }
+
 import net.sansa_stack.ml.spark.clustering.{ RDFByModularityClustering => RDFByModularityClusteringAlg }
+import org.apache.log4j.{ Level, Logger }
+import org.apache.spark.sql.SparkSession
+
 
 object RDFByModularityClustering {
 
@@ -58,4 +60,4 @@ object RDFByModularityClustering {
 
     help("help").text("prints this usage text")
   }
-}
+}
@@ -1,15 +1,13 @@
 package net.sansa_stack.examples.spark.ml.clustering
 
 import scala.collection.mutable
-import org.apache.spark.sql.SparkSession
-import org.apache.log4j.{ Level, Logger }
-import org.apache.jena.riot.{ Lang, RDFDataMgr }
-import java.io.ByteArrayInputStream
-import org.apache.jena.riot.Lang
+
+import net.sansa_stack.ml.spark.clustering.RDFGraphPowerIterationClustering
 import net.sansa_stack.rdf.spark.io._
 import net.sansa_stack.rdf.spark.model.graph._
-import net.sansa_stack.rdf._
-import net.sansa_stack.ml.spark.clustering.RDFGraphPowerIterationClustering
+import org.apache.jena.riot.{ Lang, RDFDataMgr }
+import org.apache.log4j.{ Level, Logger }
+import org.apache.spark.sql.SparkSession
 
 object RDFGraphPIClustering {
 
 
@@ -1,13 +1,15 @@
 package net.sansa_stack.examples.spark.ml.clustering
 
 import scala.collection.mutable
-import org.apache.spark.sql.SparkSession
-import org.apache.log4j.{ Level, Logger }
-import java.net.{ URI => JavaURI }
+
 import net.sansa_stack.ml.spark.clustering.{ SilviaClustering => AlgSilviaClustering }
-import org.apache.jena.riot.Lang
 import net.sansa_stack.rdf.spark.io._
 import net.sansa_stack.rdf.spark.model.graph._
+import org.apache.jena.riot.Lang
+import org.apache.log4j.{ Level, Logger }
+import org.apache.spark.sql.SparkSession
+
+
 
 object SilviaClustering {
 
 
@@ -50,8 +50,8 @@ object RDFGraphKernel {
   }
 
   case class Config(
-    in:        String = "",
-    iteration: Int    = 5)
+    in: String = "",
+    iteration: Int = 5)
 
   val parser = new scopt.OptionParser[Config]("Mines the Rules example") {
 
@@ -68,4 +68,3 @@ object RDFGraphKernel {
     help("help").text("prints this usage text")
   }
 }
-
@@ -1,10 +1,9 @@
 package net.sansa_stack.examples.spark.ml.kge
 
-import org.apache.spark.sql._
-import net.sansa_stack.rdf.spark.kge.triples.Triples
+import net.sansa_stack.ml.spark.kge.linkprediction.crossvalidation.{ kFold, Bootstrapping, Holdout }
 import net.sansa_stack.rdf.spark.kge.convertor.ByIndex
-import net.sansa_stack.ml.spark.kge.linkprediction.crossvalidation.{ Bootstrapping, Holdout }
-import net.sansa_stack.ml.spark.kge.linkprediction.crossvalidation.kFold
+import net.sansa_stack.rdf.spark.kge.triples.Triples
+import org.apache.spark.sql._
 
 object CrossValidation {
 
@@ -45,9 +44,9 @@ object CrossValidation {
     indexedData.numeric.take(10).foreach(println)
 
     val (train, test) = technique match {
-      case "holdout"       => new Holdout(numericData, 0.6f).crossValidation()
+      case "holdout" => new Holdout(numericData, 0.6f).crossValidation()
       case "bootstrapping" => new Bootstrapping(numericData).crossValidation()
-      case "kFold"         => new kFold(numericData, k, spark).crossValidation()
+      case "kFold" => new kFold(numericData, k, spark).crossValidation()
       case _ =>
         throw new RuntimeException("'" + technique + "' - Not supported, yet.")
     }
@@ -79,9 +78,9 @@ object CrossValidation {
       text("The k value (used only for technique'kFold')")
 
     checkConfig(c =>
-      if (c.technique == "kFold" && c.k == 0) failure("Option --k-Fold must not be empty if technique 'kFold	' is set")
+      if (c.technique == "kFold" && c.k == 0) failure("Option --k-Fold must not be empty if technique 'kFold' is set")
       else success)
 
     help("help").text("prints this usage text")
   }
-}
+}
@@ -1,10 +1,11 @@
 package net.sansa_stack.examples.spark.ml.mining
 
 import scala.collection.mutable
-import org.apache.spark.sql.SparkSession
+
+import net.sansa_stack.ml.spark.mining.amieSpark.{ DfLoader, RDFGraphLoader }
 import net.sansa_stack.ml.spark.mining.amieSpark.KBObject.KB
-import net.sansa_stack.ml.spark.mining.amieSpark.{ RDFGraphLoader, DfLoader }
 import net.sansa_stack.ml.spark.mining.amieSpark.MineRules.Algorithm
+import org.apache.spark.sql.SparkSession
 
 /*
  * Mine Rules
@@ -32,7 +33,7 @@ object MineRules {
       .master("local[*]")
       .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
       .getOrCreate()
-      
+
     val hdfsPath = outputPath + "/"
 
     val know = new KB()
@@ -44,8 +45,8 @@ object MineRules {
 
     val algo = new Algorithm(know, 0.01, 3, 0.1, hdfsPath)
 
-    //var erg = algo.ruleMining(sparkSession.sparkContext, sparkSession.sqlContext)
-    //println(erg)
+    // var erg = algo.ruleMining(sparkSession.sparkContext, sparkSession.sqlContext)
+    // println(erg)
     var output = algo.ruleMining(spark.sparkContext, spark.sqlContext)
 
     var outString = output.map { x =>
@@ -55,7 +56,7 @@ object MineRules {
         if (i == 0) {
           temp = rdfTrp(i) + " <= "
         } else {
-          temp += rdfTrp(i) + " \u2227 "
+          temp += rdfTrp(i) + """ \u2227 """
         }
       }
       temp = temp.stripSuffix(" \u2227 ")
@@ -67,7 +68,7 @@ object MineRules {
   }
 
   case class Config(
-    in:  String = "",
+    in: String = "",
     out: String = "")
 
   val parser = new scopt.OptionParser[Config]("Mines the Rules example") {
@@ -84,4 +85,4 @@ object MineRules {
 
     help("help").text("prints this usage text")
   }
-}
+}
@@ -1,12 +1,13 @@
 package net.sansa_stack.examples.spark.ml.outliers.anomalydetection
 
 import scala.collection.mutable
-import org.apache.jena.riot.Lang
-import net.sansa_stack.rdf.spark.io._
-import org.apache.spark.sql.{ SparkSession, Dataset, Row, SaveMode }
-import org.apache.spark.storage.StorageLevel
+
 import net.sansa_stack.ml.spark.outliers.anomalydetection._
+import net.sansa_stack.rdf.spark.io._
+import org.apache.jena.riot.Lang
 import org.apache.spark.rdd.RDD
+import org.apache.spark.sql.{ Dataset, Row, SaveMode, SparkSession }
+import org.apache.spark.storage.StorageLevel
 
 object AnomalyDetection {
   def main(args: Array[String]) {
@@ -19,11 +20,11 @@ object AnomalyDetection {
   }
 
   def run(
-    input:            String,
-    JSimThreshold:    Double,
+    input: String,
+    JSimThreshold: Double,
     anomalyListLimit: Int,
-    numofpartition:   Int,
-    output:           String): Unit = {
+    numofpartition: Int,
+    output: String): Unit = {
 
     println("==================================================")
     println("|        Distributed Anomaly Detection           |")
@@ -35,24 +36,24 @@ object AnomalyDetection {
       .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
       .getOrCreate()
 
-    //N-Triples Reader
+    // N-Triples Reader
     val lang = Lang.NTRIPLES
     val triplesRDD = spark.rdf(lang)(input).repartition(numofpartition).persist()
 
     // predicated that are not interesting for evaluation
     val wikiList = List("wikiPageRevisionID,wikiPageID")
 
-    //filtering numeric literal having xsd type double,integer,nonNegativeInteger and squareKilometre
+    // filtering numeric literal having xsd type double,integer,nonNegativeInteger and squareKilometre
     val objList = List(
       "http://www.w3.org/2001/XMLSchema#double",
       "http://www.w3.org/2001/XMLSchema#integer",
       "http://www.w3.org/2001/XMLSchema#nonNegativeInteger",
       "http://dbpedia.org/datatype/squareKilometre")
 
-    //helful for considering only Dbpedia type as their will be yago type,wikidata type also
+    // helful for considering only Dbpedia type as their will be yago type,wikidata type also
     val triplesType = List("http://dbpedia.org/ontology")
 
-    //some of the supertype which are present for most of the subject
+    // some of the supertype which are present for most of the subject
     val listSuperType = List(
       "http://dbpedia.org/ontology/Activity", "http://dbpedia.org/ontology/Organisation",
       "http://dbpedia.org/ontology/Agent", "http://dbpedia.org/ontology/SportsLeague",
@@ -62,7 +63,7 @@ object AnomalyDetection {
       "http://dbpedia.org/ontology/Species", "http://dbpedia.org/ontology/Eukaryote",
       "http://dbpedia.org/ontology/Location")
 
-    //hypernym URI
+    // hypernym URI
     val hypernym = "http://purl.org/linguistics/gold/hypernym"
 
     var clusterOfSubject: RDD[(Set[(String, String, Object)])] = null
@@ -78,7 +79,7 @@ object AnomalyDetection {
 
     val test = setDataSize.map(f => outDetection.iqr2(f, anomalyListLimit))
 
-    val testfilter = test.filter(f => f.size > 0) //.distinct()
+    val testfilter = test.filter(f => f.size > 0) // .distinct()
     val testfilterDistinct = testfilter.flatMap(f => f)
     testfilterDistinct.saveAsTextFile(output)
     setData.unpersist()
@@ -87,11 +88,11 @@ object AnomalyDetection {
   }
 
   case class Config(
-    in:               String = "",
-    threshold:        Double = 0.0,
-    anomalyListLimit: Int    = 0,
-    numofpartition:   Int    = 0,
-    out:              String = "")
+    in: String = "",
+    threshold: Double = 0.0,
+    anomalyListLimit: Int = 0,
+    numofpartition: Int = 0,
+    out: String = "")
 
   val parser = new scopt.OptionParser[Config]("SANSA -Outlier Detection") {
 
@@ -101,26 +102,26 @@ object AnomalyDetection {
       action((x, c) => c.copy(in = x)).
       text("path to file that contains RDF data (in N-Triples format)")
 
-    //Jaccard similarity threshold value
+    // Jaccard similarity threshold value
     opt[Double]('t', "threshold").required().
       action((x, c) => c.copy(threshold = x)).
       text("the Jaccard Similarity value")
 
-    //number of partition
+    // number of partition
     opt[Int]('a', "numofpartition").required().
       action((x, c) => c.copy(numofpartition = x)).
       text("Number of partition")
 
-    //List limit for calculating IQR
+    // List limit for calculating IQR
     opt[Int]('c', "anomalyListLimit").required().
       action((x, c) => c.copy(anomalyListLimit = x)).
       text("the outlier List Limit")
 
-    //output file path
+    // output file path
     opt[String]('o', "output").required().valueName("<directory>").
       action((x, c) => c.copy(out = x)).
       text("the output directory")
 
     help("help").text("prints this usage text")
   }
-}
+}
Original file line number	Diff line number	Diff line change
`@@ -50,8 +50,8 @@ object RDFGraphKernel {`
`50`	`50`	`}`
`51`	`51`
`52`	`52`	`case class Config(`
`53`		`- in: String = "",`
`54`		`- iteration: Int = 5)`
	`53`	`+ in: String = "",`
	`54`	`+ iteration: Int = 5)`
`55`	`55`
`56`	`56`	`val parser = new scopt.OptionParser[Config]("Mines the Rules example") {`
`57`	`57`
`@@ -68,4 +68,3 @@ object RDFGraphKernel {`
`68`	`68`	`help("help").text("prints this usage text")`
`69`	`69`	`}`
`70`	`70`	`}`
`71`		`-`