Merge pull request #20 from jGleitz/feature/java-package-and-constants

jGleitz · web-flow · commit e409558e7b67 · 2020-02-07T01:31:25.000+02:00
feat: Notations for Java packages and constants
diff --git a/build.gradle.kts b/build.gradle.kts
@@ -1,6 +1,6 @@
+import de.marcphilipp.gradle.nexus.NexusRepository
 import org.jetbrains.dokka.gradle.DokkaTask
 import org.jetbrains.kotlin.gradle.tasks.KotlinCompile
-import de.marcphilipp.gradle.nexus.NexusRepository
 
 plugins {
 	kotlin("jvm").version("1.3.61")
diff --git a/src/main/kotlin/BaseStringNotation.kt b/src/main/kotlin/BaseStringNotation.kt
@@ -1,20 +1,18 @@
 package de.joshuagleitze.stringnotation
 
-import java.util.*
-
 /**
  * Base class for implementing string notations.
  *
  * @constructor Creates a string notation that will use the provided regular expression to [split][String.split] parts when parsing.
  */
 abstract class BaseStringNotation(private val splitAt: Regex): StringNotation {
 	/**
-	 * Transforms a parsed part after it has been read. The default implementation is to convert the part to lowercase to discard possibly
-	 * wrong case information.
+	 * Transforms a parsed part after it has been read. The default implementation does not change the part.
 	 */
-	protected open fun transformPartAfterParse(index: Int, part: String) = part.toLowerCase(Locale.ROOT)
+	protected open fun transformPartAfterParse(index: Int, part: String) = part
 
-	override fun parse(sourceString: String): Word = Word(sourceString.split(splitAt).asSequence().mapIndexed(::transformPartAfterParse))
+	override fun parse(sourceString: String): Word =
+		Word(sourceString.split(splitAt).asSequence().filter(String::isNotBlank).mapIndexed(::transformPartAfterParse))
 
 	/**
 	 * Allows to transform a part before it is being printed. The default implementation does not modify the part in any way.
@@ -34,7 +32,7 @@ abstract class BaseStringNotation(private val splitAt: Regex): StringNotation {
 
 	override fun print(word: Word) = word.parts
 		.mapIndexed(::transformPartToPrint)
-		.foldIndexed(StringBuffer()) { index, left, right -> left.append(printBeforePart(index, right)).append(right) }
+		.foldIndexed(StringBuffer()) { index, existing, part -> existing.append(printBeforePart(index, part)).append(part) }
 		.toString()
 
 	override fun toString() = this::class.java.simpleName!!
diff --git a/src/main/kotlin/JavaNotations.kt b/src/main/kotlin/JavaNotations.kt
@@ -0,0 +1,119 @@
+package de.joshuagleitze.stringnotation
+
+import java.util.*
+import java.util.stream.IntStream
+import javax.lang.model.SourceVersion
+
+/**
+ * A notation for Java type names. This notation is like [UpperCamelCase], but when [printing][StringNotation.print], it will drop any
+ * character that is not allowed in a Java identifier. If the result is a Java keyword, `_` will be appended to it.
+ *
+ * Allowed characters are determined using [Character.isJavaIdentifierStart] and [Character.isJavaIdentifierPart]. Keywords are detected
+ * using [SourceVersion.isKeyword].
+ */
+object JavaTypeName: StringNotation by UpperCamelCase {
+	override fun print(word: Word) = UpperCamelCase.print(
+		Word(word.parts.mapIndexed { index, wordPart ->
+			if (index == 0) wordPart.keepOnlyJavaIdentifierChars()
+			else wordPart.keepOnlyJavaIdentifierContinuationChars()
+		})
+	)
+		.neutralizeJavaReservedKeywords()
+
+	override fun toString() = this::class.java.simpleName!!
+}
+
+/**
+ * A notation for java member names. This notation is like [LowerCamelCase], but when [printing][StringNotation.print], it will drop any
+ * character that is not allowed in a Java identifier. If the result is a Java keyword, `_` will be appended to it.
+ *
+ * Allowed characters are determined using [Character.isJavaIdentifierStart] and [Character.isJavaIdentifierPart]. Keywords are detected
+ * using [SourceVersion.isKeyword].
+ */
+object JavaMemberName: BaseStringNotation(camelCaseSplitRegex) {
+	override fun transformPartAfterParse(index: Int, part: String) = part.toLowerCase(Locale.ROOT)
+
+	override fun print(word: Word) = word.parts
+		.foldIndexed(StringBuffer()) { index, existing, part ->
+			val filteredPart =
+				if (index == 0) part.keepOnlyJavaIdentifierChars()
+				else part.keepOnlyJavaIdentifierContinuationChars()
+			val nextPart =
+				if (existing.contains(Regex("[a-zA-Z]"))) filteredPart.toFirstUpperOtherLowerCase()
+				else filteredPart.toLowerCase()
+			existing.append(printBeforePart(index, nextPart)).append(nextPart)
+		}.toString().makeValidJavaIdentifier()
+}
+
+/**
+ * A notation for java package parts. When [printing][StringNotation.print], it simply concatenates all word parts and drops any character
+ * that is not allowed in a Java identifier. If the result is a Java keyword, `_` will be appended to it. When
+ * [parsing][StringNotation.parse], the notation will recognise word parts both in the [LowerCamelCase] and the [SnakeCase] notation.
+ * However, neither notation is conventional and parsing will usually yield only one word part on real-world inputs.
+ *
+ * Allowed characters are determined using [Character.isJavaIdentifierStart] and [Character.isJavaIdentifierPart]. Keywords are detected
+ * using [SourceVersion.isKeyword].
+ */
+object JavaPackagePart: BaseStringNotation(Regex("_|${camelCaseSplitRegex.pattern}")) {
+	override fun transformPartAfterParse(index: Int, part: String) = part.toLowerCase(Locale.ROOT)
+
+	override fun transformPartToPrint(index: Int, part: String) = part.toLowerCase(Locale.ROOT)
+
+	override fun print(word: Word) = super.print(word).makeValidJavaIdentifier()
+}
+
+/**
+ * A notation for whole java packages. When [printing][StringNotation.print] parts, it will drop any character that is not allowed in a Java
+ * identifier. If the result is a Java keyword, `_` will be appended to it.
+ *
+ * Allowed characters are determined using [Character.isJavaIdentifierStart] and [Character.isJavaIdentifierPart]. Keywords are detected
+ * using [SourceVersion.isKeyword].
+ */
+object JavaPackageName: BaseStringNotation(Regex("\\.")) {
+	override fun transformPartToPrint(index: Int, part: String) = part.toLowerCase(Locale.ROOT).makeValidJavaIdentifier()
+
+	override fun printBeforeInnerPart(index: Int, part: String) = "."
+}
+
+/**
+ * A notation for `static final` fields in Java. This notation is like [ScreamingSnakeCase], but when [printing][StringNotation.print], it
+ * will drop any character that is not allowed in a Java identifier.  If the result is a Java keyword, `_` will be appended to it.
+ *
+ * Allowed characters are determined using [Character.isJavaIdentifierStart] and [Character.isJavaIdentifierPart]. Keywords are detected
+ * using [SourceVersion.isKeyword].
+ */
+object JavaConstantName: StringNotation by ScreamingSnakeCase {
+	override fun print(word: Word) = ScreamingSnakeCase.print(word).makeValidJavaIdentifier()
+
+	override fun toString() = this::class.java.simpleName!!
+}
+
+private fun String.makeValidJavaIdentifier() = this.keepOnlyJavaIdentifierChars().neutralizeJavaReservedKeywords()
+
+private fun String.keepOnlyJavaIdentifierChars() = this.chars()
+	.skipWhile { !Character.isJavaIdentifierStart(it) }
+	.keepOnlyJavaIdentifierContinuationChars()
+	.collectToString()
+
+private fun String.keepOnlyJavaIdentifierContinuationChars() = this.chars().keepOnlyJavaIdentifierContinuationChars().collectToString()
+private fun IntStream.keepOnlyJavaIdentifierContinuationChars() = this.filter { Character.isJavaIdentifierPart(it) }
+private fun IntStream.collectToString() =
+	this.collect({ StringBuilder() }, { left, right -> left.appendCodePoint(right) }, { left, right -> left.append(right) })
+		.toString()
+
+private fun String.neutralizeJavaReservedKeywords() = when {
+	this == "" -> "__"
+	SourceVersion.isKeyword(this) -> this + "_"
+	else -> this
+}
+
+private inline fun IntStream.skipWhile(crossinline condition: (Int) -> Boolean): IntStream {
+	var found = false
+	return this.filter {
+		if (!found) {
+			found = !condition(it)
+		}
+		found
+	}
+}
+
diff --git a/src/main/kotlin/Notations.kt b/src/main/kotlin/Notations.kt
@@ -1,15 +1,17 @@
 package de.joshuagleitze.stringnotation
 
-import java.util.stream.IntStream
+import java.util.*
 
-private val camelCaseSplitRegex = Regex("(?<=.)(?=\\p{Lu})")
+internal val camelCaseSplitRegex = Regex("(?<=.)(?=\\p{Lu})")
 
 /**
  * The `UpperCamelCase` notation.
  *
  * @see JavaTypeName
  */
 object UpperCamelCase: BaseStringNotation(camelCaseSplitRegex) {
+	override fun transformPartAfterParse(index: Int, part: String) = part.toLowerCase(Locale.ROOT)
+
 	public override fun transformPartToPrint(index: Int, part: String) = part.toFirstUpperOtherLowerCase()
 }
 
@@ -19,13 +21,17 @@ object UpperCamelCase: BaseStringNotation(camelCaseSplitRegex) {
  * @see JavaMemberName
  */
 object LowerCamelCase: BaseStringNotation(camelCaseSplitRegex) {
+	override fun transformPartAfterParse(index: Int, part: String) = part.toLowerCase(Locale.ROOT)
+
 	override fun transformPartToPrint(index: Int, part: String) = if (index == 0) part.toLowerCase() else part.toFirstUpperOtherLowerCase()
 }
 
 /**
  * The `SCREAMING_SNAKE_CASE` notation.
  */
 object ScreamingSnakeCase: BaseStringNotation(Regex("_")) {
+	override fun transformPartAfterParse(index: Int, part: String) = part.toLowerCase(Locale.ROOT)
+
 	override fun printBeforeInnerPart(index: Int, part: String) = "_"
 
 	override fun transformPartToPrint(index: Int, part: String) = part.toUpperCase()
@@ -35,63 +41,17 @@ object ScreamingSnakeCase: BaseStringNotation(Regex("_")) {
  * The `snake_case` notation.
  */
 object SnakeCase: BaseStringNotation(Regex("_")) {
-	override fun transformPartAfterParse(index: Int, part: String) = part
 	override fun printBeforeInnerPart(index: Int, part: String) = "_"
 }
 
-/**
- * A notation for java type names. This notation is like [UpperCamelCase], but will drop any character that is not allowed in a Java
- * identifier when [printing][StringNotation.print].
- *
- * Allowed characters are determined using [Character.isJavaIdentifierStart] and [Character.isJavaIdentifierPart].
- */
-object JavaTypeName: BaseStringNotation(camelCaseSplitRegex) {
-	override fun transformPartToPrint(index: Int, part: String) = part.toFirstUpperOtherLowerCase()
-	override fun print(word: Word) = super.print(word).keepOnlyJavaIdentifierChars()
-}
-
-/**
- * A notation for java member names. This notation is like [LowerCamelCase], but will drop any character that is not allowed in a Java
- * identifier when [printing][StringNotation.print].
- *
- * Allowed characters are determined using [Character.isJavaIdentifierStart] and [Character.isJavaIdentifierPart].
- */
-object JavaMemberName: BaseStringNotation(camelCaseSplitRegex) {
-	override fun print(word: Word) = word.parts
-		.foldIndexed(StringBuffer()) { index, left, right ->
-			val rightPart =
-				if (left.contains(Regex("[a-zA-Z]"))) right.toFirstUpperOtherLowerCase()
-				else right.toLowerCase()
-			left.append(printBeforePart(index, rightPart)).append(rightPart)
-		}.toString().keepOnlyJavaIdentifierChars()
-
-}
-
 /**
  * Notation for words written like in normal language. [Parsing][StringNotation.parse] will recognise all substrings that are separated by
  * one or more characters of whitespace as a [part][Word.parts]. [Printing][StringNotation.print] will print the parts separated by one
  * space.
  */
 object NormalWords: BaseStringNotation(Regex("[\\s]+")) {
-	override fun transformPartAfterParse(index: Int, part: String) = part
 	override fun printBeforeInnerPart(index: Int, part: String) = " "
 }
 
 internal fun String.toFirstUpperOtherLowerCase() = if (isNotEmpty()) this[0].toUpperCase() + substring(1).toLowerCase() else this
 
-fun String.keepOnlyJavaIdentifierChars() = this.chars()
-	.skipWhile { !Character.isJavaIdentifierStart(it) }
-	.filter { Character.isJavaIdentifierPart(it) }
-	.collect({ StringBuilder() }, { left, right -> left.appendCodePoint(right) }, { left, right -> left.append(right) })
-	.toString()
-
-internal inline fun IntStream.skipWhile(crossinline condition: (Int) -> Boolean): IntStream {
-	var found = false
-	return this.filter {
-		if (!found) {
-			found = !condition(it)
-		}
-		found
-	}
-}
-
diff --git a/src/test/kotlin/BaseNotationTest.kt b/src/test/kotlin/BaseNotationTest.kt
@@ -0,0 +1,72 @@
+package de.joshuagleitze.stringnotation
+
+import ch.tutteli.atrium.api.fluent.en_GB.feature
+import ch.tutteli.atrium.api.fluent.en_GB.toBe
+import ch.tutteli.atrium.api.verbs.expect
+import org.junit.jupiter.api.Assumptions.assumeTrue
+import org.junit.jupiter.api.TestInstance
+import org.junit.jupiter.params.ParameterizedTest
+import org.junit.jupiter.params.provider.Arguments
+import org.junit.jupiter.params.provider.MethodSource
+
+@TestInstance(TestInstance.Lifecycle.PER_CLASS)
+abstract class BaseNotationTest(
+	private val notation: StringNotation,
+	private val unchangedWords: List<NotationTestData>,
+	private val parseOnlyWords: List<NotationTestData> = emptyList(),
+	private val printOnlyWords: List<NotationTestData> = emptyList()
+) {
+	@ParameterizedTest(name = "\"{1}\" -> {2}")
+	@MethodSource("parseWords")
+	fun `parses words correctly`(minimumJavaVersion: Int, input: String, expectedWord: Word) {
+		assumeTrue(currentJavaVersion >= minimumJavaVersion, "Requires at least Java $minimumJavaVersion")
+		expect(input.fromNotation(notation)) {
+			feature(Word::partsList).toBe(expectedWord.partsList)
+		}
+	}
+
+	@ParameterizedTest(name = "{2} -> \"{1}\"")
+	@MethodSource("printWords")
+	fun `prints words correctly`(minimumJavaVersion: Int, expectedResult: String, sourceWord: Word) {
+		assumeTrue(currentJavaVersion >= minimumJavaVersion, "Requires at least Java $minimumJavaVersion")
+		expect(sourceWord) {
+			feature(Word::toNotation, notation).toBe(expectedResult)
+		}
+	}
+
+	@ParameterizedTest(name = "\"{1}\"")
+	@MethodSource("unchangedWords")
+	fun `parsing and printing a word written in this notation does not change the word`(minimumJavaVersion: Int, word: String) {
+		assumeTrue(currentJavaVersion >= minimumJavaVersion, "Requires at least Java $minimumJavaVersion")
+		expect(word) {
+			feature(String::fromNotation, notation) {
+				feature(Word::toNotation, notation).toBe(word)
+			}
+		}
+	}
+
+	private fun parseWords() = asArguments(unchangedWords + parseOnlyWords)
+	private fun printWords() = asArguments(unchangedWords + printOnlyWords)
+	private fun unchangedWords() = asArguments(unchangedWords)
+
+	private fun asArguments(pairs: List<NotationTestData>) = pairs.map {
+		Arguments.arguments(
+			it.minimumJavaVersion,
+			it.string,
+			it.word
+		)
+	}
+}
+
+data class NotationTestData(val word: Word, val string: String, var minimumJavaVersion: Int = 0)
+
+infix fun Word.to(string: String) = NotationTestData(this, string)
+infix fun String.to(word: Word) = NotationTestData(word, this)
+infix fun NotationTestData.ifJvmVersionIsAtLeast(minimumJavaVersion: Int) = this.apply { this.minimumJavaVersion = minimumJavaVersion }
+
+val currentJavaVersion by lazy {
+	System.getProperty("java.runtime.version")
+		.split(".")
+		.let { if (it[0] == "1") it.drop(1) else it }[0]
+		.toInt()
+}
diff --git a/src/test/kotlin/JavaNotationsTest.kt b/src/test/kotlin/JavaNotationsTest.kt
diff --git a/src/test/kotlin/NotationsTest.kt b/src/test/kotlin/NotationsTest.kt