fix bug: wasn't setting charPosInLine for first token. add sqlite as option.

parrt · parrt · commit 72bca40cc95f · 2016-04-12T17:41:00.000-07:00
diff --git a/java/src/org/antlr/codebuff/Formatter.java b/java/src/org/antlr/codebuff/Formatter.java
@@ -5,7 +5,6 @@
 import org.antlr.v4.runtime.ParserRuleContext;
 import org.antlr.v4.runtime.Token;
 import org.antlr.v4.runtime.WritableToken;
-import org.antlr.v4.runtime.misc.Interval;
 import org.antlr.v4.runtime.tree.ParseTree;
 import org.antlr.v4.runtime.tree.TerminalNode;
 
@@ -82,24 +81,18 @@ public List<TokenPositionAnalysis> getAnalysisPerToken() {
 		return analysis;
 	}
 
-
 	public String format() {
 		if ( tokenToNodeMap == null ) {
 			tokenToNodeMap = indexTree(root);
 		}
 
 		tokens.seek(0);
 		WritableToken firstToken = (WritableToken)tokens.LT(1);
-		WritableToken secondToken = (WritableToken)tokens.LT(2);
-		// all tokens are wiped of line/col info so set them for first 2
+		// all tokens are wiped of line/col info so set them for first 1 token and emit
 		firstToken.setLine(1);
 		firstToken.setCharPositionInLine(0);
-		secondToken.setLine(1);
-		secondToken.setCharPositionInLine(firstToken.getText().length());
-
-		String prefix = tokens.getText(Interval.of(0, secondToken.getTokenIndex()));
-		output.append(prefix);
-
+		charPosInLine = firstToken.getText().length();
+		output.append(firstToken.getText());
 
 		realTokens = getRealTokens(tokens);
 		for (int i = CollectFeatures.ANALYSIS_START_TOKEN_INDEX; i<realTokens.size(); i++) { // can't process first 2 tokens
diff --git a/java/src/org/antlr/codebuff/Tool.java b/java/src/org/antlr/codebuff/Tool.java
@@ -30,7 +30,8 @@
  *
  * Testing:
  *
- * Tool  -antlr     ../corpus/antlr4/samples       ../corpus/antlr4/test/Clojure.g4
+ * Tool  -antlr     ../corpus/antlr4/training       ../corpus/antlr4/testing/Clojure.g4
+ * Tool  -sqlite    ../corpus/sqlite/training       ../corpus/sqlite/testing/t1.sql
  * Tool  -java      ../samples/stringtemplate4     src/org/antlr/codebuff/Tool.java
  * Tool  -java      ../samples/stringtemplate4     ../samples/stringtemplate4/org/stringtemplate/v4/AutoIndentWriter.java
  */
@@ -42,30 +43,46 @@ public static void main(String[] args)
 		throws Exception
 	{
 		if ( args.length<2 ) {
-			System.err.println("ExtractFeatures [-java|-antlr] root-dir-of-samples test-file");
+			System.err.println("ExtractFeatures [-java|-antlr|-sqlite] root-dir-of-samples test-file");
 		}
 		int tabSize = 4; // TODO: MAKE AN ARGUMENT
 		String language = args[0];
 		String corpusDir = args[1];
 		String testFilename = args[2];
-		String output;
-		if ( language.equals("-java") ) {
-			Corpus corpus = train(corpusDir, ".*\\.java", JavaLexer.class, JavaParser.class, "compilationUnit", tabSize, true);
-			InputDocument testDoc = load(testFilename, JavaLexer.class, tabSize);
-			Pair<String,List<TokenPositionAnalysis>> results = format(corpus, testDoc, JavaLexer.class, JavaParser.class, "compilationUnit", tabSize);
-			output = results.a;
-			List<TokenPositionAnalysis> analysisPerToken = results.b;
-			GUIController controller = new GUIController(analysisPerToken, testDoc, output, JavaLexer.class);
-			controller.show();
-		}
-		else {
-			Corpus corpus = train(corpusDir, ".*\\.g4", ANTLRv4Lexer.class, ANTLRv4Parser.class, "grammarSpec", tabSize, true);
-			InputDocument testDoc = load(testFilename, ANTLRv4Lexer.class, tabSize);
-			Pair<String,List<TokenPositionAnalysis>> results = format(corpus, testDoc, ANTLRv4Lexer.class, ANTLRv4Parser.class, "grammarSpec", tabSize);
-			output = results.a;
-			List<TokenPositionAnalysis> analysisPerToken = results.b;
-			GUIController controller = new GUIController(analysisPerToken, testDoc, output, ANTLRv4Lexer.class);
-			controller.show();
+		String output = "???";
+		Corpus corpus;
+		InputDocument testDoc;
+		GUIController controller;
+		List<TokenPositionAnalysis> analysisPerToken;
+		Pair<String, List<TokenPositionAnalysis>> results;
+		switch ( language ) {
+			case "-java":
+				corpus = train(corpusDir, ".*\\.java", JavaLexer.class, JavaParser.class, "compilationUnit", tabSize, true);
+				testDoc = load(testFilename, JavaLexer.class, tabSize);
+				results = format(corpus, testDoc, JavaLexer.class, JavaParser.class, "compilationUnit", tabSize);
+				output = results.a;
+				analysisPerToken = results.b;
+				controller = new GUIController(analysisPerToken, testDoc, output, JavaLexer.class);
+				controller.show();
+				break;
+			case "-antlr":
+				corpus = train(corpusDir, ".*\\.g4", ANTLRv4Lexer.class, ANTLRv4Parser.class, "grammarSpec", tabSize, true);
+				testDoc = load(testFilename, ANTLRv4Lexer.class, tabSize);
+				results = format(corpus, testDoc, ANTLRv4Lexer.class, ANTLRv4Parser.class, "grammarSpec", tabSize);
+				output = results.a;
+				analysisPerToken = results.b;
+				controller = new GUIController(analysisPerToken, testDoc, output, ANTLRv4Lexer.class);
+				controller.show();
+				break;
+			case "-sqlite":
+				corpus = train(corpusDir, ".*\\.sql", SQLiteLexer.class, SQLiteParser.class, "parse", tabSize, true);
+				testDoc = load(testFilename, SQLiteLexer.class, tabSize);
+				results = format(corpus, testDoc, SQLiteLexer.class, SQLiteParser.class, "parse", tabSize);
+				output = results.a;
+				analysisPerToken = results.b;
+				controller = new GUIController(analysisPerToken, testDoc, output, SQLiteLexer.class);
+				controller.show();
+				break;
 		}
 		System.out.println(output);
 	}