blaze-base/tests/integrationtests/com/google/idea/blaze/base/lang/buildfile/lexer/HighlightingLexerTest.java - intellij - Git at Google

 /*
  * Copyright 2016 The Bazel Authors. All rights reserved.
  *
  * Licensed under the Apache License, Version 2.0 (the "License");
  * you may not use this file except in compliance with the License.
  * You may obtain a copy of the License at
  *
  *    http://www.apache.org/licenses/LICENSE-2.0
  *
  * Unless required by applicable law or agreed to in writing, software
  * distributed under the License is distributed on an "AS IS" BASIS,
  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  * See the License for the specific language governing permissions and
  * limitations under the License.
  */
 package com.google.idea.blaze.base.lang.buildfile.lexer;

 import org.junit.Test;
 import org.junit.runner.RunWith;
 import org.junit.runners.JUnit4;

 import static org.junit.Assert.assertEquals;

 /**
  * Tests of tokenization behavior of {@link BuildLexerBase} in 'highlighting mode' (see {@link BuildLexerBase.LexerMode})
  */
 @RunWith(JUnit4.class)
 public class HighlightingLexerTest extends AbstractLexerTest {

   public HighlightingLexerTest() {
     super(BuildLexerBase.LexerMode.SyntaxHighlighting);
   }

   @Test
   public void testBasics1() throws Exception {
     assertEquals("IDENTIFIER RPAREN WHITESPACE", names(tokens("wiz) ")));
     assertEquals("IDENTIFIER WHITESPACE RPAREN", names(tokens("wiz )")));
     assertEquals("WHITESPACE IDENTIFIER RPAREN", names(tokens(" wiz)")));
     assertEquals("WHITESPACE IDENTIFIER WHITESPACE RPAREN WHITESPACE", names(tokens(" wiz ) ")));
     assertEquals("IDENTIFIER WHITESPACE RPAREN", names(tokens("wiz\t)")));
   }

   @Test
   public void testBasics2() throws Exception {
     assertEquals("RPAREN", names(tokens(")")));
     assertEquals("WHITESPACE RPAREN", names(tokens(" )")));
     assertEquals("WHITESPACE RPAREN WHITESPACE", names(tokens(" ) ")));
     assertEquals("RPAREN WHITESPACE", names(tokens(") ")));
   }

   @Test
   public void testBasics3() throws Exception {
     assertEquals("INT COMMENT NEWLINE INT", names(tokens("123#456\n789")));
     assertEquals("INT WHITESPACE COMMENT NEWLINE INT", names(tokens("123 #456\n789")));
     assertEquals("INT COMMENT NEWLINE INT", names(tokens("123#456 \n789")));
     assertEquals("INT COMMENT NEWLINE WHITESPACE INT", names(tokens("123#456\n 789")));
     assertEquals("INT COMMENT NEWLINE INT WHITESPACE", names(tokens("123#456\n789 ")));
   }

   @Test
   public void testBasics4() throws Exception {
     assertEquals("", names(tokens("")));
     assertEquals("COMMENT", names(tokens("# foo")));
     assertEquals("INT WHITESPACE INT WHITESPACE INT WHITESPACE INT", names(tokens("1 2 3 4")));
     assertEquals("INT DOT INT", names(tokens("1.234")));
     assertEquals("IDENTIFIER LPAREN IDENTIFIER COMMA WHITESPACE IDENTIFIER RPAREN", names(tokens("foo(bar, wiz)")));
   }

   @Test
   public void testIntegersAndDot() throws Exception {
     assertEquals("INT(1) DOT INT(2345)", values(tokens("1.2345")));

     assertEquals("INT(1) DOT INT(2) DOT INT(345)", values(tokens("1.2.345")));

     assertEquals("INT(1) DOT INT(0)", values(tokens("1.23E10")));
     assertEquals("invalid base-10 integer constant: 23E10", lastError);

     assertEquals("INT(1) DOT INT(0) MINUS INT(10)", values(tokens("1.23E-10")));
     assertEquals("invalid base-10 integer constant: 23E", lastError);

     assertEquals("DOT WHITESPACE INT(123)", values(tokens(". 123")));
     assertEquals("DOT INT(123)", values(tokens(".123")));
     assertEquals("DOT IDENTIFIER(abc)", values(tokens(".abc")));

     assertEquals("IDENTIFIER(foo) DOT INT(123)", values(tokens("foo.123")));
     assertEquals("IDENTIFIER(foo) DOT IDENTIFIER(bcd)", values(tokens("foo.bcd"))); // 'b' are hex chars
     assertEquals("IDENTIFIER(foo) DOT IDENTIFIER(xyz)", values(tokens("foo.xyz")));
   }

   @Test
   public void testNoIndentation() throws Exception {
     assertEquals("INT(1) NEWLINE INT(2) NEWLINE INT(3)",
       values(tokens("1\n2\n3")));
     assertEquals("INT(1) NEWLINE WHITESPACE INT(2) NEWLINE WHITESPACE INT(3) NEWLINE INT(4) WHITESPACE",
       values(tokens("1\n  2\n  3\n4 ")));
     assertEquals("INT(1) NEWLINE WHITESPACE INT(2) NEWLINE WHITESPACE INT(3)",
       values(tokens("1\n  2\n  3")));
     assertEquals("INT(1) NEWLINE WHITESPACE INT(2) NEWLINE WHITESPACE INT(3)",
       values(tokens("1\n  2\n    3")));
     assertEquals("INT(1) NEWLINE WHITESPACE INT(2) NEWLINE WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
       values(tokens("1\n  2\n    3\n  4\n5")));

     assertEquals("INT(1) NEWLINE WHITESPACE INT(2) NEWLINE WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
       values(tokens("1\n  2\n    3\n   4\n5")));
   }

   @Test
   public void testIndentationInsideParens() throws Exception {
     // Indentation is ignored inside parens:
     assertEquals("INT(1) WHITESPACE LPAREN NEWLINE WHITESPACE INT(2) NEWLINE " +
       "WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
       values(tokens("1 (\n  2\n    3\n  4\n5")));
     assertEquals("INT(1) WHITESPACE LBRACE NEWLINE WHITESPACE INT(2) NEWLINE " +
       "WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
       values(tokens("1 {\n  2\n    3\n  4\n5")));
     assertEquals("INT(1) WHITESPACE LBRACKET NEWLINE WHITESPACE INT(2) NEWLINE " +
       "WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
       values(tokens("1 [\n  2\n    3\n  4\n5")));
     assertEquals("INT(1) WHITESPACE LBRACKET NEWLINE WHITESPACE INT(2) RBRACKET " +
       "NEWLINE WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
       values(tokens("1 [\n  2]\n    3\n    4\n5")));
   }

   @Test
   public void testNoIndentationAtEOF() throws Exception {
     assertEquals("NEWLINE WHITESPACE INT(1)", values(tokens("\n  1")));
   }

   @Test
   public void testBlankLineIndentation() throws Exception {
     // Blank lines and comment lines should not generate any newlines indents
     // (but note that every input ends with).
     assertEquals("NEWLINE WHITESPACE COMMENT NEWLINE", names(tokens("\n      #\n")));
     assertEquals("WHITESPACE COMMENT", names(tokens("      #")));
     assertEquals("WHITESPACE COMMENT NEWLINE", names(tokens("      #\n")));
     assertEquals("WHITESPACE COMMENT NEWLINE", names(tokens("      #comment\n")));
     assertEquals("DEF WHITESPACE IDENTIFIER LPAREN IDENTIFIER RPAREN COLON NEWLINE WHITESPACE " +
       "COMMENT NEWLINE NEWLINE WHITESPACE NEWLINE WHITESPACE RETURN WHITESPACE IDENTIFIER NEWLINE",
       names(tokens("def f(x):\n"
         + "  # comment\n"
         + "\n"
         + "  \n"
         + "  return x\n")));
   }

   @Test
   public void testMultipleCommentLines() throws Exception {
     assertEquals("COMMENT NEWLINE COMMENT NEWLINE COMMENT NEWLINE COMMENT NEWLINE DEF WHITESPACE IDENTIFIER " +
       "LPAREN IDENTIFIER RPAREN COLON NEWLINE WHITESPACE RETURN WHITESPACE IDENTIFIER NEWLINE",
       names(tokens("# Copyright\n"
         + "#\n"
         + "# A comment line\n"
         + "# An adjoining line\n"
         + "def f(x):\n"
         + "  return x\n")));
   }

   @Test
   public void testBackslash() throws Exception {
     // illegal characters marked as whitespace (skipped by parser)
     assertEquals("IDENTIFIER WHITESPACE IDENTIFIER",
       names(tokens("a\\\nb")));
     assertEquals("IDENTIFIER ILLEGAL WHITESPACE IDENTIFIER",
       names(tokens("a\\ b")));
     assertEquals("IDENTIFIER LPAREN WHITESPACE INT RPAREN",
       names(tokens("a(\\\n2)")));
   }

   @Test
   public void testTokenPositions() throws Exception {
     assertEquals("[0,3) [3,4) [4,7) [7,8) [8,9) [9,10) [10,11) [11,12) [12,13) [13,19) [19,20) [20,21)",
       positions(tokens("foo(bar, {1: 'quux'})")));
   }

 }
	/*
	* Copyright 2016 The Bazel Authors. All rights reserved.
	*
	* Licensed under the Apache License, Version 2.0 (the "License");
	* you may not use this file except in compliance with the License.
	* You may obtain a copy of the License at
	*
	* http://www.apache.org/licenses/LICENSE-2.0
	*
	* Unless required by applicable law or agreed to in writing, software
	* distributed under the License is distributed on an "AS IS" BASIS,
	* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
	* See the License for the specific language governing permissions and
	* limitations under the License.
	*/
	package com.google.idea.blaze.base.lang.buildfile.lexer;

	import org.junit.Test;
	import org.junit.runner.RunWith;
	import org.junit.runners.JUnit4;

	import static org.junit.Assert.assertEquals;

	/**
	* Tests of tokenization behavior of {@link BuildLexerBase} in 'highlighting mode' (see {@link BuildLexerBase.LexerMode})
	*/
	@RunWith(JUnit4.class)
	public class HighlightingLexerTest extends AbstractLexerTest {

	public HighlightingLexerTest() {
	super(BuildLexerBase.LexerMode.SyntaxHighlighting);
	}

	@Test
	public void testBasics1() throws Exception {
	assertEquals("IDENTIFIER RPAREN WHITESPACE", names(tokens("wiz) ")));
	assertEquals("IDENTIFIER WHITESPACE RPAREN", names(tokens("wiz )")));
	assertEquals("WHITESPACE IDENTIFIER RPAREN", names(tokens(" wiz)")));
	assertEquals("WHITESPACE IDENTIFIER WHITESPACE RPAREN WHITESPACE", names(tokens(" wiz ) ")));
	assertEquals("IDENTIFIER WHITESPACE RPAREN", names(tokens("wiz\t)")));
	}

	@Test
	public void testBasics2() throws Exception {
	assertEquals("RPAREN", names(tokens(")")));
	assertEquals("WHITESPACE RPAREN", names(tokens(" )")));
	assertEquals("WHITESPACE RPAREN WHITESPACE", names(tokens(" ) ")));
	assertEquals("RPAREN WHITESPACE", names(tokens(") ")));
	}

	@Test
	public void testBasics3() throws Exception {
	assertEquals("INT COMMENT NEWLINE INT", names(tokens("123#456\n789")));
	assertEquals("INT WHITESPACE COMMENT NEWLINE INT", names(tokens("123 #456\n789")));
	assertEquals("INT COMMENT NEWLINE INT", names(tokens("123#456 \n789")));
	assertEquals("INT COMMENT NEWLINE WHITESPACE INT", names(tokens("123#456\n 789")));
	assertEquals("INT COMMENT NEWLINE INT WHITESPACE", names(tokens("123#456\n789 ")));
	}

	@Test
	public void testBasics4() throws Exception {
	assertEquals("", names(tokens("")));
	assertEquals("COMMENT", names(tokens("# foo")));
	assertEquals("INT WHITESPACE INT WHITESPACE INT WHITESPACE INT", names(tokens("1 2 3 4")));
	assertEquals("INT DOT INT", names(tokens("1.234")));
	assertEquals("IDENTIFIER LPAREN IDENTIFIER COMMA WHITESPACE IDENTIFIER RPAREN", names(tokens("foo(bar, wiz)")));
	}

	@Test
	public void testIntegersAndDot() throws Exception {
	assertEquals("INT(1) DOT INT(2345)", values(tokens("1.2345")));

	assertEquals("INT(1) DOT INT(2) DOT INT(345)", values(tokens("1.2.345")));

	assertEquals("INT(1) DOT INT(0)", values(tokens("1.23E10")));
	assertEquals("invalid base-10 integer constant: 23E10", lastError);

	assertEquals("INT(1) DOT INT(0) MINUS INT(10)", values(tokens("1.23E-10")));
	assertEquals("invalid base-10 integer constant: 23E", lastError);

	assertEquals("DOT WHITESPACE INT(123)", values(tokens(". 123")));
	assertEquals("DOT INT(123)", values(tokens(".123")));
	assertEquals("DOT IDENTIFIER(abc)", values(tokens(".abc")));

	assertEquals("IDENTIFIER(foo) DOT INT(123)", values(tokens("foo.123")));
	assertEquals("IDENTIFIER(foo) DOT IDENTIFIER(bcd)", values(tokens("foo.bcd"))); // 'b' are hex chars
	assertEquals("IDENTIFIER(foo) DOT IDENTIFIER(xyz)", values(tokens("foo.xyz")));
	}

	@Test
	public void testNoIndentation() throws Exception {
	assertEquals("INT(1) NEWLINE INT(2) NEWLINE INT(3)",
	values(tokens("1\n2\n3")));
	assertEquals("INT(1) NEWLINE WHITESPACE INT(2) NEWLINE WHITESPACE INT(3) NEWLINE INT(4) WHITESPACE",
	values(tokens("1\n 2\n 3\n4 ")));
	assertEquals("INT(1) NEWLINE WHITESPACE INT(2) NEWLINE WHITESPACE INT(3)",
	values(tokens("1\n 2\n 3")));
	assertEquals("INT(1) NEWLINE WHITESPACE INT(2) NEWLINE WHITESPACE INT(3)",
	values(tokens("1\n 2\n 3")));
	assertEquals("INT(1) NEWLINE WHITESPACE INT(2) NEWLINE WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
	values(tokens("1\n 2\n 3\n 4\n5")));

	assertEquals("INT(1) NEWLINE WHITESPACE INT(2) NEWLINE WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
	values(tokens("1\n 2\n 3\n 4\n5")));
	}

	@Test
	public void testIndentationInsideParens() throws Exception {
	// Indentation is ignored inside parens:
	assertEquals("INT(1) WHITESPACE LPAREN NEWLINE WHITESPACE INT(2) NEWLINE " +
	"WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
	values(tokens("1 (\n 2\n 3\n 4\n5")));
	assertEquals("INT(1) WHITESPACE LBRACE NEWLINE WHITESPACE INT(2) NEWLINE " +
	"WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
	values(tokens("1 {\n 2\n 3\n 4\n5")));
	assertEquals("INT(1) WHITESPACE LBRACKET NEWLINE WHITESPACE INT(2) NEWLINE " +
	"WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
	values(tokens("1 [\n 2\n 3\n 4\n5")));
	assertEquals("INT(1) WHITESPACE LBRACKET NEWLINE WHITESPACE INT(2) RBRACKET " +
	"NEWLINE WHITESPACE INT(3) NEWLINE WHITESPACE INT(4) NEWLINE INT(5)",
	values(tokens("1 [\n 2]\n 3\n 4\n5")));
	}

	@Test
	public void testNoIndentationAtEOF() throws Exception {
	assertEquals("NEWLINE WHITESPACE INT(1)", values(tokens("\n 1")));
	}

	@Test
	public void testBlankLineIndentation() throws Exception {
	// Blank lines and comment lines should not generate any newlines indents
	// (but note that every input ends with).
	assertEquals("NEWLINE WHITESPACE COMMENT NEWLINE", names(tokens("\n #\n")));
	assertEquals("WHITESPACE COMMENT", names(tokens(" #")));
	assertEquals("WHITESPACE COMMENT NEWLINE", names(tokens(" #\n")));
	assertEquals("WHITESPACE COMMENT NEWLINE", names(tokens(" #comment\n")));
	assertEquals("DEF WHITESPACE IDENTIFIER LPAREN IDENTIFIER RPAREN COLON NEWLINE WHITESPACE " +
	"COMMENT NEWLINE NEWLINE WHITESPACE NEWLINE WHITESPACE RETURN WHITESPACE IDENTIFIER NEWLINE",
	names(tokens("def f(x):\n"
	+ " # comment\n"
	+ "\n"
	+ " \n"
	+ " return x\n")));
	}

	@Test
	public void testMultipleCommentLines() throws Exception {
	assertEquals("COMMENT NEWLINE COMMENT NEWLINE COMMENT NEWLINE COMMENT NEWLINE DEF WHITESPACE IDENTIFIER " +
	"LPAREN IDENTIFIER RPAREN COLON NEWLINE WHITESPACE RETURN WHITESPACE IDENTIFIER NEWLINE",
	names(tokens("# Copyright\n"
	+ "#\n"
	+ "# A comment line\n"
	+ "# An adjoining line\n"
	+ "def f(x):\n"
	+ " return x\n")));
	}

	@Test
	public void testBackslash() throws Exception {
	// illegal characters marked as whitespace (skipped by parser)
	assertEquals("IDENTIFIER WHITESPACE IDENTIFIER",
	names(tokens("a\\\nb")));
	assertEquals("IDENTIFIER ILLEGAL WHITESPACE IDENTIFIER",
	names(tokens("a\\ b")));
	assertEquals("IDENTIFIER LPAREN WHITESPACE INT RPAREN",
	names(tokens("a(\\\n2)")));
	}

	@Test
	public void testTokenPositions() throws Exception {
	assertEquals("[0,3) [3,4) [4,7) [7,8) [8,9) [9,10) [10,11) [11,12) [12,13) [13,19) [19,20) [20,21)",
	positions(tokens("foo(bar, {1: 'quux'})")));
	}

	}