Why the performance is so bad #2083

hydra1983 · 2024-12-27T17:29:38Z

hydra1983
Dec 27, 2024

Performance test based on jest-bench

It took me three days to implement the g4 grammar using Chevrotain, but the performance turned out to be significantly worse than before.

Antlr4

antlr4

grammar Formula;

// antlr的分析器定义文件

//////////////////// parser rules:

// The entry point of the grammar
formula
    : expr
    ;

// Defines expressions based on operator precedence similar to JavaScript
// 运算符优先级按照JS的风格来，具体参考（https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Operators/Operator_Precedence）
expr
    : FIELD                                       # field          // 字段 (e.g., #field.name#)
    | INT                                         # int            // 整数 (e.g., 123)
    | DOUBLE                                      # double         // 浮点数 (e.g., 123.45)
    | String                                      # str            // 字符串 (e.g., "text")
    | op=(TRUE | FALSE)                           # bool           // 布尔值 (true/false)
    | NULL                                        # null           // 空值 (null)
    | LPAREN expr RPAREN                          # parens         // 括号 (e.g., (a + b))
    | ID LPAREN (expr (COMMA expr)*)? RPAREN      # func           // 函数调用 (e.g., SUM(a, b))
    | '[' (expr (COMMA expr)*)? ']'               # list           // 数组 (e.g., [1, 2, 3])
    | op=MINUS expr                               # unaryOperator  // 一元运算符：负号(-)
    | expr op=(MULTIPLY | DIVIDE) expr            # mulDiv         // 乘除法 (e.g., a * b or a / b)
    | expr op=(PLUS | MINUS) expr                 # plusMinus      // 加减法 (e.g., a + b or a - b)
    | expr op=(EQ | NEQ | LT | LE | GT | GE) expr # compare        // 比较符 (e.g., a > b, a == b)
    | expr expr                                   # error          // 错误 (invalid expressions)
    ;

//////////////////// lexer rules:

// Arithmetic and comparison operators
PLUS        : '+';                // Addition
MINUS       : '-';                // Subtraction
MULTIPLY    : '*';                // Multiplication
DIVIDE      : '/';                // Division

// Parentheses for grouping expressions
LPAREN      : '(' | '（';         // Left parenthesis (including full-width version)
RPAREN      : ')' | '）';         // Right parenthesis (including full-width version)

// Comparison operators
EQ          : '==';               // Equal
NEQ         : '!=';               // Not equal
LT          : '<';                // Less than
LE          : '<=';               // Less than or equal to
GT          : '>';                // Greater than
GE          : '>=';               // Greater than or equal to

// Boolean and null literals
FALSE       : 'FALSE' | 'false';  // Boolean false
TRUE        : 'TRUE' | 'true';    // Boolean true
NULL        : 'NULL' | 'null';    // Null value

// Comma as a separator (supports both half-width and full-width)
COMMA       : ',' | '，';         // Comma separator

// Identifier rule for variables and fields
ID
    : [$_A-Za-z\u4e00-\u9fa5][_A-Za-z0-9\u4e00-\u9fa5]* | '[' [0-9*]+ ']'
    ;                             // Identifiers can include letters, numbers, and underscores

// Field rule, supporting both hashed and nested formats
FIELD
    : '#' ID ('.' ID)* '#' | ID ('.' ID)*
    ;                             // e.g., #field.name# or field.name

// Integer literals
INT
    : '0' | [1-9][0-9]*
    ;                             // e.g., 0, 123, 456

// Floating-point literals
DOUBLE
    : ('0' | [1-9][0-9]*)('.'[0-9]*)?
    ;                             // e.g., 0.1, 123.45

// Whitespace, ignored during parsing
WS
    : [ \t\r\n]+ -> skip
    ;                             // Skips spaces, tabs, and newlines

// String literals (supports both double quotes and Chinese quotation marks)
String
    : '"' (StringCharacter+)? '"' | '“' (StringCharacter+)? '”'
    ;                             // e.g., "text", “text”

// Allowed characters within strings
StringCharacter
    : ~["“”\\] | EscapeSequence
    ;                             // Any character except quotes or backslashes, or an escape sequence

// Escape sequences for strings
EscapeSequence
    : '\\' [btnfr"“”'\\] |  UnicodeEscape
    ;                             // e.g., \n, \t, \" or Unicode sequences

// Unicode escape sequence
UnicodeEscape
    : '\\' 'u' HexDigit HexDigit HexDigit HexDigit
    ;                             // e.g., \u1234

// Hexadecimal digit
HexDigit
    : [0-9a-fA-F]
    ;                             // Hexadecimal characters (0-9, A-F)

Chevrontain v10.5.0

chevrotain

comments are generated by o1-mini

import { createToken, Lexer } from 'chevrotain';

/**
 * -----------------------------------------
 * Arithmetic and comparison operators
 * -----------------------------------------
 */

export const PLUS_MINUS_OPS = createToken({
  name: 'PLUS_MINUS_OPS',
  pattern: Lexer.NA,
});
// Plus sign, e.g., 1 + 2
export const PLUS = createToken({ name: 'PLUS', pattern: /\+/, categories: PLUS_MINUS_OPS }); // Addition

// Minus sign, e.g., 1 - 2
export const MINUS = createToken({ name: 'MINUS', pattern: /-/, categories: PLUS_MINUS_OPS }); // Subtraction

export const MUL_DIV_OPS = createToken({
  name: 'MUL_DIV_OPS',
  pattern: Lexer.NA,
});
// Multiplication sign, e.g., 1 * 2
export const MULTIPLY = createToken({ name: 'MULTIPLY', pattern: /\*/, categories: MUL_DIV_OPS }); // Multiplication

// Division sign, e.g., 1 / 2
export const DIVIDE = createToken({ name: 'DIVIDE', pattern: /\//, categories: MUL_DIV_OPS }); // Division

/**
 * -----------------------------------------
 * Parentheses for grouping expressions
 * (includes full-width versions)
 * -----------------------------------------
 */

// Left parenthesis '(' or '（'
export const LPAREN = createToken({ name: 'LPAREN', pattern: /\(|（/ }); // Left parenthesis

// Right parenthesis ')' or '）'
export const RPAREN = createToken({ name: 'RPAREN', pattern: /\)|）/ }); // Right parenthesis

/**
 * -----------------------------------------
 * Brackets for indexing or grouping
 * -----------------------------------------
 */

// Left square bracket '['
export const LBRACKET = createToken({ name: 'LBRACKET', pattern: /\[/ }); // Left bracket

// Right square bracket ']'
export const RBRACKET = createToken({ name: 'RBRACKET', pattern: /\]/ }); // Right bracket

/**
 * -----------------------------------------
 * Comparison operators
 * -----------------------------------------
 */

export const COMPARE_OPS = createToken({
  name: 'COMPARE_OPS',
  pattern: Lexer.NA,
});
// Less than or equal '<='
export const LE = createToken({ name: 'LE', pattern: /<=/, line_breaks: false, categories: COMPARE_OPS }); // Less Than or Equal

// Greater than or equal '>='
export const GE = createToken({ name: 'GE', pattern: />=/, line_breaks: false, categories: COMPARE_OPS }); // Greater Than or Equal

// Less than '<'
export const LT = createToken({ name: 'LT', pattern: /</, line_breaks: false, categories: COMPARE_OPS }); // Less Than

// Greater than '>'
export const GT = createToken({ name: 'GT', pattern: />/, line_breaks: false, categories: COMPARE_OPS }); // Greater Than

// Equal '=='
export const EQ = createToken({ name: 'EQ', pattern: /==/, line_breaks: false, categories: COMPARE_OPS }); // Equal

// Not equal '!='
export const NEQ = createToken({ name: 'NEQ', pattern: /!=/, line_breaks: false, categories: COMPARE_OPS }); // Not Equal

/**
 * -----------------------------------------
 * Boolean and null literals
 * -----------------------------------------
 */

// Boolean true, matches 'TRUE' or 'true'
export const TRUE = createToken({ name: 'TRUE', pattern: /TRUE|true/, line_breaks: false }); // Boolean true

// Boolean false, matches 'FALSE' or 'false'
export const FALSE = createToken({ name: 'FALSE', pattern: /FALSE|false/, line_breaks: false }); // Boolean false

// Null value, matches 'NULL' or 'null'
export const NULL = createToken({ name: 'NULL', pattern: /NULL|null/, line_breaks: false }); // Null value

/**
 * -----------------------------------------
 * Comma as a separator (supports both half-width and full-width)
 * -----------------------------------------
 */

// Comma separator, matches ',' or '，'
export const COMMA = createToken({ name: 'COMMA', pattern: /,|，/ }); // Comma separator

/**
 * -----------------------------------------
 * Identifier rule for variables and fields
 * -----------------------------------------
 */

// Define DOT token for matching '.' character
export const DOT = createToken({ name: 'DOT', pattern: /\./ });

// Define a regular expression for identifiers (ID_PATTERN)
// 1) Normal form: First character can be $_A-Za-z or Chinese, followed by $_A-Za-z0-9 or Chinese
// 2) Bracket form: [1], [2], [*], etc.
export const ID_PATTERN =
  '(?:' + // Non-capturing group to handle two cases
  // 1. Normal identifier: starts with [$_A-Za-z or Chinese], followed by [$_A-Za-z0-9 or Chinese]*
  '[$_A-Za-z\\u4E00-\\u9FA5]' +
  '[$_A-Za-z0-9\\u4E00-\\u9FA5]*' +
  // Or
  '|' +
  // 2. Bracketed identifier: '[' followed by any combination of numbers or '*', ending with ']'
  '\\[' +
  '[0-9*]+' +
  '\\]' +
  ')';

// Generate ID token for normal variable names or forms like [1]
export const ID = createToken({ name: 'ID', pattern: new RegExp(ID_PATTERN), line_breaks: false }); // Use helper pattern for ID

/**
 * -----------------------------------------
 * Field rule, reusing ID pattern
 * -----------------------------------------
 */

// Define FIELD regular expression (FIELD_PATTERN):
// 1) Wrapped in hashes: #ID(.ID)*#
// 2) Without hashes: ID(.ID)*
// ".ID" indicates multiple sub-IDs connected with '.' (nested fields)
export const FIELD_PATTERN =
  '(?:' + // Non-capturing group to handle two field formats
  // 1. Wrapped in hashes
  '#' +
  ID_PATTERN +
  '(?:' + // Non-capturing group for zero or more ".ID"
  '\\.' +
  ID_PATTERN +
  ')*' +
  '#' +
  // Or
  '|' +
  // 2. Regular nested fields
  ID_PATTERN +
  '(?:' +
  '\\.' +
  ID_PATTERN +
  ')*' +
  ')';

// Declare FIELD token; matches longer strings in preference to ID
export const FIELD = createToken({
  name: 'FIELD',
  pattern: new RegExp(FIELD_PATTERN),
  longer_alt: ID,
}); // Reuse ID pattern in FIELD definition

/**
 * -----------------------------------------
 * Integer literals
 * -----------------------------------------
 */

// Integer, e.g., 123
export const INT = createToken({ name: 'INT', pattern: /\d+/, line_breaks: false }); // Integer literals

/**
 * -----------------------------------------
 * Floating-point literals
 * -----------------------------------------
 */

// Floating-point number, e.g., 123.45
export const DOUBLE = createToken({
  name: 'DOUBLE',
  pattern: /\d+\.\d+/,
  line_breaks: false,
}); // Floating-point literals

/**
 * -----------------------------------------
 * String-related tokens
 *
 * Demonstrates how to reuse sub-patterns step by step:
 *   HexDigit -> UnicodeEscape -> EscapeSequence -> StringCharacter -> STRING
 * -----------------------------------------
 */

// Hexadecimal characters [0-9a-fA-F]
export const HEX_DIGIT_PATTERN = '[0-9a-fA-F]';

// UnicodeEscape: Format \u1234 (backslash + 'u' + 4 HexDigits)
export const UNICODE_ESCAPE_PATTERN =
  '\\u' + // Double backslashes represent a single backslash character
  '' +
  HEX_DIGIT_PATTERN +
  '{4}';

// EscapeSequence: Includes \uXXXX or regular escape characters (\n, \t, \" etc.)
export const ESCAPE_SEQUENCE_PATTERN =
  '\\\\[btnfr"“”\'\\\\]' + // Regular escapes, e.g., \n, \t, \", ...
  '|' +
  UNICODE_ESCAPE_PATTERN; // Include UnicodeEscape

/**
 * StringCharacter represents a single character within a string:
 *  - Regular character (not quotes or backslash)
 *  - Or an escape sequence (EscapeSequence)
 */
export const STRING_CHARACTER_PATTERN =
  '[^"“”\\\\]' + // Non-quote, non-backslash
  '|' +
  ESCAPE_SEQUENCE_PATTERN; // Reuse EscapeSequence

/**
 * STRING_PATTERN:
 * Supports both regular English quotes "..." and Chinese quotes “...”.
 * Can contain multiple StringCharacters.
 */
const STRING_PATTERN =
  '(?:' +
  // English quotes:
  '"' +
  '(?:' +
  STRING_CHARACTER_PATTERN +
  ')*' +
  '"' +
  ')' +
  '|' +
  '(?:' +
  // Chinese quotes:
  '“' +
  '(?:' +
  STRING_CHARACTER_PATTERN +
  ')*' +
  '”' +
  ')';

// Declare StringLiteral token to match complete strings
export const STRING = createToken({
  name: 'STRING',
  pattern: new RegExp(STRING_PATTERN),
  line_breaks: true,
  start_chars_hint: ['"“'],
});

/**
 * -----------------------------------------
 * Whitespace, ignored during parsing
 * -----------------------------------------
 */

// Matches whitespace characters [ \t\r\n]+, skipped during parsing
export const WS = createToken({
  name: 'WS',
  pattern: /\s+/,
  group: Lexer.SKIPPED,
}); // Skips spaces, tabs, and newlines

/**
 * -----------------------------------------
 * Export all tokens as an array
 * in the order specified in the .g4 file
 * -----------------------------------------
 */
export const allTokens = [
  // Whitespace, ignored during parsing
  WS,

  // Comparison operators
  EQ,
  NEQ,
  LE,
  GE,
  LT,
  GT,

  // Arithmetic and comparison operators
  PLUS,
  MINUS,
  MULTIPLY,
  DIVIDE,

  // Parentheses for grouping expressions
  LPAREN,
  RPAREN,
  LBRACKET,
  RBRACKET,

  // Comma as a separator (supports both half-width and full-width)
  COMMA,

  // Identifier rule for variables and fields
  DOT,

  // Boolean and null literals
  TRUE,
  FALSE,
  NULL,

  ID,

  // Field rule, supporting both hashed (#) and nested formats
  FIELD,

  // Floating-point literals
  DOUBLE,

  // Integer literals
  INT,

  // String literals (supports both double quotes and Chinese quotation marks)
  STRING,
  // StringCharacter,
  // EscapeSequence,
  // UnicodeEscape,
  // HexDigit,
  PLUS_MINUS_OPS,
  MUL_DIV_OPS,
  COMPARE_OPS,
];

import { IOrAlt, IParserConfig, OrMethodOpts } from '@chevrotain/types';
import { CstNode, CstParser, EOF, ParserMethod } from 'chevrotain';
import {
  COMMA,
  COMPARE_OPS,
  DOT,
  DOUBLE,
  FALSE,
  FIELD,
  ID,
  INT,
  LBRACKET,
  LPAREN,
  MINUS,
  MUL_DIV_OPS,
  NULL,
  PLUS,
  PLUS_MINUS_OPS,
  RBRACKET,
  RPAREN,
  STRING,
  TRUE,
  allTokens,
} from './formula.lexer';

export class FormulaParser extends CstParser {
  // If only the formula entry is needed externally, only expose formula,
  // other rules can be made private with _ruleName (optional).
  public formula!: ParserMethod<[], CstNode>;

  // Other rules can be read-only or fully public as needed
  public expr!: ParserMethod<[], CstNode>;
  public primary!: ParserMethod<[], CstNode>;
  public field!: ParserMethod<[], CstNode>;
  public bool!: ParserMethod<[], CstNode>;
  public parens!: ParserMethod<[], CstNode>;
  public func!: ParserMethod<[], CstNode>;
  public list!: ParserMethod<[], CstNode>;
  public unaryOperator!: ParserMethod<[], CstNode>;
  public mulDiv!: ParserMethod<[], CstNode>;
  public plusMinus!: ParserMethod<[], CstNode>;
  public compare!: ParserMethod<[], CstNode>;
  public error!: ParserMethod<[], CstNode>;

  private c1: IOrAlt<any>[] | OrMethodOpts<any>;
  private c2: IOrAlt<any>[] | OrMethodOpts<any>;
  private c3: IOrAlt<any>[] | OrMethodOpts<any>;
  private c4: IOrAlt<any>[] | OrMethodOpts<any>;
  private c5: IOrAlt<any>[] | OrMethodOpts<any>;

  constructor(config?: IParserConfig) {
    // Pass allTokens to let the parser know available tokens
    super(allTokens, config);

    this.c1 = undefined;
    this.c2 = undefined;
    this.c3 = undefined;
    this.c4 = undefined;
    this.c5 = undefined;

    const $ = this;

    /**
     * formula: Entry rule for the entire parsing process
     * Explicitly consuming EOF is recommended to ensure remaining input is not ignored.
     */
    $.formula = $.RULE('formula', () => {
      $.SUBRULE($.expr);
      // New: Consume EOF to raise an error if there are leftover tokens
      $.CONSUME(EOF);
    });

    /**
     * expr: Top-level expression, can include multiple operators (multiplication/division, addition/subtraction, comparison)
     * First parses a primary, then continues if mulDiv/plusMinus/compare appears.
     */
    $.expr = $.RULE('expr', () => {
      $.SUBRULE($.compare);
    });

    /**
     * primary: Basic expressions
     * Lists all possible terminal nodes, such as FIELD, INT, DOUBLE, STRING, boolean, NULL, parentheses expressions, functions, lists, unary operations, etc.
     */
    $.primary = $.RULE('primary', () => {
      $.OR(
        $.c1 ||
          ($.c1 = [
            // prettier-ignore
            {
              GATE: () => {
                return this.LA(1).tokenType === ID
                    && this.LA(2).tokenType === LPAREN
              },
              ALT: () => $.SUBRULE($.func)
            },
            { ALT: () => $.SUBRULE($.field) },
            { ALT: () => $.CONSUME(INT) },
            { ALT: () => $.CONSUME(DOUBLE) },
            { ALT: () => $.CONSUME(STRING) },
            { ALT: () => $.SUBRULE($.bool) },
            { ALT: () => $.CONSUME(NULL) },
            { ALT: () => $.SUBRULE($.parens) },
            { ALT: () => $.SUBRULE($.list) },
            // { ALT: () => $.SUBRULE($.unaryOperator) },
          ]),
      );
    });

    /**
     * field: Parses FIELD or ID as a field reference
     */
    $.field = $.RULE('field', () => {
      $.OR(
        $.c2 ||
          ($.c2 = [
            // 1. Parses FIELD token
            { ALT: () => $.CONSUME(FIELD) },
            // 2. Parses regular field access
            {
              ALT: () => {
                $.CONSUME(ID); // First consume ID
                $.MANY(() => {
                  $.OR2(
                    $.c3 ||
                      ($.c3 = [
                        {
                          ALT: () => {
                            $.CONSUME(DOT); // '.'
                            $.CONSUME2(ID); // Second consume ID
                          },
                        },
                        {
                          ALT: () => {
                            $.CONSUME2(DOT); // '.'
                            $.CONSUME(LBRACKET); // '['
                            $.SUBRULE($.expr); // '1'
                            $.CONSUME(RBRACKET); // ']'
                          },
                        },
                      ]),
                  );
                });
              },
            },
          ]),
      );
    });

    /**
     * bool: Boolean literals (TRUE/FALSE)
     */
    $.bool = $.RULE('bool', () => {
      $.OR($.c4 || ($.c4 = [{ ALT: () => $.CONSUME(TRUE) }, { ALT: () => $.CONSUME(FALSE) }]));
    });

    /**
     * parens: Parentheses expression ( expr )
     * - LPAREN + expr + RPAREN
     */
    $.parens = $.RULE('parens', () => {
      $.CONSUME(LPAREN);
      $.SUBRULE($.expr);
      $.CONSUME(RPAREN);
    });

    /**
     * func: Function calls
     * Format: ID ( [expr(, expr)*] ), allows no arguments (OPTION)
     */
    $.func = $.RULE('func', () => {
      $.CONSUME(ID);
      $.CONSUME(LPAREN);
      $.OPTION(() => {
        $.SUBRULE($.expr);
        $.MANY(() => {
          $.CONSUME(COMMA);
          $.SUBRULE2($.expr);
        });
      });
      $.CONSUME(RPAREN);
    });

    /**
     * list: Lists [ expr (, expr)* ]
     * Starts with LBRACKET '[', optional expr, multiple separated by commas, ends with RBRACKET ']'
     */
    $.list = $.RULE('list', () => {
      $.CONSUME(LBRACKET);
      $.OPTION(() => {
        $.SUBRULE($.expr);
        $.MANY(() => {
          $.CONSUME(COMMA);
          $.SUBRULE2($.expr);
        });
      });
      $.CONSUME(RBRACKET);
    });

    /**
     * compare: Comparison operators
     * =, !=, <, <=, >, >=
     */
    $.compare = $.RULE('compare', () => {
      $.SUBRULE($.plusMinus, { LABEL: 'lhs' });
      $.MANY(() => {
        $.CONSUME(COMPARE_OPS);
        $.SUBRULE2($.plusMinus, { LABEL: 'rhs' });
      });
    });

    /**
     * plusMinus: Addition/Subtraction (binary operations)
     * If + or - appears after expr, matches and consumes another primary
     */
    $.plusMinus = $.RULE('plusMinus', () => {
      $.SUBRULE($.mulDiv, { LABEL: 'lhs' });
      $.MANY(() => {
        $.CONSUME(PLUS_MINUS_OPS);
        $.SUBRULE2($.mulDiv, { LABEL: 'rhs' });
      });
    });

    /**
     * mulDiv: Multiplication/Division (binary operations)
     * Indicates that the current expr accepts a * or / and continues matching primary
     */
    $.mulDiv = $.RULE('mulDiv', () => {
      $.SUBRULE($.unaryOperator, { LABEL: 'lhs' });
      $.MANY(() => {
        $.CONSUME(MUL_DIV_OPS);
        $.SUBRULE2($.unaryOperator, { LABEL: 'rhs' });
      });
    });

    /**
     * unaryOperator: Unary operations
     * +primary / -primary
     */
    $.unaryOperator = $.RULE('unaryOperator', () => {
      $.OPTION(() => {
        $.OR($.c5 || ($.c5 = [{ ALT: () => $.CONSUME(PLUS) }, { ALT: () => $.CONSUME(MINUS) }]));
      });
      $.SUBRULE($.primary);
    });

    $.error = $.RULE('error', () => {
      $.SUBRULE($.expr);
      $.SUBRULE2($.expr);
    });

    // Initialize the parser (mandatory)
    $.performSelfAnalysis();
  }
}

const maxLookahead = 2;
const traceInitPerf = false;
const skipValidations = true;

const defaultParser = (() =>
  new FormulaParser({
    maxLookahead,
    traceInitPerf,
    skipValidations,
  }))();

const locationTrackingParser = (() =>
  new FormulaParser({
    nodeLocationTracking: 'onlyOffset',
    maxLookahead,
    traceInitPerf,
    skipValidations,
  }))();

const createLexer = () =>
  new Lexer(allTokens, {
    ensureOptimizations: true,
    traceInitPerf,
    skipValidations,
  });

Answered by bd82

Mar 9, 2025

Hello @hydra1983

Modeling the binary operator precedence as part of the grammar tends to result in very deeply nested parse trees
and a large performance overhead.

Perhaps Antlr has some optimizations around this pattern.
If you are building a productive grammar with Chevrotain which uses binary operators
I would recommend to apply the Swift programming language approach of parsing the operators as a flat list
and computing the precedence at a post-parsing phase.

https://docs.swift.org/swift-book/documentation/the-swift-programming-language/expressions/#Infix-Expressions
See the Note section in the above link

View full answer

msujew · 2024-12-27T22:44:58Z

msujew
Dec 27, 2024
Collaborator

Hey @hydra1983,

I've converted this into a discussion. Have you tried profiling your code yet? Node.js features some pretty good profiling that should help you identify bottlenecks.

Generally, Chevrotain has been the fastest option for parsing text in the JS space for me. However, it is easy to accidentally run into slow behavior. For example, do you get any parser errors? Or does the whole input parse without errors? Do you recreate the parser during your benchmark, or do you use the same object for the whole benchmark?

2 replies

hydra1983 Dec 28, 2024
Author

Hey @hydra1983,

I've converted this into a discussion. Have you tried profiling your code yet? Node.js features some pretty good profiling that should help you identify bottlenecks.

Generally, Chevrotain has been the fastest option for parsing text in the JS space for me. However, it is easy to accidentally run into slow behavior. For example, do you get any parser errors? Or does the whole input parse without errors? Do you recreate the parser during your benchmark, or do you use the same object for the whole benchmark?

below is my benchmark code

import { benchmarkSuite } from 'jest-bench';
import { FormulaCalculator, FormulaCalculatorImpl } from '../src';
import { Antlr4FormulaCalculator } from '../src/lib/calculator/antlr4/formula.calculator';
import { ChevrotainFormulaCalculator } from '../src/lib/calculator/chevrotain/formula.calculator';

let antlrCalculator: FormulaCalculator;
let chevrotainCalculator: FormulaCalculator;
const formula = {
  expression: '1',
};

benchmarkSuite('antlrCalculator', {
  setupSuite() {
    antlrCalculator = new FormulaCalculatorImpl(undefined, undefined, new Antlr4FormulaCalculator());
  },

  ['antlrCalculator.calculate']: () => {
    antlrCalculator.calculate(formula);
  },
});

benchmarkSuite('chevrotainCalculator', {
  setupSuite() {
    chevrotainCalculator = new FormulaCalculatorImpl(undefined, undefined, new ChevrotainFormulaCalculator());
  },

  ['chevrotainCalculator.calculate']: () => {
    chevrotainCalculator.calculate(formula);
  },
});

All unit tests with antlr4 passed

nx run @dg/lcdp-formula:test                                                                                                                                                                                    ─╯

> nx run @dg/lcdp-formula:test

  Configuration Documentation:
  https://jestjs.io/docs/configuration

 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/minverse.spec.ts (5.113 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/min.spec.ts (5.112 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/formula/formula.spec.ts (5.113 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/array-map.spec.ts (5.116 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/filter.spec.ts (5.126 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/lookup/index-of.spec.ts (5.145 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/power.spec.ts (5.157 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/util/formula.util.spec.ts (5.229 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/uniq-by.spec.ts (5.263 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/lookup/index-of-group.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/log10.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/text2date.shanghai.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/matches.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/minute-trim-right-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/millisecond.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/sort.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/info/is-array.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/calculator/formula.calculator.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/substr.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/trend.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/year-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/day.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/rsq.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/date-trim-minute-diff.shanghai.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/replace.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/fst-der.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/minute-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/average.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/lookup/item-at.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/week.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/logic/and.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/date2text.shanghai.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/millisecond-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/math/formula.latex-util.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/is-empty.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/format.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/business/conclude.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/exp.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/second-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/stdev.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/mmult.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/logic/or.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/logic/if-match.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/year-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/max.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/array-merge.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/abs.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/month-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/split.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/slice.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/date2json.shanghai.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/date2text.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/count.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/concat.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/second.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/floor.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/in-range.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/atan2.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/sum.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/minute-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/day-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/include.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/second-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/year.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/date.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/lookup/last-index-of.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/week-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/round.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/hour.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/linest.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/cubic-sol.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/log2.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/month.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/stdevp.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/median.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/lookup/item-of.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/json2date.shanghai.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/ceil.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/minute.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/now.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/hour-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/millisecond-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/median.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/month-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/log.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/comparator/formula.comparator.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/uniq.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/hour-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/stdev-avg.spec.ts

Test Suites: 89 passed, 89 total
Tests:       201 passed, 201 total
Snapshots:   0 total
Time:        17.227 s, estimated 22 s
Ran all test suites.

 ————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————

 >  NX   Successfully ran target test for project @dg/lcdp-formula (18s)

All unit tests with chevrotain passed as well

nx run @dg/lcdp-formula:test                                                                                                                                                                                    ─╯

> nx run @dg/lcdp-formula:test

  Configuration Documentation:
  https://jestjs.io/docs/configuration

 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/power.spec.ts (6.628 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/lookup/index-of.spec.ts (6.632 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/formula/formula.spec.ts (6.697 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/min.spec.ts (6.715 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/uniq-by.spec.ts (6.737 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/array-map.spec.ts (6.799 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/minverse.spec.ts (6.858 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/util/formula.util.spec.ts (6.904 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/filter.spec.ts (7.036 s)
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/hour-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/ceil.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/now.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/millisecond-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/minute.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/lookup/item-of.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/json2date.shanghai.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/month-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/median.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/rsq.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/date-trim-minute-diff.shanghai.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/day.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/linest.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/date.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/round.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/trend.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/replace.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/fst-der.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/year-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/hour.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/year.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/business/conclude.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/substr.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/lookup/last-index-of.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/week-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/cubic-sol.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/calculator/formula.calculator.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/second-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/log2.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/mmult.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/minute-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/is-empty.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/include.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/math/formula.latex-util.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/millisecond-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/format.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/hour-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/exp.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/logic/or.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/in-range.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/minute-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/day-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/sum.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/month.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/stdev.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/logic/if-match.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/second-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/week.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/concat.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/date2text.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/count.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/stdev-avg.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/slice.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/date2text.shanghai.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/max.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/date2json.shanghai.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/split.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/month-increase.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/year-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/logic/and.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/abs.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/atan2.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/stdevp.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/floor.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/millisecond.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/array-merge.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/minute-trim-right-diff.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/median.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/log10.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/text2date.shanghai.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/info/is-array.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/sort.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/lookup/index-of-group.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/date/second.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/lookup/item-at.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/text/matches.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/array/uniq.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/comparator/formula.comparator.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/math/log.spec.ts
 PASS   @dg/lcdp-formula  packages/formula/spec/unit/function/stat/average.spec.ts

Test Suites: 89 passed, 89 total
Tests:       201 passed, 201 total
Snapshots:   0 total
Time:        19.008 s
Ran all test suites.

 ————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————

 >  NX   Successfully ran target test for project @dg/lcdp-formula (20s)

I will do a profiling later to find the bottlenecks

robocoder Feb 1, 2025

The docs mentioned somewhere that caching ALTs may hurt performance where the number of ALTs in the $.OR wasn't at least 4 (which seems to only apply to $.c1 in your parser).

bd82 · 2025-03-09T12:05:05Z

bd82
Mar 9, 2025
Maintainer

Hello @hydra1983

Modeling the binary operator precedence as part of the grammar tends to result in very deeply nested parse trees
and a large performance overhead.

Perhaps Antlr has some optimizations around this pattern.
If you are building a productive grammar with Chevrotain which uses binary operators
I would recommend to apply the Swift programming language approach of parsing the operators as a flat list
and computing the precedence at a post-parsing phase.

https://docs.swift.org/swift-book/documentation/the-swift-programming-language/expressions/#Infix-Expressions
See the Note section in the above link

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Why the performance is so bad #2083

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{editor}}'s edit

{{editor}}'s edit

Uh oh!

Replies: 2 comments 2 replies

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{editor}}'s edit

{{editor}}'s edit

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{editor}}'s edit

{{editor}}'s edit

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{editor}}'s edit

{{editor}}'s edit

Uh oh!

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

Why the performance is so bad #2083

Uh oh!

Uh oh!

hydra1983 Dec 27, 2024

Antlr4

Chevrontain v10.5.0

Replies: 2 comments · 2 replies

Uh oh!

Uh oh!

msujew Dec 27, 2024 Collaborator

Uh oh!

Uh oh!

hydra1983 Dec 28, 2024 Author

Uh oh!

Uh oh!

robocoder Feb 1, 2025

Uh oh!

bd82 Mar 9, 2025 Maintainer

hydra1983
Dec 27, 2024

Replies: 2 comments 2 replies

msujew
Dec 27, 2024
Collaborator

hydra1983 Dec 28, 2024
Author

bd82
Mar 9, 2025
Maintainer