A precedence climbing parser in Python

if c.isdigit(): num = int(c) while not at_end() and peek().isdigit(): num = num * 10 + int(advance()) result.append(num) continue

if c == "<": if not at_end() and peek() == "=": advance() result.append("<=") else: result.append("<") continue

if c.isalpha(): var = c while not at_end() and peek().isalpha(): var += advance() result.append(var) continue raise ParseError(f"Unexpected character: {c}") return result

result = parse_(tokens, 0) if not tokens or tokens.pop(0) != ")": raise ParseError("Expected closing parenthesis") return result if token in OPERATOR_NAMES: raise ParseError(f"Unexpected operator: {token}") if isinstance(token, int): return token if isinstance(token, str) and token.isalpha():

return token raise ParseError(f"Unexpected token: {token}") def comma_separated(): if not tokens: raise ParseError("Expected closing parenthesis in function call") if tokens[0] == ")":

if token == "(": args = comma_separated() if not tokens or tokens.pop(0) != ")": raise ParseError("Expected closing parenthesis in function call") lhs = [lhs, *args] continue

import re
import unittest


class TokenizerTests(unittest.TestCase):
    def test_empty(self):
        self.assertEqual(tokenize(""), [])

    def test_digit(self):
        self.assertEqual(tokenize("1"), [1])

    def test_number(self):
        self.assertEqual(tokenize("123"), [123])

    def test_add(self):
        self.assertEqual(tokenize("+"), ["+"])

    def test_sub(self):
        self.assertEqual(tokenize("-"), ["-"])

    def test_sub(self):
        self.assertEqual(tokenize("-"), ["-"])

    def test_mul(self):
        self.assertEqual(tokenize("*"), ["*"])

    def test_div(self):
        self.assertEqual(tokenize("/"), ["/"])

    def test_pow(self):
        self.assertEqual(tokenize("^"), ["^"])

    def test_comma(self):
        self.assertEqual(tokenize(","), [","])

    def test_less(self):
        self.assertEqual(tokenize("<"), ["<"])

    def test_less_than_one(self):
        self.assertEqual(tokenize("<1"), ["<", 1])

    def test_less_equal_one(self):
        self.assertEqual(tokenize("<=1"), ["<=", 1])

    def test_skip_whitespace(self):
        self.assertEqual(tokenize("1         2"), [1, 2])

    def test_skip_line_comment(self):
        self.assertEqual(tokenize("1#         2\n3"), [1, 3])

    def test_unrecognized_operator(self):
        with self.assertRaises(ParseError):
            tokenize("%")

    def test_var(self):
        self.assertEqual(tokenize("a"), ["a"])
        self.assertEqual(tokenize("abc"), ["abc"])


class ParseTests(unittest.TestCase):
    def assert_parse_error(self, message):
        return self.assertRaisesRegex(ParseError, re.escape(message))

    def test_empty(self):
        with self.assert_parse_error("Unexpected end of input"):
            parse([])

    def test_const(self) -> None:
        self.assertEqual(parse([3]), 3)

    def test_var(self) -> None:
        self.assertEqual(parse(["abc"]), "abc")

    def test_const_leftover_raises(self) -> None:
        with self.assert_parse_error("Unexpected tokens: 4 5"):
            parse([3, 4, 5])

    def test_const_paren(self) -> None:
        self.assertEqual(parse(["(", 3, ")"]), 3)
        self.assertEqual(parse(["(", "(", "(", 3, ")", ")", ")"]), 3)

    def test_const_paren_missing(self) -> None:
        with self.assert_parse_error("Expected closing parenthesis"):
            parse(["(", 3])

        with self.assert_parse_error("Unexpected tokens: )"):
            parse([3, ")"])

    def test_call_fun(self) -> None:
        self.assertEqual(parse(["f", "(", "x", ")"]), ["f", "x"])

    def test_call_fun_no_arguments(self) -> None:
        self.assertEqual(parse(["f", "(", ")"]), ["f"])

    def test_call_fun_missing_closing_paren(self) -> None:
        with self.assert_parse_error("Expected closing parenthesis in function call"):
            parse(["f", "("])

        with self.assert_parse_error("Expected closing parenthesis in function call"):
            parse(["f", "(", "x"])

    def test_call_fun_need_comma(self) -> None:
        with self.assert_parse_error("Expected closing parenthesis in function call"):
            parse(["f", "(", "x", "y", ")"])

    def test_call_fun_double_comma(self) -> None:
        with self.assert_parse_error("Unexpected token: ,"):
            parse(["f", "(", "x", ",", ",", "y", ")"])

    def test_call_fun_more_than_one_argument(self) -> None:
        self.assertEqual(parse(["f", "(", "x", ",", "y", ")"]), ["f", "x", "y"])

    def test_negate_const(self) -> None:
        with self.assert_parse_error("Unexpected end of input"):
            parse(["-"])
        self.assertEqual(parse(["-", 3]), ["negate", 3])

    def test_add(self) -> None:
        self.assertEqual(parse([1, "+", 2]), ["+", 1, 2])

    def test_add_negate(self) -> None:
        self.assertEqual(parse([1, "+", "-", 2]), ["+", 1, ["negate", 2]])

    def test_mul_negate(self) -> None:
        self.assertEqual(parse([1, "*", "-", 2]), ["*", 1, ["negate", 2]])

    def test_sub_negate(self) -> None:
        self.assertEqual(parse([1, "-", "-", 2]), ["-", 1, ["negate", 2]])

    def test_begin_add_raises(self) -> None:
        with self.assert_parse_error("Unexpected operator: +"):
            parse(["+"])

        with self.assert_parse_error("Unexpected operator: +"):
            parse(["+", 2])

    def test_double_add_raises(self) -> None:
        with self.assert_parse_error("Unexpected operator: +"):
            parse([1, "+", "+", 2])

    def test_add_add(self) -> None:
        self.assertEqual(parse([1, "+", 2, "+", 3]), ["+", 1, ["+", 2, 3]])

    def test_add_mul(self) -> None:
        self.assertEqual(parse([1, "+", 2, "*", 3]), ["+", 1, ["*", 2, 3]])
        self.assertEqual(parse(["(", 1, "+", 2, ")", "*", 3]), ["*", ["+", 1, 2], 3])

    def test_mul_add(self) -> None:
        self.assertEqual(parse([1, "*", 2, "+", 3]), ["+", ["*", 1, 2], 3])

    def test_sub(self) -> None:
        self.assertEqual(parse([1, "-", 2]), ["-", 1, 2])

    def test_sub_sub(self) -> None:
        self.assertEqual(parse([1, "-", 2, "-", 3]), ["-", ["-", 1, 2], 3])

    def test_add_mul(self) -> None:
        self.assertEqual(parse([1, "+", 2, "*", 3]), ["+", 1, ["*", 2, 3]])
        self.assertEqual(parse([1, "*", 2, "+", 3]), ["+", ["*", 1, 2], 3])


class EndToEndTests(unittest.TestCase):
    def parse(self, source: str) -> list:
        return parse(tokenize(source))

    def test_int(self):
        self.assertEqual(self.parse("123"), 123)

    def test_add(self):
        self.assertEqual(self.parse("3+4"), ["+", 3, 4])

    def test_add_call(self):
        self.assertEqual(self.parse("1+f(2)*3"), ["+", 1, ["*", ["f", 2], 3]])
        self.assertEqual(self.parse("1*f(2)+3"), ["+", ["*", 1, ["f", 2]], 3])

    def test_call_call(self):
        self.assertEqual(self.parse("f(1)(2)"), [["f", 1], 2])

    def test_call0(self):
        self.assertEqual(self.parse("f()"), ["f"])

    def test_call1(self):
        self.assertEqual(self.parse("f(x)"), ["f", "x"])

    def test_call2(self):
        self.assertEqual(self.parse("f(x, y)"), ["f", "x", "y"])

    def test_call3(self):
        self.assertEqual(self.parse("f(x, y, z)"), ["f", "x", "y", "z"])

    def test_call_expression_argument(self):
        self.assertEqual(self.parse("f(1+2, 3*4)"), ["f", ["+", 1, 2], ["*", 3, 4]])

    def test_call_nested(self):
        self.assertEqual(self.parse("f(g(x), h(y))"), ["f", ["g", "x"], ["h", "y"]])


if __name__ == "__main__":
    unittest.main()