用数组存储需要在同一个地方用到的多个符号 思路: 1.获取每一行输入,并将每一行输入按照空格分割 2.将分割后的每一个部分进行判断 3.判断步骤: 1).定义临时变量 w ,用于存储在遍历到界符或特殊符号前的值 2).遍历到界符,或者运算符,若w不为空,则 w 的值一定为关键字或自定义标识或整数 3).运算符分为可能是两位和一位情况,分开讨论 4).遍历结束后还得验证 w 是否为空,因为可能存在 判断的额部分刚好是一个完整的 关键字或自定义标识或整数
"""
-------------------------------------------------
File Name: __init__.py
Author: lenovo
Date: 2022/3/9
Create by: PyCharm
Description : C语言词法分析程序
-------------------------------------------------
"""
import sys
keyword = ["main", "if", "else", "for", "while", "int"]
boundary = ["{", "}", "(", ")", ",", ";"]
operator = ["+", "-", "*", "/"]
operatorTwo = ["=", "!", "<", ">"]
def print_w(w):
if len(w) > 0:
if w in keyword:
print("(keyword,%s)" % w)
elif w.isdigit():
print("(integer,%s)" % w)
else:
print("(identifier,%s)" % w)
def judge(s):
w = ""
for i in range(len(s)):
if s[i] in boundary:
print_w(w)
w = ""
print("(boundary,%s)" % s[i])
elif s[i] in operatorTwo:
print_w(w)
w = ""
if (i + 1) < len(s) and s[i + 1] == "=":
print("(operator,%s)" % (s[i] + "="))
else:
if i == 0:
print("(operator,%s)" % s[i])
elif (i - 1) >= 0 and (s[i - 1] not in operatorTwo):
print("(operator,%s)" % s[i])
elif s[i] in operator:
print_w(w)
w = ""
print("(operator,%s)" % s[i])
else:
w += s[i]
print_w(w)
if __name__ == '__main__':
for line in sys.stdin:
line = " ".join(line.split())
words = line.split()
for word in words:
judge(word)
A - 小C语言–词法分析程序 Description 小C语言文法
-
<程序>→<main关键字>(){<声明序列><语句序列>} -
<声明序列>→<声明序列><声明语句>|<声明语句>|<空> -
<声明语句>→<标识符表>; -
<标识符表>→<标识符>,<标识符表>|<标识符> -
<语句序列>→<语句序列><语句>|<语句> -
<语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句> -
< if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句> -
< while语句>→< while关键字>(<表达式>)<复合语句> -
< for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句> -
<复合语句>→{<语句序列>} -
<赋值语句>→<表达式>; -
<表达式>→<标识符>=<算数表达式>|<布尔表达式> -
<布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式> -
<关系运算符>→>|<|>=|<=|==|!= -
<算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项> -
<项>→<项>*<因子>|<项>/<因子>|<因子> -
<因子>→<标识符>|<无符号整数>|(<算数表达式>) -
<标识符>→<字母>|<标识符><字母>|<标识符><数字> -
<无符号整数>→<数字>|<无符号整数><数字> -
<字母>→a|b|…|z|A|B|…|Z -
<数字>→0|1|2|3|4|5|6|7|8|9 -
< main关键字>→main -
< if关键字>→if -
< else关键字>→else -
< for关键字>→for -
< while关键字>→while -
< int关键字>→int
每行单词数不超过10个 小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符 和运算符。 关键字:main if else for while int 自定义标识符:除关键字外的标识符 整数:无符号整数 界符:{ } ( ) , ; 运算符:= + - * / < <= > >= == !=
Input 输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。
Output 按照源程序中单词出现顺序输出,输出二元组形式的单词串。
(单词种类,单词值)
单词一共5个种类:
关键字:用keyword表示 自定义标识符:用identifier表示 整数:用integer表示 界符:用boundary表示 运算符:用operator表示
每种单词值用该单词的符号串表示。
|