IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> C++知识库 -> 编译原理课设 词法分析 语法分析 C++实现 -> 正文阅读

[C++知识库]编译原理课设 词法分析 语法分析 C++实现

https://github.com/McFly-byte/compiler/tree/master

课程设计总览

课程设计要求

创建一个词法分析程序,该程序支持分析常规单词。

a) 输入:一个文本文档,包括一组 3o型文法(正规文法)的产生式。
b) 输出:一个源代码文本文档,包含一组需要识别的字符串(程序代码)。
c) 要求:词法分析程序可以准确识别:科学计数法形式的常量(如 0.314E+1),复数常量(如10+12i),可检查整数常量的合法性,标识符的合法性(首字符不能为数字等),尽量符合真实常用高级语言要求的规则。

创建一个使用 LL(1) 方法或 LR(1) 方法的语法分析程序。

a) 输入:包含 2o型文法(上下文无关文法)的产生式集合的文本文档;任务 1 词法分析程序输出的(生成的)token 令牌表。
b) 输出:YES 或 NO(源代码字符串符合此 2o型文法,或者源代码字符串不符合此 2o型文法);错误提示文件,如果有语法错标示出错行号,并给出大致的出错原因。

项目基本内容

词法分析器

a) 输入:自定义正规文法文件、程序源代码
b) 输出:Token串(三元组)
c) 流程:读入正规文法,生成对应NFA,确定化NFA,根据生成的DFA对输入源程序代码进行分析,产生Token串

语法分析器

a) 输入:自定义2型文法文件、词法分析产生的Token串
b) 输出:LR(1)分析信息(项目集族、状态信息等)、错误信息、分析结果
c) 流程:
i) 第一步,读入2型文法,构造项目族规范集,根据LR(1)分析法产生对应的DFA、Action表、Goto表。
ii) 第二步,读入Token串,根据LR(1)的产物进行语法分析。

开发环境

语言:C++

硬件环境:Windows10 + DevC++5.11

项目结构

文件说明:

a) 文件夹
i) Compiler 项目文件夹
ii) Lexer 子项目词法分析器
iii) Parser 子项目语法分析器
b) .cpp/.h
i) LR LR(1)分析法
ii) NFA 不确定、确定的有穷自动机
iii) Op 将复杂的文法描述转换成字母符号产生式
c) .txt(输入、输出文件)
i) Input.txt/output.txt: 输入、输出测试
ii) Regular grammar.txt: 正规文法
iii) Source code.txt: 源程序代码
iv) Lexer.txt: Token(行号、内容、类别)序列
v) Describe.txt:语法描述
vi) 2NF grammar.txt: 语法对应2型文法
vii) Parser.txt:程序输出

项目结构:

在这里插入图片描述

a) Compiler
在这里插入图片描述

b) Lexer
在这里插入图片描述

c) Parser
在这里插入图片描述

词法分析器(Lexer)

实现原理

识别类型

类型具体说明
关键字“if”、“then”、“else”、“bool”、“char”、“int”、“double”、“const”、“while”、“do”、“begin”、“end”
标识符可以由数字、字母、下划线组成。
常量可以识别整数、小数、科学计数法、复数
运算符单目运算符:“=”、“+”、“-”、“>”、“<”、“*”、“/”、“%”
运算符双目运算符:“==”、“>=”、"<="等
界符“;”、“(”、“)”、“{”、“}”、“,”

正规文法

在这里插入图片描述

说明:
i) 内容类别由正规文法第一行产生式右部确定:Token-标识符、Operator-运算符、Separator-界符、Constant-常量、Key-关键字
ii) 根据此正规文法,可识别“识别类型”中全部类别
iii) 文法已由符号代替非终结符,并作正规化,该步骤独立与机器手动完成
iv) 程序读入时自动跳过“//”注释之后该行的内容

重要类与结构定义

NFA 不确定的有穷自动机

LA 词法分析

class LA /* Lexical Analysis /
{
public:
ofstream fout;
string line; /
输入行 /
string word; /
当前处理串 /
string T; /
当前状态 /
int index; /
当前状态对应List中下标 /
int id; /
输出编号 */

LA();
void analysis( NFA& nfa, string file3, string file2 );
void read_next_VT( char ch, NFA& nfa, string file2 );
void output( int tag, NFA& nfa, string file2 );

};

isEquallALL 比较类(在map中根据second找key)

class isEqualALL
{
public:
explicit isEqualALL(char c) : ch? {}
bool operator() (const std::pair<string, char>& element) const {
return element.second == ch;
}
private:
const char ch;
};

重要函数

函数定义注释
void NFA::nfa_2_dfa()/* NFA的图转化为 DFA的图 */
void NFA::cope_line( string line )/* 每次处理一行,可能有多条产生式*/
void NFA::cope_formula( string formula )/* 每次处理一条产生式 */
void NFA::e_closure( string status, vector& T )/* 给出一个状态,求$闭包 */
void NFA::vt_move( char vt, vector V, vector& T )/* 在闭包V中找到vt弧转换, 将新状态放入T中 */
string NFA::get_first_VN( string formula )/* 从输入种获取第一个VN,这是起始符 */
string NFA::get_next_VN( string & formula )/* 从输入中得到下一个VN,并在line中去掉其与其之后的-> */
string NFA::get_next_VT( string & formula )/* 从输入中得到下一个VT */
void LA::analysis( NFA& nfa, string file3, string file4 )/* 根据NFA对象进行词法分析 */
void LA::read_next_VT( char ch, NFA& nfa, string file4 )/* 处理下一个非终结符 */

运行结果

输入源程

在这里插入图片描述

运行时相关信息

a) NFA信息
在这里插入图片描述

b) NFA 状态-弧 (部分)
在这里插入图片描述

c) DFA信息
在这里插入图片描述

d) DFA 状态-弧

在这里插入图片描述

运行结果

(部分截图)
在这里插入图片描述

语法分析器(Parser)

实现原理

原理

先根据2型文法,利用LR(1)分析法构造项目集,进而得到DFA、Action表和Goto表。再利用词法分析的结果进行语法分析,输出相应信息

文法

在这里插入图片描述

对应2型文法
在这里插入图片描述

说明:
i) 语法由describle.txt给出,由op转为2型文法并输出到2NF grammar.txt中。
ii) 每个大写字母对应一个或一类非终结符,每个小写字母对应一个或一类终结符。
iii) 最终分析的结果再由文件最后一行字典转换为字符对应的状态

重要类与结构定义

LR(0)

LR(1)

class LR1 : public LR
{
public:
map<char,string> First; /* 每个非终结符的First集的集合 */
map<string,char> Dic;

void generate_firstset(); 
bool contains( string a, string b );
string first( string remaider, string lookahead );

virtual void input( string File );
void analysis( string FileIn, string FileOut );
void build_DFA();
void build_table( vector<clcn>& Collections ); 
void enclosure( clcn& C );
int  verify_conflict( clcn C );
void print_state( clcn C );  

};

重要函数

void LR::collection_2_dfa()
/* 根据项目集规范组得到DFA、Action、Goto */

void LR::build_table( vector<vector >& States )
/* 根据DFA构造Action表和Goto表 /
/
规定0状态遇初态结束 */

void LR::enclosure( vector& Closure )
/* 把闭包根据规则扩充,不改变其状态 */

int LR::verify_conflict( vector Closure )
/* 检测闭包中是否存在冲突 */

void LR::report( int error )
/* 根据error的类型报告错误 */

void LR::input( string File )
/* 输入2型文法产生式 /
/
因为是2型文法,故规定每个Vt、Vn长度都为1 /
/
Production第0位是产生式左部,后面是产生式右部 */

void LR1::analysis( string FileIn, string FileOut )
/* 读入词法分析结果,进行语法分析,输出 */

void LR1::generate_firstset()
/* 生成每个非终结符的First集的集合 */

void LR1::print_state( clcn C )
/* 输出项目集族 */

string LR1::first( string remainder, string lookahead )
/* 输入项目分隔符右边部分以及该项目向前搜索符,求给出字串的first集 */

void LR1::build_DFA()
/* 重写LR1中项目集规范族的构造, 产生DFA、Action、Goto */

string UTF8ToGB(const char* str);
/* 读入一行包含中文字符的字符串,使其能够存入map中不产生乱码 */

void turn_to_2NF( string In, string Out );
/* 逐字符处理语法,生成2NF */
*具体实现见代码包

运行结果

运行时相关信息

a) 各项目集规范族内容(部分截图)
序号即代表状态号,从结果来看,共186个状态
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

b) DFA状态-弧 (部分截图)
在这里插入图片描述
在这里插入图片描述

c) Action表
在这里插入图片描述

d) Goto表 (部分截图)

在这里插入图片描述

运行结果

在这里插入图片描述

将输入远程序改写后(去掉while-do语句的后半部分),重新执行:
在这里插入图片描述

输出

在这里插入图片描述

  C++知识库 最新文章
【C++】友元、嵌套类、异常、RTTI、类型转换
通讯录的思路与实现(C语言)
C++PrimerPlus 第七章 函数-C++的编程模块(
Problem C: 算法9-9~9-12:平衡二叉树的基本
MSVC C++ UTF-8编程
C++进阶 多态原理
简单string类c++实现
我的年度总结
【C语言】以深厚地基筑伟岸高楼-基础篇(六
c语言常见错误合集
上一篇文章      下一篇文章      查看所有文章
加:2022-05-18 17:26:01  更:2022-05-18 17:28:31 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 18:56:35-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码