【编译原理】实验二:基于有穷自动机FA词法分析器设计与实现

一、实验目的

利用有穷自动机FA开展指定高级程序设计语言(如C语言)的词法分析、设计及实现。能够正确掌握有穷自动机词法分析的技术原理及方法,针对C语言的不同单词,开展单词识别模型设计及词法分析处理。

自主查阅参考资料,结合12章有穷自动机的课堂讲解,利用高级程序设计语言(编码语言不限制,如C/C++/java/Python等)开展词法分析器设计及编码实践,分析结果、撰写实验报告。

二、实验环境(仪器设备、软件等)

1、机房电脑 Window10

2、Dev-C++/ Eclipse等

三、实验原理(或要求)

1 )待识别的 C 语言单词类型包括:

关键字、标识符、常量(包括整型、浮点型等)、运算符、界符等;

关键字:if, else, while, for等

...

2 )不同类型单词有穷自动机状态转换图 DFA

词法分析是编译原理中的一个关键阶段,它主要负责将输入的源代码字符串分解成一系列的标记(tokens),这些标记是源代码的基本构成元素。

3 )词法分析的实验内容及原理:

①词法分析器的核心功能

编译过程的第一步是进行词法分析,词法分析程序的功能是:扫描源程序字符,按语言的词法规则识别出各类单词或符号,并将有关字符组合成为单词并输出,同时进行词法检查。

单词符号的形式为:Token 二元组 ( 单词符号种别 / 类型,属性值 )

②根据有穷自动机状态转换图进行单词识别。

确定有穷自动机DFA在编译原理中的一个实际应用例子是识别源代码中的关键字。

四、实验步骤

(1)识别C语言的不同单词状态状态转换图DFA如下:(见文末链接)

(2)实验中采用的不同类型单词的种别码表;(见文末链接)

|---|
| |
| |

(3)词法分析器主要函数、变量说明及算法流程图。(见文末链接)

主要函数说明:

initKeywords() 初始化关键字映射表,建立关键字到种别码的关系

initOperators() 初始化运算符映射表,建立运算符到种别码的关系

initDelimiters() 初始化界符映射表,建立界符到种别码的对应关系

Lexer::advance() 读取下一个字符,处理行号计数

关键变量说明:

基于FA的词法分析的模型设计思路:(见文末链接)

算法流程图:(见文末链接)

(4)词法分析器完整代码(见文末链接)

核心数据结构:Token结构体:存储词法单元的三元组;三个符号表:关键字、运算符、界符的映射表

五、记录与处理

① 数据1:

词法分析结果:

测试结果都与预期结果一致。

六、思考与总结

实验过程中,我通过设计和实现DFA状态转换图,掌握了如何识别不同类型的单词,如关键字、标识符、常量、运算符和界符等,我还学会了如何处理空白字符、注释以及错误处理机制。我掌握了DFA在词法分析中的应用原理和方法,并生成了对应的Token序列,最终测试结果都与预期结果

七、成果文件提取链接

通过网盘分享的文件:

链接: https://pan.baidu.com/s/1grJ6ohwR_svNbvH2pk5igg?pwd=mj2u 提取码: mj2u

相关推荐
星云穿梭29 分钟前
用Python写一个带图形界面的学生管理系统——完整教程
python
金銀銅鐵1 小时前
用 Pygame 实现 15 puzzle
python·数学·游戏
黄忠6 小时前
大模型之LangGraph技术体系
python·llm
hboot19 小时前
AI工程师第二课 - 数据处理
人工智能·python·数据分析
用户8356290780511 天前
使用 Python 自动化 PowerPoint 形状布局与格式设置
后端·python
用户8356290780511 天前
用 Python 自动化 PowerPoint 演讲者备注添加
后端·python
clint4561 天前
C++进阶(1)——前景提要
c++
夜悊1 天前
C++代码示例:进制数简单生成工具
c++
黄忠1 天前
01-系统架构设计-LangGraph状态机与多源异构RAG
python
zzzzzz3101 天前
假如我是掘金管理员,我先给评论区装个'代码审查'系统
python·程序员·机器人