《编译原理》在线开放式作业答案.doc

上传人（卖家）：2023DOC

文档编号：5505734

上传时间：2023-04-23

格式：DOC

页数：11

大小：169KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

19 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《《编译原理》在线开放式作业答案.doc》由用户（2023DOC）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 编译原理编译原理在线开放式作业答案

资源描述：: 1、0513编译原理在线开放式作业实施方案作业内容要求：完成扫描程序的设计与实现,具体要求为:设计并实现TINYC语言的扫描程序;完成并提交实验报告,扫描程序的源程序,编译后的可执行程序,例子和运行结果.实验报告至少要包含如下内容:1实验目的;2TINYC语言的词法说明,扫描器的输入和输出;3实验原理(所采用的过程);3.1记号种类及各记号所代表的字符串集合;3.2各记号对应的正则表达式及所有记号对应的正则表达式;3.3各记号对应的DFA及所有记号对应的DFA;4扫描程序的功能说明和程序说明,程序模块等;5输入示例及其运行结果;6总结:获得的经验,遇到的问题,改进方案等.格式及提交要求：1、学生须
2、按以上要求完成实验报告作业。2、在word文档中完成实验报告；使用“北京师范大学网络教育课程论文”做为论文封面；正文使用宋体五号字；标题加粗。北京师范大学网络教育课程作业课程代码：课程名称：学习中心姓名学号专业年级实验目的; 完整地指出TINYC的词法结构，也就是：定义记号和它们的特性实验内容;TINYC的记号分为3个典型类型：保留字、特殊符号和“其他”记号。保留字一共有8个，它们的含义类似。特殊符号有10种：分别是4种基本的整数运算符号、2种比较符号，以及括号、分号和赋值符号。除了赋值符号是两个字符的长度之外，其余均为一个字符。表1 TINYC语言的记号保留字特殊符号其他
3、if+数（1个或更多的数字）then-else*end/repeat=until标识符（1个或更多的字母）read(write);:=其他记号就是数了，它们是一个或多个数字以及标识符的序列，而标识符又是（为了简便）一个或多个字母的序列。除了记号之外，TINYC还要遵循以下的词法惯例：注释应放在花括号.中，且不可嵌套；代码应是自由格式；空白格由空格、制表位和新行组成；最长子串原则后须接识别记号。在为该语言设计扫描程序时，可以从正则表达式开始并根据前一节中的算法来开发NFA和DFA。实际上，前面已经给出了数、标识符和注释的正则表达式。其他记号的正则表达式都是固定串，因而均不重要。由于扫描程序的DF
4、A记号十分简单，所以无需按照这个例程就可直接开发这个DFA了。我们按一下步骤进行。首先要注意到除了赋值符号之外，其他所有的特殊符号都只有一个字符，这些符号的DFA如下：在该图中，不同的接受状态是由扫描程序返回的记号区分开来。如果在这个将要返回的记号（代码中的一个变量）中使用其他指示器，则所有接受状态都可集中为一个状态，称之为DONE。若将这个二状态的DFA与接受数和标识符的DFA合并在一起，就可得到下面的DFA：请注意，利用方括号指出了不可被消耗的先行字符。现在需要在这个DFA中添加注释、空白格和赋值。一个简单的从初始状态到其本身的循环要消耗空白格。注释要求一个额外的状态，它由花括号左边达
5、到并在花括号右边返回到它。赋值也需要中间状态，它由分号上的初始状态达到。如果后面紧跟有一个等号，那么就会生成一个赋值记号。反之就不消耗下一个字符，且生成一个错误记号。实际上，未列在特殊符号中的所有单个字符既不是空白格或注释，也不是数字或字母，它们应被作为错误而接受，我们将它们与单个字符符号混合在一起。如下图是为扫描程序给出的最后一个DFA。在上面的讨论或上图中的DFA都未包括保留字。这是因为根据DFA的观点，而认为保留字与标识符相同，以后再在接受后的保留字表格中寻找标识符是最简单的。当然，最长子串原则保证了扫描程序唯一需要改变的动作是被返回的记号。因为，仅在识别了标识符之后才考虑保留字。现在再
6、来讨论实现这个DFA的代码，它已被放在了scan.h文件和scan.c文件之中。其中最主要的过程是getToken，它消耗输入字符并根据上图中的DFA返回下一个被识别的记号。这个实现利用了双重嵌套情况分析，以及一个有关状态的大型情况列表，在大列表中的是基于当前输入字符的单独列表。记号本身被定义成globals.h中的枚举类型，它包括在表1中列出的所有记号以及内务记号ENDFILE（当达到文件的末尾时）和ERROR（当遇到错误字符时）。扫描程序的状态也被定义为一个枚举类型，但它是位于扫描程序之中。扫描程序还需总地计算出每个记号的特性，并有时会采取其他动作（例如将标识符插入到符号表中）。在TINY
7、C扫描程序中，所要计算的唯一特性是词法或是被识别的记号的串值，它位于变量tokenString之中。这个变量同getToken一并是提供给编译器其他部分的唯一的两个服务，它们的定义已被收集在头文件scan.h。声明了tokenString的长度固定为41，因此那个标识符也就不能超过40个字符（加上结尾的空字符）。后面还会提到这个限制。扫描程序使用了3个全程变量：文件变量source和listing，在globals.h中声明且在main.c中被分配和初始化的整型变量lineno。由getToken过程完成的额外的簿记如下所述：表reservedWords和过程reservedLookup完成位
8、于由getToken的主要循环识别的标识符之后的保留字的查找，currentToken的值也随之改变。标志变量save被用作指示是否将一个字符增加到tokenString之上；由于需要包括空白格、注释和非消耗的先行，所以这些都是必要的。到扫描程序的字符输入由getNextChar函数提供，该函数将一个256-字符缓冲区内部的lineBuf中的字符取到扫描程序中。如果已经耗尽了这个缓冲区，且假设每一次都获取了一个新的源代码行（以及增加的lineno），那么getNextChar就利用标准的C过程fgets从source文件更新改缓冲区。虽然这个假设允许了更简单的代码，但却不能正确地处理行的字数超
9、过255个字符的TINYC程序。最后，TINYC中的数与标识符的识别要求从INNUM和INID到最终状态的转换都应是非消耗的。可以通过提供一个ungetNextChar过程在输入缓冲区中反填一个字符来完成这一任务，但对于源行很长的程序而言，这也不是很好。作为TINYC扫描程序行为的解释，可考虑一下下面清单1中TINYC程序sample.tny。程序清单2假设将这个程序作为输入，那么当TraceScan和EchoSource都是集合时，它列出了扫描程序的输出。之后将详细讨论由这个扫描程序的实现所引出的一些问题。清单1 TINYC语言中的样本程序 Sample program In TINYC l
10、anguage - Computes factorialread x; input an integer If 0 x then dont compute if x = 0 fact : = 1; repeat fact := fact * x; x := x - 1 until x = 0; write fact output factorial of x end清单2 当程序清单1中的TINY程序作为输入时，扫描程序的输出TINYC COMPILATION: sample.tny 1: Sample program 2: in TINYC language - 3: computes fa
11、ctorial 4: 5: read x ; input an integer 5: reserved word: read 5: ID, name = x 5: ; 6: if 0 x then dont compute if x = 0 6: reserved word: if 6: NUM, val = 0 6: 6: ID, name= x 6: reserved word: then 7: fact := 1; 7: ID,name= fact 7: := 7: NUM, val = 1 7: ; 8: repeat 8: reserved word: repeat 9: fact
12、:= fact * x; 9: ID, name= fact 9: := 9: ID, name= fact 9: * 9: ID, name= * 9: ; 10: x := x -1 10: ID, name= x 10: := 10: ID, name= x 10: - 10: NUM, val= 1 11: until x = 0; 11: reserved word: until 11: ID, name= x 11: = 11: NUM, val= 0 11: ; 12: write fact output factorial of x 12: reserved word: wri
13、te 12: ID, name= fact 13: end 13: reserved word: end 14:EOF实验心得TINYC对保留字的识别是通过首先将它们看作是标识符，之后再在保留字表中查找它们来完成的。这在扫描程序中很平常，但它却意味着扫描程序的效率须依赖于在保留字表中查找过程的效率。我们的扫描程序使用了一种非常简便的方法线性搜索，即按顺序从开头到结尾搜索表格。这对于小型表格不成问题，例如TINYC中的表格，它只有8个保留字，但对于真实语言而言，这却是不可接受的，因为它通常有30 - 60 个保留字。这时候就需要一个更快的查找，而这又要求使用更好的数据结构而不是线性列表。假若保
14、留字列表是按字母表的顺序写出的，那么就可以使用二分搜索。另一种选择是使用杂凑表，此时我们希望利用一个冲突性很小的杂凑函数。由于保留字不会改变（至少不会很快地），所以可事先开发出这样一个杂凑函数，它们在表格中的位置对于编译器的每一步运行而言都是固定的。人们已经确定了各种语言的最小完善杂凑函数，也就是说能够区分出保留字且具有最小数值的函数，因此杂凑表可以不大于保留字的数目。例如，如果只有8个保留字，则最小完善杂凑函数总会生成一个0 -7的值，且每个保留字也会生成不同的值。在处理保留字时，另一个选择是使用储存标识符的表格，即：符号表。在过程开始之前，将所有的保留字整个输入到该表中并且标上“保留”（因
15、此不允许重新定义），这样做的好处在于只要求一个查找表。但在TINYC扫描程序中，直到扫描阶段之后才构造符号表，因此这个方法对于这种类型的设计并不合适。TINYC扫描程序设计中的另一个缺点是记号串最长仅为40个字符。由于大多数的记号的大小都是固定的，所以对于它们而言这并不是问题；但是对于标识符来讲就麻烦了，这是因为程序设计语言经常要求程序中的标识符长度为任意值。更糟的是：如果为每一个标识符都分配一个40个字符长度的数组，那么就会浪费掉大多数的空间；这是因为绝大多数的标识符都很短。由于使用了实用程序函数copyString复制记号串，其中copyString函数动态地分配仅为所需的空间，TINYC编译器的代码就不会出现这个问题了。TokenString长度限制的解决办法与之类似：仅仅基于需要来分配，有可能使用realloc标准C函数。另一种办法是为所有的标识符分配最初的大型数组，接着再在该数组中按照自己做的方式进行存储器的分配。

展开阅读全文

163文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：《编译原理》在线开放式作业答案.doc
链接地址：https://www.163wenku.com/p-5505734.html

2023DOC

内容提供者

实名认证

联系作者