编译
一、任务概述
本项大作业将设计并实现一个Mini Java语言的编译器
Mini Java概述
Mini Java是Java语言的子集。作为一种很好的编译课程教学语言,它与Java相比做了如下精简:
(1)不允许重载(overloading)
(2)一个文件中可以申明若干个类,但必须有且只有一个的主类,辅类可以有多个,类不能申明为public;主类中只能有一个主方法,该方法的签名必须为“public static void main(String[])”,其中String[]参数不做处理。主方法中只能有一条输出语句:System.out.println( int ),该语句只能输出整型变量值
(3)只有类,没有接口,有继承关系(单继承)
(4)类中只能申明变量和方法
(5)只有四种变量类型:整型(integer)、布尔型(boolean)、数组(array)、对象;只有一类数组:整型数组(int[]);变量必须申明为(auto)型
(6)方法必须为public,必须有返回值,返回值类型受(5)限制;可以有参数,可以没有,参数数量没有限制,类型受(5)限制
(7)一共有6中语句(statement):代码块(block)、简单赋值语句(assignment statement)、数组赋值语句(array assignment statement)、打印语句(print statement)、if语句、while语句
(8)一共有9种表达式(expression):与(and)、比较(compare)、加(plus)、减(minus)、乘(times)、数组定位(array lookup)、数组长度(array length)、消息传递(message sending,即参数传递)、主表达式(primary expression);与表达式为“短路与”(&&);比较只能作小于比较
(9)主表达式一共有9种:整数(Integer)、“真”(true)、“假”(false)、对象、this、初始化(allocation)、数组初始化(array allocation)、非(not)、括号(bracket)
(10)初始化时只能使用空参数,所以没有“构造器(constructor)”概念
(11)对标识符(IDENTIFIER)没有作明确定义,在这里规定只能是字母、数字的集合,但必须以字母开头,区分大小写
(12)对整数(INTEGER_LITERAL)没有作明确定义,在这里规定为无符号整数,32位(0~4294967295)
(13)不允许注释
(14)类变量声明时不能初始化,初始化必须在方法中完成
(15)不能定义内部类
保留字、终结符
保留字
识别编码
记忆符
值
<EOF>
0
EOF
-
boolean
1
BOOLEAN
-
class
2
CLASS
-
else
3
ELSE
-
extends
4
EXTENDS
-
fasle
5
FALSE
-
if
6
IF
-
int
7
INT
-
length
8
LENGTH
-
main
9
MAIN
-
new
10
NEW
-
public
11
PUBLIC
-
return
12
RETURN
-
static
13
STATIC
-
this
14
THIS
-
true
15
TRUE
-
void
16
VOID
-
while
17
WHILE
-
String
18
STRING
-
System.out.println
19
PRINTLN
-
=
20
EQUAL
-
!
21
NOT
-
&&
22
AND
-
+
23
PLUS
-
-
24
MINUS
-
*
25
TIMES
-
<
26
COMPARE
-
.
27
DOT
-
;
28
SEMICOLON
-
,
29
COMMA
-
[
30
LEFT_SQUARE
-
]
31
RIGHT_SQUARE
-
(
32
LEFT_BRACKET
-
)
33
RIGHT_BRACKET
-
{
34
LEFT_BLOCK
-
}
35
RIGHT_BLOCK
-
标识符
36
ID_STRING
内部字符串
无符号整数
37
ID_INTEGER
整数值
本编译器概述
(1)语法分析程序用带回溯的递归子程序法
(2)对源文件进行两遍处理:第一遍词法分析,第二遍语法分析
(3)使用编译时静态分配存储空间
(4)整型数据类型32位,占4个字节;布尔型数据类型8位,占1个字节;内存(由列表虚拟)寻址10位,1KB
(5)为了实现方便,父类必须在子类之前定义
(6)由于时间原因,编译器做了如下简化:
(i)表达式只能处理加法、减法、乘法、小于比较、逻辑与,且只能对整数或布尔值直接进行计算,而不能计算变量的值
(ii)不能处理方法调用
(iii)不能处理数组
(iv)不能进行对象初始化
(v)不能处理结构化语句