2.4 shell工具及graphviz绘图工具
为了更好地分析GCC的运行过程,可以使用GCC支持的一些编译选项,例如,-fdump-tree-all、-fudmp-ipa-all、-fdump-rtl-all等,这样编译过程中将产生大量的中间运行结果信息,帮助用户理解GCC的处理细节。另外,用户也可以根据需要在源代码中增加适当的调试代码,从而输出一些运行时的中间信息。对这些输出结果进行高效分析,从中提取有价值的信息是GCC分析过程中非常关键的一种途径。
笔者认为,借助于Linux shell命令的强大字符串处理功能,可以极大地提高信息处理的效率。例如,可以使用grep对输出中的特定模式进行匹配,利用sed对输出的信息进行各种强大的编辑处理,包括替换、修改等,利用awk可以对输出结果进行进一步的处理。建议读者熟练使用grep、sed、awk等工具,并能熟练编写一些简单的处理脚本。
另一方面,图形直观生动,擅长展示逻辑关系,因此,为了说明问题,往往需要对处理结果进行图形方式的展示,graphviz提供的绘图工具(http://www.graphviz.org/)就是笔者进行GCC分析时常用的图形生成工具。
例如,对于如下的源代码test.c:
[GCC@host2 g2r]$ cat test.c
int global_int = 0;
int main(int argc, char *argv[])
{
int i;
static int static_sum=0;
int array[10]={0,1,2,3,4,5,6,7,8,9};
for(i=global_int; i<10; i++){
int j=i*2;
static_sum = static_sum + j + array[i];
if(static_sum>1000) goto Label_RET;
}
Label_RET:
return static_sum;
}
通过在GCC中增加调试代码,可以生成main函数的控制流图文件Control_F?low.dot。
[GCC@host2 g2r]$ cat Control_Flow.dot
digraph G {
node [shape = record];
0 [label = "{ENTRY}"];
0 -> 2 [style=solid, label=fallthru];
2 [label = "{BB-2}"];
2 -> 6 [style=solid, label=fallthru];
3 [label = "{BB-3}"];
3 -> 4 [style=solid, label=true];
3 -> 5 [style=solid, label=false];
4 [label = "{BB-4}"];
4 -> 7 [style=solid, label=fallthru];
5 [label = "{BB-5}"];
5 -> 6 [style=solid, label=fallthru];
6 [label = "{BB-6}"];
6 -> 3 [style=solid, label=true];
6 -> 7 [style=solid, label=false];
7 [label = "{BB-7}"];
7 -> 8 [style=solid, label=fallthru];
8 [label = "{BB-8}"];
8 -> 1 [style=solid];
1 [label = "{EXIT}"];
}
显然,该控制流图是不直观、不容易理解的,然而通过将Control_F?low.dot中描述的逻辑关系转换成graphviz的图形脚本,就可以利用graphviz中dot工具生成其图示结果Control_F?low.png,
如图2-4所示。
`dot -Tpng -o Control_Flow.png Control_Flow.dot`
可以看出,使用图形表示可以非常直观地展示程序中的控制流程,也为代码分析提供了最直观形象的辅助。
再举一例。在分析GCC的AST生成及GIMPLE生成等过程中,需要了解AST节点的具体内容及其相互关系,此时,也可以通过对GCC生成的AST中间结果进行脚本的处理,并生成其图示结果,例如图2-5给出了上述源代码中sum=a+b语句对应的关键AST节点及其相互关系,该结果形象直观,节点之间的关系清晰,对于分析AST的生成和GIMPLE转换等都具有非常重要的意义。
图2-5 sum=a+b对应的AST片段图示