写这篇原创文章是因为看到了极客中的一篇文章《有趣各种编程语言实现2+2=5》,其中C语言是这样实现的:
int main() { char __func_version__[] = “5″; // For source control char b[]=”2″, a=2; printf(“%d + %s = %s\n”, a, b, a+b); return 0; }
有些童鞋可能会说,这不是偷换概念吗,拿字符串和int相加,是滴,但在这里请这些童鞋暂且幽默一回,想一想为何a+b会得出5的结果?你们实际动手编译了吗?结果是为5吗?
我动手编译了,结果不是5,确切的说是一个不可打印的ascii字符,所以console显示的是:2+2= ,稍对C堆栈布局略有了解的都知道,其实这段代码最后试图打印的是__func_version__里的字符串"5",但遗憾的是不同编译器,甚至同一种编译器用不通编译选项生成得stack布局是截然不同的,这就无法保证精确定位b之后3字节正好指向__func_version__。
那么在gcc -O3下到底布局如何呢?我们略微修改一下代码:
#include <stdio.h> int main() { //char b[]="2", a=2; char __func_version__[] = "5"; // For source control char b[]="2", a=2; printf("%p %p %p\n",__func_version__,b,&a); /* for(int i=0;i<100;++i){ printf("%d + %s = %s\n", i, b, i+b); } */ printf("%d + %s = %s\n", a, b, a+b); return 0; }
我们来看一下结果:
gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/local/Cellar/gcc48/4.8.2/libexec/gcc/x86_64-apple-darwin13.0.0/4.8.2/lto-wrapper
Target: x86_64-apple-darwin13.0.0
Configured with: ../configure --build=x86_64-apple-darwin13.0.0 --prefix=/usr/local/Cellar/gcc48/4.8.2 --enable-languages=c,c++,objc,obj-c++ --program-suffix=-4.8 --with-gmp=/usr/local/opt/gmp4 --with-mpfr=/usr/local/opt/mpfr2 --with-mpc=/usr/local/opt/libmpc08
--with-cloog=/usr/local/opt/cloog018 --with-isl=/usr/local/opt/isl011 --with-system-zlib --enable-version-specific-runtime-libs --enable-libstdcxx-time=yes --enable-stage1-checking --enable-checking=release --enable-lto --disable-werror --enable-plugin --disable-nls
--disable-multilib
Thread model: posix
gcc version 4.8.2 (GCC)
cs$gcc -std=c99 -Wall -O3 -g0 -o 5 5.c
apple@kissAir: cs$./5
0x7fff504fa920 0x7fff504fa930 0x7fff504fa910
2 + 2 = OP?
纳尼!肿么__func_version__还比b要小,那么不管b加什么正数都无法指向前者了,当然有些人会说了,可以整数回绕啊,我呵呵了。那也不行哦,那样就不是“2+2=5”鸟,而是"2+xxxxxxxxxx=5"鸟了哦。虽然可以改变两个字符数组变量的位置来解决这一问题,即b[]定义放在__func_version__前面,但那也要"2+16=5"哦,我不知道gcc有没有什么编译选项可以pack堆栈变量滴,但我知道#pragma pack(1)是可以打包结构变量滴,so很简单的我们可以添加如下代码:
#pragma pack(1) typedef struct __foo { char *b; char a; char *__func_version__; }foo; void print_5_by_struct(void) { foo foo_v = {"2",(char)2,"5"}; printf("%p %p\n",foo_v.__func_version__,foo_v.b); printf("%d + %s = %s\n",foo_v.a,foo_v.b,foo_v.a+foo_v.b); }
最终如愿以偿的打印了“2+2=5”,如果有其他童鞋知道gcc如何pack变量布局的,请告知本猫,在此感谢。
有些童鞋又会说了,你这样结构太累赘鸟,太墨迹,不爽快!也好办,没说只能用gcc啊,我们试试clang吧 :)
#include <stdio.h> int main() { char __func_version__[] = "5"; // For source control char b[]="2", a=2; printf("%p %p %p\n",__func_version__,b,&a); printf("%d + %s = %s\n", a, b, a+b); return 0; }
shell编译运行如下:
clang -v
Apple LLVM version 5.1 (clang-503.0.40) (based on LLVM 3.4svn)
Target: x86_64-apple-darwin13.2.0
Thread model: posix
apple@kissAir: cs$clang -std=c99 -Wall -O3 -g0 -o 5 5.c
apple@kissAir: cs$./5
0x7fff57925936 0x7fff57925934 0x7fff57925933
2 + 2 = 5
所以说学C啥的光死看书不中啊,要学以致用啊,在此抛砖引玉,谢谢各位观赏哦。