13.12 如何获取当前进程对应之静态映像文件的绝对路径 A: hushui110@水木清华 这是一个x86/Linux Kernel 2.4.7-10系统中利用proc获取绝对路径的例子 -------------------------------------------------------------------------- /* * gcc -Wall -pipe -g -static -o myprog_2 myprog_2.c */ #include #include #include #define MAXBUFSIZE 1024 int main ( int argc, char * argv[] ) { char buf[ MAXBUFSIZE ]; int count; count = readlink( "/proc/self/exe", buf, MAXBUFSIZE ); if ( count < 0 || count >= MAXBUFSIZE ) { printf( "Failed\n" ); return( EXIT_FAILURE ); } buf[ count ] = '\0'; printf( "/proc/self/exe -> [%s]\n", buf ); return( EXIT_SUCCESS ); } /* end of main */ -------------------------------------------------------------------------- [scz@ /home/scz/src]> echo $PATH /bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:. [scz@ /home/scz/src]> ./myprog_2 /proc/self/exe -> [/home/scz/src/myprog_2] [scz@ /home/scz/src]> ../src/myprog_2 /proc/self/exe -> [/home/scz/src/myprog_2] [scz@ /home/scz/src]> myprog_2 /proc/self/exe -> [/home/scz/src/myprog_2] [scz@ /home/scz/src]> 显然这里直接给出了最期待的结果,没有冗余信息。 A: scz & microcat 2000-03-18 下面在x86/Linux Kernel 2.4.7-10上演示、讨论 -------------------------------------------------------------------------- /* * gcc -Wall -pipe -g -static -o myprog myprog.c */ #include #include int main ( int argc, char * argv[] ) { return( EXIT_SUCCESS ); } /* end of main */ -------------------------------------------------------------------------- [scz@ /home/scz/src]> gcc -Wall -pipe -g -static -o myprog myprog.c [scz@ /home/scz/src]> echo $PATH /bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:. [scz@ /home/scz/src]> gdb ./myprog (gdb) b main (gdb) r (gdb) x/17s 0xbfffff00 0xbfffff00: "SHLVL=1" 0xbfffff08: "_=/bin/bash" 0xbfffff14: "SHELL=/bin/bash" 0xbfffff24: "HOSTTYPE=i386" 0xbfffff32: "OSTYPE=linux-gnu" 0xbfffff43: "HISTSIZE=1000" 0xbfffff51: "TERM=vt100" 0xbfffff5c: "HOME=/home/scz" 0xbfffff6b: "SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass" 0xbfffff9e: "PATH=/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:." 0xbfffffd2: "LESSCHARSET=latin1" 0xbfffffe5: "/home/scz/src/./myprog" <-- 注意这个输出 0xbffffffc: "" 0xbffffffd: "" 0xbffffffe: "" 0xbfffffff: "" 0xc0000000:
[scz@ /home/scz/src]> gdb myprog (gdb) b main (gdb) r (gdb) x/17s 0xbfffff00 0xbfffff00: "z" 0xbfffff02: "SHLVL=1" 0xbfffff0a: "_=/bin/bash" 0xbfffff16: "SHELL=/bin/bash" 0xbfffff26: "HOSTTYPE=i386" 0xbfffff34: "OSTYPE=linux-gnu" 0xbfffff45: "HISTSIZE=1000" 0xbfffff53: "TERM=vt100" 0xbfffff5e: "HOME=/home/scz" 0xbfffff6d: "SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass" 0xbfffffa0: "PATH=/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:." 0xbfffffd4: "LESSCHARSET=latin1" 0xbfffffe7: "/home/scz/src/myprog" <-- 注意这个输出 0xbffffffc: "" 0xbffffffd: "" 0xbffffffe: "" 0xbfffffff: "" [scz@ /home/scz/src]> gdb ../src/myprog (gdb) b main (gdb) r (gdb) x/17s 0xbfffff00 0xbfffff00: "=1" 0xbfffff03: "_=/bin/bash" 0xbfffff0f: "SHELL=/bin/bash" 0xbfffff1f: "HOSTTYPE=i386" 0xbfffff2d: "OSTYPE=linux-gnu" 0xbfffff3e: "HISTSIZE=1000" 0xbfffff4c: "TERM=vt100" 0xbfffff57: "HOME=/home/scz" 0xbfffff66: "SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass" 0xbfffff99: "PATH=/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:." 0xbfffffcd: "LESSCHARSET=latin1" 0xbfffffe0: "/home/scz/src/../src/myprog" <-- 注意这个输出 0xbffffffc: "" 0xbffffffd: "" 0xbffffffe: "" 0xbfffffff: "" 0xc0000000:
[scz@ /home/scz/src]> 这是ELF文件在Linux系统中加载进内存之后的布局简图 -------------------------------------------------------------------------- 0x08048000 code .text,代码,只读 data .data,包含已经初始化的数据,只读 bss .bss,未初始化数据,初始化成0,读/写 ... 堆区,动态分配获取的内存从.bss往内存高端增长 ... (heap),读/写 ... stack 栈区,起始地址大于0xBFFF0000 arguments main()的形参 environment 环境变量区域 program name execve()第一形参,不是argv[0] 0xBFFFFFFC null(dword) 最后四个字节固定为零 0xC0000000 -------------------------------------------------------------------------- 通常动态链接库被映射到0x40000000往高端的地址。对于Linux,如果打了不可执行 堆栈内核补丁,动态链接库被映射到0x40000000往低端的地址。tt说就是以前的映射 地址减去0x40000000。打了补丁后使得通过字符串拷贝(strcpy)传递shellcode相对 复杂化,需要更多技巧。 program name处不一定是绝对路径,实际对应了execve()第一形参。一般从shell上 启动进程,shell根据PATH环境变量自动搜索匹配出一个路径,未必是绝对路径。假 设PATH环境变量中有当前目录(.),所执行的程序也只在当前目录下有,直接指定程 序名(myprog)执行时,shell会向execve()第一形参传递"./myprog"。注意,execve 第一形参未必是绝对路径。用gdb加载后再执行,情况有所不同。如果gdb命令行上指 定的程序名非绝对路径,gdb在调用execve()之前会调用getcwd()拼接在程序名之前, 此时不依赖PATH环境变量。所以用gdb调试溢出程序时应该在命令行上指定绝对路径, 避免不必要的偏移调整。 现在来看这样一个演示程序 -------------------------------------------------------------------------- /* * gcc -Wall -pipe -g -static -o myprog_1 myprog_1.c */ #include #include extern char **environ; int main ( int argc, char * argv[] ) { char *path = ( char * )( 0xc0000000 - 5 ); while ( *--path ); ++path; printf( "path --> %08x [%s]\n", ( unsigned int )path, path ); printf( "argv --> %08x\n", ( unsigned int )argv ); printf( "argv[0] --> %08x [%s]\n", ( unsigned int )argv[0], argv[0] ); printf( "environ --> %08x\n", ( unsigned int )environ ); printf( "environ[0] --> %08x [%s]\n", ( unsigned int )environ[0], environ[0] ); return( EXIT_SUCCESS ); } /* end of main */ -------------------------------------------------------------------------- 直接执行,然后用gdb加载后执行,对比输出上的不同。 [scz@ /home/scz/src]> myprog_1 path --> bffffff1 [./myprog_1] <-- 注意这里前面多了一个"./" argv --> bffffb24 argv[0] --> bffffc29 [myprog_1] environ --> bffffb2c environ[0] --> bffffc32 [PWD=/home/scz/src] [scz@ /home/scz/src]> ./myprog_1 path --> bffffff1 [./myprog_1] argv --> bffffb24 argv[0] --> bffffc27 [./myprog_1] environ --> bffffb2c environ[0] --> bffffc32 [PWD=/home/scz/src] [scz@ /home/scz/src]> ../src/myprog_1 path --> bfffffec [../src/myprog_1] argv --> bffffb14 argv[0] --> bffffc18 [../src/myprog_1] environ --> bffffb1c environ[0] --> bffffc28 [PWD=/home/scz/src] [scz@ /home/scz/src]> Linux系统中main()函数里自修改argv[0]欺骗ps有效,而FreeBSD、Solaris则无效。 execve()第二形参可以指定不同于第一形参的argv[0]。argv[0]不可信,但execve() 第一形参相对就可信得多。如果是自己写程序,可以考虑在main()中第一时刻判断 execve()第一形参是否为相对路径,进而决定是否调用getcwd(),最后拼接出一个绝 对路径。就像gdb所做的那样。 需要考虑"/home/scz/src/./myprog"、"/home/scz/src/../src/myprog"这些情况, 消掉"./"、"../"等冗余信息。 A: scz & microcat 2002-09-13 18:00 下面在SARPC/Solaris 8 64-bit kernel mode上演示、讨论 -------------------------------------------------------------------------- /* * gcc -Wall -pipe -g -static -o myprog_3 myprog_3.c */ #include #include extern char **environ; static void outputBinary ( const unsigned char *byteArray, const size_t byteArrayLen ) { size_t offset, k, j, i; fprintf( stderr, "byteArray [ %u bytes ] ----> \n", byteArrayLen ); if ( byteArrayLen <= 0 ) { return; } i = 0; offset = 0; for ( k = byteArrayLen / 16; k > 0; k--, offset += 16 ) { fprintf( stderr, "%08X ", offset ); for ( j = 0; j < 16; j++, i++ ) { if ( j == 8 ) { fprintf( stderr, "-%02X", byteArray[i] ); } else { fprintf( stderr, " %02X", byteArray[i] ); } } fprintf( stderr, " " ); i -= 16; for ( j = 0; j < 16; j++, i++ ) { /* * if ( isprint( (int)byteArray[i] ) ) */ if ( ( byteArray[i] >= ' ' ) && ( byteArray[i] <= 255 ) && ( byteArray[i] != 0x7f ) ) { fprintf( stderr, "%c", byteArray[i] ); } else { fprintf( stderr, "." ); } } fprintf( stderr, "\n" ); } /* end of for */ k = byteArrayLen - i; if ( k <= 0 ) { return; } fprintf( stderr, "%08X ", offset ); for ( j = 0 ; j < k; j++, i++ ) { if ( j == 8 ) { fprintf( stderr, "-%02X", byteArray[i] ); } else { fprintf( stderr, " %02X", byteArray[i] ); } } i -= k; for ( j = 16 - k; j > 0; j-- ) { fprintf( stderr, " " ); } fprintf( stderr, " " ); for ( j = 0; j < k; j++, i++ ) { if ( ( byteArray[i] >= ' ' ) && ( byteArray[i] <= 255 ) && ( byteArray[i] != 0x7f ) ) { fprintf( stderr, "%c", byteArray[i] ); } else { fprintf( stderr, "." ); } } fprintf( stderr, "\n" ); return; } /* end of outputBinary */ int main ( int argc, char * argv[] ) { char *path = ( char * )( 0xffbf0000 - 5 ); while ( *path == '\0' ) { path--; } while ( *path ) { path--; } ++path; printf( "path --> %08x [%s]\n", ( unsigned int )path, path ); printf( "argv --> %08x\n", ( unsigned int )argv ); printf( "argv[0] --> %08x [%s]\n", ( unsigned int )argv[0], argv[0] ); printf( "environ --> %08x\n", ( unsigned int )environ ); printf( "environ[0] --> %08x [%s]\n", ( unsigned int )environ[0], environ[0] ); outputBinary( ( const unsigned char * )( 0xffbf0000 - 256 ), 256 ); return( EXIT_SUCCESS ); } /* end of main */ -------------------------------------------------------------------------- 直接执行,然后用gdb加载后执行,对比输出上的不同。SPARC/Solaris与x86/Linux 在此问题上有不少区别。 [scz@ /home/scz/src]> echo $PATH /bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:. [scz@ /export/home/scz/src]> myprog_3 path --> ffbeffee [myprog_3] argv --> ffbefcfc argv[0] --> ffbefd7c [myprog_3] environ --> ffbefd04 environ[0] --> ffbefd85 [PWD=/export/home/scz/src] [scz@ /export/home/scz/src]> ./myprog_3 path --> ffbefff0 [myprog_3] <-- 注意这里前面反而没有了"./" argv --> ffbefcfc argv[0] --> ffbefd7c [./myprog_3] environ --> ffbefd04 environ[0] --> ffbefd87 [PWD=/export/home/scz/src] [scz@ /export/home/scz/src]> ../src/myprog_3 path --> ffbeffea [../src/myprog_3] argv --> ffbefcec argv[0] --> ffbefd6c [../src/myprog_3] environ --> ffbefcf4 environ[0] --> ffbefd7c [PWD=/export/home/scz/src] [scz@ /export/home/scz/src]> 如果我们复制myprog_3到/usr/bin下去,再次执行myprog_3,可以看到如下输出 [scz@ /export/home/scz/src]> myprog_3 path --> ffbeffe9 [/usr/bin/myprog_3] <-- 注意这里 argv --> ffbefcf4 argv[0] --> ffbefd74 [myprog_3] environ --> ffbefcfc environ[0] --> ffbefd7d [PWD=/export/home/scz/src] byteArray [ 256 bytes ] ----> 00000000 55 6C 74 72 61 2D 35 5F-31 30 00 53 48 4C 56 4C Ultra-5_10.SHLVL 00000010 3D 31 00 5F 49 4E 49 54-5F 55 54 53 5F 4D 41 43 =1._INIT_UTS_MAC 00000020 48 49 4E 45 3D 73 75 6E-34 75 00 53 48 45 4C 4C HINE=sun4u.SHELL 00000030 3D 2F 62 69 6E 2F 62 61-73 68 00 48 4F 53 54 54 =/bin/bash.HOSTT 00000040 59 50 45 3D 73 70 61 72-63 00 4F 53 54 59 50 45 YPE=sparc.OSTYPE 00000050 3D 73 6F 6C 61 72 69 73-32 2E 38 00 48 4F 4D 45 =solaris2.8.HOME 00000060 3D 2F 65 78 70 6F 72 74-2F 68 6F 6D 65 2F 73 63 =/export/home/sc 00000070 7A 00 54 45 52 4D 3D 76-74 31 30 30 00 50 41 54 z.TERM=vt100.PAT 00000080 48 3D 2F 62 69 6E 3A 2F-75 73 72 2F 62 69 6E 3A H=/bin:/usr/bin: 00000090 2F 73 62 69 6E 3A 2F 75-73 72 2F 73 62 69 6E 3A /sbin:/usr/sbin: 000000A0 2F 75 73 72 2F 6C 6F 63-61 6C 2F 62 69 6E 3A 2E /usr/local/bin:. 000000B0 00 5F 49 4E 49 54 5F 4E-45 54 5F 53 54 52 41 54 ._INIT_NET_STRAT 000000C0 45 47 59 3D 6E 6F 6E 65-00 5F 3D 2F 62 69 6E 2F EGY=none._=/bin/ 000000D0 6D 79 70 72 6F 67 5F 33-00 53 55 4E 57 2C 55 6C myprog_3.SUNW,Ul 000000E0 74 72 61 2D 35 5F 31 30-00 2F 75 73 72 2F 62 69 tra-5_10./usr/bi 000000F0 6E 2F 6D 79 70 72 6F 67-5F 33 00 00 00 00 00 00 n/myprog_3...... [scz@ /export/home/scz/src]> 前面说的getcwd()拼接技术同样适用于SPARC/Solaris 8。 与Linux相比,有几处重要变化,一是从0xC0000000变成0xFFBF0000,二是如果程序 在当前目录下,没有了前面的"./",三是SPARC芯片的一些对齐特性导致我们要找的 位置可能比想像的要向内存低端移动一些字节。 后两点容易理解,那我们是如何确定0xC0000000、0xFFBF0000的呢。这个问题实际上 就是<<如何编程获取栈底地址>>所解决的,参看这篇QA。假设堆栈(stack)向低地址 方向增长,则所谓栈底指堆栈(stack)最高地址,下面是tt用程序找出来的 x86/Linux 栈底是0xc0000000( 栈底往低地址的4个字节总是零 ) SPARC/Solaris 7/8 栈底是0xffbf0000( 栈底往低地址的4个字节总是零 ) SPARC/Solaris 2.6 栈底是0xf0000000( 栈底往低地址的4个字节总是零 ) x86/FreeBSD 栈底是0xbfc00000( 栈底往低地址的4个字节总是零 ) x86/NetBSD 1.5 栈底是0xbfbfe000 x86/OpenBSD 2.8 栈底是0xdfbfe000 利用ELF文件加载进内存之后的布局获取绝对路径固然可行,但是带有很强的Hacking 味,并不可取,不是万不得已不要使用这种技术。 Linux有"/proc/self/exe",Solaris有"/proc/self/auxv",这些都是可以一用的。 当然在Solaris系统中直接使用getexecname(3C)获取execve()第一形参最好,否则涉 及在用户空间读取U区的问题,也带有很强的Kernel Hacking味道。参看<<如何在命 令行上访问指定进程P、U两区,如何欺骗Solaris的ps>>、<>两篇QA。 D: law@水木清华 在main()一开始就取execve()第一形参,或者退而求其次取argv[0],然后解析$PATH 环境变量,自己确定哪个目录里含有进程静态文件映像。如果是取execve()第一形参, 这个办法可行。如果取argv[0],就面临着argv[0]不可信的问题。而前面的技术取的 都是execve()第一形参。 注意,如果取argv[0],就不能依赖getcwd()拼接,这点与取execve()第一形参不同。 很可能命令行上的"myprog_3"实际根据$PATH产生了"/usr/bin/myprog_3",argv[0] 与getcwd()无论如何也拼不出正确的绝对路径。 A: scz 2002-09-13 20:45 这是一个x86/FreeBSD 4.5-RELEASE系统中利用proc获取绝对路径的例子 -------------------------------------------------------------------------- /* * gcc -Wall -pipe -g -static -o myprog_4 myprog_4.c */ #include #include #include #include #define MAXBUFSIZE 1024 int main ( int argc, char * argv[] ) { char proc[64]; char buf[ MAXBUFSIZE ]; int count; sprintf( proc, "/proc/%d/file", ( unsigned int )getpid() ); count = readlink( proc, buf, MAXBUFSIZE ); if ( count < 0 || count >= MAXBUFSIZE ) { printf( "Failed\n" ); return( EXIT_FAILURE ); } buf[ count ] = '\0'; printf( "%s -> [%s]\n", proc, buf ); return( EXIT_SUCCESS ); } /* end of main */ -------------------------------------------------------------------------- [scz@ /home/scz/src]> echo $PATH /bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:. [scz@ /home/scz/src]> myprog_4 /proc/121/file -> [/usr/home/scz/src/myprog_4] [scz@ /home/scz/src]> ./myprog_4 /proc/122/file -> [/usr/home/scz/src/myprog_4] [scz@ /home/scz/src]> ../src/myprog_4 /proc/123/file -> [/usr/home/scz/src/myprog_4] [scz@ /home/scz/src]> 与Linux系统中"/proc/self/exe"一样,FreeBSD系统中"/proc//file"直接给出 了最期待的结果,没有冗余信息。 手头系统有限,无法一一验证其它Unix系统。个人觉得从栈底向低端移动取execve() 第一形参的办法比较通用,可以写成可移植的函数,但还是不太推荐这种Hacking。