博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
深度探索编译器安全检查
阅读量:6381 次
发布时间:2019-06-23

本文共 8577 字,大约阅读时间需要 28 分钟。

安全是高质量软件的重点关注方面,最让人害怕、最多被误解的就是缓冲区溢出。现在,提及缓冲区溢出足以让人们停下来,仔细听。太频繁了,技术细节丢失在抄本中,大部分人们对于这种基础的、值得关注的方面离开了。为了解决这个问题,Visual C++ .NET引入了安全检查来帮助开发者确定缓冲区溢出。

什么是缓冲区溢出?

   缓冲区是一块内存,通常是数组的形式。当没有校验数组的长度时,可能会写出缓冲区的边界。如果这样的行为发生的地址比缓冲区的内存地址高,称为缓冲区溢出;类似的,如果这样的行为发生的地址比缓冲区的内存地址低,称为缓冲区下溢。缓冲区下溢的发生率明显少于缓冲区溢出,但是,正如本文的后面所描述,它确实发生过。向一个正在运行进程注入代码的缓冲区溢出被称为可以用缓冲区溢出。

   一些文档化的函数,例如strcpygetsscanfsprintfstrcat等,本身很容易受到缓冲区溢出的攻击,所以不推荐使用他们。一个简单的例子说明了这些函数的危险性:

ExpandedBlockStart.gif
int vulnerable1(
char * pStr)  { 
InBlock.gif        
int nCount = 0; 
InBlock.gif        
char pBuff[_MAX_PATH]; 
InBlock.gif 
InBlock.gif        strcpy(pBuff, pStr); 
InBlock.gif        
for(; pBuff; pBuff++) 
InBlock.gif               
if (*pBuff == '\\') nCount++; 
InBlock.gif        
return nCount; 
ExpandedBlockEnd.gif}
   这些代码有个明显的弱点
 
—如果由
pStr
指向的缓冲区长度大于
_MAX_PATH
 ,
那么
pBuffer
参数可能溢出。如果包含一句
assert(strlen(pStr) < _MAX_PATH)
就能够在
debug
版本下发现这个错误,但是
release
版本不行。用这些容易受到攻击的函数被认为是坏的实践。技术上来讲更不容易受到攻击的相似的函数确实存在,如
strncpy
strncat
memcpy
。这些函数的问题是开发者来验证缓冲区的长度,而不是编译器。下面的函数展示一个普遍的错误:

 

None.gif#define BUFLEN 16 
None.gifvoid vulnerable2(void
ExpandedBlockStart.gif
InBlock.gif        wchar_t buf[BUFLEN]; 
InBlock.gif        int ret; 
InBlock.gif        ret = MultiByteToWideChar(CP_ACP, 0, "1234567890123456789", -1, buf, sizeof(buf)); 
InBlock.gif        printf("%d\n", ret); 
ExpandedBlockEnd.gif}
None.gif

   这种情况下,字节的个数用来标示缓冲区的大小,而不是字符的个数,于是发生了缓冲区溢出。为了修正这个可攻击点,MultiByteToWideChar的最后一个参数因该使用sizeof(buf)/sizeof(buf[0]). vulnerable1 vulnerable2都是很普遍的错误,并且可以很容易的预防。然而,如果由于代码Reviewer的疏忽,这些潜在的安全漏洞可能发布到产品中。这就是为什么Visual C++ .NET引入了安全检查,它可以阻止vulnerable1 vulnerable2函数中的缓冲区溢出向容易受到攻击的应用程序注入恶意代码。

 

X86栈的分析

   为了理解如何利用缓冲区溢出以及安全检查如何工作,必须完全理解堆栈的布局结构。在X86体系下,堆栈向下增长,意味着新创建数据的地址小于早期压入栈中元素的地址。每一个函数创建一个新的、有如下布局的栈帧,注意高内存地址在列表的顶部:

·                     Function parameters

·                     Function return address

·                     Frame pointer

·                     Exception Handler frame

·                     Locally declared variables and buffers

·                     Callee save registers

从以上布局很明显的可以看出,缓冲区溢出有可能覆盖掉比该缓冲区分配的早的变量,异常处理帧,栈帧指针,返回地址,函数参数。为了接管程序的执行,一个值必须写进数据中,该数据的值被装载进
EIP寄存器中。函数的返回地址就是一个这样的数据。典型的利用缓冲区溢出是覆盖函数返回地址,让函数的返回指令将返回地址加载到EIP中。
数据元素按照如下方式存入栈中。函数调用之前将函数的参数压入栈中。参数从右到左被压入栈中。CALL指令将函数的返回地址压入栈中,它存储EIP寄存器的当前值。栈帧指针是前一个EB寄存器的值,当没有发生FPO优化时,也压入栈中。因此,栈帧指针不总是在栈中。如果函数包括了try/catch 或者任何其他形式的异常处理结构,编译器将在栈中包含异常处理信息。之后,是局部声明的变量和分配的缓冲区。这些分配的顺序可能根据优化实施而作改变。最后是调用者保存的寄存器如ESIEDIEBX,如果他们在函数执行时被使用。

运行时检查

   缓冲区溢出是cc++程序员普遍犯的错误,也是潜在的最危险的。Visual C++ .NET提供了工具,它可以使开发者在开发阶段很容易发现这些错误并修正。Visual C++ 6.0中的/GZ开关在Visual C++ .NET中的/RTC1中获得了新生。/RTC1开关是/RTsu的别名,其中s代表堆栈检查,u代表未初始化变量检查。所有在堆栈中分配的缓冲区在边界处设置了标签。因此,缓冲区溢出、下溢可以被捕捉。尽管小的缓冲区溢出可能不会改变程序的执行,它可以改变附近的数据,而这都不会被觉察到。

   运行时检查对于那些不仅想写安全的代码、而且关心编写正确代码的基本问题的开发者很有帮助。然而运行时检查仅仅工作在debug版本下,该特性从没有设计为在产品代码中可用。但是,在产品代码中进行这样的检查有很明显的价值。做这些运行时检查需要一小部分的性能损失。结果,Visual C++ .NET引入了/GS开关。

 

/GS开关做什么

/GS开关在缓冲区和返回地址间提供了一个“Speed bump”或cookie。如果一个溢出覆盖了返回地址,那么它也覆盖了放在缓冲区和他之间的Cookie,新的堆栈布局如下:

·                     Function parameters

·                     Function return address

·                     Frame pointer

·                     Cookie

·                     Exception Handler frame

·                     Locally declared variables and buffers

·                     Callee save

Cookie在以后会更详细的检查。随着这些安全检查的加入,函数的执行也改变了。首先,当一个函数执行时,第一条要执行的指令在函数的prolog中。至少,prolog为堆栈中的局部变量分配空间,例如如下指令:

sub esp,20h

这条指令为函数中的局部变量预留了32字节。当函数使用/GS开关编译时,函数prolog将预留另外的4个字节,三个如下另外的指令:

None.gifsub esp,24h 
None.gifmov eax,dword ptr [___security_cookie (408040h)] 
None.gifxor eax,dword ptr [esp+24h] 
None.gifmov dword ptr [esp+20h],eax
None.gif
   prolog
包含了一个提取cookie拷贝的指令,接着一条指令是将cookie和返回地址进行XOR操作,最后将cookie存储在紧挨着返回地址的下面。从以上来看,函数象正常一样执行。当函数返回时,最后要执行的是函数的epilog,它和prolog正好相反。如果没有安全检查,它将回收堆栈空间、返回,就像如下指令:
None.gifadd esp,20h 
None.gifret
None.gif

 

 
 

当使用/GS
编译时,安全检查也放在epilog
中:
None.gifmov ecx,dword ptr [esp+20h] 
None.gifxor ecx,dword ptr [esp+24h] 
None.gifadd esp,24h 
None.gifjmp __security_check_cookie (4010B2h)
None.gif
查询堆栈的 cookie
的拷贝,然后和返回地址进行 XOR
操作, ECX
寄存器应该包含和存储在
 
__security_cookie
变量中的原始
cookie
相同的内容。接着回收堆栈空间,然后不是
RET
指令,而是执行
JMP
指令,跳转到
__security_check_cookie
例程。

__security_check_cookie例程是很直观的。如果cookie没有被改变,它执行RET指令并结束函数调用。否则,它调用report_failure函数,report_failure接着调用__security_error_handler(_SECERR_BUFFER_OVERRUN, NULL)。这些函数都定义在C 运行库(CRT)的源文件seccook.c中。

 

错误处理器

 

   使这些安全检查起作用需要
CRT
的支持。当安全检查失败时,程序的控制需要交给
__security_error_handler
,以下是它的处理概要:
None.gif
void __cdecl __security_error_handler(
int code, 
void *data) 
ExpandedBlockStart.gif {       
ExpandedSubBlockStart.gif        
if (user_handler != NULL) { 
ExpandedSubBlockStart.gif               __try { 
InBlock.gif                               user_handler(code, data); 
ExpandedSubBlockStart.gif               } __except (EXCEPTION_EXECUTE_HANDLER) {} 
ExpandedSubBlockStart.gif        } 
else { 
//
dot.gifprepare outmsgdot.gif 
InBlock.gif
               __crtMessageBoxA( outmsg, "Microsoft Visual C++ Runtime Library", MB_OK|MB_ICONHAND|MB_SETFOREGROUND|MB_TASKMODAL); 
ExpandedSubBlockEnd.gif        } 
InBlock.gif        _exit(3); 
ExpandedBlockEnd.gif}
None.gif

 
 

缺省情况下,安全检查失败的应用程序弹出显示信息为
 Buffer overrun detected!
的对话框,当关闭对话框后终止应用程序。
CRT
库提供给开发者定制不同的、能够更好的处理缓冲区溢出的处理器功能。函数
__set_security_error_handler
  
通过在变量
user_handler
存储用户提供的处理器的方式来安装
handler
。以下例子说明:

 
 

None.gif
void __cdecl report_failure(
int code, 
void * unused) 
ExpandedBlockStart.gif
InBlock.gif        
if (code == _SECERR_BUFFER_OVERRUN) 
InBlock.gif               printf("Buffer overrun detected!\n"); 
ExpandedBlockEnd.gif
None.gif
void main() 
ExpandedBlockStart.gif
InBlock.gif        _set_security_error_handler(report_failure); 
InBlock.gif        
//
 More code follows 
ExpandedBlockEnd.gif
}
None.gif
   缓冲区溢出发生时,将会向控制台窗口打印一条消息,而不是弹出消息窗口。尽管用户处理器没有显示的终止程序,但是当处理器返回时,
__security_error_handler
通过调用
_exit(3)
来终止程序。函数
__security_error_handler
 
_set_security_error_handler
都在
CRT
secfail.c
文件中
讨论在用户处理器中应该怎么做是有用的。普遍的动作时抛出异常。然而,因为异常信息存储在堆栈中,抛出异常会将控制传递给异常栈。为了防止这种行为发生,
__security_error_handler
函数中调用用户函数时使用
try
/__except
来捕捉所有异常,然后终止程序。开发者不应该调用
DebugBreak
因为它会导致异常,也不应该调用
longjmp
.
用户处理器应该做的是报告错误,尽可能创建一个日志以便修正这个问题。

有时,开发者或许想重写函数__security_error_handler,而不是用函数_set_security_error_handler来达到同样的目的。重写容易出错,主处理器非常重要,如果没有正确的实现将导致危险的结果。

 

Cookie的值

Cookie是一个和指针同样大小的随机数,意味着在X86体系下,cookie4个字节长。它的值存储在CRT全局变量__security_cookie中。它的值由在CRT seccinit.c文件中的函数__security_init_cookie来初始化。Cookie的随机性来自于CPU处理器的计数器。每一个影像文件(使用/GS编译的DLLEXE )在装载时有一个不同的cookie

当时用/GS编译器开关编译程序时可能有两个问题。第一、不包含CRT支持的程序

将缺少随机的cookie,因为CRT初始化时调用__security_init_cookie。如果在装载时cookie没有被初始化,如果有缓冲区溢出,应用程序还是有可能被攻击。为了解决这个问题,应用程序在启动时需要显示的调用__security_init_cookie。第二、调用文档化的函数来初始化的

遗留的应用程序可能遇到不可预期的安全检查失败。例如下面的例子:

 
 

ExpandedBlockStart.gifDllEntryPoint(
dot.gif)  {
InBlock.gif         
char buf[_MAX_PATH]; 
//
 A buffer that triggers security checks 
InBlock.gif
        
dot.gif 
InBlock.gif        _CRT_INIT(); 
InBlock.gif        
dot.gif 
ExpandedBlockEnd.gif}
None.gif
   
问题是
_CRT_INIT
改变了已经存在的用来安全检查的
cookie
的值。因为
cookie
的值在函数退出时和原来的值不同,安全检查认为发生了缓冲区溢出。解决办法是避免在调用
_CRT_INIT
之前声明缓冲区。现在可以使用
_alloca
在堆栈上分配缓冲区作为回避方法,因为如果使用函数
_alloca
分配缓冲区,编译器不会产生安全检查。这种回避方法不保证在以后的
Visual C++
版本中适用。

 

性能影响

必须平衡程序的性能和安全检查。Visual C++编译器组致力于将性能影响降低到最小。大多说情况下,性能影响不超过2%。实际上,经验显示对大多说的应用程序、包括高性能的服务器端程序来讲,性能影响是微乎其微的。

使性能不受影响的最重要的因素是只有那些容易受到攻击的函数才执行安全检查。现在,容易受到攻击的函数为在堆栈中分配缓冲区的函数。字符串缓冲区如果分配多于四个字节、缓冲区中每个元素时12个字节,就容易受到攻击。小缓冲区不容易受到攻击并且限制进行安全检查的函数的数量就限制了代码的增长。大部分的可执行程序因为适用/GS编译引起的代码增长时微乎其微的。

 

例子

 

              因此,/GS开关并没有修正缓冲区溢出,但是它可以阻止攻击者利用缓冲区进行攻击。当时用/GS开关编译vulnerable1 vulnerable2时,溢出就不会被利用。缓冲区溢出发生在最后一个动作的函数可以免于被攻击。因为如果溢出发生在函数执行的早期,安全检查或者没有机会执行、或者安全检查本身已被攻击,象如下例子。

例子1

ExpandedBlockStart.gif
class Vulnerable3  {
InBlock.gif 
public
InBlock.gif        
int value; 
ExpandedSubBlockStart.gif        Vulnerable3() { value = 0; } 
ExpandedSubBlockStart.gif        
virtual ~Vulnerable3() { value = -1; } 
ExpandedBlockEnd.gif}; 
ExpandedBlockStart.gif
void vulnerable3(
char * pStr)  { 
InBlock.gif        Vulnerable3 * vuln = 
new Vulnerable3; 
InBlock.gif        
char buf[20]; 
InBlock.gif        strcpy(buf, pStr); 
InBlock.gif        delete vuln; 
ExpandedBlockEnd.gif}
None.gif

 
 

              
这种情况下,在栈中分配了含有许函数的对象的指针。因为对象含有虚函数,对象包含一个
vtable
指针。供给者能提供一个恶意的
pStr
并溢出
buf
。函数返回前,
delete
操作符调用
vuln
的虚函数。调用需要在
vtable
中查找析构函数,它已经被接管了。在函数返回前,程序已经北接管,所以安全检查根本没有检测到缓冲区溢出发生。

例子2

 
 

ExpandedBlockStart.gif
void vulnerable4(
char *bBuff, 
in cbBuff)  {
InBlock.gif         
char bName[128];
InBlock.gif         
void (*func)() = MyFunction; 
InBlock.gif        memcpy(bName, bBuff, cbBuff); 
InBlock.gif        (func)(); 
ExpandedBlockEnd.gif}
None.gif
   这种情况下,函数容易受到指针修改攻击。当编译器为这两个局部变量分配空间时,它把
func
变量放在
bName
之前。因为这种布局优化器可以提升代码的效率。很不幸,这允许攻击者一个为
bBuff
提供恶意的值。攻击者同样可以提供
cbBuff
的值,它标示着
bBuff
的大小。函数忽略了验证
cbBuff
小于等于
128
。调用
memcpy
导致了缓冲区溢出,覆盖了
func
的值。因为在 vulnerable4
返回之前首先调用
func
,在进行安全检查之前,代码已经被攻击了。

例子3

 
 

ExpandedBlockStart.gif
int vulnerable5(
char * pStr)  { 
InBlock.gif        
char buf[32]; 
InBlock.gif        
char * 
volatile pch = pStr; 
InBlock.gif        strcpy(buf, pStr); 
InBlock.gif        
return *pch == '\0'; 
ExpandedBlockEnd.gif
ExpandedBlockStart.gif
int main(
int argc, 
char* argv[])  { 
ExpandedSubBlockStart.gif        __try { vulnerable5(argv[1]); } 
ExpandedSubBlockStart.gif        __except(2) { 
return 1; } 
InBlock.gif        
return 0; 
ExpandedBlockEnd.gif}
None.gif
   这个程序展示了一个特别难的问题,因为它使用了结构化异常处理。如前面提及,使用异常处理的函数将把异常处理信息,例如合适的异常处理函数,放在栈中。本例中,
main
函数的异常处理帧因为函数
vulnerable5
的缺陷而可能被攻击。攻击者利用溢出
buf
来破坏
pch
main
函数的异常处理帧。因为
vulnerable5
函数后来引用了
pch
,如果攻击者覆盖它的值为
0
,这将导致访问异常。在堆栈展开的过程中,操作系统在异常处理帧中查找处理该异常的异常处理函数。因为异常处理帧已经被破坏,操作系统可能将程序的控制权交给由攻击者提供的任意代码。安全检查将不能够检查这样的缓冲区溢出,因为函数没有正常返回。

近来一些很流行的攻击都是利用异常处理。其中最流行的Code Red病毒出现在2001年夏。Window XP已经创建了一个环境,在该环境下,通过异常处理进行攻击将会更难,因为异常处理函数的地址不在栈中,而且调用异常处理函数之前清除所有的寄存器的值。

例子4

 
 

ExpandedBlockStart.gif
void vulnerable6(
char * pStr)  { 
InBlock.gif        
char buf[_MAX_PATH]; 
InBlock.gif        
int * pNum; 
InBlock.gif        strcpy(buf, pStr); 
InBlock.gif        sscanf(buf, "%d", pNum); 
ExpandedBlockEnd.gif}
None.gif
   不象以前其他的例子,当时用
/GS
开关编译此函数时,攻击者不能简单的通过缓冲区溢出来获得程序的控制权。如果想获得程序的控制权需要两阶段的攻击。
pNum
将被分配在
buf
之前使得它可以被
pStr
提供的任意的值重写。攻击者将不得不选择四个字节进行重写。如果缓冲区重写超过了
cookie
,存储在
user_handle
中的用户提供的处理器或者或者存储在
__security_cookie
中的默认处理器会接管程序的运行。如果没有覆盖
cookie
,攻击者将选择函数的返回地址作作为不包含安全检查的函数。这种情况下,程序正常的执行,从函数中正常返回,没有意识到缓冲区溢出;一段时间后,程序悄悄的被接管。

容易受到攻击的代码可能受到另外的攻击如,发生在堆中的缓冲区溢出,它不能够被/GS开关检查出来。数组索引越界攻击,它对数组中的某一个位置进行存取,而不是对数组进行连续写入,这样的问题/GS开关也不能检查出来。一个未检查的数组索引可以访问内存的任意部分,而不会修改cookie的内容。另外一种未检查的索引是有符号、无符号的不匹配。如果索引是有符号整数,简单的验证索引小于数组的大小也是不够的。最后,/GS开关不能够检查缓冲区下溢。

 

结论

              很明显,缓冲区溢出是应用程序的一个非常关键的缺陷。没有比写出紧凑、安全的代码更重要。尽管大多数观点认为,少量的缓冲区溢出很难被发现。在编写安全代码方面,/GS开关对开发者是很有帮助的。但是,它解决不了代码中的缓冲区溢出的问题。尽管安全检查在某种程度上阻止了缓冲区被利用,但程序仍然终止了,一种拒绝服务的攻击,特别是服务器端代码。使用/GS开关是一种安全的方法来减少在没有意识到的情况下,受到缓冲区溢出的攻击。

              尽管存在能够标记可能受到攻击的代码的工具,例如本文所讨论的,但是他们都是由缺点的。被好的代码Review人员检查过得好的代码比什么都更可靠。Michael Howard David LeBlanc < Writing Secure Code>在编写高度安全的应用程序方面,提供了很多其他的、可以降低被攻击的方法。

转载地址:http://nlhqa.baihongyu.com/

你可能感兴趣的文章
你要做的是产品经理,不是作图经理!
查看>>
JavaEE 项目常见错误汇总
查看>>
快速掌握Python基础语法(下)
查看>>
【Android自定义View】绘图之文字篇(三)
查看>>
适配iOS 11和iPhoneX屏幕适配遇到的一些坑
查看>>
Fetch API 简单封装
查看>>
给媳妇做一个记录心情的小程序
查看>>
iOS App无需跳转系统设置自动连接Wi-Fi
查看>>
一道柯里化面试题
查看>>
本科studying abroad 无法毕业申请硕士转学转校处理一切studying abroad 问题
查看>>
RxJava(RxAndroid)的简单学习
查看>>
Java8 函数式编程之函数接口(下)
查看>>
【本人秃顶程序员】MySQL 全表 COUNT(*) 简述
查看>>
centos7中使用febootstrap自制一个基础的centos 7.2的docker镜像
查看>>
C#开发Unity游戏教程之判断语句
查看>>
安装 SharePoint Server 2007
查看>>
springmvc mybatis 调用sql , 转成json
查看>>
linux centos 7 网卡突然不能上网异常解决
查看>>
授之以渔-运维平台发布模块一(Jenkins篇)
查看>>
DedeCMS操作基础(一)
查看>>