Injection Attacks-XML注入

注入攻击

XML注入

虽然JSON的出现实现了服务器与客户端之间的“轻量级”数据交流,但是,作为另一种流行的可行方案,许多web服务API同时还是继续支持XML。另外,除了web服务之外,XML也是许多使用XML schemas 实行数据交换的协议的基础,例如RSS,Atom,SOAP,以及RDF等等,举不胜举。

XML无处不在:它存在于web应用的服务器中,或者在浏览器中作为XMLHttpRequest的请求和应答的格式,亦或在浏览器的扩展程序中。由于应用广泛,XML成为了吸引注入攻击的目标。它受众广,同时常用的XML解析器,例如libxml2,允许对XML进行一些默认处理。libxml2常在DOM、SimpleXML和XMLReader扩展中的PHP中使用。当浏览器的XML交换很频繁时,我们要考虑到,XML作为请求格式时,就算是认证用户,也有可能正通过跨站脚本攻击发送攻击者所编写的XML。

XML外部实体注入攻击

面对XML外部实体攻击(XXE)的脆弱点在于,XML解析器的库往往都支持自定义的XML实体引用。你应该熟悉,XML拥有表示>、<和&apos 等特殊标记字符的实体,作为对一般实体的标准补充。同时XML允许用户在XML文档内自定义实体,以此来扩展其标准实体集。这些自定义实体可以直接写在可选的DOCTYPE中,而它们代表的扩展值则可引用一个外部资源。正是普通XML的这种支持自定义引用、可引用外部资源内容的可扩展性,导致系统易受XXE的攻击。通常,我们的系统绝不应当允许不受信任的输入以无法预期的方式参与到系统交互中来,同时绝大大多数程序开发人员都不会考虑到XXE。因此值得我们特别注意。

例如,让我们来试着定义一个新的自定义实体“harmless”。

<!DOCTYPE results [ <!ENTITY harmless "completely harmless"> ]>

现在,包含这个实体定义的XML文档可以在任何允许的地方引用&harmless;实体。

<?xml version="1.0"?>
<!DOCTYPE results [<!ENTITY harmless "completely harmless">]>
<results>
    <result>This result is &harmless;</result>
</results>

XML解析器,例如PHP DOM,在解析这段XML时,会在加载完文档后立即处理这个自定义实体。因此,请求相关文本时,会得到如下的返回:

This result is completely harmless

无疑,好处是,自定义实体可以用较短的实体名来代表重复的文本和XML。当XML需要遵守特定的语法规范,或者需要自定义实体使编辑更为简单时,这种方法并不少见。但是,考虑到遵守不信任外部输入的原则,我们要特别小心地对待应用程序中使用的所有XML,辨别它们的真正目的。下面的这个就肯定不是无害的输入:

<?xml version="1.0"?>
<!DOCTYPE results [<!ENTITY harmless SYSTEM
"file:///var/www/config.ini">]>
<results>
    <result>&harmless;</result>
</results>

取决于请求的本地文件的内容,某些内容可用于扩充&harmless;实体,这些内容可以从XML解析器中提取出来,包含在web应用的输出中,攻击者看到它们,即会造成信息泄露。获取的文件将会被解析成XML,除非避开某些可以触发解析的特殊字符,而这限制了泄露的范围。如果文件被解析为XML但并不包含有效的XML内容,系统会报错,这样一来可以避免内容泄露。但是,PHP中有一个巧妙的“技俩”,可以绕过这种范围的限制,既使得攻击者接收不到应答,远程HTTP请求却仍然可以影响web应用。

PHP有三种常用的方法,用来解析和使用XML:PHP DOM、SimpleXML,以及XMLReader。这三种方法都需要使用libxml2扩展,也默认启用外部实体支持。这种默认设置导致PHP在XXE面前很脆弱,而我们在考虑web应用或XML应用库的安全性时,很容易疏忽这一点。

你也知道,XHTML和HTML5都可以被序列化为有效的XML,也就是说,某些XHTML页面和被序列化的HTML5可以被解析为XML,例如,使用DOMDocument::loadXML(),而不是DOMDocument::loadHTML()时。这种XML解析方法在XEE注入的面前也很脆弱。注意,与XHTML DOCTYPES不同,libxml2目前甚至无法识别HTML5 DOCTYPE,因此无法让其成为有效的XML。

XXE注入实例

文件内容和信息泄露

在早前的一个信息泄露的例子中,我们注意到自定义实体可能引用一个外部文件。

<?xml version="1.0"?>
<!DOCTYPE results [<!ENTITY harmless SYSTEM
"file:///var/www/config.ini">]>
<results>
    <result>&harmless;</result>
</results>

这会把文件内容扩展到自定义的&harmless;实体中。由于所有类似的请求都是在本地完成的,这使得该应用有权限读取的所有文件内容都可能被泄露。只要应用的输出中包含了这个扩展了的实体,攻击者就可以查看那些文件,包括没有公开的文件。因这种方式而造成内容泄露的文件是相当有限的,只能是XML文件,和不会造成XML解析错误的文件。但是,PHP可以完全忽略这种限制。

 <?xml version="1.0"?>
<!DOCTYPE results [
    <!ENTITY harmless SYSTEM
    "php://filter/read=convert.base64-encode/resource=/var/www/config.ini"
    >
]>
<results>
    <result>&harmless;</result>
</results>

PHP允许通过URI访问PHP wrapper,这是一般文件系统函数,如file_get_contents()、require()、require_once()、file()、和copy()等,接受的协议之一。PHP wrapper支持一些过滤器,这些过滤器运行在给定的资源上,结果可以通过函数调用返回。在上述例子中,我们对想要读取的目标文件使用了convert.base-64-encode过滤器。

这意味着,攻击者通过利用XXE的脆弱性,可以用PHP读取任何可读的文件,不论文本格式如何。攻击者只需用base64将应用输出解码,就可以毫无顾忌的分析一大堆非公开文件的内容。尽管这本身不会直接伤害终端用户或是应用后台,但是它能让攻击者了解目标应用,从而以最小的代价、最低的风险发现应用的其他弱点。

绕过访问控制

访问控制可以通过各种方法来实现。由于XXE攻击是挂在web应用后台的,它无法使用当前用户会话产生任何影响,但是攻击者仍然可以借助从本地服务器发送请求,来绕过后台访问控制。我们来看一下下面这个简单的访问控制:

if (isset($_SERVER['HTTP_CLIENT_IP'])
    || isset($_SERVER['HTTP_X_FORWARDED_FOR'])
    || !in_array(@$_SERVER['REMOTE_ADDR'], array(
        '127.0.0.1',
        '::1',
    ))
) {
    header('HTTP/1.0 403 Forbidden');
    exit(
        'You are not allowed to access this file.'
    );
}

这段PHP和无数的类似代码都用于限制特定PHP文件对本地服务器的访问,如 localhost。但是,应用前端的XXE脆弱性,正好为攻击者提供了绕过访问控制所需的凭证,因为XML解析器发出的所有HTTP请求都来自localhost。

<?xml version="1.0"?>
<!DOCTYPE results [
    <!ENTITY harmless SYSTEM
    "php://filter/read=convert.base64-encode/resource=http://example.com/viewlog.php"
    >
]>
<results>
    <result>&harmless;</result>
</results>

如果只有本地请求可以查看日志,攻击者就可以成功获取日志。同样的思路也适用于只接受本地请求的维护和管理接口。

拒绝服务(DOS)

几乎所有可以控制服务器资源利用的东西,都可用于制造DOS攻击。通过XML外部实体注入,攻击者可以发送任意的HTTP请求,从而在恰当的时候耗尽服务器资源。

下文中还有一些其他的例子,通过XML实体扩展造成XXE攻击,从而制造潜在的DOS攻击。

抵御XML外部实体注入

这类攻击十分“诱人“,但对它的防御也简单的出奇。既然DOM、SimpleXML和XMLReader依赖于libxml2,我们可以简单地利用libxml_disable_entity_loader()函数来禁止外部实体引用。与此同时,DOCTYPE中预定义的自定义实体却不会受到影响,因为它们并没有使用任何需要文件系统操作或发送HTTP请求的外部资源。

$oldValue = libxml_disable_entity_loader(true);
$dom = new DOMDocument();
$dom->loadXML($xml);
libxml_disable_entity_loader($oldValue);

在所有涉及通过字符串、文件或者远程URI来加载XML时,都需要使用这些操作。

当应用程序及其大部分请求都不需要外部实体时,你可以简单地从全局禁掉外部资源加载。大多数时候,这比找出所有的XML加载实例来逐个操作要更好。记住,许多库天生自带XEE脆弱性:

libxml_disable_entity_loader(true);

每次需要临时允许加载外部资源时,加载完后切记再把这里设为TRUE。例如,在将Docbook XML转换为HTML时,所使用的XSL样式就是依赖于外部实体的,这里需要外部实体,但是是无害的。

但是,libxml2函数绝不是"万能钥匙"。我们需要确认,其他用于解析或处理XML的扩展和PHP库的引用外部实体的功能,都处于关掉状态。

如果不能通过上述方法来开关外部实体引用,你还可以检查一下XML文档是否声明了DOCTYPE。如果声明了,同时禁掉了外部实体,则可以简单地丢弃XML文档,拒绝可能造成解析器脆弱性的不受信任的XML访问,同时将这种行为记录为一次可能的攻击。我们需要将这种行为记录下来,因为除此之外不会有任何系统报错记录。可以在日常输入验证中进行这项检查。但是,这种方法并不理想,笔者还是强烈建议从源头上解决外部实体的问题。

/**
 * Attempt a quickie detection
 */
$collapsedXML = preg_replace("/[:space:]/", '', $xml);
if(preg_match("/<!DOCTYPE/i", $collapsedXml)) {
    throw new \InvalidArgumentException(
        'Invalid XML: Detected use of illegal DOCTYPE'
    );
}

同时,值得注意的是,当我们怀疑一段数据有可能是某个攻击的结果时,最好的方法是丢弃它,而不是继续使用它。既然它已经表现出了危险,为什么还要继续使用它呢?因此,将上述两个步骤合并起来,我们可以在无法丢弃数据时(例如第三方的库),通过主动跳过坏数据起到保护作用。之所以我们更愿意完全丢弃这些数据,还因为上文提到过的一个理由:libxml_disable_entity_loader()不会将自定义实体完全禁掉,只有引用外部资源的才会被禁掉。因此这仍有可能导致一个被称为XML实体扩展的注入攻击。在下文中我们会提到这种攻击。

原文地址:Injection Attacks

本文系 OneAPM 工程师编译整理。。

本文转自 OneAPM 官方博客

时间: 2024-11-01 10:17:35

Injection Attacks-XML注入的相关文章

SQL Injection(SQL注入)介绍及SQL Injection攻击检测工具

1.关于SQL Injection 迄今为止,我基本没有看到谁写出一篇很完整的文章,或者说很成熟的 解决方案(能做到 的人肯定很多,问题是没有流传开来,很遗憾) 我简单的说几点,希望启发大家思考,起到抛砖引玉的作用 一.SQL Injection的原理 SQL Injection的实现方法和破坏作 用有很多,但万变不离其宗,其原理可以概括为一句话 :SQL Injection就是向服务器端提交事先准备好的数据,拼凑出攻击者想要的SQL语句,以改变数据库操作执行计划. 我想,这么说也许不算精炼,但

SQL Injection with MySQL 注入分析_安全教程

声明 本文仅用于教学目的,如果因为本文造成的攻击后果本人概不负责,本文所有代码均为本人所写,所有数据均经过测试.绝对真实.如果有什么遗漏或错误,欢迎来安全天使论坛和我交流. 前言 2003年开始,喜欢脚本攻击的人越来越多,而且研究ASP下注入的朋友也逐渐多了起来,我看过最早的关于SQL注入的文章是一篇99年国外的高手写的,而现在国外的已经炉火纯青了,国内才开始注意这个技术,由此看来,国内的这方面的技术相对于国外还是有一段很大差距,话说回来,大家对SQL注入攻击也相当熟悉了,国内各大站点都有些堪称

初级教程之SQL Injection(SQL注入攻击)

攻击|教程 因为目前SQL注入是非常热门而且技术门槛较低的攻击手段,并且非常实用,轻则可以拿到网站的一些帐号,比如拿到某个电影网站的黄金会员的帐号:重则利用其网站楼多入侵整个服务器等等. 这里打算作为一个专题讲解SQL及其注入.其中对于SQL不太明白的地方希望大家自己查资料.这个帖子将长期更新... 一,SQL纵览 SQL(Structured Query Language)语言是一种结构化查询语言.SQL语言中完成核心功能的共有9个关键词:SELECT(数据查询).CREAT.DROP.ALT

AngularJs Dependency Injection(DI,依赖注入)_AngularJS

一.Dependency Injection(依赖注入) 依赖注入(DI)是一个软件设计模式,处理代码如何得到它所依赖的资源. 关于DI更深层次的讨论,可以参观Dependency Injection(http://en.wikipedia.org/wiki/Dependency_injection),Inversion of Control(http://martinfowler.com/articles/injection.html),也可以参观软件设计模式的书. 1. DI in a nu

XML 实体扩展攻击

XMl Entity Expansion(攻击)某种程度上类似于 XML Entity Expansion,但是它主要试图通过消耗目标程序的服务器环境来进行DOS攻击的.这种攻击基于XML Entity Expansion实现,通过在XML的DOCTYPE中创建自定义实体的定义实现,比如,这种定义可以在内存中生成一个比XML的原始允许大小大出很多的XML结构,来使这种攻击得以耗尽网络服务器正常有效运行的必需内存资源.这种攻击方式同样适用于HTML5的XML序列化功能模块,该模块当前还不能被lib

Java Spring各种依赖注入注解的区别

Spring对于Bean的依赖注入,支持多种注解方式: @Resource  javax.annotation  JSR250 (Common Annotations for Java)    @Inject  javax.inject  JSR330 (Dependency Injection for Java)    @Autowired  org.springframework.bean.factory  Spring  直观上看起来,@Autowired是Spring提供的注解,其他几个

我要造轮子之IoC和依赖注入

1.前言 因为这是我设想要写的一系列文章的第一篇.所以我先说明一下我为什么要重复造轮子. 在这里造轮子的目的不是为了造出比前人更出色的轮子来,而是通过造轮子,学习轮子内部的结构及相关原理.甚至去模仿前人轮子上的优点,吸收这些优点. 这一系列文章初步估计应该包括:IoC和依赖注入.AOP.ORM.Servlet容器(tomcat)等. 2.IoC和依赖注入的概念 Inverse of Control,控制反转. IoC主要功能是依赖关系的转移.应用的本身不负责依赖对象的创建和维护,而是由第三方容器

注入攻击-SQL注入和代码注入

注入攻击 OWASP将注入攻击和跨站脚本攻击(XSS)列入网络应用程序十大常见安全风险.实际上,它们会一起出现,因为 XSS 攻击依赖于注入攻击的成功.虽然这是最明显的组合关系,但是注入攻击带来的不仅仅是 XSS. 注入攻击代指一类攻击,它们通过注入数据到一个网络应用程序以期获得执行,亦或是通过非预期的一个方式来执行恶意数据.这种类别的攻击包括跨站脚本攻击(XSS).SQL 注入攻击.头部注入攻击.日志注入攻击和全路径暴露.当然限于篇幅,这里只是一个简单的介绍. 这类攻击是每个程序员的梦魇.它们

实例讲解Java的Spring框架中的控制反转和依赖注入_java

近来总是接触到 IoC(Inversion of Control,控制反转).DI(Dependency Injection,依赖注入)等编程原则或者模式,而这些是著名 Java 框架 Spring.Struts 等的核心所在.针对此查了 Wikipedia 中各个条目,并从图书馆借来相关书籍,阅读后有些理解,现结合书中的讲解以及自己的加工整理如下:   eg1问题描述: 开发一个能够按照不同要求生成Excel或 PDF 格式的报表的系统,例如日报表.月报表等等.   解决方案: 根据"面向接口