让你的 PHP 7 更快

PGO正如名字所说(Profile Guided Optimization 有兴趣的可以Google), 他需要用一些用例来获得反馈, 也就是说这个优化是需要和一个特定的场景绑定的.

你对一个场景的优化, 也许在另外一个场景就事与愿违了. 它不是一个通用的优化. 所以我们不能简单的就包含这些优化, 也无法直接发布PGO编译后的PHP7.

当然, 我们正在尝试从PGO找出一些共性的优化, 然后手工Apply到PHP7上去, 但这个很明显不能做到针对一个场景的特别优化所能达到的效果, 所以我决定写这篇文章简单介绍下怎么使用PGO来编译PHP7, 让你编译的PHP7能特别的让你自己的独立的应用变得更快.

首先, 要决定的就是拿什么场景去Feedback GCC, 我们一般都会选择: 在你要优化的场景中: 访问量最大的, 耗时最多的, 资源消耗最重的一个页面.

拿Wordpress为例, 我们选择Wordpress的首页(因为首页往往是访问量最大的).

我们以我的机器为例:

Intel(R) Xeon(R) CPU           X5687  @ 3.60GHz X 16(超线程),
48G Memory

php-fpm 采用固定32个worker, opcache采用默认的配置(一定要记得加载opcache)

以wordpress 4.1为优化场景..

首先我们来测试下目前WP在PHP7的性能(ab -n 10000 -c 100):

$ ab -n 10000 -c 100 http://inf-dev-maybach.weibo.com:8000/wordpress/
This is ApacheBench, Version 2.3 <$Revision: 655654 $>
Copyright 1996 Adam Twiss, Zeus Technology Ltd, http://www.zeustech.net/
Licensed to The Apache Software Foundation, http://www.apache.org/

Benchmarking inf-dev-maybach.weibo.com (be patient)
Completed 1000 requests
Completed 2000 requests
Completed 3000 requests
Completed 4000 requests
Completed 5000 requests
Completed 6000 requests
Completed 7000 requests
Completed 8000 requests
Completed 9000 requests
Completed 10000 requests
Finished 10000 requests

Server Software:        nginx/1.7.12
Server Hostname:        inf-dev-maybach.weibo.com
Server Port:            8000

Document Path:          /wordpress/
Document Length:        9048 bytes

Concurrency Level:      100
Time taken for tests:   8.957 seconds
Complete requests:      10000
Failed requests:        0
Write errors:           0
Total transferred:      92860000 bytes
HTML transferred:       90480000 bytes
Requests per second:    1116.48 [#/sec] (mean)
Time per request:       89.567 [ms] (mean)
Time per request:       0.896 [ms] (mean, across all concurrent requests)
Transfer rate:          10124.65 [Kbytes/sec] received

可见Wordpress 4.1 目前在这个机器上, 首页的QPS可以到1116.48. 也就是每秒钟可以处理这么多个对首页的请求,

现在, 让我们开始教GCC, 让他编译出跑Wordpress4.1更快的PHP7来, 首先要求GCC 4.0以上的版本, 不过我建议大家使用GCC-4.8以上的版本(现在都GCC-5.1了).

第一步, 自然是下载PHP7的源代码了, 然后做./configure. 这些都没什么区别

接下来就是有区别的地方了, 我们要首先第一遍编译PHP7, 让它生成会产生profile数据的可执行文件:

$ make prof-gen
注意, 我们用到了prof-gen参数(这个是PHP7的Makefile特有的, 不要尝试在其他项目上也这么搞哈 :) )

然后, 让我们开始训练GCC:

$ sapi/cgi/php-cgi -T 100 /home/huixinchen/local/www/htdocs/wordpress/index.php >/dev/null

也就是让php-cgi跑100遍wordpress的首页, 从而生成一些在这个过程中的profile信息.

然后, 我们开始第二次编译PHP7.

$ make prof-clean
$ make prof-use && make install

好的, 就这么简单, PGO编译完成了, 现在我们看看PGO编译以后的PHP7的性能:

$ ab -n10000 -c 100 http://inf-dev-maybach.weibo.com:8000/wordpress/
This is ApacheBench, Version 2.3 <$Revision: 655654 $>
Copyright 1996 Adam Twiss, Zeus Technology Ltd, http://www.zeustech.net/
Licensed to The Apache Software Foundation, http://www.apache.org/

Benchmarking inf-dev-maybach.weibo.com (be patient)
Completed 1000 requests
Completed 2000 requests
Completed 3000 requests
Completed 4000 requests
Completed 5000 requests
Completed 6000 requests
Completed 7000 requests
Completed 8000 requests
Completed 9000 requests
Completed 10000 requests
Finished 10000 requests

Server Software:        nginx/1.7.12
Server Hostname:        inf-dev-maybach.weibo.com
Server Port:            8000

Document Path:          /wordpress/
Document Length:        9048 bytes

Concurrency Level:      100
Time taken for tests:   8.391 seconds
Complete requests:      10000
Failed requests:        0
Write errors:           0
Total transferred:      92860000 bytes
HTML transferred:       90480000 bytes
Requests per second:    1191.78 [#/sec] (mean)
Time per request:       83.908 [ms] (mean)
Time per request:       0.839 [ms] (mean, across all concurrent requests)
Transfer rate:          10807.45 [Kbytes/sec] received

现在每秒钟可以处理1191.78个QPS了, 提升是~7%. 还不赖哈(咦, 你不是说10%么? 怎么成7%了? 呵呵, 正如我之前说过, 我们尝试分析PGO都做了些什么优化, 然后把一些通用的优化手工Apply到PHP7中. 所以也就是说, 那~3%的比较通用的优化已经包含到了PHP7里面了, 当然这个工作还在继续).

于是就这么简单, 大家可以用自己的产品的经典场景来训练GCC, 简单几步, 获得提升, 何乐而不为呢

文章转载自 开源中国社区 [http://www.oschina.net]

时间: 2024-10-02 00:29:20

让你的 PHP 7 更快的相关文章

360安全浏览器-更快的网页下载速度

  360安全浏览器在浏览的各个方面进行优化以提高浏览速度,它比IE等同类浏览器具有更快的下载速度,这需要您自己的使用体验. 从技术上讲,大致有如下几个重要的环节进行了浏览优化: 1.扁平的模块封装,减少代码环节,节省CPU占用 2.特别为浏览器优化的OLE容器,减少不必要的接口和处理过程,节省CPU占用 3.独特的ActiveX控件自动安装过滤,停止浏览器自动下载控件的过程,节省网络带宽 4.增强的页面元素黑名单过滤,不同于标准接口的一般实现方法,在增强速度的同时,不影响界面美观,过滤掉的元素

Android版Chrome支持更快的安全加密算法

谷歌最近通过控制浏览器及其访问的站点来加速Android平台安全网页的浏览--谷歌anti-abuse研究团队主管Elie Bursztein在本周四的博客文章中表示,谷歌推行了更快的新型加密算法,这两种名为ChaCha20和Poly1305的加密算法加入到了Chrome浏览器中. Bursztein表示:"ChaCha20和Poly1305在移动和可穿戴设备上会显得非常快."部分原因就在于这些算法能够利用ARM芯片中的部分加速特性.而且此类算法能够有效防止数据窃听,包括来自政府的监控

优化JS和CSS更快地下载网页图片

文章简介:我关注JS和CSS的重点也是如何能够更快地下载图片.图片是用户可以直观看到的.他们并不会关注JS和CSS.确实,JS和CSS会影响图片内容的展示,尤其是会影响图片的展示方式(比如图片轮播,CSS背景图和媒体查询).但是我认为JS和CSS只是展示图片的方式.在页面加载的过程 我的大部分性能优化工作都集中在JavaScript和CSS上,从早期的Move Scripts to the Bottom和Put Stylesheets at the Top规则.为了强调这些规则的重要性,我甚至说

让你的 PHP 7 更快 (GCC PGO)

我们一直致力于提升PHP7的性能,  上个月我们注意到GCC的PGO能在Wordpress上能带来近10%的性能提升,  这个让我们很激动. 然而,  PGO正如名字所说(Profile Guided Optimization 有兴趣的可以Google), 他需要用一些用例来获得反馈, 也就是说这个优化是需要和一个特定的场景绑定的. 你对一个场景的优化, 也许在另外一个场景就事与愿违了.  它不是一个通用的优化. 所以我们不能简单的就包含这些优化, 也无法直接发布PGO编译后的PHP7. 当然,

更快更安全更稳定 OpenDNS上网新方式

无论你何时使用Internet,都会用到DNS.每次发送电子邮件或是在网上冲浪,你都必须依赖DNS.DNS负责主机名字之间和互联网络地址之间的映射,是由计算机来处理的,要是连接DNS服务器的过程出现延迟,或者如果DNS服务器解析某个地址时间过长,那么访问就会出现延迟.而如果能够以某种方式加快域名解析,就能够加快上网冲浪的速度,下面介绍的是一种加速方法:使用OpenDNS. 一.OpenDNS的特点有三个: 1.OpenDNS具有更安全的特点.OpenDN可以识别和阻止钓鱼(Phishing)网站

异步加载:ControlJS让脚本加载更快的一个模块

文章简介:关于ControlJs的使用和基础讲解. 关于ControlJs一共有三篇文章,这是第一部分.ControlJS是让脚本加载更快的一个模块(a javascript module for making scripts load faster). 三篇文章的结构分别为: 1. async loading2. delayed execution3.overriding document.write关于第一部分的异步加载,这个的关键在于尽快将页面作为html绘制出来,然后再用javascri

写出更轻巧、更快并且更不会让你头疼的CSS

网页制作Webjx文章简介:写出更轻巧.更快并且更不会让你头疼的CSS. 为什么我们的CSS变得一团糟--我们真的很容易陷入这样的困惑中. 有时这是一开始就马虎编程的结果,有时是由于后期多重的附加代码(hacks)和修改造成的. 无论是哪种原因,这都不是无法避免的.写出干净,超级可管理的CSS很简单,只要你走对了路,你的代码会更便于今后的维护和编辑. 写出更轻巧.更快并且更不会让你头疼的CSS,以下这10个技巧将会提高你这方面的能力. 1.保持条理性 像任何事情一样,让自己保持条理性(有组织)是

移动设计优化:让APP变得更快的设计方法

文章描述:我们都知道不管网页还是移动应用,响应速度都是最重要的体验指标之一,并且移动应用的网络环境不稳定,速度的体验显得尤为重要.其实速度优化不仅是程序员的事,设计,也能够让App变得更快. D.A:我们都知道不管网页还是移动应用,响应速度都是最重要的体验指标之一,并且移动应用的网络环境不稳定,速度的体验显得尤为重要.其实速度优化不仅是程序员的事,设计,也能够让App变得更快. 1.后台执行 这是一条很通用,也容易理解的方法.用户不会愿意盯着进度条傻傻地等待,除了"取消"没有其他选择.

让电脑启动更快的十五招

嫌脑启动太慢是每个脑迷的共同心病,让脑启动更快是大家的共同心愿,本人在使用脑过程中总结了加快脑启动速度的"十五式",与您分享. 一.BIOS的优化设置 在BIOS设置的首页我们进入"Advanced BIOS Features"选项,将光标移到"Frist Boot Device"选项,按"PageUP"和"PageDOWN"进行选择,默认值为"Floppy",这表示启动时系统会先从软驱

TOP N 和SET ROWCOUNT N 哪个更快?

懒得翻译了,大意:在有合适的索引的时候,Top n和set rowcount n是一样快的.但是对于一个无序堆来说,top n更快.原理自己看英文去. Q. Is using the TOP N clause faster than using SET ROWCOUNT N to return a specific number of rows from a query? A. With proper indexes, the TOP N clause and SET ROWCOUNT N st