百万级高并发网站MYSQL应用攻略

在长时间的网站开发过程中,能作一个百万IP的网站对我来说真是一个新的挑战,由于本人的水平有限,所以一直就职于一个小公司,在这里也只是抱着重在参与的想法。在以后我所讲述到的内容知识点上如有不适之处请大家多多批评指教。

  在一开始接触PHP接触MYSQL的时候就听不少人说:“Mysql就跑跑一天几十万IP的小站还可以,要是几百万IP就不行了”,原话不记得了,大体就是这个意思。一直也没有好的机会去验证这个说法,一是从没有接手过这么大流量的网站,二是平时工作也比较忙,懒得去管这些,反正现在用不着,抱着这个想法把这个问题一直留到了最近,才把这个问题搞明白。

  就在前几天公司旗下一网站(由于这是公司的商业内容我就不说是那个网站了,免得有兄弟说是AD)以下简称A站,这A站在年后流量猛增从一天的七八十万猛跑到了好几百万的IP,一天下来接近一千万的Pv让整个服务器在高压下超负荷的工作着,时不时的服务就出现当机。

  最首先反映出情况的是数据统计,一天下来一个数据也没有统计上,原来是mysql挂了。

  本文就围绕这个问题来讲讲我们公司几个技术人员的解决方案。

  1. Mysql服务器集群

  由于是小公司在资金和成本上都有所限制,而且在技术上也没有几个技术员接触过,所以这个方法自然就让大伙否决了。

  这里说说我个人的理解!做集群不但添加资费的开销,而且在技术上也有很大的挑战,对于我们公司目前的情况是不大现实的。集群无非就是把一台服务器的压力转接到两台或是多台服务器上,我是这么理解的,也许我理解有误,还请大家指教。

  2. 分而治之

  这个方法和集群差不多,不过是把统计的代码放在不同的服务器上跑,由于公司有不少配置低的服务器跑几万到几十万IP还是没有问题的,我们可以把几百万流量分成十来个几十万的量分而统计。

  优点:充分的利用了现在的资源,解决了目前的问题。

  缺点:这样的方法不是长久之计,迟早还是会出问题的。而且在统计数据的时候比较麻烦。

  3. 统计代码的修改

  由于之前采用的是在插入数据之前加以判断,这个IP是否存在,来路等的处理,无形中增加了服务器的压力,所以大伙把统计代码改成来一个就插入数据库,不管三七二十一等以后在处理。

  这个方法基本上把当天的数据保留下来了,可是在处理的时候由于数据量的庞大,来来回回还是把服务器跑死了,而且在插入的时候由于当时设计数据结构的时候留有的索引,也大大的消耗了不少的服务器资源。

  那么把索引去掉到最后处理的时候又是老慢的,得不偿失。

  4. 统计方式的修改

  最后这一个方法,效果非常的明显。那是什么方法呢!

  这里就主要介绍这个方法:

  A、 保留原用的数据结构不变,并把所有的数据按一定的结构存入文件。

  结构:可以是xml,json,也可以是你自己想的任何有规律的数据排放。

  例如:

1 221.2.70.52,http://www.baidu.com,windowxp\r\n

2 221.2.70.52,http://www.baidu.com,windowxp\r\n

    

    写入文件:fopen,fwrite??no 这里介绍一个非常好用的技巧,也许大家都知道,但是像我这样的菜鸟大概都不知道,那就是用error_log,这不是写错误日志的吗?对就是他,非常方便。

  格式:

1 error_log("内容", 3, "/date.dat");    

    这里我就不说他的具体用了,不明白的朋友可以查一下手册。

  B、数据文件的命名

  为什么这里要讲文件的命名呢?如果就一味的把数据的写入文件不作任何的处理那么他和直接插入数据库有多大的区别呢?那么我们所作的一切都是无用功了。

  首先是在时间的利用上:date(‘YmdH’)得到的值是如:2008121112这有什么好入,这样一来这个数据就是一个小时一个文件必免了文件过大,而且不用去判断自动生成。

  IP的应用:由于在很多数据上都是一个IP操作的,所以把相同IP的数据放在一个文件里在后面的处理就非常方便处理。请看后面的介绍,这里我们取IP成三位为文件名字的一部分。

  C、 数据的导入处理

  通过以上两位的操作当天的数据会一个不少的保留下来,接下来怎么处理其实并不是很重要了。但是这里还是讲讲我的想法。

  入库前处理:

  前面讲到把IP三位相同的放一个文件就是为了入库前到它们进行处理,首先可以用最笨的方法把数据拆成N个数据。在进行重复数据的删除。

  如果一个IP浏览多页那么PV在这里就可以得到统计,并把访问的页面进行处理,组成新的数据。

  导入方法:

  这里要介绍一下数据的导入方法

1 $sql="LOAD DATA INFILE '".$file."' INTO TABLE `test` FIELDS TERMINATED BY ',' LINES TERMINATED BY '\r\n'(

2

3   `time` , `md5`

4

5   )";    

    就这一个语句,在导入几十万数据的时候可以说是刷刷的,用法我这里也不过多介绍了,大家有不明白的可以查手册,所以说解决数据库的瓶颈的办法不定要加设备,也不一定要换数据库,只要换一个思路就能解决不少问题。

  至此所以有数据也就讲的差不多了。由于我肚子里的墨水太少,如有不得当之处还请大家见谅。

时间: 2024-08-01 01:17:54

百万级高并发网站MYSQL应用攻略的相关文章

MySQL百万级高并发网站实战攻略

在一开始接触PHP接触MYSQL的时候就听不少人说:"MySQL就跑跑一天几十万IP的小站还可以,要是几百万IP就不行了",原话不记得了,大体就是这个意思.一直也没有好的机会去验证这个说法,一是从没有接手过这么大流量的网站,二是平时工作也比较忙,懒得去管这些,反正现在用不着,抱着这个想法把这个问题一直留到了最近,才把这个问题搞明白. 就在前几天公司旗下一网站(由于这是公司的商业内容我就不说是那个网站了)以下简称A站,这A站在年后流量猛增从一天的七八十万猛跑到了好几百万的IP,一天下来接

linux下安装apache与php;Apache+PHP+MySQL配置攻略_服务器

1.apache  在如下页面下载apache的for Linux 的源码包   http://www.apache.org/dist/httpd/;  存至/home/xx目录,xx是自建文件夹,我建了一个wj的文件夹.  命令列表:   cd /home/wj  tar -zxvf httpd-2.0.54.tar.gz mv httpd-2.0.54 apache  cd apache  ./configure --prefix=/usr/local/apache2 --enable-mo

RedHat上安装 apache + gd1.8.3 + php4 + tomcat + sybase + oracle + mysql 黄金攻略

apache|mysql|oracle|攻略 看了网上众多网友对php.jsp.sybase.oracle.apache等方面的安装经验,发现有很多都是重复而且不够全面,根据本人对以上各种东东长期总结和参考相关文档以及各位网友的文章,并经自己亲自实践,现将在RedHat6.2下apache1.3.12+gd1.8.3+php4.04+tomcat+sybase11.9.2+oracle8.1.6+mysql3.22.27的安装配置全部奉献给大家,希望能对大家有所帮助: 运行环境:PⅢ550+25

win2K下配置asp+cgi+php+mysql全攻略

win2K下配置asp+cgi+php+mysql全攻略 支持asp+cgi+php+mysql 安装win2K,安装IIS Indexing Service, FrontPage 2000 Server Extensions, Internet Service Manager (HTML) 这几个别装,还有其它的一些,总之不用的都别装.(根据安全原则,最少的服务+最小的权限=最大的安全.) 首先,打开internet管理器(开始-->程序-->管理-->Internet服务管理) 如果

memcached在大负载高并发网站上的应用(一)---简介

大家可能对memcached这种产品早有了解,或者已经应用在自己的网站中了,但是也有一些朋友从来都没有听说过或者使用过. 这都没什么关系,本文旨在从各个角度综合的介绍这种产品,尽量深入浅出,如果能对您现在或以后的工作有所帮助,笔者将感到无比荣幸. 我要介绍的内容包括以下几个方面: 1.memcached的简介 2.memcached的应用场景 3.memcached的安装 4.memcached的使用 5.memcached的部署架构 6.memcached的局限性 7.memcached的改进

千万级-高并发WEB设计问题,来自一个面试题

问题描述 高并发WEB设计问题,来自一个面试题 这是一个面试题,困扰我好长时间了. 有个网站首页,需要满足千万级小数据量用户访问,首页上包含如下几部分: 1 统计部分,全站统计,与具体用户无关,与已存储的数据有关 2 静态页面部分 3 个人统计部分,与当前登录用户用惯,与已存储的数据有关,个人统计数据很少 4 数据部分,与具体内容无关,与已存储的数据有关.数据很少 要求: 1 满足千万级用户访问 2 前端可以负载,可以集群,可以异步 3 后端存储可以是DB,可以是内存,也可以是其他 4 技术 架

PHP个人网站架设全攻略

个人网站|攻略 这里和大家交流一下架设个人网站的经验.不妥之处,敬请指正! 一 编辑调试环境 win98本地编辑调试,爽不爽?先下一个Omnihttpd Proffesinal V2.06 ,装上就有PHP4beta3可以用了.如果你较懂HTML,推荐用EditPlus,相当好哦!否则只好用DreamWeaver先了.还要连数据库?幸好MySQL还有For WIN32的版本. 二 先来一个计数器 自己的计数器总比外来的好,敝帚自珍嘛!时下介绍的计数器源代码总是那种刷新一下就长,不免有些自欺欺人,

揭秘:企业网站改版全攻略

中介交易 SEO诊断 淘宝客 云主机 技术大厅 互联网的发展日新月异,网络技术也随之愈发纯熟与先进.随着人们生活水平与质量的不断提高,用户对网站的需求也在不断的提升.一些建站时间较长的网站不论是界面上还是网站的整体功能上都丧失了相应的竞争优势,这就导致了,很多建设时间比较长的网站在一定程度上有可能会被新网站所超越,以至于空有一个老域名,而没有忠实的用户和良好的用户体验.那么当务之急就是对网站进行改版了. 进行网站改版说起来很轻松,但是实施起来就没那么简单了.网站seoer最担心的一个问题就是改版

运用Squidoo进行网站推广全攻略(四)

中介交易 SEO诊断 淘宝客 云主机 技术大厅 大家好,这是我们运用Squidoo进行WEB 2.0网站优化推广图文全攻略的第四篇了,在上一篇教程<运用Squidoo进行WEB 2.0网站优化推广图文全攻略(三 元素美化镜头篇)>中,我们建立了一个镜头的介绍模块,以及一个简单的博客RSS模块,我想你一定还记得上次最后我们看到的那一大串问号,也就是下面这张图片: 但是不知道大家有没有注意,第一行问号的那个PHP是正常显示的,事实上,我这篇博文名叫<百钱百鸡问题的PHP程序代码>,很巧