转移大数据量网站的技巧

　　通常来说，转移一个网站的步骤是这样：

　　1，关闭网站，防止转移期间数据出现变化

　　2，转移数据到新主机

　　3，开通网站

　　但是如果网站数据量非常大，在第二步中是非常耗时的，网站长时间关闭会造成很多不利的影响。

　　所以在这里为大家介绍一种更高效的方式：rsync。

　　rsync可以增量的传输新增加的文件，也可以更新两台主机不同内容的文件(只传输差异部分)。

　　具体的操作方式是这样，先确定好转移网站的时间，先在前一天，执行一次rsync，将数据全部传输至新服务器，这期间是不需要关闭网站的。在正式转移网站的时候，再执行一次rsync，这一次需要关闭网站，由于这次只传输新增加的和有变化的文件，所以传输的数据量会非常少，所以关闭网站的时间也会少很多。

　　举个例子，10G数据量的网站，这种方式可能会把转移期间中断的时间从几个小时降低到十几分钟。数据量越大，差别越明显。

　　使用rsync需要在两台主机都安装对应的软件包：

　　Debian/Ubuntu: apt-get install -y rsync

　　CentOS: yum install -y rsync

　　传输命令在新主机和旧主机上执行都可以，但是命令格式是不一样的，假设在新主机执行，命令为：

　　rsync -avz -e ssh root@ip.ip.ip.ip:/source/path/ /dest/path/

　　1)ip.ip.ip.ip为原主机IP

　　2)/source/path/为需要转移的数据在原主机上的路径

　　3)/dest/path/为要保存在新主机上的路径

　　这里介绍的参数是通过SSH服务来传输数据，如果原主机的SSH端口不是默认的22，需要指定SSH端口，假如端口为60000，那么命令为：

　　rsync -avz -e ‘ssh -p 60000′ root@ip.ip.ip.ip:/source/path/ /dest/path/

　　PS:执行长时间操作的命令，最好在screen窗口里运行。

时间： 2025-01-28 05:26:14

转移大数据量网站的技巧的相关文章

php 大数据量及海量数据处理算法总结_php技巧

下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题.下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎与我讨论. 1.Bloom filter 适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集基本原理及要点: 对于原理来说很简单,位数组+k个独立hash函数.将hash函数对应的值的位数组置1,查找时如果发现所有hash函数对应位都是1说明

高性能WEB开发(5) 减少请求，响应的数据量_相关技巧

GZIP压缩 gzip是目前所有浏览器都支持的一种压缩格式,IE6需要SP1及以上才支持(别说你还在用IE5,~_~).gzip可以说是最方便而且也是最大减少响应数据量的1种方法. 说它方便,是因为你不需要为它写任何额外的代码,只需要在http服务器上加上配置都行了,现在主流的http服务器都支持gzip,各种服务器的配置这里就不一一介绍(其实是我不知道怎么配), nginx的配置可以参考我这篇文章:www.blogjava.net/BearRui/archive/2010/01/29/w

大数据量下的分页

分页|数据对于非常大的数据模型而言,分页检索时,每次都加载整个数据源非常浪费.通常的选择是检索页面大小的块区的数据,而非检索所有的数据,然后单步执行当前行. 本文演示ASP.net的DataGrid和Sql Server 实现大数据量下的分页,为了便于实现演示,数据表采用了Northwind数据库的Orders表(830条记录). 如果数据表中有唯一的自增索引,并且这个字段没有出现断号现象.检索页面大小的块区数据就非常简单了.通过简单的Sql语句就可以实现这个功能:select * from

Mysql大数据量存储及访问的设计讨论

一.引言随着互联网应用的广泛普及,海量数据的存储和访问成为了系统设计的瓶颈问题.对于一个大型的互联网应用,每天几十亿的PV无疑对数据库造成了相当高的负载.对于系统的稳定性和扩展性造成了极大的问题.通过数据切分来提高网站性能,横向扩展数据层已经成为架构研发人员首选的方式.水平切分数据库,可以降低单台机器的负载,同时最大限度的降低了了宕机造成的损失.通过负载均衡策略,有效的降低了单台机器的访问负载,降低了宕机的可能性:通过集群方案,解决了数据库宕机带来的单点数据库不能访问的问题:通过读写分离策略更

大数据量下的数据库查询与插入如何优化？（整理）

数据库经常要做一些查询与插入,但是如果查询和插入的数据量过大的时候就会引发数据库性能问题,降低数据库工作效率.因此性能调优是大家在工作中都能够预见的问题,大到世界五百强的核心系统,小到超市的库存系统,几乎都会有要调优的时候.面对形形色色的系统,林林总总的需求,调优的手段也是丰富多彩. 1.尽量使语句符合查询优化器的规则避免全表扫描而使用索引查询 2.避免频繁创建和删除临时表,以减少系统表资源的消耗. 3.尽量避免向客户端返回大数据量,若数据量过大,应该考虑相应需求是否合理. 4.建立高效的索引

大数据量下高并发同步的讲解（不看，保证你后悔）(转)

对于我们开发的网站,如果网站的访问量非常大的话,那么我们就需要考虑相关的并发访问问题了.而并发问题是绝大部分的程序员头疼的问题, 但话又说回来了,既然逃避不掉,那我们就坦然面对吧~今天就让我们一起来研究一下常见的并发和同步吧. 为了更好的理解并发和同步,我们需要先明白两个重要的概念:同步和异步 1.同步和异步的区别和联系所谓同步,可以理解为在执行完一个函数或方法之后,一直等待系统返回值或消息,这时程序是出于阻塞的,只有接收到返回的值或消息后才往下执行其它的命令. 异步,执行完函数或方法后

Pandas处理大数据的一些小技巧

近期的工作和Hive SQL打交道比较多,偶尔遇到一些SQL不好解决的问题,会将文件下载下来用pandas来处理,由于数据量比较大,因此有一些相关的经验可以和大家分享近期的工作和Hive SQL打交道比较多,偶尔遇到一些SQL不好解决的问题,会将文件下载下来用pandas来处理,由于数据量比较大,因此有一些相关的经验可以和大家分享. 大文本数据的读写有时候我们会拿到一些很大的文本文件,完整读入内存,读入的过程会很慢,甚至可能无法读入内存,或者可以读入内存,但是没法进行进一步的计算,这个时候如

大数据量中的模糊查询优化方案

----------------------------------------------------------------------------------------------[版权申明:本文系作者原创,转载请注明出处] 文章出处:http://blog.csdn.net/sdksdk0/article/details/52589761作者:朱培 ID:sdksdk0 ------------------------------------------------

在ASP.NET 2.0中操作数据之二十五：大数据量时提高分页的效率_自学过程

导言如我们在之前的教程里讨论的那样,分页可以通过两种方法来实现: 1.默认分页– 你仅仅只用选中data Web control的智能标签的Enable Paging ; 然而,当你浏览页面的时候,虽然你看到的只是一小部分数据,ObjectDataSource 还是会每次都读取所有数据 2.自定义分页– 通过只从数据库读取用户需要浏览的那部分数据,提高了性能. 显然这种方法需要你做更多的工作. 默认的分页功能非常吸引人,因为你只需要选中一个checkbox就可以完成了.但是它每次都读取所有的