采集程序设计经验交流（二）——下载网页

　　采集程序设计经验交流(二)——下载网页(1)

　　“小网站本不需要维护，只是因为你的程序太笨了，所以你成了无休止的网站维护者。”

　　网页下载方法1(XMLHTTP应用)

　　用到的对象：XMLHTTP，只需三行代码，即可完成网页下载：

　　第一步：创建对象

　　Set ms = CreateObject("Microsoft.XMLHTTP")

　　这行代码用于创建一个xmlhttp对象，其中ms为创建对象的名称，ASP编程经常用到，可以随便写，不再赘述。

　　第二步：设置参数

　　ms.open "GET",url,False

　　其中url是要下载网页的网址，把它换成你的目标网页网址即可，格式为：http://www.99jpw.cn，一定要写完整，不可省略http://;

　　“GET”是打开的方法，当然也可以用POST，产生的效果和HTML里的表单提交方式是一样的。

　　第三步：发送数据

　　ms.Send()

　　此行代码用于发送数据并下载，下载后的数据储存在变量responsebody里。

　　下面我们以下载“点点机票网(http://www.66666999.com)”首页为例进行一下说明

　　代码：

　　Set ms = CreateObject("Microsoft.XMLHTTP")

　　ms.Open "GET","http://www.99jpw.cn",False

　　ms.Send()

　　response.write ms.responseBody

　　运行以上代码大家可以发现，我们已经成功下载了http://www.66666999.com

　　这里有个问题需要注意一下，8630.html">有时候网址很长，直接加在第二行代码里会显得很乱，那么，我们可以用一个变量来代替一下，如下：

　　url="http://www.99jpw.cn"

　　Set ms = CreateObject("Microsoft.XMLHTTP")

　　ms.Open "GET",url ,False

　　ms.Send()

　　response.write ms.responseBody

　　这样以来代码就变得整齐多了。

时间： 2024-12-22 11:44:35

采集程序设计经验交流（二）——下载网页的相关文章

xhtml+css网页制作中常见问题解决方法_经验交流

无论是谁,在制作页面的过程都是会碰到这样或者那样的问题,出了问题就肯定要解决.解决问题的前提是要知道问题出在什么地方,对于新手来说不一定一看到问题就知道问题出在哪里.比如在IE6中"多了一只猪"的问题,对于一些问题需要更多的经验交流分享吸收后才能更好的成长. 在网络中我想大家都有提过问题,需要别人解答的时候,但往往是你的一个问题却得不到任何人给你的解答,或者说是完全被无视了.对于这个时候的你,是不是在想"难道是因为我这个问题太简单了,他们都不想回答""他们

CSS中常用的单位_经验交流

一.长度单位 长度单位是Web页设计中最常用的一个单位.一个排列无序.杂乱无章的页面不可能给人们留下什么好的印象.于是,在设计的时候需要为元素的位置.尺寸精确地定义一些值,以使其达到预期的效果. CSS给予人们精确控制网页的能力,这一点为人们津津乐道.它允许人们定义外观.尺寸.空间及其他的样式.但是,CSS所给出的控制同时也是一个危险的东西,这不仅表现在设计者缺乏经验,更在于如何给出一个尺寸和空间值.为什么呢?因为一个设计者虽然能够决定某一个特殊的屏幕分辨率,但是不可能决定别人的大脑

如何用C#写代码批量下载网页上提供的附件。

问题描述如何用C#写代码批量下载网页上提供的附件. 在一个网页上有一个导出PDF文件的功能,是当点击这个按钮后,执行一个脚本,然后弹出文件下载另存为的对话框进文件的下载功能. 现在希望用C#实现自动批量的下载并保存这些PDF文件. 求实现方法,谢谢! 解决方案用webclient.downloadfile或者httpwebrequest去下载. 解决方案二: 建议压缩成ZIP包后再下载. 解决方案三: 执行的是一个脚本,现在我可以实现通过代码模拟这个单击操作,执行这个脚本,但是如何能得到下载

nodejs通过phantomjs实现下载网页

这篇文章主要介绍了nodejs通过phantomjs实现下载网页的方法,有需要的小伙伴可以参考下. 功能其实很见简单,通过 phantomjs.exe 采集 url 加载的资源,通过子进程的方式,启动nodejs 加载所有的资源,对于css的资源,匹配css内容,下载里面的url资源当然功能还是很简单的,在响应式设计和异步加载的情况下,还是有很多资源没有能够下载,需要根据实际情况处理下首先当然是下载 nodejs 和 phantomjs 下面是 phantomjs.exe 执行的 dow

Shopify的Docker实战经验（二）如何用容器支持10万的在线商店

本文讲的是Shopify的Docker实战经验(二)如何用容器支持10万的在线商店,[编者的话]Shopify是一个电子商务平台,提供专业的网上店面.目前的客户超过12万,包括GE.特斯拉汽车.GitHub等.作为首家市值超过10亿美元的加拿大网络公司,Shopify在欧美市场的影响力也与日俱增.Shopify是一个大型的Ruby on Rails应用,其产品服务器能通过给1700个处理核心和6TB RAM分配任务来完成每秒处理8000多个请求.Shopify在其博客上分享了系列内容来介绍他们的

Lotus经验交流群：93214150，欢迎你！

问题描述 Lotus经验交流群:93214150,欢迎你! 解决方案解决方案二:....解决方案三:ggg

急~~socket下载网页

问题描述如题我能接收到网页信息,但只有http头正常,内容全是乱码.是我接收不对,还是转换编码不对?网页编码是UTF-8,用UTF-8和ASCII都是乱码.下面是接收Byte[]bytesReceived=newByte[1024];intbytes=1;stringpage="";do{bytes=socket.Receive(bytesReceived,bytesReceived.Length,0);page+=Encoding.ASCII.GetString(bytesRece

Python使用scrapy采集数据过程中放回下载过大页面的方法_python

本文实例讲述了Python使用scrapy采集数据过程中放回下载过大页面的方法.分享给大家供大家参考.具体分析如下: 添加以下代码到settings.py,myproject为你的项目名称复制代码代码如下: DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.LimitSizeHTTPClientFactory' 自定义限制下载过大页面的模块复制代码代码如下: MAX_RESPONSE_SIZE = 1048576 # 1Mb fro

asp.net用迅雷下载文件总是变成下载网页，有什么办法可以解决？？？？？？？？

问题描述 asp.net用迅雷下载文件总是变成下载网页,有什么办法可以解决?? 解决方案解决方案二:这是迅雷监视了下载,么有办法吧解决方案三:你下载代码是不是有问题?解决方案四:直接链接文件就不会了解决方案五:代码没问题的,用IE下载就没问题,同时文件格式不是TXT也没问题解决方案六:直接链接文件具体怎样操作

猜你喜欢

关于网页*静态化*及SEO问题的一些看法

我们还是先来讨论一下,什么叫做"静态页". 我们还是先来讨论一下,什么叫做"静态页".有朋友说,放在硬盘上的htm或html文件便是一种静态页,Web服务器不需 ...

结合实例实习F#(三)--理解函数式语言中的函数

前两篇我主要说了些F#中基本的语法,今天我接着来说说函数,函数在函数式编程中起着非常重要的作用,可以夸张一点来说,如果你了解并能熟练应用函数,你就可以向别人说"我精通函数式编程了" ...

FR-TO-FR本地交换概述

拓扑: R1配置: R2配置: 更多精彩内容:http://www.bianceng.cnhttp://www.bianceng.cn/Network/jhjs/

手动去除Windows Live Messenger广告

最近Windows Live Messenger挺火的.不过很烦的是新版MSN跟旧的一样,带着广告条.可以去网上下载补丁来去掉这些广告.不过偶不喜欢用补丁,所以在网上找了个手动的去广告的方法,这个方法 ...

NHibernate之旅(10)：探索父子(一对多)关联查询

本节内容关联查询引入一对多关联查询 1.原生SQL关联查询 2.HQL关联查询 3.Criteria API关联查询结语关联查询引入在NHibernate中提供了三种查询方式给我们选择:NH ...

Win8共享打印机拒绝访问如何解决？

1.在共享打印机的计算机上,打开控制面板,单击"查看设备和打印机" 2.在打开的设备列表,右键单击共享的打印机,单击"打印机属性",选中这台打印机 3.在& ...

实测160WIFI无线路由软件完美兼容Win8.1

想让你的无线网卡变成一个能发生WIFI信号的无线路由?可能会有网友想到国外老牌的Connectify,一个当年被称之为最靠谱的让无线网卡发射WIFI的软件.但当你使用过160WIFI这个小巧的无线路由 ...

计算机丢失XINPUT1-3.dll的解决方案

1. 将附件中XINPUT1-3.DLL文件放入 windows 文件夹的system32文件夹中. 2. 步骤1如无效,下载重新安装DirectX9.0 可以解决问题.

cpu使用率忽高忽低怎么办?

首先我们打开任务管理器,然后切换到cpu行列,对占用cpu的出程序逐一排查,查看哪个cpu程序占用的cpu忽高忽低的情况.找到占用cpu不稳定的进程将其结束掉(不是系统进程的前提下),如果发现时系 ...

C# 可以利用反射给只读属性赋值吗？

结论:可以验证demo如下: using System; using System.Collections.Generic; using System.ComponentModel; using S ...

ios-下面两种写法的区别是什么

问题描述下面两种写法的区别是什么 @interface XXX () @property (strong nonatomic) UITableView *tableView;@end@impleme ...

从0开始构建一个属于你自己的PHP框架

如何构建一个自己的PHP框架为什么我们要去构建一个自己的PHP框架?可能绝大多数的人都会说"市面上已经那么多的框架了,还造什么轮子?".我的观点"造轮子不是目的,造轮子 ...

dom4j xmlwriter构造方法

问题描述 dom4j xmlwriter构造方法 XMLWriter writer = new XMLWriter(new FileOutputStream(filepath), format ); ...

nginx负载均衡页面不定时出现520错误

问题描述 nginx负载均衡页面不定时出现520错误阿里云的机器,以前偶尔会出现502,最近突然频繁了,每天四五次,每次都重启其中一个机器的memcache和网站程序才行, nginx的err日志: ...

struts2后台乱码

问题描述 RT,有点困惑的是第一次提交不乱码第二次乱码具体如下:我做的是一个faq发布系统在第一次提交的时候把内容都封装到一个faq对象中提交比如<inputtype="text&qu ...

Hadoop－Drill深度剖析

1.概述在<Hadoop - 实时查询Drill>一文当中,笔者给大家介绍如何去处理实时查询这样的业务场景,也是简略的提了一下如何去实时查询HDFS,然起相关细节并未说明.今天给大家细说 ...

mysql 查询数据量过大时，索引失效,怎么强制使用索引

问题描述 mysql 查询数据量过大时,索引失效,怎么强制使用索引解决方案 MYSQL强制使用索引和禁止使用索引mysql 强制索引mysql强制索引解决方案二: 你的sql语句是否有合法的应用到 ...

【SQL】查找数据的方式 (二)

如果表查询中所有的列都包括在了索引中,就有可能使用FFS,当然也可以使用hint来选择FFS.下面看看使用不同方式访问索引的例子: SQL> create index idx_un_tset_o ...

基于嵌入式SQL和C语言多线程的DB2 workload开发

由于程序示例代码的重用性较高,可以大大的提高需要使用这种 DB2 workload 的软件http://www.aliyun.com/zixun/aggregation/18863.html" ...

EMC叶成辉：大数据需挖掘太多创业机会

EMC叶成辉腾讯科技讯(娄池)3月7日消息,EMC全球高级副总裁.大中华区总裁叶成辉日前向腾讯科技表示,大数据领域内仍有无数的创业机遇,IBM.EMC这样的大数据巨头没有精力在各个垂直领域进行数据挖掘 ...

Availability

可访问性: 云计算系统处在可http://www.aliyun.com/zixun/aggregation/7317.html">工作状态的时间的比例,即可用性水平,通常被描述为系统的 ...

透析行业真假 IDC客户托管需谨慎

中介交易 SEO诊断淘宝客云主机技术大厅中国IDC圈去年连续跟踪报道了几起IDC行业恶性"倒闭"事件,虽然最后大多受害客户在各方的努力下拿回了所属服务器及备份,但仍然不可避 ...

水晶报表打包

问题描述各位大侠我使用visualstudio2008开发了一个winform应用打包是系统必备里选择了"crystalreportbasicforvisualstudio2008&quo ...

请教一个.net开发的问题？

问题描述请教一个.net开发的问题? 大家好,我是业余爱好者,在一个小项目中用3行代码成功调用迅雷下载: dynamic Thunder= AutomationFactory.CreateObjec ...

浅析php创建者模式_php实例

创建者模式: 在创建者模式中,客户端不再负责对象的创建与组装,而是把这个对象创建的责任交给其具体的创建者类,把组装的责任交给组装类,客户端支付对对象的调用,从而明确了各个类的职责. 应用场景:创建非常 ...

iframe窗口高度自适应的实现方法_javascript技巧

domainA 中有一个页面index.html,通过iframe嵌套了domainB中的一个页面other.html由于other.html页面在iframe中显示,而且其页面内容会动态的增加或减少 ...

阿里妈妈赚钱怎么做?阿里妈妈怎么做?

1.我们进入到百度搜索,然后打开它如下图所示 2.在百度中我们再搜索"阿里妈妈"进入,如下图所示. 3.在打开"阿里妈妈网站"之后我们可以使用淘宝号登录,也可以 ...

PHP中DOMDocument生成与解析XML格式数据

数组代码如下复制代码 $arr[] = array( 'name' => $row['name'], 'sex' => $row['sex'], 'age' => $row[' ...

流媒体服务器的架设

1. 解压DarwinStreamingSrvr5.5.5-Windows.exe至C盘,如图: 将上面的解压到C盘根目录2.进入解压后的目录,点击里面的install.bat文件点击instal ...

为什么不能用CSC命令啊?

问题描述我只能把.CS文考到CSC.EXE目录下才可以用SCS编译.CS麻烦告知一下! 解决方案解决方案二:是没配置好.net环境建议去看下陈老师的视频教程http://cgbluesky.blo ...

热搜