利用了XMLHTTP组件，抓取网页的指定部分。

抓取网页。偶要实现实实更新天气预报。利用了XMLHTTP组件，抓取网页的指定部分。
需要分件html源代码
此例中的被抓取的html源代码如下

2004年8月24日星期二；白天：晴有时多云南风3—4级；夜间：晴南风3—4级；气温：最高29℃最低19℃

而程序中是从
以2004年8月24日为关键字搜索，直到

结速
而抓取的内容就变成了"2004年8月24日星期二；白天：晴有时多云南风3—4级；夜间：晴南风3—4级；气温：最高29℃最低19℃ "
干干净净的了。记录一下。
＜%
On Error Resume Next
Server.ScriptTimeOut=9999999
Function getHTTPPage(Path)
t = GetBody(Path)
getHTTPPage=BytesToBstr(t,"GB2312")
End function
Function GetBody(url)
on error resume next
Set Retrieval = CreateObject("Microsoft.XMLHTTP")
With Retrieval
.Open "Get", url, False, "", ""
.Send
GetBody = .ResponseBody
End With
Set Retrieval = Nothing
End Function
Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
Function Newstring(wstr,strng)
Newstring=Instr(lcase(wstr),lcase(strng))
if Newstring<=0 then Newstring=Len(wstr)
End Function
%＞

时间： 2024-08-24 22:41:04

利用了XMLHTTP组件，抓取网页的指定部分。的相关文章

javascript-如何利用js或者jQuery抓取网页数据

问题描述如何利用js或者jQuery抓取网页数据有什么高效的方法吗,或者怎么实现,主要问题在于,怎么获取frame里的元素解决方案这个是服务器端弄的,客户端js受限于浏览器安全,无法直接获取跨域数据. 一定js可以用雅虎的yql将远程html下载转为jsonp数据,或者自己服务器做代理页面解决方案二: bobo说的很对,要高效,建议你在服务器上抓取,或者干脆用io.js一类的将js作为本地应用的运行时.

详解JAVA抓取网页的图片,JAVA利用正则表达式抓取网站图片_java

利用Java抓取网页上的所有图片: 用两个正则表达式: 1.匹配html中img标签的正则:<img.*src=(.*?)[^>]*?> 2.匹配img标签中得src中http路径的正则:http:\"?(.*?)(\"|>|\\s+) 实现: package org.swinglife.main; import java.io.File; import java.io.FileOutputStream; import java.io.InputStream;

零基础写python爬虫之使用urllib2组件抓取网页内容_python

版本号:Python2.7.5,Python3改动较大,各位另寻教程. 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地. 类似于使用程序模拟IE浏览器的功能,把URL作为HTTP请求的内容发送到服务器端, 然后读取服务器端的响应资源. 在Python中,我们使用urllib2这个组件来抓取网页. urllib2是Python的一个获取URLs(Uniform Resource Locators)的组件. 它以urlopen函数的形式提供了一个非常简单的接口. 最简

php中如何抓取网页图片

PHP是一门很容易上手的Web编程语言.PHP学习成本很低,能够迅速开发各种Web应用,是一个很优秀的工具. 尽管很多人觉得PHP缺点很多,quick and dirty 之类的,但是"这个世界上只有两种编程语言,一种是饱受争议的,一种是没人用的",不是吗?只要能够把事情做好的工具,就是好工具.PHP就是这么一个优秀的语言工具. 01.<?php 02.header('content-type:text/html;charset=utf-8');03. set_time_limi

PHP使用CURL实现多线程抓取网页_php技巧

PHP 利用 Curl Functions 可以完成各种传送文件操作,比如模拟浏览器发送GET,POST请求等等,受限于php语言本身不支持多线程,所以开发爬虫程序效率并不高,这时候往往需要借助Curl Multi Functions 它可以实现并发多线程的访问多个url地址.既然 Curl Multi Function如此强大,能否用 Curl Multi Functions 来写并发多线程下载文件呢,当然可以,下面给出我的代码: 代码1:将获得的代码直接写入某个文件 <?php $urls

java使用正则抓取网页邮箱_java

使用正则抓捕网上邮箱这就是我们需要抓捕的网站. 实现思路: 1.使用java.net.URL对象,绑定网络上某一个网页的地址 2.通过java.net.URL对象的openConnection()方法获得一个HttpConnection对象 3.通过HttpConnection对象的getInputStream()方法获得该网络文件的输入流对象InputStream 4.循环读取流中的每一行数据,并由Pattern对象编译的正则表达式区配每一行字符,取得email地址下面是我们的代码: pa

利用NodeJS和PhantomJS抓取网站页面信息以及网站截图_javascript技巧

利用PhantomJS做网页截图经济适用,但其API较少,做其他功能就比较吃力了.例如,其自带的Web Server Mongoose最高只能同时支持10个请求,指望他能独立成为一个服务是不怎么实际的.所以这里需要另一个语言来支撑服务,这里选用NodeJS来完成. 安装PhantomJS 首先,去PhantomJS官网下载对应平台的版本,或者下载源代码自行编译.然后将PhantomJS配置进环境变量,输入 $ phantomjs 如果有反应,那么就可以进行下一步了. 利用PhantomJS进行简

PHP抓取网页、解析HTML常用的方法总结

这篇文章主要介绍了PHP抓取网页.解析HTML常用的方法总结,本文只是对可以实现这两个需求的方法作了总结,只介绍方法,不介绍如何实现,需要的朋友可以参考下概述爬虫是我们在做程序时经常会遇到的一种功能.PHP有许多开源的爬虫工具,如snoopy,这些开源的爬虫工具,通常能帮我们完成大部分功能,但是在某种情况下,我们需要自己实现一个爬虫,本篇文章对PHP实现爬虫的方式做个总结. PHP实现爬虫主要方法 1.file()函数 2.file_get_contents()函数 3.fopen()-

linux-Linux c socket抓取网页保存到文件一直是乱码

问题描述 Linux c socket抓取网页保存到文件一直是乱码如题,建立连接后发送请求后,保存到文件的代码如下: while(recvSize=recv(sockfdrecvBufBUF_SIZE0)>0){ fwrite(recvBufsizeof(char)strlen(recvBuf)fp); printf(""%s""recvBuf); memset(recvBuf0sizeof(recvBuf)); } 网页可以在终端上正常显示,但是这样保存到

猜你喜欢

Flink运行时之基于Netty的网络通信(下)

客户端核心处理器这一篇,我们分析一下客户端协议栈中的核心的处理器PartitionRequestClientHandler,该处理器用于处理服务端的响应消息. 我们以客户端获取到响应之后回调该处理器 ...

Flash视频教程：线条工具

教程|视频教程点击这里全屏观看教程

mahout源码分析之DistributedLanczosSolver（七）总结篇

Mahout版本:0.7,hadoop版本:1.0.4,jdk:1.7.0_25 64bit. 看svd算法官网上面使用的是亚马逊的云平台计算的,不过给出了svd算法的调用方式,当算出了eigenVe ...

事务：构建处理故障的可扩展系统，防止丢失数据

本文将介绍以下内容: 稳定的消息传送事务和系统一致性处理错误队列问题消息大小和计时本文使用以下技术: WCF.MSMQ 设计分布式系统一直都是个挑战.有了功能日益强大的 CLR.高效的 Vi ...

Android设置页面的设计

在Android 的程序中设置项可以说是一个必须要有的页面.下面说一下如何写一个基本的设置页面.我们先来看一下常用安卓程序的设置页面: 都是大同小异,下面说一下如何实现.其实就是layout ...

利用滤镜及图层叠加制作逼真的水墨荷花

水墨荷花制作思路并不复杂:把图片转为黑白,用滤镜等增加水墨纹理即可.不过在处理的时候还有很多细节需要处理,如图片的背景,水墨纹理控制范围等,这些需要自己慢慢摸索. 原图最终效果 1.打开素材图片 ...

PS色彩制作完美景色

色彩到处都有.我们被色彩环绕着,无法忽略,因此我们在拍摄时把色彩的存在视作理所当然.但是这样很可能只会拍出平淡的照片.无处不在并不意味着你不应该认真注意色彩对照片的影响.我们每天都会看到很多照片--在 ...

新浪微博企业首页包含那些的功能？

企业首页包括管理功能.数据展示功能.在企业首页,企业可以管理消息中心.和企业的应用.并可以通过查看数据中心.学习中心对运营进行优化通过官方客服模块与新浪微博进行交流.

力高答题做题机会有几次

力高答题做题机会有几次从答题说明里面,我们可以知道每次发布的考试只有三次的答题机会,但是不代表这这款软件只能答题三次,每次发布新试题的时候又可以答题了.而且一旦开始答题了不能后退的,要一口气答完 ...

USB音箱插电脑的电流声怎么去掉？

刚配了一台主机,装USB小音箱,USB插到主机上面就会有"吱吱吱"的电流声,很燥人.静音了也有!一拔掉就没了."吱吱"声随着音箱音量的变化而变化.用另一电源 ...

怎么找回win7系统消失的音量图标

对于广大win7系统用户而言,通常我们在win7系统中调节音量,都会点击任务栏右下角的音量图标.可是有用户反映在使用音量图标的时候,突然发现音量图标消失不见了,这是怎么回事呢?很多用户遇到这种情况不知 ...

数据蒋堂 | JOIN简化 - 维度对齐

我们先把上一期中双子表对齐例子的SQL写出来: SELECT Orders.id, Orders.customer, A.x, B.y FROM Orders LEFT JOIN (SELECT id ...

CIO新生代

为企业信息工作"第一把手"的CIO职位,1998年前后才被引入中国, 不过几年的功夫,人们却已经开始谈论起CIO的"新生代"来了. 令相关经理人和咨询专家振奋的 ...

聚焦电商大战

刘强东宣布停战消费者称这是一场集体忽悠 8月15号开始的京东苏宁价格大战,让京东商城董事局主席兼CEO刘强东成了风头人物,他强调,从当日起,京东所有大家电保证比国美.苏宁连锁店便宜至少10%以上,1 ...

winfrom中有一个文档，文档中包含文字，图片和表格，如何进行分页打印？

问题描述主要是分页问题,主要是分页问题解决方案

El表达式不起作用

问题描述用maven创建的项目,在使用到el表达式的时候不起作用,页面上只看到纯el表达式的代码,而不是代表的属性值! 解决方案解决方案二:头上加<%@pageisELIgnored=&qu ...

什么是链接诱饵？

摘要: 什么是链接诱饵? 百度百科是这样定义的,链接诱饵简单的说是指的是创建有用.有趣.吸引眼球的内容,从而吸引吸引其他站长.博主的注意力,生成的外部链接. 如何利用链接诱什么是链接诱饵? 百度百科 ...

中国新首富刘忠田15年狂揽240亿

本报记者高斌发自辽阳金融危机下遭遇资本退潮的张茵.杨惠妍,财富大幅缩水,黄光裕更是身陷囹圄,而45岁的辽阳汉子刘忠田,却随着中国忠旺(01333,HK)即将赴港上市而在逆势中蹿升为新一代中国首富 ...

一波C语言字符数组实用技巧集锦_C 语言

字符数组倒序 #include <stdio.h> void daoxu(char str[]){ int i; char temp; for(i = 0; i < strlen(s ...

微软再次败诉欧盟反垄断案面临6.13亿美元罚款

9月17日综合外电报道,欧洲初审法院驳回了微软提交的针对欧盟反垄断裁决的大部分上诉请求,从而结束了长达三年的诉讼战.判决要求微软必须支付6.13亿美元的罚款,并帮助竞争对手的产品与Windows系统兼 ...

《Spring Data实战》——第2章　Repository：便利的数据访问层 2.1快速入门

第2章 Repository:便利的数据访问层长期以来,实现应用程序的数据访问层一直是件繁琐的工作,因为我们经常需要编写大量的样板式代码,而且贫血(anemic)的领域类并没有按照真正面向对象或领域 ...

JavaScript 获得选中文本内容的方法_javascript技巧

有如下实现方法: 在Firefox, Google Chrome, Safari, Opera中:可以用 window.getSelection() (参考MDC) 在IE下,可以用 document ...

各大问答网站推广的优缺点

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅网络推广的方式最常见的莫过于两种, ...

android studio-Android studio 怎样导入eclipse项目

问题描述 Android studio 怎样导入eclipse项目提示这个,怎么解决! 解决方案原文地址:http://www.ithao123.cn/content-2382286.html 现 ...

品牌网站页面优化视觉力量解救网络营销

随着时代的进步与互联网平台的迅速成长,人们对工作职业的选择不仅局限于吃饱饭.穿暖衣.而互联网平台因信息传播速度快.范围广而受到更多商家的关注,成立品牌网站,进行互联网虚拟营销也成为更多品牌的首选. ...

TCPDF 5.9.112发布生成PDF文件的PHP类

TCPDF 5.9.112此版本包括一些小的改进. TCPDF是一个无需外部扩展下快速生成PDF文件的PHP类.TCPDF支持所有ISO页面格式和自定义页面格式,还包含自定义边距和度量单位.UTF- ...

投资十大戒律：不要把鸡蛋放在一个篮子里

也许现在你开始明白,投资并不像在渔场里钓鱼那么简单.你必须清醒的认识到,在投资的时候,如果一笔生意听起来好得让人难以置信,那这笔生意的确不值得置信.如果你曾经是一名失败的投资者,那么现在值得欣慰的是, ...

OPhone若要普及还需进一步降价

东方早报记者周玲昨天,LG手机中国区总裁任伟光表示,OPhone手机价格在1500-2000元才能便于市场普及,否则OPhone的客户群会变得很小.上海移动总经理郑杰也以开玩笑的口吻称" ...

Spring AOP 实现之CGLIB

cglib(Code Generation Library)是一个强大的,高性能,高质量的Code生成类库.它可以在运行期扩展Java类与实现Java接口. cglib封装了asm,可以在运行期动态生 ...

《Adobe Photoshop CS5中文版经典教程（全彩版）》—第1课1.1节开始在Adobe Photoshop中工作

第1课熟悉工作区Adobe Photoshop CS5中文版经典教程(全彩版)在本课中,读者将学习以下内容: 打开Adobe Photoshop文件: 选择和使用工具箱中的工具: 在选项栏中设置所选 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.020 s.