asp 采集实战代码

最近实在是太流行采集了,本人是不喜欢采集的,但对采集的原理我却很有兴趣进行研究,拿到了网上采集常用函数,对其进行了一番研究,并实战,结果成功,撇开效率问题,采集原理并不复杂,大家可以在搜索吧输入“采集”查看其原理。下面是一个采集的例子:

复制代码 代码如下:

<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>

<% Response.CodePage=65001%> 

<% Response.Charset="UTF-8" %> 

<%Server.Scripttimeout=9999999

response.expires = 0 

response.expiresabsolute = Now() - 1 

response.addHeader "pragma","no-cache" 

response.addHeader "cache-control","private" 

Response.CacheControl = "no-cache"

%> 

<% 

'声明取得目标信息的函数,通过XML组件进行实现。 

Function GetURL(url) 

Set Retrieval = server.createobject("MSXML2.XMLHTTP")

With Retrieval 

.Open "GET", url, False 

.Send 

If .Status<>200 then '判断文档是否已经解析完,以做客户端接受返回消息 

exit function 

End If

' 二进制转字符串

GetURL = sTb(.responsebody) 

end with

'对取得信息进行验证,如果信息长度小于100则说明截取失败 

End Function

' 二进制转字符串,否则会出现乱码的! 

Function sTb(vin)

Const adTypeText = 2

Dim BytesStream,StringReturn

Set BytesStream = Server.CreateObject("ADODB.Stream")

With BytesStream

.Type = adTypeText

.Open

.WriteText vin

.Position = 0

.Charset = "GB2312"

.Position = 2

StringReturn = .ReadText

.Close

End With

Set BytesStream = Nothing

sTb = StringReturn

End Function

Function Newstring(Wstr,Strng) 

 Newstring=Instr(Lcase(Wstr),Lcase(Strng)) 

 If Newstring<=0 Then Newstring=Len(Wstr) 

End Function

'声明截取的格式,从Start开始截取,到Over为结束 

Function GetKey(HTML,Start,Over) 

 Start=Newstring(HTML,start) 

 Over=Newstring(HTML,Over) 

 GetKey=Mid(HTML,Start,Over-start) 

End Function

Dim Softid,Url,Html,Title 

'采集百度知道

For i = 1 to 100

Url="http://zhidao.baidu.com/question/10000"&i&".html"

Html = GetURL(Url) 

Question = GetKey(Html,"<cq>","</cq>") 

Answer = GetKey(Html,"<ca>","</ca>")

Response.Write(Question&"<br />")

Response.Write(Answer)

Response.Write("采集成功")

Next

'打开数据库,准备入库 

'dim connstr,conn,rs,sql 

'connstr="DBQ="+server.mappath("db1.mdb")+";DefaultDir=;DRIVER={Microsoft Access Driver (*.mdb)};" 

'set conn=server.createobject("ADODB.CONNECTION") 

'conn.open connstr 

'set rs=server.createobject("adodb.recordset") 

'sql="select [列名] from [表名] where [列名]='"&Title&"'" 

'rs.open sql,conn,3,3 

'if rs.eof and rs.bof then 

'rs("列名")=Title 

'rs.update 

'set rs=nothing 

'end if 

'set rs=nothing 

%>

时间: 2024-09-21 01:39:32

asp 采集实战代码的相关文章

asp 采集实战代码_应用技巧

最近实在是太流行采集了,本人是不喜欢采集的,但对采集的原理我却很有兴趣进行研究,拿到了网上采集常用函数,对其进行了一番研究,并实战,结果成功,撇开效率问题,采集原理并不复杂,大家可以在搜索吧输入"采集"查看其原理.下面是一个采集的例子: 复制代码 代码如下: <%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%> <% Response.CodePage=65001%>  <% Respo

asp采集代码示例

下面是一侧ASP采集页面内容最基础的必备源代码,修改以下的代码需要有一定的ASP基础. 以下是引用片段:< %  '功能:asp采集代码  '作者:wangsdong  '备注:支持原创程序,请保留此信息,谢谢  url="http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml"  str=getHTTPPage(url)  title=strcut(str,"<h1 id=""arti

一段ASP防采集的代码

采集 一段ASP防采集的代码<%        '作用:文字防复制乱码 函数        'Date:2006-3-6        '作者:blue2004        '参数str 为原文,str1作者也是你自己,reslut产生乱码的种子        Function ReadToCode(str,Str1,result)                dim name                dim i,j,k                If isnull(str) th

简单的asp采集代码教程_小偷/采集

采集开始 第一步是分析要采集的页面. 使用浏览器打开要采集的页面(如:http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml,你可以其他页面),打开后,点击右键,查源文件. 第二步,找到要采集的内容所在位置. 假如我要采集这个页面上的标题和内容所在的位置: 标题在<h1 id="artibodyTitle" style="color:#03005C;">和</h1>之间 内容在<

asp采集-ASP采集小偷,指定数据无法抓取

问题描述 ASP采集小偷,指定数据无法抓取 http://chaxun.ttk.cn:8084/BarScanRecord/trackInfo_jsp.jsp?expBill=560230596486&opeCate=2 页面里我只想偷取,当前状态:已签收,但一直无法实现,请指教以下为小偷代码 <% '功能:asp采集代码 'url=""http://www.kuaidi100.com/query?type=tiantian&postid=560230596486

[ASP-Last-Code]显示ASP页面的代码

显示|页面 <%'*************************************************************'在支持FSO的情况下,可以显示本站内的所有ASP页面的代码'适用于代码演示时在效果页面上直接显示该页面的代码而不用再对代码制作专门的页面'使用方法:ViewSource.asp?file=要显示的文件名'如:ViewSource.asp?file=x.asp'modify By : Babyt'*******************************

用asp实现的代码批量修改程序,fso相关

用asp实现的代码批量修改程序,fso相关 是因工作需要做的一个批量修改代码的小东西,拿出来与大家分享 目前可以处理的文件类型:.asp .inc .htm .html 具体类型可自行修改添加 程序实现的功能:将源目录下的文件批量修改后存到目的目录下 用它稍做修改可以实现很多东西噢! 别的不说了,代码里面都写的很清楚了 <% '// +---------------------------------------------------------------------------+ '//

让使用者可以看到你的ASP的原代码

假如你写了一个ASP的程序,希望让你的使用者看到ASP的原始代码,你可以利用FileSystemObject这个对象送出程序原始代码.<%@ Language=VBScript %><%Option Explicit %><%Dim strURLstrURL = Request.QueryString("URL") Dim strDir, strFileNamestrDir = Request.ServerVariables("APPL_PHYS

用asp实现的代码批量修改程序

程序 用asp实现的代码批量修改程序,fso相关 是因工作需要做的一个批量修改代码的小东西,拿出来与大家分享 目前可以处理的文件类型:.asp .inc .htm .html 具体类型可自行修改添加 程序实现的功能:将源目录下的文件批量修改后存到目的目录下 用它稍做修改可以实现很多东西噢! 别的不说了,代码里面都写的很清楚了 <% '// +---------------------------------------------------------------------------+ '