用XMLHTTP读取网页源代码

xml|网页|源代码

    在VBScript中,我们用XMLHTTP组件来获取网页源代码,并可以赋给某变量从而动态保存为HTML文件。有关XMLHTTP对象的介绍请参考以下文章:http://www.webjx.com/htmldata/2005-10-17/1129556661.html;有关XMLHTTP的使用实例请参考以下文章:http://www.webjx.com/htmldata/2005-02-25/1109332374.html。
    我按照第二篇文章的介绍写了一段代码:
    <%
    set x=server.createObject("Microsoft.XMLHTTP")
    x.open "get","http://www.webjx.com",false
    x.send
    response.write "<xmp>"&x.responseText&"</xmp>"
    set x=nothing
    %>
    不过测试后发现其中的中文全都显示为乱码,去网上搜了一下,实在找不着一个简单的解决办法。不过找到一个responseBody属性,这在第一篇文章中是没有提及的。和responseText属性不同的是,responseBody返回的是一个二进制字符串(responseText返回的是普通字符串),用response.binaryWrite x.responseBody,发现能正常显示中文。于是我们只需编写一个把二进制字符串转换为普通字符串的函数bin2str:

    function bin2str(bin)
        dim tmp,ustr
        tmp=""
        for i=1 to LenB(bin)-1
            ustr=AscB(MidB(bin,i,1))
            if ustr>127 then
                i=i+1
                tmp=tmp&chr(ustr*256+AscB(MidB(bin,i,1)))
            else
                tmp=tmp&chr(ustr)
            end if
        next
        bin2str=tmp
    end function
    
    关于从二进制字符串中恢复汉字信息请参照以下文章:http://www.ahcit.com/200407/20040752.doc。
    有了这个函数,我们就可以很方便地提取指定网址的源代码并赋给变量了:

    set x=server.createObject("Microsoft.XMLHTTP")
    x.open "get","http://www.webjx.com",false
    x.send
    str=bin2str(x.responseBody)
    response.write "<xmp>"&str&"</xmp>"
    set x=nothing

时间: 2024-10-30 05:55:44

用XMLHTTP读取网页源代码的相关文章

C#读取查看网页源代码

  C#查看指定网址URL的网页源代码,支持获取有用户名密码的网页,需要注意显示代码时候的编码,可能会乱码:   示例图看一下:获取百度首页的网页源码:  

JS远程获取网页源代码实例_javascript技巧

复制代码 代码如下: <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <head> <meta http-equiv="Content-type" content="text/html; charset=utf-8"> <title>远程网页源代码读取</title> <sty

php查看网页源代码的方法

 这篇文章主要介绍了php查看网页源代码的方法,涉及php读取网页文件的技巧,具有一定参考借鉴价值,需要的朋友可以参考下     本文实例讲述了php查看网页源代码的方法.分享给大家供大家参考.具体实现方法如下: ? 1 2 3 4 5 6 7 8 9 <?php $url = "http://www.jb51.net"; $fp = @fopen($url, 'r') or die("Cannot Open $url via Get method"); wh

挂QQ的网页源代码[ASP/PHP/JS]

js|网页|源代码 明:此代码适合你做网站用,普通朋友可以不用理这个东西! ASP: <%dim objXMLHTTP, qq, pwdqq = "10000"pwd = "123456"set objXMLHTTP = Server.CreateObject("MSXML2.XMLHTTP.5.0")objXMLHTTP.open "POST", http://211.139.167.71/waptest/TWF/qq

c#代码-C#如何利用正则表达式读取网页指定内容

问题描述 C#如何利用正则表达式读取网页指定内容 C#如何利用正则表达式读取网页指定内容,求高手指点,直接上传源代码也行,非常感谢帮助

关于网页源代码屏蔽(2)

网页|源代码 那么,有些人就会想到,如果对方看不到框架网页的源代码.又何谈去直接打开被保护网页?对,这就是接下来我要讲的.如果要一个页面的菜单栏内的查看源代码失去效用.那最简单的办法就是去掉菜单栏.而这一点是可以通过弹出窗口来实现的.之所以不选用超链接打开无菜单栏窗口是因为那样会暴露目标地址,浏览者可以直接在浏览器中敲入地址,而绕过这个屏蔽的菜单栏.要使用超链接打开无菜单栏窗口,就必须在一个已受到源代码屏蔽保障的网页中使用相关链接. 那么,我们就看看如何利用弹出窗口来去掉菜单栏.其实,我们要做的

关于网页源代码屏蔽(1)

网页|源代码 很早就想写一篇关于网页源代码屏蔽的文章.是因为经常编出些JS脚本的之后,在沾沾自喜的同时,也在担心源代码会被人家看到,盗用我的脚本.所以一直以来,我都在尽力维护我的网页源代码的安全.虽然目前还没有找到完全安全的屏蔽方法(也就是说,这些方法在我想出来的同时,自己已经知道其弱点和破解方法了),但是,我这里有很多屏蔽的思路,来总结一下. 众所周知,要保护一个页面,最基础的就是要屏蔽右键.而现在网页上用得最多的是function click(),即下面这段代码: 〈script〉 func

关于网页源代码屏蔽(3)

网页|源代码 最后我们要做的工作,就是把每一页,或者你认为重要的关键的页面进行加密,就OK啦.怎样对网页的源代码进行加密就不用我多说了吧?网上到处都有,可以用工具,也可以自己写一个htm文件来转换.加密软件,我推荐"Batch HTML Encryptor",去google找吧.还有转换加密网页的代码如下: 〈HTML〉〈HEAD〉〈TITLE〉网页加密解密〈/TITLE〉 〈META http-equiv=Content-Type content="text/html; c

让别人看不到我的网页源代码的方法汇总

网页|源代码 1.将以下代码加入到HEML的<body></body>之间 <SCRIPT language=javascript> function click() {if (event.button==2) {alert('不许你偷看!');}}document.onmousedown=click </SCRIPT> ................................................................. 2.禁