ASP获取网页全部图片地址并保存到数组.

网页|数组|图片地址

1.31修正
src=后面有空格不能正确匹配.已修正.
src=''为空时出错.已修正.
发现BUG: 图片路径有多个空格时只能保留一个.未修正.
2.18修正
图片路径有多个空格时只能保留一个的BUG.已修正.

以下是代码:
<%
’功能:获取全部图片地址,保存到一个数组.
’来源:http://jorkin.reallydo.com/article.asp?id=448
’需要ReplaceAll函数:http://jorkin.reallydo.com/article.asp?id=406

Function getIMG(sString)
    Dim sReallyDo, regEx, iReallyDo
    Dim oMatches, cMatch
    ’//定义一个空数组
    iReallyDo = -1
    ReDim aReallyDo(iReallyDo)
    If IsNull(sString) Then
        getIMG = ""
        Exit Function
    End If
    ’//格式化HTML代码
    ’//将每个 <img 换行 方便正则替换
    sReallyDo = sString
    On Error Resume Next
    sReallyDo = Replace(sReallyDo, vbCr, " ")
    sReallyDo = Replace(sReallyDo, vbLf, " ")
    sReallyDo = Replace(sReallyDo, vbTab, " ")
    sReallyDo = Replace(sReallyDo, "<img ", vbCrLf & "<img ", 1, -1, 1)
    sReallyDo = Replace(sReallyDo, "/>", " />", 1, -1, 1)
    sReallyDo = ReplaceAll(sReallyDo, "= ", "=", True)
    sReallyDo = ReplaceAll(sReallyDo, "> ", ">", True)
    sReallyDo = Replace(sReallyDo, "><", ">" & vbCrLf & "<")
    sReallyDo = Trim(sReallyDo)
    On Error GoTo 0
    Set regEx = New RegExp
    regEx.IgnoreCase = True
    regEx.Global = True
    ’//去除onclick,onload等脚本
    regEx.Pattern = "\s[on].+?=([\""|\’])(.*?)\1"
    sReallyDo = regEx.Replace(sReallyDo, "")
    ’//将SRC不带引号的图片地址加上引号
    regEx.Pattern = "<img.*?\ssrc=([^\""\’\s][^\""\’\s>]*).*?>"
    sReallyDo = regEx.Replace(sReallyDo, "<img src=""$1"" />")
    ’//正则匹配图片SRC地址
    regEx.Pattern = "<img.*?\ssrc=([\""\’])([^\""\’]+?)\1.*?>"
    Set oMatches = regEx.Execute(sReallyDo)
    ’//将图片地址存入数组
    For Each cMatch in oMatches
        iReallyDo = iReallyDo + 1
        ReDim Preserve aReallyDo(iReallyDo)
        aReallyDo(iReallyDo) = regEx.Replace(cMatch.Value, "$2")
    Next
    getIMG = aReallyDo
End Function
%>

时间: 2024-09-22 02:39:20

ASP获取网页全部图片地址并保存到数组.的相关文章

ASP获取网页全部图片地址并保存为数组的正则_应用技巧

目前还是有BUG的,最新的测试页面在: http://www.reallydo.com/getimg.asp 正则分析页面在: http://jorkin.reallydo.com/article.asp?id=380  发现BUG请在后面留言,谢谢. 1.31修正 src=后面有空格不能正确匹配.已修正. src=''为空时出错.已修正. 发现BUG: 图片路径有多个空格时只能保留一个.未修正. 2.18修正 图片路径有多个空格时只能保留一个的BUG.已修正. 复制代码 代码如下: <%  '

ASP获取网页全部图片地址并保存为数组的正则

目前还是有BUG的,最新的测试页面在: http://www.reallydo.com/getimg.asp 正则分析页面在: http://jorkin.reallydo.com/article.asp?id=380  发现BUG请在后面留言,谢谢. 1.31修正 src=后面有空格不能正确匹配.已修正. src=''为空时出错.已修正. 发现BUG: 图片路径有多个空格时只能保留一个.未修正. 2.18修正 图片路径有多个空格时只能保留一个的BUG.已修正. 复制代码 代码如下: <%  '

php获取CSS文件中图片地址下载保存到本地

 代码如下 复制代码 /**      * 获取CSS中图片地址,并且保存到本地      */     class getInCssImage     {           /**          *  图片保存下来          * @param $cssUrl css的url地址          * @param $dir 保存图片的目录          * @return void          */         static public function save

Python获取网页上图片下载地址的方法_python

本文实例讲述了Python获取网页上图片下载地址的方法.分享给大家供大家参考.具体如下: 这里获取网页上图片的下载地址是正在写的数据采集中的一段,代码如下: 复制代码 代码如下: #!/user/bin/python3 import urllib2 from HTMLParser import HTMLParser class MyHtmlParser(HTMLParser):     links = []     def handle_starttag(self, tag, attrs):  

html5-将自己网页上的图片指向其他网页的图片地址,显示没有权限

问题描述 将自己网页上的图片指向其他网页的图片地址,显示没有权限 在自己写的jsp代码中,添加了此段代码 out.print("<img src=" + data.getImages().get(1) + "alt=" + data.getImage() + ">"); 显示效果如下: 难道只能将图片下载到本地才有权限访问此图片吗? 解决方案 网页中为什么不显示图片获取网页内所有图片地址网页中图片的显示问题 解决方案二: 人家判断了来

ASP 获取腾讯IP地址的接口程序代码

<script type=text/javascript教程 src=http://fw.qq.com/ipaddress></script> <script type=text/javascript> var hehe1=IPData[2] var hehe2=IPData[3] alert(hehe1); alert(hehe2); document.write(IPData.join(' ')); </script> 如何用ASP来存储,从上面读取出来

js 获取内容中图片地址正则表达式

js 获取内容中图片地址正则表达式 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-eq

asp正则获取html文件图片地址

Function getIMG(sString)     Dim sReallyDo, regEx, iReallyDo     Dim oMatches, cMatch     '//定义一个空数组     iReallyDo = -1     ReDim aReallyDo(iReallyDo)     If IsNull(sString) Then         getIMG = ""         Exit Function     End If     sReallyDo

用XMLHTTP组件解析图片地址并保存

xml 现在基于WEB页的HTML的编辑器在新闻系统,文章系统中用得越来越广,一个网页一粘就可以保持原来的样式,同时图片也可以在这个页中保持.但是在使用过程中,如果所粘贴页中的图片被删除,就会在自己的页面上留下一个大大的"X",影响美观.以前只好把这个图片保存下来,再重新上传到服务器上,这样实在麻烦.能不能让服务器自动去下载图片保存在服务器并且替换页面上的链接?答案是肯定的. 要实现这个功能需要经过三个步骤: 一,取得原页中的图片的地址.方法很多,可以用分割字符串,也可以用正则匹配.实