Java中使用正则表达式获取网页中所有图片的路径_java

/**
	 * 从HTML源码中提取图片路径,最后以一个 String 类型的 List 返回,如果不包含任何图片,则返回一个 size=0 的List
	 * 需要注意的是,此方法只会提取以下格式的图片:.jpg|.bmp|.eps|.gif|.mif|.miff|.png|.tif|.tiff|.svg|.wmf|.jpe|.jpeg|.dib|.ico|.tga|.cut|.pic
	 * @param htmlCode HTML源码
	 * @return <img>标签 src 属性指向的图片地址的List集合
	 * @author Carl He
	 */
	public static List<String> getImageSrc(String htmlCode) {
		List<String> imageSrcList = new ArrayList<String>();
		Pattern p = Pattern.compile("<img//b[^>]*//bsrc//b//s*=//s*('|/")?([^'/"/n/r/f>]+(//.jpg|//.bmp|//.eps|//.gif|//.mif|//.miff|//.png|//.tif|//.tiff|//.svg|//.wmf|//.jpe|//.jpeg|//.dib|//.ico|//.tga|//.cut|//.pic)//b)[^>]*>", Pattern.CASE_INSENSITIVE);
		Matcher m = p.matcher(htmlCode);
		String quote = null;
		String src = null;
		while (m.find()) {
			quote = m.group(1);
			src = (quote == null || quote.trim().length() == 0) ? m.group(2).split("//s+")[0] : m.group(2);
			imageSrcList.add(src);
		}
		return imageSrcList;
	}

以上是小编为您精心准备的的内容,在的博客、问答、公众号、人物、课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索java
, 正则表达式
, 网页
, 图片
路径
java 正则表达式 路径、java获取正则表达式、java 获取当前路径、java获取项目路径、java 获取文件路径,以便于您获取更多的相关知识。

时间: 2025-01-11 12:22:50

Java中使用正则表达式获取网页中所有图片的路径_java的相关文章

node.js正则表达式获取网页中所有链接的代码实例_node.js

实现代码 复制代码 代码如下: var http = require('http'); //定义函数var getAHref = function(htmlstr){    var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim;    var arr = [];    while(tem=reg.exec(htmlstr)){        arr.push(tem[2]);    }    return a

python使用正则表达式分析网页中的图片并进行替换的方法

 这篇文章主要介绍了python使用正则表达式分析网页中的图片并进行替换的方法,涉及Python使用正则表达式的技巧,具有一定参考借鉴价值,需要的朋友可以参考下     本文实例讲述了python使用正则表达式分析网页中的图片并进行替换的方法.分享给大家供大家参考.具体分析如下: 这段代码分析网页中的所有图片表单<img>,分析后为其前后添加相应的修饰标签,并添加到图片的超级链接. 代码如下: result = value.replace("[ page ]","

JavaScript获取网页中第一个图片id的方法

 下面的代码通过document.images获取网页中的所有图片,然后获取第一个图片的id属性   1 2 3 4 5 6 7 8 9 10 11 12 13 <!DOCTYPE html> <html> <body> <img id="klematis lilac" border="0" src="klematis.jpg" width="148" height="112

如何获取网页中按钮的地址?

问题描述 如何获取网页中按钮的地址? 例如http://contest.i21st.cn/zhuanti/20th/final.php?from=timeline&isappinstalled=0这个网页中第8个人..恳请请答 解决方案 分析页面dom.用tag,名称等来查找.都可以找到. 解决方案二: 获取网页,直接用正则表达式提取. 解决方案三: 推荐Jsoup,可以根据html标签来提取数据内容

android如何获取网页中特定标记之间的代码并作为字符串返回?

问题描述 android如何获取网页中特定标记之间的代码并作为字符串返回? 比如 我要获取某个网页上fhh jkl 这两个标记之间的代码 并返回该怎么弄? 解决方案 正则表达式提取 (?<=fhh).*?(?<jkl) 解决方案二: 除了用正则之外你也可以用Jsoup提取

c#代码中, 如何获取网页中的json数据?

问题描述 c#代码中, 如何获取网页中的json数据? 用浏览器访问java的web项目, 输入网址,返回json,形如: [{'a':'1','b':'2'},{'c':'3','d':'4'}] 如何在c#代码里获取这个json串呢? 有没有现成类库或方法??? 解决方案 先用fiddler得到获取json的网址.然后用fiddler获取.用System.Runtime.Serialization.Json解析http://www.cnblogs.com/ambar/archive/2010

PHP批量获取网页中所有固定种子链接的方法_php技巧

本文实例讲述了PHP批量获取网页中所有固定种子链接的方法.分享给大家供大家参考,具体如下: 经常的下载链接比较多的时候,就像一次性将所有的链接添加到迅雷或者电炉,但是没有在这种选项,怎么办,咱是PHPer啊,这事儿难不到咱 且看代码,当然要换成你的,要根据具体情况来做修改. <?php header("content-type:text/html;charset=utf8"); $str = file_get_contents('./ShowFile.asp'); $str1 =

JavaScript获取网页中第一个图片id的方法_javascript技巧

本文实例讲述了JavaScript获取网页中第一个图片id的方法.分享给大家供大家参考.具体如下: 下面的代码通过document.images获取网页中的所有图片,然后获取第一个图片的id属性 <!DOCTYPE html> <html> <body> <img id="klematis lilac" border="0" src="klematis.jpg" width="148"

如何获取网页中的密码和文本输入框的内容

一.介绍 网页中的密码输入框和一般不同,它没有句柄之类的,但是通过获取IE的IHTMLInputTextElement接口,就可以获取网页中的输入框(包括文本和密码输入框)的内容了. 源代码在VC知识库首页运行效果图如下: 二.具体代码 VARIANT id, index; CComPtr<IDispatch> spDispatch; CComQIPtr<IHTMLDocument2, &IID_IHTMLDocument2> pDoc2; CComPtr<IHTML