PHP正则表达式提取html超链接中的href地址

用php的正则表达式相关函数,实现提取html超链接<a href="地址"></a>中的地址。

 代码如下 复制代码

<?php

$preg='/<a .*?href="(.*?)".*?>/is';

$str ='<a href="链接1">URLNAME</a>文本段1<a href="链接2" target="_blank">URLNAME</a>文本段2<a  target="_blank" href="链接3">URLNAME</a>...文本段n';

preg_match_all($preg,$str,$match);//在$str中搜索匹配所有符合$preg加入$match中

for($i=0;$i<count($match[1]);$i++)//逐个输出超链接地址

{

  echo $match[1][$i]."<br />";

}

?>

 

最终输出:

链接1<br />链接2<br />链接3<br />

附一个
PHP的正则表达式提取图片地址的代码。

 代码如下 复制代码

$str='<p style="padding: 0px; margin-top: 0px; margin-bottom: 0px; line-height: 200%;"><img border="0" src="upfiles/2009/07/1246430143_4.jpg" alt=""/></p><p style="padding: 0px; margin-top: 0px; margin-bottom: 0px; line-height: 200%;"><img border="0" src="upfiles/2009/07/1246430143_3.jpg" alt=""/></p><p style="padding: 0px; margin-top: 0px; margin-bottom: 0px; line-height: 200%;"><img border="0" src="upfiles/2009/07/1246430143_1.jpg" alt=""/></p>'; 

$pattern="/<[img|IMG].*?src=['|"](.*?(?:[.gif|.jpg]))['|"].*?[/]?>/"; 

preg_match_all($pattern,$str,$match); 

print_r($match);

时间: 2024-09-10 08:36:25

PHP正则表达式提取html超链接中的href地址的相关文章

基于Python正则表达式提取搜索结果中的站点地址

正则表达式对于Python来说并不是独有的,最近在把google搜索的结果中所有的站点地址导出,于是想到用python正则表达式提取搜索结果中的站点地址. 这其中涉及几个需要解决的问题: 1.获取搜索的结果文本 为了获得更多的地址,我使用了Google的高级搜索功能,每个页面显示100条结果. 获得显示的结果后,可以查看源码,并保持成文本文件就有了搜索的结果文本 2.分析如何提取站点信息 首先需要分析获取的页面,查看以怎样的方式可以提取出站点信息. 我使用IE8自带的开发工具(按F12就会弹出来

基于Python正则表达式提取搜索结果中的站点地址_正则表达式

正则表达式对于Python来说并不是独有的,最近在把google搜索的结果中所有的站点地址导出,于是想到用python正则表达式提取搜索结果中的站点地址. 这其中涉及几个需要解决的问题: 1.获取搜索的结果文本 为了获得更多的地址,我使用了Google的高级搜索功能,每个页面显示100条结果. 获得显示的结果后,可以查看源码,并保持成文本文件就有了搜索的结果文本 2.分析如何提取站点信息 首先需要分析获取的页面,查看以怎样的方式可以提取出站点信息. 我使用IE8自带的开发工具(按F12就会弹出来

利用VB提取HTML文件中的EMAIL地址

电子邮件(EMAIL)是INTERNET上应用最广泛的一种服务之一.我们每天都在使用电子邮件,有时为了宣传我们的产品.网站等,更是离不开电子邮件,这就需要收集很多的EMAIL地址.下面我们将向大家介绍用VB自编一个EMAIL地址提取器,用来提取保存在我们硬盘中的HTML文件中所包含的EMAIL地址. 一 设计界面 进入VB,选择"标准EXE"新建一工程,选择"工程"菜单下的"引用",选中Microsoft scripting Runtime&qu

PHP正则表达式提取淘宝搜索图片及链接地址

程序代码  代码如下 复制代码 <?php $keywords=$_GET['word'];//关键词 $p=($_GET['p']-1)*40;//页码 $html = file_get_contents("http://s.taobao.com/search?q=".$keywords."&pid=mm_17149866_0_0&s=".$p."#J_relative");//pid可以自己修改 preg_match_a

php正则表达式之正则字符中的图片地址

 代码如下 复制代码 if (preg_match_all("/http://[^ "']+[.jpg|.gif|.jpeg|.png]+/ui",stripcslashes($content),$aliurl)){ $i=0; //多个文件++ while(list($key ,$v) = each($aliurl[0])){ //echo $v."<br />"; $filetype = pathinfo($v, PATHINFO_EXTE

PHP提取数据库内容中的图片地址并循环输出_php技巧

复制代码 代码如下: /* 1 (?s) 代表 Pattern.DOTALL,也就是匹配换行,允许 img里出现在多行 2 .*?代表非贪婪匹配任意字符,直到后面的条件出现 3 ?: 代表这个匹配但不被捕获,也就是不在结果出现 [\.gif|\.jpg] 是或者的意思 */ $pattern="/<img.*?src=[\'|\"](.*?(?:[\.gif|\.jpg]))[\'|\"].*?[\/]?>/"; $str='<p style=&q

提取CuteEditor编辑器中的图片地址,并将远程图片保存到本地

问题描述 给位高手帮帮我好急我单独做一个页用publicpartialclass_Default:System.Web.UI.Page{protectedvoidPage_Load(objectsender,EventArgse){Regexre=newRegex(@"srcs*=s*(?:([""'])(?<src>[^""']+)1|(?<src>[^s>]+))",RegexOptions.IgnoreCase

PHP中使用正则表达式提取中文实现笔记

这篇文章主要介绍了PHP中使用正则表达式提取中文实现笔记,本文还讲解了韩文.日文的正则表达式,并同时给出实现代码和使用示例,需要的朋友可以参考下     最近老板叫做一个数据查重的小练习,涉及从一个包含中文字段的文件中提取出其中的中文字段并存储,使用php开发.中间涉及到php正则表达式中文匹配的问题,网上搜罗一大片,但是也很乱没有一个准信儿,经过自己的代码的修改和检验,先将extract函数写下. 首先要注意到的是,双字节字符的编码问题,这里我们以后还可能会遇到像韩文.日文等编码问题,与中文理

php使用正则表达式提取字符串中尖括号、小括号、中括号、大括号中的字符

 PHP使用正则表达式提取字符串中尖括号<>.小括号().中括号[].大括号{}中的字符示例,需要的朋友可以参考下    代码如下: $str="你好<我>(爱)[北京]{天安门}";    echo f1($str); //返回你好  echo f2($str); //返回我  echo f3($str); //返回爱  echo f4($str); //返回北京  echo f5($str); //返回天安门    function f1($str)  {