php解析字符串里所有URL地址的方法

具体如下：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47

<?php
// $html = the html on the page
// $current_url = the full url that the html came from
//(only needed for $repath)
// $repath = converts ../ and / and // urls to full valid urls
function pageLinks($html, $current_url = "", $repath = false){
preg_match_all("/<a.+?href=("|')(?!javascript:|#)(.+?)("|')/i", $html, $matches);
$links = array();
if(isset($matches[2])){
$links = $matches[2];
}
if($repath && count($links) > 0 && strlen($current_url) > 0){
$pathi = pathinfo($current_url);
$dir = $pathi["dirname"];
$base = parse_url($current_url);
$split_path = explode("/", $dir);
$url = "";
foreach($links as $k => $link){
if(preg_match("/^../", $link)){
$total = substr_count($link, "../");
for($i = 0; $i < $total; $i++){
array_pop($split_path);
}
$url = implode("/", $split_path) . "/" . str_replace("../", "", $link);
}elseif(preg_match("/^///", $link)){
$url = $base["scheme"] . ":" . $link;
}elseif(preg_match("/^/|^.//", $link)){
$url = $base["scheme"] . "://" . $base["host"] . $link;
}elseif(preg_match("/^[a-zA-Z0-9]/", $link)){
if(preg_match("/^http/", $link)){
$url = $link;
}else{
$url = $dir . "/" . $link;
}
}
$links[$k] = $url;
}
}
return $links;
}
header("content-type: text/plain");
$url = "http://www.jb51.net";
$html = file_get_contents($url);
// Gets links from the page:
print_r(pageLinks($html));
// Gets links from the page and formats them to a full valid url:
print_r(pageLinks($html, $url, true));

时间： 2024-08-15 11:56:17

php解析字符串里所有URL地址的方法的相关文章

php解析字符串里所有URL地址的方法_php技巧

本文实例讲述了php解析字符串里所有URL地址的方法.分享给大家供大家参考.具体如下: <?php // $html = the html on the page // $current_url = the full url that the html came from //(only needed for $repath) // $repath = converts ../ and / and // urls to full valid urls function pageLinks($ht

php提取字符串中网站url地址的方法_php技巧

本文实例讲述了php提取字符串中网站url地址的方法.分享给大家供大家参考.具体分析如下: 今天写一个问答系统上线之后发现有很多人发链接了,由于业务部门要我们过滤掉网站地址了,下面我给大家分享一个提取字符串url地址函数,代码如下: 复制代码代码如下: $postInfo['answer2'] ='可以的,商业贷款可摊还36%,公积金贷款可摊还16%|||可以先把账户里的余额提取出来用作首付,然后每个月贷款商业贷款可摊还36%,公积金贷款可摊还16%|||可以的,现在甲类公积金是摊还比例htt

php提取字符串里所有URL的例子

这篇文章主要介绍了php提取字符串中网站url地址的方法,可通过正则匹配查找并提取出URL地址,需要的朋友可以参考下 $postInfo['answer2'] ='学习php的方法很多,通过搜索引擎可以搜索到很多资料,当然也可以进入PHP二次开发博客学习哦:http://www.111cn.net,一起交流学'; preg_match_all("/http:[\/]{2}[a-z]+[.]{1}[a-z\d\-]+[.]{1}[a-z\d]*[\/]*[A-Za-z\d]*[\/]*[A-

php获取字符串中图片url地址正则

例子代码如下复制代码 $preg = "/<[img|IMG].*?src=[\'|\"](.*?(?:[\.gif|\.jpg]))[\'|\"].*?[\/]?>/i"; preg_match_all($preg,$str,$res); 这下子,管用多了,不管怎样的代码结构,都能顺利的匹配出图片的路径. 例子代码如下复制代码 $str='<p style="padding: 0px; margin-top: 0px; ma

python清除字符串里非字母字符的方法

本文实例讲述了python清除字符串里非字母字符的方法.分享给大家供大家参考.具体如下: ? 1 2 3 4 5 6 7 8 9 s = "hello world! how are you? 0" # Short version print filter(lambda c: c.isalpha(), s) # Faster version for long ASCII strings: id_tab = "".join(map(chr, xrange(256))

python统计文本字符串里单词出现频率的方法

本文实例讲述了python统计文本字符串里单词出现频率的方法.分享给大家供大家参考.具体实现方法如下: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 # word frequency in a text # tested with Python24 vegaseat 25aug2005 # Chinese wisdom ...

JS获取几种URL地址的方法小结

本篇文章主要是对JS获取几种URL地址的方法进行了总结介绍,需要的朋友可以过来参考下,希望对大家有所帮助以下为JS获取几种URL地址的方法代码如下: thisURL = document.URL; thisHREF = document.location.href; thisSLoc = self.location.href; thisDLoc = document.location; thisTLoc = top.location.href; thisPLoc = parent

JS获取几种URL地址的方法小结_javascript技巧

以下为JS获取几种URL地址的方法复制代码代码如下: thisURL = document.URL;thisHREF = document.location.href;thisSLoc = self.location.href;thisDLoc = document.location; thisTLoc = top.location.href;thisPLoc = parent.document.location;thisTHost = top.location.hostname;thisH

js实现ifram取父窗口URL地址的方法_javascript技巧

本文实例讲述了js实现ifram取父窗口URL地址的方法.分享给大家供大家参考.具体实现方法如下: var url=''; try { url = window.top.document.referrer ; } catch(M) { if (window.parent) { try { url = window.parent.document.referrer; } catch(L) { url = ""; } } } if (url === "") { url

猜你喜欢

Javascript高级教程:javascript闭包

文章简介:理解JavaScript的闭包是迈向高级JS程序员的必经之路,理解了其解释和运行机制才能写出更为安全和优雅的代码. 闭包(closure)是Javascript语言的一个难点,也是它的特色, ...

岳贵：互联网就是一棵摇钱树！

今天是高考的日子,我家有一个人参加高考,所以我在这里没事就祝福一下吧,虽然不起什么作用.同时绝对正式的祝天下所有参加高考的朋友们:加油!成功属于有准备的人! 互联网就是一棵摇钱树!没事你就去摇 ...

10条建议着手开始Web2.0实施

专家精选10条建议助你着手构建一个更动态的Web站点,跃入Web2.0时代-- 如今Web2.0的宣传铺天盖地,很难找到一个可靠的策略来让公司的网站更加动态.在这里我们给出10条建议,这些建议均来源于 ...

百度再次大力度打击SEO SEOER准备好了么

今天早上习惯性打开度娘随便搜索了一个词,突然发现怎么感觉界面这么别扭呢,开始还以为是自己字体,或者是浏览器设置的问题,后来仔细一观察,才发现是度娘又有了新的动作,百度将原来右侧的推广链接由右对齐调 ...

WCF从理论到实践(5)：Binding细解

本文的出发点: 通过阅读本文,您能了解以下知识: WCF中的Binding是什么? Binding的组成? Binding Element 的分类? Binding描述了那些层面的信息? 选择正确的B ...

英特尔主板挂载LINUX的网卡驱动

一.首先要挂载光驱 # mount /media/cdrom (或mount /dev/cdrom /mnt/cdrom) 二.查看(进入)光驱目录 # cd /media/cd ...

Photoshop制作一款细腻华丽的名表

绘制名表之前,要对表的结构有全面的了解;然后画出色块图;再用渐变.图层样式.图案.画笔等给表的每个部分增加颜色和质感;最终再整体细调即可. 表的构成元素较多,绘制的时候一定要分区分组绘制,这样方便 ...

腾达(Tenda)FH451路由器通过设置URL过滤限制网页访问

适用路由器型号:F450/F451/F453/Ff455/F456/FH450/FH451 通过设置URL过滤来限制连接到该路由器下打开的网页,通过进入到路由器管理界面中(在地址栏中输入默认IP地址: ...

《从零开始学Swift》学习笔记（Day67）——Cocoa Touch设计模式及应用之MVC模式

原创文章,欢迎转载.转载请注明:关东升的博客 MVC(Model-View-Controller,模型-视图-控制器)模式是相当古老的设计模式之一,它最早出现在Smalltalk语言中.现在,很多 ...

linux svn迁移备份的三种方法

原文:http://www.iitshare.com/linux-svn-migration.html svn备份方式对比分析一般采用三种方式: 1.svnadmin dump 2.svnadmin ...

8天玩转并行开发——第八天用VS性能向导解剖你的程序

原文:8天玩转并行开发--第八天用VS性能向导解剖你的程序最后一篇,我们来说说vs的"性能向导",通常我们调试程序的性能一般会使用Stopwatch,如果 ...

记录用户在线时间

前言同事在弄一个叫学习空间的系统,其中需要记录用户的在线时间,于是我就帮忙实现一下,那个系统的其他部分都没参与过.不过功能实现得还可以,就小结一下也看看能不能有更好的解决方法. 正文思路:在页 ...

Twitter 重造 Google 的秘密武器

Google 拥有许多数据中心,它如何进行管理呢?答案就是软件系统 Borg.通过 Borg,公司可以将众多数据中心视为一个电脑,进行统一管理.Borg 是公司保存最好的秘密之一.不过,Twitter ...

.net如何实现生成word2003打印！并可以下载

问题描述 .net如何实现生成word2003打印!并可以下载解决方案解决方案二:它是否能滿足你需求?解决方案三:不要发广告!解决方案四:廣而告之,這是控件,非常好用,呵呵呵

创造出美好的生活

在今年的春节,有这样一个特别的话题,那就是许多人拜年不再发短信,而是通过微信了.只需要一个群发助手就可以了,比起一毛钱一条的短信,还得费劲巴拉地一条条发,不仅省钱还省力.实际上,微信给运营商留着面子呢 ...

医疗大健康行业案例(老人健康实时监测和预警) - 阿里云RDS PostgreSQL最佳实践

标签 PostgreSQL , pipelineDB , 流式计算 , 独立事件相关性 , 舆情分析 , 实时状态分析 , 递归查询 , 时序数据背景人的身体和机器差不多,随着年龄的增长,器官逐渐 ...

关于事务的几个概念介绍（转）

啥是事务? 有一组操作组成的可靠的独立的工作单元. ACID是咋回事? A(原子性)事务的原子操作单元,对数据的修改,要么全部执行,要么全部不执行: C(一致性)在事务开始和完成时,数据必须保 ...

android端接收消息出现问题，ios端没事

问题描述解决方案调用rest api发消息的时候,发消息的json请求体格式不对,参照官网格式

在C#中主线程和子线程如何实现互相传递数据

在C#中主线程和子线程如何实现互相传递数据老帅在C#中创建线程Thread时,可以有多种方法,而主线程和子线程 ...

项目中的一个JQuery ajax实现案例

/** * brief 这些代码用于在线制图中 attention author <list of authors> <date> begin modify by * nu ...

j2me课表的修改（J2ME程序设计实例教程）

问题描述刚学习j2me,用是的J2ME程序设计实例教程.书上有一个课程表的实例,发现上面只有添加和删除课程的功能而不能修改,想增加一个修改的功能.我就想在显示每天课程的类中添加一个修改功能,在课程上 ...

小米pay支付怎么使用小米云闪付使用方法介绍

第一步:在小米手机中安装银行APP,然后打开找到界面中的"云闪付"如下所示. 第二步:首次使用会提示需要安装云闪付安全插件,点击确定,之后添加信用卡第三步:之后安按照提示完成银行 ...

浅析c++中new和delete的用法_C 语言

new和delete运算符用于动态分配和撤销内存的运算符 new用法: 1.开辟单变量地址空间1)new int; //开辟一个存放数组的存储空间,返回一个指向该存储空间的地址.int *a = n ...

浏览器兼容的JS写法总结_javascript技巧

一.元素查找问题1. document.all[name] (1)现有问题:Firefox不支持document.all[name] (2)解决方法:使用getElementsByName(n ...

[求助].net2安装部署如何不用下载framework?

问题描述就是把需要的文件全部打包.安装后不用去下载就可以运行程序.该如何操作?谢谢. 解决方案解决方案二: 本人觉得暂时无解~~~把.netframework一起打包??解决方案三: 关注up解决 ...

规模化运行敏捷：三大挑战

在大型企业内,IT领导者正在开发一种新的运营模式,来应对数字化需求.该模型假定,如果团队以持续交付的方式支持数字产品和服务,则应用开发将需要规模化敏捷方法的使用. 在寻求规模化运行敏捷的过程中,许多企 ...

迪信通开盘股价破发下跌近5%

DoNews 7月8日消息(记者周勤燕)7月8日,国内移动通信连锁企业迪信通在港交所主板上市,股票代码06188.HK,发行价5.3港元,发行约1.67亿股,募资约7.97亿港元(约6.38亿人民币 ...

说一说数据中心部署快照的那些事

IT专业人员越来越依靠快照来保护他们的虚拟环境数据.快照在几秒钟内提供一个冻结的.备用的数据实例.这个实例可以被备份.复制甚至用作启动另外一台虚拟机(VM)的基准线. 快照利用存储设备上的数据组织方式 ...

360称百度插件采集用户信息用于封杀360浏览器

和讯科技消息 1月28日,http://www.aliyun.com/zixun/aggregation/12568.html">360安全中心今日公开表示,百度"凤巢&qu ...

又见西布曲明一减肥药被召回

网购减肥药要小心,已在国内叫停的西布曲明又现身了. 记者今晨从美国食品药品管理局(FDA)获悉,由于含有西布曲明成分,一款名为SlimXtreme的草本减肥胶囊被召回,而这款药在国内购物网上有售. F ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.029 s.