重开一帖,如何将网页源码中../等相对路径转换为绝对路径??

问题描述

我想采集一个页面,,并取出里面的链接,,但是采集的是网页的源代码,,里面的链接都是相对路径,,有什么简便的法子能把这些相对路径替换成绝对路径吗??例如采集http://www.177ks.com的首页,,里面有个路径是../index.aspx采集源码后把这些路径转换成http://www.177ks.com/index.aspx..我看好像网络蜘蛛采过来的代码都是绝对路径,,,但不知道这是怎么实现的,,有什么简单的办法吗??郁闷,,原来那帖我回复不了,,下面的回复框不显出来,,怎么回事...

解决方案

解决方案二：
自己写啊，先取出当前网页地址，然后根据../的个数来确定该取当前网页地址的第几级，然后把../后的东西拼上去就可以了
解决方案三：
string.format
解决方案四：
string.replace("..","http://www.177ks.com/")
解决方案五：
我倒,,上面几个就不能多想想,,我要是取的是最里面的页面,,"../../../../index.aspx"难道要都设上值,,一点点的替换呀...
解决方案六：
正则表达式会不会用啊？

时间： 2024-08-23 11:38:10

重开一帖,如何将网页源码中../等相对路径转换为绝对路径??的相关文章

求助，python 解析爬取的网页源码中的json部分

问题描述求助,python 解析爬取的网页源码中的json部分爬下来的网页源码有一部分是这样的 : 中间那一部分是json吧?要怎么才能解析成像浏览器那样的好继续抓取所要的信息? 说部分是因为有另外一些是正常的html,就中间这一部分想要的信息就这样两行超级长的延伸...也使用过json.load()来解析,不想显示错误"没有可以解析的json对象". 这两行中还有一部分"}u0026nicku003d${nick}u0026rnu003d${rn}u0026stats.

如何将网页源码中../等相对路径转换为绝对路径??

问题描述获取一个网页的代码后,,里面的文件路径都是相对路径,,有没有专门的类来将这些路径转换为绝对路径呢??如,177ks.com首页,/index.aspx转换为http://www.177ks.com/index.aspx 解决方案解决方案二:.net有专门的类解决方案三:字符串操作replace解决方案四:不会,顶下,期待结果解决方案五:Server.mappath("path")解决方案六:URL重写解决方案七:绝对路径不利于部署...为什么要转换呢?

C#怎么把网页源码中相同格式的内容都给提取出来？

问题描述比如:<pclass="intro">xxx</p><pclass="intro">yyyy</p><pclass="intro">zzzz</p><pclass="intro">wwww</p>,我想把xxx,yyyy,zzzz,wwww都给提取出来改怎么办解决方案解决方案二:stringcontent="

在 Firefox 里通过外部编辑器查看网页源码

在 Firefox 浏览器中,通过右键.菜单栏功能项或快捷键(cmd + U)就可以查看的网页源码.不过弹出的仅仅是个浏览窗口,想要进行编辑等进一步操作的话就得靠复制粘贴大法了.有没有这样一个办法,能够让 Firefox 的查看源代码功能直接调用外部编辑器来进行操作呢? 在 Firefox 地址栏输入 about:config,然后在过滤器中搜索 source.editor; 双击 view_source.editor.external 将其值设置为 true; 双击 view_source

[IT]HTML网页源码的字符编码（charset）解释

当你通过浏览器,打开某个网站,即某个url地址的时候,你所能正常看到网页的内容,各种文字,都可以正常显示,且没有显示乱码. 此过程,涉及到,浏览器帮你正确解析HTML源码,其中涉及到HTML网页源码的字符编码处理方面的问题. 和字符编码处理相关的大概逻辑是: 1.浏览器访问对应的url地址,并获取对应的HTML(或者,以及,其他的css,javascript等)网页源码 2.浏览器识别解析HTML源码内容其中包含了解析HTML的头部(head),找到对应的charset和Content-typ

技术-用jsoup抓取网页获取网页源码的时候，得到的源码和在网站上面点击右键查看源码不相同，怎么解决

问题描述用jsoup抓取网页获取网页源码的时候,得到的源码和在网站上面点击右键查看源码不相同,怎么解决用jsoup抓取网页获取网页源码的时候,得到的源码和在网站上面点击右键查看源码不相同,怎么解决 Document doc = Jsoup.parse(new URL(url), 5000); 解决方案一部分html是ajax异步加载的,你得用fiddler调试,得到这些请求,照着写解决方案二: C++ 抓取网页的源码获取网页的源码获取网页源码工具类

编码-python抓取网页，网页源码无法解码

问题描述 python抓取网页,网页源码无法解码抓取的网页:http://esf.nanjing.fang.com/ 浏览器查看源码显示content="text/html; charset=gb2312" python chardet 结果显示{'confidence': 0.0, 'encoding': None} 通过page=page.decode('gb2312','ignore').encode('utf-8'),解码后print为乱码求问应该如何对这个网页的源代码进行

webview可以获取网页源码，进行重新排版吗

private void getHtml_data(String Url, int FontSize) { String text = ""; try { URL url = new URL(Url); URLConnection conn; conn = url.openConnec

android获取网页源码问题

问题描述 android获取网页源码问题以下是我从网上找的获取网页源码的代码所有包都已经正常导入但是编译后程序一运行就崩溃求大神指点import 略; /** @author Jasonzhou @since 2013-03-21 @功能读取网页内容 @说明获取网页的全部代码后使用jsuop进行处理, 以便得到想要的内容**/ public class MainActivity extends Activity { public String url = ""http:

猜你喜欢

一种LTE天线的去耦合分析

为了满足LTE在高数据率和高系统容量方面的需求,LTE系统支持多天线MIMO(Multiple Input Multiple Output)技术,在发射端和接收端同时使用多个天线进行接收和发射,将不 ...

花卉照片处理：简化背景突出主体

花卉摄影作品后期处理中我们会经常用到下面这个方法,就是简化背景突出主体. 原照片: 处理后的效果图: 在Photoshop中打开图片,复制图层. 滤镜→模糊→高斯模糊. 设置模糊半径(可点开" ...

实例分享网站服务器不稳定对百度快照的影响

很多seoer在给网站进行优化之前,都会反复的告诉自己的老板,一定要给网站选择一个稳定的服务器.大部分seoer都会鼓励老板选择新网或者万网作为供应商,虽然价格相对于其他服务商较高,但服务器相对来说较 ...

网站优化推广双管齐下

终于加入站长网了,呵呵!笔者今天针对中小企业的互联网营销发展之路做个个人建议,今天笔者遇到一个朋友,最近想把网络这块做起来,他这边是做整体衣橱衣柜(武汉瑞时家具),这边提到了天助网的引擎发布系统,它是 ...

个人总结做SEO过程中的容易忽视的问题

学习做SEO其实不是一件容易的事情,我们每天睡觉,每天都必须吃饭,但是我们能够是否每天都坚持做SEO所需要做的事情呢? 1.首先,做SEO我们是否有个可长期执行的计划呢?很多人都没有,包括自己在做 ...

[WPF]如何在关闭非模态子窗体时用消息框确认：解决最小化窗体时抛出的异常

又是一个看起来很简单的问题.像下面这样在Closing里弹出个MessageBox确认一下不就行了? public static void OnWindowClosing(object sender, ...

webcammax怎么设置中文？

安装并启动webcammax,点击右边最后一个蓝色齿轮按钮,或者在设定语言(Language)时选择Chinese 或者Chinese Simplified 或者ChineseS即可. 1.安装原 ...

由自身网站收录下降分析导致网站收录波动的几点原因

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅众所周知,网站收录量的多少直接影响 ...

收集整理的ASP的常用内置函数_应用技巧

函数,就是该语言封装了的一个功能块,以方便用户的调用.比如"now()"在VBScript中就是一个能显示出当前日期和时间的函数.至于具体为什么能显示,则是该语言内核所定的,用户只 ...

效果-android 图片大小的处理

问题描述 android 图片大小的处理我通过SVN上传上去了一个UI界面,第二天,我update了后发现显示的图片缩小了,比以前更清晰了点,但是与这个UI相关的资源和我上传前的资源是一模一样的.然 ...

java中两种添加监听器的策略

/*第一种:将事件的处理委托给其他对象,下面的例子是委托给了MyListener(implements ActionListener)*/ import java.applet.Applet; imp ...

RFM报表如何帮你提升顾客回头率、提高客单价和降低流失率？

•1.什么是RFM 模型? •RFM 模型是会员管理领域里的一种会员消费行为分析模型, 其中: •R近度(Recency) 代表最近购买时间,指上次购买至现在的时间间隔: •F 频度(Frequenc ...

ig ee-ZigBee流水灯怎么实现

问题描述 ZigBee流水灯怎么实现 /**************************************************************************** 文件 ...

mysql-Mysql中limit分页后将数据倒叙排列

问题描述 Mysql中limit分页后将数据倒叙排列在MySQL中如何将分页的数据倒叙排列?比如取第10~20条数据,然后将数据倒叙排列解决方案 mysql limit 分页mysql 分页用的l ...

Absolute C++学习笔记1

<Absolute C++>------一本写给undergraduate的C++书关于C++的书可以说是很多了,很多时候不知道从何下手,翻过的书也很多,有的评价很高,自己觉 ...

kvm虚拟化学习笔记(十九)之convirt集中管理平台搭建

原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处 .作者信息和本声明.否则将追究法律责任.http://koumm.blog.51cto.com/703525/1305553 kvm虚拟 ...

2015年的O2O到底会如何？竞争层面升级

2014年的各种盘点还没完全结束,2015年的各种预测又纷至沓来.2014年,O2O可谓风光无限,但热了整整一年的O2O,2015年还会热下去吗?O2O对各行业的"革命"还能继续吗 ...

jQuery源码-jQuery.fn.attr与jQuery.fn.prop

jQuery.fn.attr.jQuery.fn.prop的区别假设页面有下面这么个标签,$('#ddd').attr('nick').$('#ddd').prop('nick')分别会取得什么值? ...

搜狐将新闻客户端进行到底给钱抢人自媒体的春天？

中介交易 SEO诊断淘宝客云主机技术大厅时隔两天,百度.搜狐先后推出了各自为自媒体提供的可带来收益的创新业务模式,目的很明确就是要拉拢自媒体人,将自身打造成一艘媒体航母.不过百度现在更专注在P ...

C#微信公众号开发系列教程五（接收事件推送与消息排重）

原文:C#微信公众号开发系列教程五(接收事件推送与消息排重) 微信公众号开发系列教程一(调试环境部署) 微信公众号开发系列教程一(调试环境部署续:vs远程调试) C#微信公众号开发系列教程二(新手接入 ...

关于读取文本数据整理再生成

问题描述不是关于计算机专业这一块的,纯纯纯菜鸟,老师想让我把一个txt文本读出来,把里面的数据提取一些有用信息,再整理一下,把整理好的数据生成一个新的txt文本,文本里面能像数据库里面一样,有表头和 ...

实时视频实时语音是使用的什么传输协议和编码格式实现的？

问题描述实时视频实时语音是使用的什么传输协议和编码格式实现的? 解决方案传输协议是rtp,编码格式是opus

VS2013 正忙，一直徘徊在等待界面

问题描述求大神来解救解决方案解决方案二:独自徘徊----------解决方案三:IO满了就会卡住.解决方案四:请给个具体解决方案好吗解决方案五:我也遇到同样的问题..解决方案六:如果你安装了补丁 ...

武汉月薪1500的程序员该不改继续做下去？

问题描述毕业近三年,花钱培训,又回头做程序员,在一家小公司月薪仅1500,偶尔接个小项目,工作压力不大虽说刚入行可以学习经验,但是,感觉学到的经验没有时间流失的快!也许是年龄大了,心态变了~~不知道 ...

“企业”和竞争的核心功能反而大大蜕化

"虽然屏幕越来越大,智能电视的功能越来越多,但很多数据表明消费者对当前的智能电视并不满意"人大代表.海信集团董事长周厚健本次两会的议案仍不离本行,他形象地指出:智能电视的机会在&q ...

使用WSS和SOFS管理集群存储

作为其强大云操作系统的一种重要组成部分,微软在Windows Server 2012当中添加了大量全新特性,其中就包括WSS(Windows Storage Spaces)和SOFS(Scale-Ou ...

一淘网将改版首页截图曝光

中介交易 http://www.aliyun.com/zixun/aggregation/6842.html">SEO诊断淘宝客云主机技术大厅 1月25日消息据DoNews网友 ...

ThinkPHP跳转与重定向的区别详解

跳转: 浏览器认为 : 当前 URL 请求成功 , 重新请求新的 URL . 浏览器会记录当前的 URL 和新的 URL 在请求历史记录中. 回退, 是可以回退到 , 当前的 URL 上的 . ( ...

后台(40)——MyBatis输出映射resultType以及resultMap

探索Android软键盘的疑难杂症深入探讨Android异步精髓Handler 详解Android主流框架不可或缺的基石站在源码的肩膀上全解Scroller工作机制 Android多分辨率适配框架 ...

诚聘C#, .NET开发人员

问题描述武汉市中晟科技有限公司成立于2001年,是一家专业从事电力系统软件研发.生产.销售和服务的高科技企业.公司拥有成熟的软件开发团队和先进的软件开发过程管理体系.经过多年的积累,我们的业务已经涵 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.023 s.