问题描述
我想采集一个页面,,并取出里面的链接,,但是采集的是网页的源代码,,里面的链接都是相对路径,,有什么简便的法子能把这些相对路径替换成绝对路径吗??例如采集http://www.177ks.com的首页,,里面有个路径是../index.aspx采集源码后把这些路径转换成http://www.177ks.com/index.aspx..我看好像网络蜘蛛采过来的代码都是绝对路径,,,但不知道这是怎么实现的,,有什么简单的办法吗??郁闷,,原来那帖我回复不了,,下面的回复框不显出来,,怎么回事...
解决方案
解决方案二:
自己写啊,先取出当前网页地址,然后根据../的个数来确定该取当前网页地址的第几级,然后把../后的东西拼上去就可以了
解决方案三:
string.format
解决方案四:
string.replace("..","http://www.177ks.com/")
解决方案五:
我倒,,上面几个就不能多想想,,我要是取的是最里面的页面,,"../../../../index.aspx"难道要都设上值,,一点点的替换呀...
解决方案六:
正则表达式会不会用啊?
时间: 2024-08-23 11:38:10