如何获得源文件中的链接

问题描述

<h3><ahref="http://www.edeng.cn/13/jiaju/"target="_blank">家居黄页</a></h3><p><ahref="http://www.edeng.cn/13/riyongbaihuo/"title="日用百货"target="_blank">日用百货</a>|<ahref="http://www.edeng.cn/13/jiajuzhuangshi/"title="家居装饰"target="_blank">已经获得了源代码GetSource,源文件中有如上代码,我现在要写个方法,就是要获得所有的链接,并且没有title属性的链接要删除掉,然后把得到的链接存进数据库。最后得到的结果应该是如下:http://www.edeng.cn/13/riyongbaihuo/http://www.edeng.cn/13/jiajuzhuangshi/最好是能用substring进行截取本人是新手,希望大家多多帮忙啊,多加点注释

解决方案

解决方案二:
stringtempStr=File.ReadAllText(@"C:DocumentsandSettingsAdministrator桌面Test.txt",Encoding.GetEncoding("GB2312"));//读取txstringpattern=@"(?i)<a[^>]+?href=(['""]?)([^'""]+)1[^>]+?title[^>]+?>";string[]ss=Regex.Matches(tempStr,pattern).Cast<Match>().Select(a=>a.Groups[2].Value).ToArray();/**[0]"http://www.edeng.cn/13/riyongbaihuo/"string[1]"http://www.edeng.cn/13/jiajuzhuangshi/"string*/

时间: 2024-07-29 15:13:08

如何获得源文件中的链接的相关文章

从网页源文件中得到链接。

alimama_pid="mm_10096109_566393_892186"; alimama_titlecolor="0000FF"; alimama_descolor ="000000"; alimama_bgcolor="FFFFFF"; alimama_bordercolor="E6E6E6"; alimama_linkcolor="008000"; alimama_botto

xcode-如何释放Xcode中的链接列表

问题描述 如何释放Xcode中的链接列表 有一个结构: struct list{ struct list *next; int temp;}; 用下面的方法释放: // free linked liststruct list *head_list = NULL;struct list *current_list = NULL;struct list *prev_list = NULL;current_list = head_list;while (current_file_info_arr !=

如何做好SEO中的链接策略

互联网是由上百上千万的网页组成,而网页中不可忽视的是链接策略,一个稳定的链接策略对于搜索搜索引起优化而言非常重要,这也是作为SEOer必须掌握的基本知识.没有经过优化的网页很难能够在搜索引起中展现较好的排名,难以获得更高的展现量.因此不少企业都采取SEO方式合理的将网页更过的展现给用户.在搜索引擎蜘蛛爬行中都必须依靠众多的链接来完成索引过程,这样逐渐将获取的众多网页存储起来,进行后期排序过程.可见SEO过程中,链接策略是非常重要不可忽视的环节. 站内链接策略: SEO主要包含站内优化和站外优化,

ASP.NET实现抓取网页中的链接

asp.net|链接|网页 输入一个地址,就可以把那个网页中的链接提取出来,下面这段代码可以轻松实现,主要的是用到了正则表达式.      GetUrl.ASPx代码如下:      <%@ Page Language="<a href="http://dev.21tx.com/language/vb/" target="_blank">VB</a>" CodeBehind="GetUrl.aspx.vb&

Outlook 2010打不开邮件中的链接

Outlook 2010 突然打不开邮件中的链接,提示:This operation has been canceled due to restrictions in effect on this computer. Please contact your system administrator 可尝试这几种方法: 微软的官方解决方案: http://support.microsoft.com/kb/310049 如果还不行,试试如下的方法: http://www.msoutlook.info

在Word 2010文档中断开链接

对于Word 2010文档中的链接对象,用户可以根据实际需要随时断开Word文档和链接对象之间的链接,具体操作步骤如下所述 : 第1步,打开Word 2010文档窗口,右键单击需要断开链接的对象.在打开的快截菜单中指向"链接的-对象 "级联菜单,并在打开的下一级菜单中选择"链接"命令,如图2011082001所示. 图2011082001 选 择"链接"命令 第2步,打开"链接"对话框,在链接列表中选中需要断开的链接,并单击&

在Word 2010中插入链接到文件的对象

在Word 2010文档中可以插入链接到文件的对象,当被链接的原始文件更新后,插入到Word文档中的对象也将同步更新.而嵌 入到Word文档中的文件无法实现与原始文件的同步更新.在Word 2010文档中插入链接到文件的对象步骤如下所述: 第1步,打开Word 2010文档窗口,将插入条光标定位到需要插入对象的位置.切换到"插入"功能区,在" 文本"分组中单击"对象"按钮,如图2011081704所示. 图2011081704 单 击"

在Word 2010文档中更改链接文件

在Word 2010文档中,如果链接文件的名称或位置发生变化,则用户可以根据实际需要更改链接文件的链接地址或数据范围, 操作步骤如下所述: 第1步,打开Word 2010文档窗口,右键单击链接对象.在打开的快捷菜单中指向"链接的-对象"级联菜 单,并在打开的下一级菜单中选择"链接"命令,如图2011081904所示. 图2011081904 选 择"链接"命令 第2步,打开"链接"对话框,在链接列表中选中需要更改链接地址或数据

在Word 2010中创建链接向指定文件的超链接

在Word 2010文档中创建超链接时,链接地址不仅仅可以指向网页,还可以指向包括Word文档.Excel文件等在内的任意文件 .不过只有链接向本机程序支持的文件,才能在点击超链接时打开该文件.在Word 2010文档中创建链接向指定文件超链接的步 骤如下所述: 第1步,打开Word 2010文档窗口,选中需要创建超链接的文字.切换到"插入"功能区,在"链接" 分组中单击"超链接"按钮,如图2011080904所示. 图2011080904 单