解析xHTML源码的DLL组件AngleSharp介绍_实用技巧

AngleSharp是基于.NET(C#)开发的专门为解析xHTML源码的DLL组件。

项目地址:https://github.com/FlorianRappl/AngleSharp

国内:Jumony
github地址: https://github.com/Ivony/Jumony

国外:Html Agility Pack
项目地址:http://htmlagilitypack.codeplex.com/

具体大家可以自行搜索对比三者的区别和性能。接下来咱们主要讨论主角是AngleSharp

引入AngleSharp至项目,用NuGet工具执行命令(其实我是在装逼。) Install-Package AngleSharp

在项目中添加引用Using AngleSharp

首先我们获取CnBlogs首页的HTML源代码

static public string GetHtml()
{
  HttpWebRequest myReq =
  (HttpWebRequest)WebRequest.Create("http://www.jb51.net");
  HttpWebResponse response = (HttpWebResponse)myReq.GetResponse();
  // Get the stream associated with the response.
  Stream receiveStream = response.GetResponseStream();

  // Pipes the stream to a higher level stream reader with the required encoding format.
  StreamReader readStream = new StreamReader(receiveStream, Encoding.UTF8);

  return readStream.ReadToEnd();
}

获取jb51首页当前所有博客文章的标题

private static void Main(string[] args) { //找出所有文章标题 string cnblogsHtml = GetHtml();

  //加载HTML
  var document = DocumentBuilder.Html(cnblogsHtml);
  //这里必须要使用== 不能使用Equals
  var titleItemList = document.All.Where(m => m.ClassName == "titlelnk");
  int iIndex = 1;
  foreach (var element in titleItemList)
  {
    Console.WriteLine(iIndex + ":" + element.InnerHtml);
    iIndex++;
  }
}

以上代码输出内容:

1:JNDI学习总结(三)——Tomcat下使用Druid配置JNDI数据源
2:我们前端是怎么跟设计师沟通的
3:MVC5+EF6 入门完整教程六
4:试议常用Javascript 类库中 throttle 与 debounce 辅助函数的区别
5:孤独的走过年轻
6:上周热点回顾(11.10-11.16)
7:Android动画-补间(Tween)动画
8:朴素贝叶斯算法的python实现
9:MVC三层级联方式
10:C# 标签(条码)的打印与设计(一)
11:OpenCASCADE Make Primitives-Box
12:基于solr实现hbase的二级索引
13:(十六)WebGIS中偏移补偿量引发的问题之探讨
14:javascript小游戏--生命游戏
15:Android动画-帧动画
16:C# Socket学习笔记一
17:lua表排序
18:ZooKeeper系列 第一篇:ZooKeeper快速入门
19:【插件开发】—— 9 编辑器代码分块着色-高亮显示!
20:华盛顿大学计算机视觉课程笔记(一)

官方有提供详细的文档和例子,大家可以去看一下。此插件最大的优势:支持输出Javascript、Linq语法、ID和Class选择器、动态添加节点。实为.NET开发之利器。

AngleSharp文档:https://github.com/FlorianRappl/AngleSharp/wiki/Documentation

AngleSharp例子(Demo):https://github.com/FlorianRappl/AngleSharp/wiki/Examples

以上是小编为您精心准备的的内容,在的博客、问答、公众号、人物、课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索anglesharp
, anglesharp介绍
解析xhtml
anglesharp、anglesharp 中文文档、anglesharp 教程、c sharp 工控组件、sharp,以便于您获取更多的相关知识。

时间: 2024-11-02 19:56:46

解析xHTML源码的DLL组件AngleSharp介绍_实用技巧的相关文章

asp.net中Fine Uploader文件上传组件使用介绍_实用技巧

最近在处理后台数据时需要实现文件上传.考虑到对浏览器适配上采用Fine Uploader. Fine Uploader 采用ajax方式实现对文件上传.同时在浏览器中直接支持文件拖拽[对浏览器版本有要求类似IE版本必须是9或是更高的IE10].在不同浏览器中提供统一用户体验.该组件基本覆盖目前所有主流浏览器.同时没有任何第三方组件依赖.相当Clear.在服务器端已经覆盖支持了ASP.NET/ColdFusion/Java/Node.js/Perl/PHP/Python. 对上传细节类似限制文件大

.NET微信开发之PC 端微信扫码注册和登录功能实现_实用技巧

一.前言 先声明一下,本文所注重点为实现思路,代码及数据库设计主要为了展现思路,如果对代码效率有着苛刻要求的项目切勿照搬. 相信做过微信开发的人授权这块都没少做过,但是一般来说我们更多的是为移动端的网站做授权,确切来说是在微信端下做的一个授权.今天遇到的一个问题是,项目支持微信端以及 PC 端,并且开放注册.要求做到无论在 PC 端注册或者是在微信端注册之后都可以在另外一个端进行登录.也就是说无论 PC 或是微信必须做到"你就是你"(通过某种方式关联). 二.寻找解决方案 按传统的方式

实例解析Java中的synchronized关键字与线程安全问题_实用技巧

首先来回顾一下synchronized的基本使用: synchronized代码块,被修饰的代码成为同步语句块,其作用的范围是调用这个代码块的对象,我们在用synchronized关键字的时候,能缩小代码段的范围就尽量缩小,能在代码段上加同步就不要再整个方法上加同步.这叫减小锁的粒度,使代码更大程度的并发. synchronized方法,被修饰的方法成为同步方法,其作用范围是整个方法,作用对象是调用这个方法的对象. synchronized静态方法,修饰一个static静态方法,其作用范围是整个

解析linq to xml操作XML的示例分析_实用技巧

.Net中的System.Xml.Linq命名空间提供了linq to xml的支持.这个命名空间中的XDocument,XElement以及XText,XAttribute提供了读写xml文档的关键方法.1. 使用linq to xml写xml:使用XDocument的构造函数可以构造一个Xml文档对象:使用XElement对象可以构造一个xml节点元素,使用XAttribute构造函数可以构造元素的属性:使用XText构造函数可以构造节点内的文本.如下实例代码: 复制代码 代码如下: cla

解析WPF绑定层次结构数据的应用详解_实用技巧

在实际项目应用中会存在多种类型的层次结构数据,WPF提供了良好的数据绑定机制.其中运用最频繁的就是ListBox和TreeView控件. 一.ListBox和TreeView控件的区别1.ListBox显示单层次数据集合,TreeView可以显示单层次和多层次数据集合:2.通过ListBox在UI层面可以展示良好的数据显示效果,对数据集合可以进行排序.分组.过滤操作:3.TreeView显示为一个多层次的数据集合为树形结构,通过Templete和Style属性同样可以为其定义良好的数据显示效果:

Asp.Net数据控件引用AspNetPager.dll分页实现代码_实用技巧

1.也许讲解有点初级,希望高手不要"喷"我,因为我知道并不是每一个人都是高手,我也怕高手们说我装13,小生不才: 2.如有什么不对的地方,还希望大家指出,一定虚心学习: 3.本文属于作者原创,尊重他人劳动成果,转载请注明作者,谢谢. 下面开讲: 第一步:首先是下载一个AspNetPager.dll 下载地址 AspNetPager.rar第二步:在项目的bin文件夹下引用AspNetPager.dll 如图: 第三步:在工具箱添加AspNetPager控件,如图: 接下来再如图: 这样

TrieTree服务-组件构成及其作用介绍_实用技巧

上一篇中我们对TrieTree服务有了一个整体的了解,不知道大家下载完之后有没有真正玩过这个TrieTree服务,如果你还没有玩过,没关系,本文将一步步教你配置和使用TrieTree服务. TrieTree服务由几大组件组成,如下图 Dictionary组件是核心库,主要提供基本数据定义.配置信息定义,数据结构表示,同时也提供了POSType(参考Pangu的Part of Speech定义).由于TrieTree是利用内存来加载数据的,所以这个组件的设计直接决定了内存的占用大小和数据查询性能.

asp.net下通过泛解析和伪静态实现二级域名的实现方法_实用技巧

虽然最后是实现了,但身为程序员的我,却总是感觉利用其他不开源的组件自己总把握不了技术的核心.其实在net中微软已经为我们留下了接口,让我们为所欲为了. 首先我们可以通过一张图大概了解下.net的生命周期. 从 上图可以看出来,针对每个不同用户的请求,服务器都会创建一个新的HttpContext实例直到请求结束,服务器销毁这个实例.而 Ihttpcontext是httpcontext对外公开的接口,它包含了2个方法:dispose()和Init(HttpApplication context),我

解析ABP框架中的数据传输对象与应用服务_实用技巧

数据传输对象(DTOs)数据传输对象(Data Transfer Objects)用于应用层和展现层的数据传输. 展现层传入数据传输对象(DTO)调用一个应用服务方法,接着应用服务通过领域对象执行一些特定的业务逻辑并且返回DTO给展现层.这样展现层和领域层被完全分离开了.在具有良好分层的应用程序中,展现层不会直接使用领域对象(仓库,实体). 1.数据传输对象的作用:为每个应用服务方法创建DTO看起来是一项乏味耗时的工作.但如果你正确使用它们,这将会解救你的项目.为啥呢? (1)抽象领域层 (Ab