请懂的帮忙解释一下哈~html解析

问题描述

privatestaticDocumentFragmentparse(InputSourceinput)throwsException{DOMFragmentParserparser=newDOMFragmentParser();//HTML片段的DOM解析器。//实现了一个HTML文件。提供对文档中，它的身体和标题顶层元素。//几种方法创建所有（注释，文本，元素等），基本类型的新节点。这些方法创建新的节点，但不要放置在文档树上。这些节点可能被放置在文档树使用HTMLDocumentImpldoc=newHTMLDocumentImpl();try{//设置SAX2解析器中的任何功能的状态。//设置SAX2解析器中的任何功能的状态。解析器可能无法识别功能，如果它不认识它，它可能无法完成请求。parser.setFeature("http://cyberneko.org/html/features/augmentations",false);//是否将与HTML事件有关的infoset项包括在解析管道中。parser.setProperty("http://cyberneko.org/html/properties/default-encoding",defaultCharEncoding);//IANAencodingnames默认的HTML文件编码parser.setFeature("http://cyberneko.org/html/features/scanner/ignore-specified-charset",true);parser.setFeature("http://cyberneko.org/html/features/balance-tags/ignore-outside-content",false);parser.setFeature("http://cyberneko.org/html/features/balance-tags/document-fragment",true);parser.setFeature("http://cyberneko.org/html/features/report-errors",false);//是否报告错误}catch(SAXExceptione){}doc.setErrorChecking(false);DocumentFragmentres=doc.createDocumentFragment();//创建一个空DocumentFragment对象。DocumentFragmentfrag=doc.createDocumentFragment();//解析一个文档片段parser.parse(input,frag);//解析一个文档片段，解析成DocumentFragment对象，放到frag里=================??????????System.out.println(frag+"frag");//将子节点添加到所有节点的后面res.appendChild(frag);try{while(true){frag=doc.createDocumentFragment();parser.parse(input,frag);if(!frag.hasChildNodes())break;System.out.println("-newfrag,"+frag.getChildNodes().getLength()+"nodes.");res.appendChild(frag);}}catch(Exceptione){e.printStackTrace();}returnres;}

解决方案

解决方案二：
补充一下啊：红色部分输出的是null上面代码的意思是啥啊懂得帮我解释一下啊谢谢啦这个是网络dom树组装的一部分，是爬虫的一部分
解决方案三：
你的DocumentFragmentfrag=doc.createDocumentFragment();创建对象失败了，所以返回NULL,检查一下doc的配置
解决方案四：
输出frag是null，应该是创建失败了。请问doc的配置在哪里配置啊，搜集不到DocumentFragment这些的详细的资料啊
解决方案五：
该回复于2011-04-15 17:11:06被版主删除
解决方案六：
有木有人懂啊……
解决方案七：
你试试换个类来声明parser。
解决方案八：
？书上用的都是这个类
解决方案九：
我在《自己动手写网络爬虫》第七章页面风格树去噪的源码看到和你贴出来一样的代码，我在调试这段代码，也遇到这个问题，很棘手~~~话说你看的也是这个书么？

时间： 2024-09-20 05:36:03

请懂的帮忙解释一下哈~html解析

问题描述

解决方案

请懂的帮忙解释一下哈~html解析的相关文章

请大神帮忙解释一下以下代码的执行顺序

小弟刚学extjs，这段代码看不懂，请各位高手帮忙解释一下，谢谢

请懂本本的朋友帮忙给解释下这个配置

编程c语言-c中的null到底怎么理解？直接理解为0，可以吗，请各位大神帮忙解释

标准-请懂计算机的帮忙估算一下，我鼠标连续移动一秒，计算机要花费多少时间在鼠标移动这一事件的处理上

对象-java 抽象类有段代码没看懂!!!帮忙解释下

oracle11g-linux安装oracle11 rac集群，报错，请专家帮忙解释下是哪里问题，感谢

python二分法，请大神帮忙看看这个输出，求解释。非常捉急~

xml-XML文件问题，请大神看下并帮忙解释下，感激不尽