java 讀取html文件內容

问题描述

我要讀取html文件裡面的內容如:<title>內容</title><p>內容</p>求詳細的方法和代碼

解决方案

解决方案二:
思路如下:先把HTML转化为XML,然后再解析XML。这儿有一个我未完成的读取开心网网页并解析的例子,你可以参考下:
解决方案三:
htmlparser或正则
解决方案四:
regex
解决方案五:
apache的htmlclient+htmlparser可以帮你
解决方案六:
小项目就用正则表达式,大的就研究htmlparser吧

时间: 2024-12-26 10:17:34

java 讀取html文件內容的相关文章

讀取文件內容並在頁面上顯示

问题描述 如何讀取服務器的文件內容,並顯示在頁面上?不管是什麼文件? 解决方案 解决方案二:不同文件使用不同读出方法啊你做个抽象类,里面做个抽象方法,然后继承,提供不同实现.然后判断读取的文件类型,然后选择不同方法吧解决方案三:using(StreamReadersr=newStreamReader("e:\1.txt")){stringtxt=sr.ReadToEnd();Response.Write(txt);}解决方案四:引用2楼chen_lichao的回复: using(Str

scoket傳輸XML文件內容

问题描述 想要將一個XML文件裡的內容:如:<bookstore><bookgenre="fantasy"ISBN="2-3631-4"><PN>a</PN><Model>asddfadfa</Model><OP>fas</OP><Line>dfasdf</Line><UpTime>2008/11/18下午01:39:50</Up

Csharp 讀寫文件內容搜索自動彈出 AutoCompleteMode

using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Windows.Forms; using System.IO; namespace WindowsFormsStyle { public partial clas

求幫忙,如何用POI同時從EXCEL內讀取圖片和內嵌EXCEL呢,兩個單獨都可實現!

问题描述 求好人幫忙,如何同時從EXCEL內讀取圖片和內嵌EXCEL呢,兩個單獨都可實現!代碼如下:importjava.io.FileInputStream;importjava.io.FileOutputStream;importjava.util.HashMap;importjava.util.List;importjava.util.Map;importjavassist.bytecode.Descriptor.Iterator;importorg.apache.poi.hslf.use

ASP.NET技巧:將datagrid控件內容輸出到excel文件

asp.net|datagrid|datagrid控件|excel|技巧 一個將datagrid控件內容輸出到excel文件的demo. 生成EXCEL文件#region 生成EXCEL文件public void setToExcel(){//            Response.Clear(); //            Response.Buffer= true; //            Response.Charset="utf-8";         if (efor

pdfbox讀取pdf問題(高手進)

问题描述 現在公司要讀取客戶的pdf技術文件,pdf裡由好多表格組成,,每個表格前都有一個特殊的關鍵字,,我怎樣才能定位到我要讀取的表格啊,,,高手請指點 解决方案 解决方案二:没用过..帮顶~解决方案三:現在轉個方向了,怎樣把pdf裡的每一頁轉為圖片啊,,,我用C#調用pdfbox時在BufferedImageimage=page.convertToImage();報錯,,,望高手指點,,或有沒有其也更好的技術啊..解决方案四:等待答案,帮顶解决方案五:该回复于2012-04-19 15:51

C#和Java中执行SQL文件脚本的代码(非常有用)

原文:C#和Java中执行SQL文件脚本的代码(非常有用) 我们在做程序的时候有事后会涉及到利用sql文件 直接执行,可是在sql文件中有很多注释,我们要一句一句的执行首先必须的得把sql文件解析 去除其中的注释,还有把每一句sql语句取出来,然后再利用各个平台中的数据库相关执行它.   接下来放代码! java版本的 001 package com.zz; 002   003 import java.io.*; 004 import java.util.ArrayList; 005 impor

在頁面上顯示xml節點及內容

问题描述 StreamReadersr=newStreamReader(path);stringtxt=sr.ReadToEnd();Response.Write(txt);以上運行的時候只是顯示了xml檔裡的內容,並沒有顯示節點.要怎麼樣寫才能顯示節點及內容? 解决方案 解决方案二:XmlDocumentdoc=newXmlDocument();doc.LoadXml("...");XmlNoderoot=doc.DocumentElement;XmlNodenode=root.Se

html-如何用java抓取网页隐藏音频链接

问题描述 如何用java抓取网页隐藏音频链接 我想用java抓取荔枝FM网站上所有的音频文件,但是直接查看网页源码发现找不到页面的音频链接http://www.lizhi.fm/#/25734/20075765977745926,但是我用谷歌的Developer Tools能找到这个链接http://cdn.lizhi.fm/audio/2015/05/16/20075765977745926_hd.mp3,我有点不知道怎么搞了,求帮忙看看什么情况 解决方案 搜索这个页面的data-url 解决