如何提取网页中想要的信息并保存到text文件中

问题描述

如题，如何提取网页中想要的信息并保存到text文件中！

解决方案

解决方案二：
该回复于2011-04-11 10:56:55被版主删除
解决方案三：
把网页中想要显示的内容转发（或者提交）给一个servlet控制器在控制器里面通过IO然后写到text中去
解决方案四：
提取的话，用正则过滤。
解决方案五：
引用2楼javaxiaochouyu的回复:

把网页中想要显示的内容转发（或者提交）给一个servlet控制器在控制器里面通过IO然后写到text中去

提取网页中想要的内容，这个怎么弄呢··初研究爬虫，所以不太了解，请各位大虾指点
解决方案六：
引用3楼ylz2007的回复:

提取的话，用正则过滤。

首先根据url拿到目标页面的文本，然后正则过滤出需要的，以及该页面内的所有链接对获得的链接与目前拥有的链接比对，去掉访问过的，得到还未进行爬取的进行再次处理这样层层向外

时间： 2024-11-10 01:31:29

如何提取网页中想要的信息并保存到text文件中的相关文章

struct-结构体初始化问题，定义了结构体和结构体数组，结构体中想存的数据写在了txt文件中，我该怎么做初始化

问题描述结构体初始化问题, 定义了结构体和结构体数组,结构体中想存的数据写在了txt文件中,我该怎么做初始化定义了结构体和结构体数组,结构体中想存的数据写在了txt文件中,我该怎么做初始化//定义结构体//struct achievement{int number; char name[20]; char sex; float achievement1achievement2achievement3;}tab_achievement[N]; 解决方案写一个循环,从txt中读取数据,然后赋值

php表单的数据传递-php中从表格中得到的数据怎么样运用到另一个文件中

问题描述 php中从表格中得到的数据怎么样运用到另一个文件中我想从表单中得到数据然后传到以下代码中的"tu" 代码如下: function getBoundary(){ var bdary = new BMap.Boundary(); bdary.get(" tu ", function(rs){ map.clearOverlays(); var count = rs.boundaries.length; for(var i = 0; i < count;

vs mfc 保存数据到txt-vs2005，mfc下，想把编辑框里的数据保存到txt文件里，怎么实现啊

问题描述 vs2005,mfc下,想把编辑框里的数据保存到txt文件里,怎么实现啊 vs2005,mfc下,想把编辑框里的数据保存到txt文件里,怎么实现啊解决方案响应事件比如你定义一个按钮,当点击这个按钮保存文件你对这个按钮绑定点击事件函数在函数里面取得编辑框的内容,然后写入到一个文件里面! 解决方案二: 用GetWindowText来获得编辑框中的内容,用FILE结构体来读写文件就可以解决方案三: 想要自动保存的话,就加一个判断编辑框内容是否改变的消息处理,如果改变了,那么再写入

android-把Bundle object保存到shared preference中

问题描述把Bundle object保存到shared preference中程序中有2个Activity Activity1 Activity2 Activity1: Intent intent= new Intent(Activity1.this,Acivity2.class); Bundle b=new Bundle(); b.putParcelableArrayList("actionArray", (ArrayList<? extends Parcelable>

android将Bitmap对象保存到SD卡中的方法

android将Bitmap对象保存到SD卡中的方法这篇文章主要介绍了android将Bitmap对象保存到SD卡中的方法,涉及Android读写SD卡数据的方法,需要的朋友可以参考下 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 Bitmap logoBitmap = BitmapFactory.decodeResourc

c#-如何把datagridview中的数据保存到SQL数据库中？VB.NET或C#

问题描述如何把datagridview中的数据保存到SQL数据库中?VB.NET或C# 如下图:已经实现从EXCEL导入数据到Datagridview中,现在要把其中的数据保存到数据库的AAAie表里面.请用代码说明,谢谢. 解决方案取数据用ado.net保存到SQL Server数据库.http://blog.csdn.net/lysc_forever/article/details/7697536 解决方案二: 方法1.创建一个数据库,表,表名自取,表的字段和Excel相同,取Excel

java-Java中获取多个鼠标动作并保存到point2d数组中，并使用此数组

问题描述 Java中获取多个鼠标动作并保存到point2d数组中,并使用此数组 Java中获取多个鼠标动作并保存到point2d数组中,并使用此数组建立另一个line2d数组,并画出此线段,我在建立line2d的时候老是提示index out of bounds请问这个怎么解决? 解决方案你调用数组的时候,下标越界了.调用数组的时候判断一下长度吧--擦汗解决方案二: java的数组(2)java 数组2

编程c语言-vs2013中用C语言可以把中文读入txt文件中吗就把中文当作字符串处理么？

问题描述 vs2013中用C语言可以把中文读入txt文件中吗就把中文当作字符串处理么? vs2013中用C语言可以把中文读入txt文件中吗就把中文当作字符串处理么?求大神指教解决方案当然可以了http://zhidao.baidu.com/link?url=A5Tpq8C3qn1wt0L1fDdgGgNU6Vb-7uZ3_XjPNJ5Z4GRRrSoyX51ZQGWKkwFPK9Xf8ivy-d_CYB8umXGeluN6TK 解决方案二: 中文可以当字符,不过一个汉字占两个字节

文件操作-c语言中怎样将数值型数组写到txt文件中，并且打开文件时不是一堆乱码？

问题描述 c语言中怎样将数值型数组写到txt文件中,并且打开文件时不是一堆乱码? 求教!请问在对文件进行读写的时候,将一double型的数组写进文件中,之后打开文件,为什么都是乱码?怎么修改才能在文件中显示数值呢? 附写的代码: #include #include #include struct type { double data[2]; }; void main() { int i; struct type dataset[200]; FILE *fp; if(!(fp=fopen("dat