如何提取网页中想要的信息并保存到text文件中

问题描述

如题,如何提取网页中想要的信息并保存到text文件中!

解决方案

解决方案二:
该回复于2011-04-11 10:56:55被版主删除
解决方案三:
把网页中想要显示的内容转发(或者提交)给一个servlet控制器在控制器里面通过IO然后写到text中去
解决方案四:
提取的话,用正则过滤。
解决方案五:
引用2楼javaxiaochouyu的回复:

把网页中想要显示的内容转发(或者提交)给一个servlet控制器在控制器里面通过IO然后写到text中去

提取网页中想要的内容,这个怎么弄呢··初研究爬虫,所以不太了解,请各位大虾指点
解决方案六:
引用3楼ylz2007的回复:

提取的话,用正则过滤。

首先根据url拿到目标页面的文本,然后正则过滤出需要的,以及该页面内的所有链接对获得的链接与目前拥有的链接比对,去掉访问过的,得到还未进行爬取的进行再次处理这样层层向外

时间: 2024-11-10 01:31:29

如何提取网页中想要的信息并保存到text文件中的相关文章

struct-结构体初始化问题, 定义了结构体和结构体数组,结构体中想存的数据写在了txt文件中,我该怎么做初始化

问题描述 结构体初始化问题, 定义了结构体和结构体数组,结构体中想存的数据写在了txt文件中,我该怎么做初始化 定义了结构体和结构体数组,结构体中想存的数据写在了txt文件中,我该怎么做初始化//定义结构体//struct achievement{int number; char name[20]; char sex; float achievement1achievement2achievement3;}tab_achievement[N]; 解决方案 写一个循环,从txt中读取数据,然后赋值

php表单的数据传递-php中从表格中得到的数据怎么样运用到另一个文件中

问题描述 php中从表格中得到的数据怎么样运用到另一个文件中 我想从表单中得到数据然后传到以下代码中的"tu" 代码如下: function getBoundary(){ var bdary = new BMap.Boundary(); bdary.get(" tu ", function(rs){ map.clearOverlays(); var count = rs.boundaries.length; for(var i = 0; i < count;

vs mfc 保存数据到txt-vs2005,mfc下,想把编辑框里的数据保存到txt文件里,怎么实现啊

问题描述 vs2005,mfc下,想把编辑框里的数据保存到txt文件里,怎么实现啊 vs2005,mfc下,想把编辑框里的数据保存到txt文件里,怎么实现啊 解决方案 响应事件 比如你定义一个按钮,当点击这个按钮保存文件 你对这个按钮绑定点击事件函数 在函数里面取得编辑框的内容,然后写入到一个文件里面! 解决方案二: 用GetWindowText来获得编辑框中的内容,用FILE结构体来读写文件就可以 解决方案三: 想要自动保存的话,就加一个判断编辑框内容是否改变的消息处理,如果改变了,那么再写入

android-把Bundle object保存到shared preference中

问题描述 把Bundle object保存到shared preference中 程序中有2个Activity Activity1 Activity2 Activity1: Intent intent= new Intent(Activity1.this,Acivity2.class); Bundle b=new Bundle(); b.putParcelableArrayList("actionArray", (ArrayList<? extends Parcelable>

android将Bitmap对象保存到SD卡中的方法

  android将Bitmap对象保存到SD卡中的方法          这篇文章主要介绍了android将Bitmap对象保存到SD卡中的方法,涉及Android读写SD卡数据的方法,需要的朋友可以参考下 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 Bitmap logoBitmap = BitmapFactory.decodeResourc

c#-如何把datagridview中的数据保存到SQL数据库中?VB.NET或C#

问题描述 如何把datagridview中的数据保存到SQL数据库中?VB.NET或C# 如下图:已经实现从EXCEL导入数据到Datagridview中,现在要把其中的数据保存到数据库的AAAie表里面.请用代码说明,谢谢. 解决方案 取数据用ado.net保存到SQL Server数据库.http://blog.csdn.net/lysc_forever/article/details/7697536 解决方案二: 方法1.创建一个数据库,表,表名自取,表的字段和Excel相同,取Excel

java-Java中获取多个鼠标动作并保存到point2d数组中,并使用此数组

问题描述 Java中获取多个鼠标动作并保存到point2d数组中,并使用此数组 Java中获取多个鼠标动作并保存到point2d数组中,并使用此数组建立另一个line2d数组,并画出此线段,我在建立line2d的时候老是提示index out of bounds请问这个怎么解决? 解决方案 你调用数组的时候,下标越界了.调用数组的时候判断一下长度吧--擦汗 解决方案二: java的数组(2)java 数组2

编程c语言-vs2013中 用C语言 可以把中文读入txt文件中吗 就把中文当作字符串处理么?

问题描述 vs2013中 用C语言 可以把中文读入txt文件中吗 就把中文当作字符串处理么? vs2013中 用C语言 可以把中文读入txt文件中吗 就把中文当作字符串处理么?求大神指教 解决方案 当然可以了http://zhidao.baidu.com/link?url=A5Tpq8C3qn1wt0L1fDdgGgNU6Vb-7uZ3_XjPNJ5Z4GRRrSoyX51ZQGWKkwFPK9Xf8ivy-d_CYB8umXGeluN6TK 解决方案二: 中文可以当字符,不过一个汉字占两个字节

文件操作-c语言中怎样将数值型数组写到txt文件中,并且打开文件时不是一堆乱码?

问题描述 c语言中怎样将数值型数组写到txt文件中,并且打开文件时不是一堆乱码? 求教!请问在对文件进行读写的时候,将一double型的数组写进文件中,之后打开文件,为什么都是乱码?怎么修改才能在文件中显示数值呢? 附写的代码: #include #include #include struct type { double data[2]; }; void main() { int i; struct type dataset[200]; FILE *fp; if(!(fp=fopen("dat