关于网站数据采集软件的问题

问题描述

看见一个网站数据采集软件,可以把卓越当当上的所有书目信息全部保存到本地。该软件还提供定时更新,修改价格等功能。(就不贴软件的网址了)。有没有知道这个软件的工作原理的?卓越那边是数据库,可那个软件怎么就能得到数据库的一些详细数据呢?在网上搜索了一下,好像有个说是什么webserver技术?知道的帮忙解答一下,谢谢!

解决方案

解决方案二:
这就是web蜘蛛啊!基本上的原理是:1、不断的发送http请求,然后得到服务器的数据,就像是使用IE浏览页面。2、得到服务器的数据后,进行分析,得到有用的字符串或者是数据。3、保存到本地服务器。至于服务器端,可以采用web的方式,如asp、jsp、php等。当然也可以采用web服务。
解决方案三:
分析HTML页面中的内容把需要的取出来,保存起来不断的发送请求,获取HTML页面,分析,保存
解决方案四:
mark
解决方案五:
原来的时候有个火车头,好象有源代码
解决方案六:
就是把网页的HTML爬下来,然后写正则分析页面的数据,再所数据保存到数据库中。。。很简单的。。HttpWebRequestrequest=(HttpWebRequest)WebRequest.Create(url);;WebResponseresponse=request.GetResponse();Streamstream=response.GetResponseStream();StreamReaderreader=newStreamReader(stream,Encoding.GetEncoding("gb2312"));//读取获得内容流stringHTML=reader.ReadToEnd();

时间: 2024-10-02 19:21:34

关于网站数据采集软件的问题的相关文章

网站静态页面生成及网站数据采集的攻防

采集|静态|数据|页面 本着互联网共享主义精神,特写此文献给建站新手,授人以鱼,不如授人以渔,本文所讲的只是方法和原理,希望大家看完此文,能够从中得到些帮助和启发. 本文从一个ASP程序员的角度用大量实例祥细介绍了动态网站如何生成静态页面原理,又从一个采集程序开发者的角度去祥细介绍了网站数据采集的原理及功防策略. 关于网站生成静态页面,为了让本文读者容易理解,文内列举了目前常用的多种生成静态页面的方法,其中用了很多的实例代码进行说明. 关于网站数据采集攻防,作者本身是一个采集程序的开发者,同时作

网站生成静态页面,及网站数据采集的攻、防原理和策略_小偷/采集

发布时间:2005年11月27日 晚 文章作者:翟振凯 (小琦) 交流方式: 个人站:http://www.xiaoqi.net     技术站:http://www.iisvs.net 商业站:http://www.iisvs.com QQ:53353866 22336848 关于本文:         本着互联网共享主义精神,特写此文献给建站新手,授人以鱼,不如授人以渔,本文所讲的只是方法和原理,希 望大家看完此文,能够从中得到些帮助和启发.         本文从一个ASP程序员的角度用大

android-基于GoogleFit的移动用户健康数据采集软件

问题描述 基于GoogleFit的移动用户健康数据采集软件 希望各位能给出一些思路,关于怎么运用Google fit,以及怎么实现于第三方设备的交互. 解决方案 通过 Android SDK Manager下载 Google Fit的SDK,里面有例子和文档

大学生卖傻瓜版网站开发软件

楚天都市报讯 (记者刘莉)建网站是个技术活儿,但大学生创业者罗光春却要推广一种"傻瓜版"网站建设软件,让不懂编程的人也能建设个性化网站. 罗光春去年6月从武汉理工大学环境艺术专业毕业,一次偶然机会,他接触到上海一家公司,该公司开发出一种叫做"云语言"的系统,用户可以不懂java.C语言等计算机编程语言,只要通过简单的拖动和设置即可建设自己的个性网站.还可用于开发企业ERP系统.手机智能应用程序,甚至还能用来编写游戏. 这项技术让罗光春十分兴奋,"这等于大大

“一启快”: 真正的免费网站加速软件

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 互联网的普及,越来越多的人开始自己做起了网站,于是,网站加速也得到了越来越多的人关注.可作为一名无钱.无技术.无备案的三无站长,在追寻网站加速道路上总是屡屡碰壁. 网站加速:不是你想的那么容易 首先没钱,就不能指望找人帮你做页面优化,自己动手又没有技术.即使投入了金钱,也会发现很多人做的优化也只是暂时的,一旦你的网站升级或者内容更新,又会碰到

评价网站服务器软件的几个方面

首先是管理方面的特点,主要有:是否图形方式配置.是否图形方式安装.有没有远程管理能力.可否利用简单网管协议配置和监视. 第二是从扩展能力来说,主要有:是否兼容.NET技术 .可否向64位移植.是否支持集群.能否使用IPv6协议.是否经过J2EE1.4的认证.是否兼容J2EE1.4标准. 第三个是其他的一些特征,主要有:是否具有多级的日志记录能力.是否支持微软的ISAPI接口.是否支持虚拟主机.有没有基于web的用户接口. 第四是软件的编程和脚本特征,主要有:是否提供软件的源代码.有没有自己的AP

谈谈网站与软件共振如何改变网站内容重复多余的被动局面

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 从搜索引擎放出石榴算法后,很多网站都步入了重新寻求高质量页面的路途,但是不少站长都发现不管网站的内容怎么去编辑,可以说整个网站的内容都没有多少新意可言,这也是常说的网站内容重复多余,面对这种情况作为一名站长如何改变网站内容重复多余的被动局面呢? 改变网站内容重复多余的被动局面就要求网站的内容标题与互联网中已经收录的不一样,内容要丰富与独特,而

C#开源汇总

原文:C#开源汇总 商业协作和项目管理平台-TeamLab 网络视频会议软件-VMukti 驰骋工作流程引擎-ccflow [免费]正则表达式测试工具-Regex-Tester Windows-Phone-7-SDK Excel-读写组件-ExcelLibrary .NET集成开发环境-MonoDevelop 电话软交换机-FreeSWITCH 开源操作系统-Cosmos 坦克机器人战斗仿真引擎-Robocode GIS控件-MapWindow .NET的ORM框架-MyBatis.NET We

如何查看MAC保存的网站软件密码

  如何查看MAC保存的网站软件密码 解决方法: 1. 打开 Finder > 应用程序 > 实用工具 > 钥匙串访问. 2. 点击左上角的 "登陆",右侧就能看到此前被 Mac记住登录密码的网站/软件等项目列表了. 3. 双击你想查看的项目,会弹出下图所示的详细信息.但你会发现密码部分是不显示的(任何人到钥匙串里都能直接查看的话,那还要密码干什么). 4. 点击最下面那个 "显示密码",会弹出窗口,让你输入登陆钥匙串的密码.如果你此前没设置的话,