火车采集器程序结构中的开始菜单介绍

火车采集器程序结构中的开始菜单介绍

 

  1.新建分组

  新建一个任务分组,选择所属分组,确定分组名称和备注。

  2.新建任务

  确定所属分组,新建一个任务,填写任务名称并保存。

  3.Web发布配置

  Web发布配置定义了如何登陆一个网站以及向该网站提交数据。

  主要涉及到登录信息的获取,网站编码设定,栏目列表的获取,以及使用数据测试发布效果。

  详细教程后续分解。


  4.Web发布模块

  可以定义网站登录,获取栏目列表,获取网页随机值,内容发布参数,以及上传文件,构造发布数据等高级功能。

  详细教程后续分解。


  5.数据库发布配置

  数据库发布配置定义了数据库链接信息的设置以及数据库模块的选择。

  详细教程后续分解。

  6.数据库发布模块

  用于编辑数据库的发布模块,方便我们将数据发布到配置好的数据库中。

  火车采集器可选mysql、sqlserver、oracle、access四种数据库类型,在文本输入框中填写sql语句

  (需有数据库相关知识),并可使用标签替换相应数据。也可在采集器模块文件夹中加载某一模块进行编辑。

  详细教程后续分解。


  7.计划任务

  设置列表中采集任务的启动计划,可每间隔、每天、每周、仅一次、或自定义Cron表达式,

  (Cron表达式的写法可参考相关术语中的介绍)。保存设置后,任务即可按照设置执行。

  详细教程后续分解。


  8.插件管理

  插件是可以用来扩展火车采集器功能的程序

  火车采集器V9支持PHP源码、C#源码、C#类库三种类型的插件,

  可用于扩展http请求、内容处理和文件下载的功能,并可以分别进行测试。

  详细教程后续分解。

  9.http二级代理

  网络中的代理服务器,可以代理网络用户去取得所需要的网络信息。

  代理的功能有可以突破自身ip的访问限制访问国外站点,访问一些单位或团体内部资源,

  突破电信的ip封锁和隐藏真实的ip等。

  火车采集器V9支持http代理、socket4和socket5代理。

  详细教程后续分解。


  10.http模拟请求

  可以设置如何发起一个http请求,包括设置请求信息,返回头信息。并具有自动提交的功能。

  详细教程后续分解。

时间: 2025-01-21 07:31:29

火车采集器程序结构中的开始菜单介绍的相关文章

火车采集器的学习建议

  火车采集器的学习建议           火车采集器是一个非常专业的数据抓取和数据处理软件,对软件使用者有较高的技术要求, 使用者要有基本的HTML基础,能看得懂网页源码,网页结构. 同时如果用到web发布或数据库发布,则对自己文章系统及数据存储结构要非常了解. 如果您相关基础薄弱,则需要花时间学习相关知识并多看使用手册,才可以 掌握程序的使用. 当然对HTML和数据库不是很了解,是不是就不可以使用火车采集器了呢? 也不完全是,我们程序在做了许多工作以帮助使用者更快的上手,程序做了许多 演示

火车采集器的相关术语介绍

  火车采集器的相关术语介绍           1.采集任务 采集任务是火车采集器中对于数据采集和数据发布任务的完整配置,包含采集规则和发布模块. 2.采集规则 即我们对如何采集和采集什么的问题给出一些设置让采集器按照设置的规则来执行, 这个设置可以从火车采集器里面导出保存为.ljobx文件,也可以再次导入火车采集器. 3.发布模块 在火车采集器中,发布模块是对"将已经采集到的数据发布到哪里"进行的设置. 包括WEB在线发布模块和数据库发布模块,其设置分别可以导出保存为.wpm文件和

什么是火车采集器?

  什么是火车采集器? 火车采集器是一款专业的互联网数据抓取.处理.分析,挖掘软件, 可以灵活迅速地抓取网页中大量非结构化的文本,图片等资源信息, 然后通过一系列的分析处理,准确挖掘出所需数据. 并可以选择发布到网站后台.导入数据库或者保存在本地Excel,Word等格式的文件中. 火车采集器历经十年的升级更新,积累了大量用户和良好口碑,是目前最受欢迎的网页数据采集软件. 火车采集器V9程序目录 |-Configuration用户配置保存目录 |-Synonym 用户同义词保存目录 |-Cate

20070910更新的火车采集器3.2正式版发布下载_应用技巧

火车头团队一直致力于为广大网站站点提供数据信息和实用的工具软件, 开发团队秉承"专业,专注,沉着,创新"的理念,用实力铸造精品. 经过2007年3月至2007年9月,近5个多个月的研发及几个版本的内部测试,一个具有全新内核和架构的强大信息采集,数据加工软件--火车采集器3.2版 呈献在大家面前,为始终支持和关爱火车软件发展的站长们献上一份谢礼.     火车采集器1.X-3.X一直免费使用并深受广大站长欢迎,通过大家对3.2测试版的反馈,无论在性能,功能和稳定性上面3.2都是以前版本无

火车采集器V7V8版本无法登录怎么办

原因分析 非常抱歉,因为原V7V8版本验证服务器失效和故障,部分朋友无法登录软件.出现这种情况,请下载本文附件包,解压其中对应版本中的文件,替换掉System文件夹中对应文件,然后重新登录即可. 解决办法 1.点击下载更新包:http://board.locoy.com/content/uploadfile/201605/v7v8.rar v7v8解压包文件如下 v8.4解压包如下 现在我们只要把lscommon.dll文件放到system中直接替换即可了,这样的话再登录即可成功登录了 2.直接

火车采集器 免费版使出收费版本功能实现原理_php技巧

hi 各位免费火车头采集器的采友: 火车头免费版本不支持采集结果的外挂处理,比如采用php来辅助处理结果,而火车头本身对于正则表达式的不完整支持, 导致对于采集一些有混淆文字的内容效果不好,那么咱们怎么做到过滤那些混淆字串呢? 其实很简单--采用服务器端过滤 比如采集发送到服务器端是: $_POST = array("subject"=> "这里是标题","content"=> "<div class='1fadfaf

火车头采集器炎黄网络特别版出炉

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 火车采集器(Locoy.com)是一个功能强大的数据采集软件.使用它,您可以很容易的从网页上抓取文字,图片,文件等资源.程序支持远程下载图片文件,支持网站登陆后信息采集,支持探测文件真实地址,支持代理,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等.同时,软件具有极高的稳定性,可以多线程,多任务的工作,您可以用它进行大批量数据的更新

火车头采集器3.2SP5 VIP破解版附注册机下载_常用工具

1.首先在你的机器上运行 LocoyKeygen.exe.  注意,如果运行时提示 过期,请将系统时间调整到2008-5-8号再运行.  运行会出现一个 OK 的提示框,点击后,在当前目录下会生成授权文件:  LocoyLicence.dll.  将这个文件复制到 采集器安装目录中.  将VIP文件 目录中的文件也复制到 采集器安装目录中.  执行 main.exe 即可.  火车采集器(Locoy Spider) 是一款供各大主流文章系统.论坛系统等使用的基于.NET编写的多线程桌面内容采集发

火车头采集器3.0采集图文教程_php技巧

以采集示例详解部分功能今天要给大家做示例的网站是163的 娱乐频道 这个应该是个比较通用和实用的规则,下面开始.如果您是火车采集器的老手,那么您可以参考下,因为我要讲解的会有违传统的思维:如我您是新手那么您最好能仔细看下,因为这将加快您的入门,同时在以后给您节省很多时间.以下是一些采集的基本步骤,您可以灵活运用:一.建立站点1.请先打开火车采集器,新建站点,看下图:为了方便管理您可以为您的站点取任何的您觉得易记的名称,但是我建议用目标源的名字作为站点的名称有利于日后的管理,如下图大部分的站点,通