浅析Spider Studio数据挖掘集成开发环境

传统的多线程蜘蛛程序虽然采集速度快, 但是明明不需要所有内容, 却胡子眉毛一把抓, 将整个网页都下载下来当作一个文本进行处理. 由于网页内容参差不齐, 所以抓取质量常常无法保证; 在面对由ajax等动态技术呈现的信息时更是束手无策. 自从所见即所抓技术发明之后, 这一切便得到了改观. Spider Studio 以所见即所抓为核心, 以脚本的方式来完成抓取, 并且提供了大量辅助功能.

功能特点

1. C# 脚本化抓取

比如下面这段代码会打开本页并将产品简介提取出来显示在对话框中.

开发环境-spiderstudio">

更多脚本使用信息请查看 所见即所抓脚本指南

2. 可视化定位

用鼠标在页面选择需要的内容, 开发环境将自动计算对应元素的JQuery表达式, 方便我们对其进行查看测试或者运用到脚本中.

查看本栏目更多精彩内容:http://www.bianceng.cnhttp://www.bianceng.cn/Programming/extra/

时间: 2024-09-13 13:42:42

浅析Spider Studio数据挖掘集成开发环境的相关文章

Visual Studio 2005 集成开发环境

Visual Studio 2005 集成开发环境   作者:ChinaBang时间:2005-04-10Blog: blog.csdn.net/shuaihj                 摘要:IDE增强     内容: Microsoft Visual Studio 2005 包含许多对开发环境新的增强.创新和提高,其目的在于使 Visual  .NET 开发人员比以往更加高效.本章探讨其中的一些功能,并且阐述开发人员如何使用它们以更快.更准确地编写代码. 提示除其他对 IDE 的"改进

使用Android Studio搭建Android集成开发环境(图文教程)

  [正文] 之前本人在博客中讲到使用IntelliJ IDEA 13搭建Android集成开发环境(图文教程).昨天重装系统了,所以为了跟上时代,今天来试一下Android Studio的使用.之前看过几篇博客,介绍了如何使用Android SDK搭建Android集成开发环境,但是感觉不详细,所以打算自己整理一个详细的图文教程,希望能对新手(包括自己)有所帮助. [开发环境] 物理机版本:Win 7旗舰版(64位) Java SDK版本:jdk1.8.0_20(64位) Android SD

图文详解Android Studio搭建Android集成开发环境的过程_Android

有很长一段时间没有更新博客了,最近实在是太忙了,没有时间去总结,现在终于可以有时间去总结一些Android上面的东西了,很久以前写过这篇关于使用Android Studio搭建Android集成开发环境,不过一直没有发表出来,写这篇文章的目的是记录一下Android开发环境的搭建过程,这篇文章写得一般般,主要是记录了整个搭建过程,没什么技术含量,觉得有帮助的朋友就看一下! 一.Android Studio简单介绍 2013年GoogleI/O大会首次发布了Android Studio IDE(A

Zend Studio v8.0.1发布 PHP语言集成开发环境

Zend Studio是Zend Technologies开发的PHP语言集成开发环境(Integrated Development Environment IDE).也支持HTML和js标签,但只对PHP语言提供调试支持.因为是同一个公司的产品,所以提供的Zend Framework方面的支持比其他软件好.Zend Studio5.5系列后,官方推出利用了Eclipse平台,基于PDT的Zend Studio for Eclipse 6.0,之后的版本也都构建于Eclipse. Zend St

SQL2008增强的集成开发环境

增强的集成开发环境 目录 准备工作1 练习1:智能感知功能2 练习 2:使用错误列表3 练习 3:使用单步调试5 准备工作 预计完成本实验所需的时间 30 分钟 目标 在完成本实验后,您将可以: 使用SQL Server 2008 Management Studio的新增功能 先决条件 在完成本实验前,您必须具有: 编写Transact-SQL 脚本与使用SQL Server 2005 Management Studio的相关经验. 实验场景 在本实验当中,您将会看到在SQL Server 20

Java 7: 全面教程-1.3 集成开发环境(IDEs)

1.3集成开发环境(IDEs) 你完全可以用文本编辑器来写Java 程序.但是,IDE会更方便.它不仅仅可以检查你的代码语法,还可以自动填写代码,检测,和调试你的程序.另外,在你输入的时候就自动编译了,还有运行Java程序只要点击个按钮就行.这样,可以节省你很多时间. Java IDEs的产品有很多,幸运的是,其中最好的都是免费的.以下是一个简短的列表:  NetBeans(免费且开源)  Eclipse(免费且开源)  Sun's Java Studio Enterprise(免费) 

使用IntelliJ IDEA 13搭建Android集成开发环境(图文教程)

原文:使用IntelliJ IDEA 13搭建Android集成开发环境(图文教程) [声明]  欢迎转载,但请保留文章原始出处→_→  生命壹号:http://www.cnblogs.com/smyhvae/ 文章来源:http://www.cnblogs.com/smyhvae/p/4013535.html 联系方式:smyhvae@163.com    [正文] [开发环境] 物理机版本:Win 7旗舰版(32位) Java SDK版本:jdk1.8.0_20(32位) Android S

《Android App开发入门:使用Android Studio 2.X开发环境》——第 1章 使用 Android Studio 开发 Android App

第 1章 使用 Android Studio 开发 Android App 1-1 创建第一个 Android App 项目 1-2 在计算机的仿真器上执行 App 1-3 Android Studio 快速上手 1-4 Android 项目的构成 本章将介绍如何使用 Android Studio 集成开发环境开发 Android App.我们将先说明在 Android Studio 中如何添加.创建 Android App,接着说明如何将完成的程序( App)放在仿真器上执行与测试.让读者先体

《C++语言入门经典》一1.2 Visual Studio 2010 集成编译环境

1.2 Visual Studio 2010 集成编译环境 C++的开发环境有很多种,例如,常见的Visual C++ 6.0 等.Visual Studio 2010 是微软公司继Visual C++ 6.0 之后新设计的集成开发环境,它更加支持C++标准规范,对新标准--C++0x 提供全面的支持.下面就来介绍它的使用方法. 1.2.1 安装Visual Studio 2010 在安装Visual Studio 2010 之前,首先要了解安装Visual Studio 2010 的必备条件,