如何抓取js的嵌套table代码

问题描述

今天抓取数据时页面是<div id=""></div>是在js中写的table，不知道怎么在后台抓取所以新建了一个新的jsp，想将js在table的源代码放到jsp里面去，再通过后台访问自己建的jsp现在只能取出整个页面的源代码，不知道如何取出table的源代码，请教各位或者各位有没有什么其他好的方法，或是在后台直接抓取详细信息，页面http://gtog.ningbo.gov.cn/col/col10267/index.html抓取table代码：<div id="25130"></div> 问题补充：wangqj 写道

解决方案

你可以通过httpclient和htmlParser 做任何你想做的事，很简单
解决方案二：
htmlparser拿到的是树状结构，一个子节点一个子节点的取就可以了
解决方案三：
if (tag instanceof LinkTag)// <a> 标签　　　　　　　　　　　　　　　 { 　　　　　　　　　　　　　　　　　　　 LinkTag link = (LinkTag) tag; 　　　　　　　　　　　　　　　　　　　 String linkUrl = link.getLink
解决方案四：
关于网站改版的问题，没有方法改善。。。。任何爬虫，要爬比较细的属性的时候，都需要随时关注网站的动态，除非依据特殊的属性，比如一个class=“aaa”但是aaa也有可能改变
解决方案五：
http://hi.baidu.com/honestt/blog/item/854af551a49bb813367abebb.html
解决方案六：
你抓的是列表吧，列表不在那个div
解决方案七：
你抓的应该是html的数据，怎么会是源码？是用httpclient抓的吗？

时间： 2024-08-28 06:01:46

如何抓取js的嵌套table代码的相关文章

javascript实时抓取天气和汇率的代码

问题描述 javascript实时抓取天气和汇率的代码前台直接通过接口抓取,网上的说明看不懂啊,有没有完整代码好好研究一下,谢谢了

asp 抓取baidu收录网页数代码

asp 抓取baidu收录网页数代码 <% response.expires = -1 response.addheader "cache-control","no-cache" Response.AddHeader "Pragma","no-cache" wd=Request("d") If Request("s")="baidus" Then BaiduUr

分享下页面关键字抓取www.icbase.com站点代码(带asp.net参数的)_php实例

复制代码代码如下: <?php/** * HOST: www.icbase.com *///set_time_limit(0);// base functionfunction curl_get($url, $data = array(), $header = array(), $timeout = 15, $port = 80, $reffer = '', $proxy = ''){ $ch = curl_init(); if (!empty($data)) { $data = is_arr

Java_爬虫，如何抓取Js动态生成数据的页面？

问题描述很多网站是用js或Jquery 生成数据的,到后台获取到数据以后,用 document.write()或者("#id").html="" 的方式写到页面中,这个时候用浏览器查看源码是看不到数据的.HttpClient是不行的,看网上说HtmlUnit,说可以获取后台js加载完后的完整页面,但是我按照文章上说的写了 ,都不好使.String url = "http://xinjinqiao.tprtc.com/admin/main/flrp

分享下页面关键字抓取components.arrow.com站点代码_php实例

复制代码代码如下: <?php /** * HOST: components.arrow.com */ //set_time_limit(0); // base function function curl_get($url, $data = array(), $header = array(), $timeout = 15, $port = 80, $reffer = '', $proxy = '') { $ch = curl_init(); if (!empty($data)) { $da

php curl 登录163邮箱并抓取邮箱好友列表的代码（经测试）

CURL技术说白了就是模拟浏览器的动作实现页面抓取或表单提交,通过此技术可以实现许多有去的功能.复制代码代码如下: <?php error_reporting(0); //邮箱用户名(不带@163.com后缀的) $user = 'papatata_test'; //邮箱密码 $pass = '000000'; //目标邮箱 //$mail_addr = uenucom@163.com'; //登陆 $url = 'http://reg.163.com/logins.jsp?type=1&

asp.net抓取sina邮箱联系人实现代码

代码如下复制代码 using System; using System.Net; using System.IO; using System.Text; using System.Collections.Specialized; using System.Text.RegularExpressions; /* * AddressSina * 新浪免费邮箱获取联系人(sina.com/sina.cn) * * 改?履?s * ver 1.00.00 @[20100721] 星缘梦

实时抓取YAHOO股票报价的代码

<? function getYahooQuote($stockSymbol = "CCR") { if (!$targetURL) $targetURL = "http://finance.yahoo.com/q?s=$stockSymbol&d=t"; //设定要抓取的URL目标 $fd = fopen("$targetURL", "r"); $stopExtract

实时抓取YAHOO股票报价的代码_php基础

<? function getYahooQuote($stockSymbol = "CCR") { if (!$targetURL) $targetURL = "http://finance.yahoo.com/q?s=$stockSymbol&d=t"; //设定要抓取的URL目标 $fd = fopen("$targetURL", "r"); $stopExtract

猜你喜欢

网页制作实例：js用于树型结构级联选择

js|树型结构|网页 <html><head><meta http-equiv="Content-Type" content="text/h ...

技巧：创建网站的RSS内容摘要

rss|创建|技巧 RSS 是一种"轻量级.多用途.可扩展的元数据描述及联合推广格式",也可以理解为一种规范.它本身是一种 XML 格式,用于为内容整合客户端提供选择性的.汇总过的 ...

中小企业站SEO服务的可作性及SEO服务方法的探讨

之前有看到文章描述,中小企业网站SEO服务没有可作性,今天就中小企业SEO服务的可作性以及方法与大家探讨. 首先,我们来分析中小企业网站的特点: 1.网站结构简单;我想这个大多站长和我有同感吧,首页. ...

安装easy_install时出现的问题

zipimport.ZipImportError: can't decompress data; zlib not available 解决办法今天在安装easy_install时出现如下错误出现 ...

光影魔术手为什么有时会出现“参数错误”的提示

光影魔术手发现"参数错误"的提示在软件无法分配资源时出现.正片功能需要申请大量的系统资源做海量运算,当系统中资源较低时(如同时有多个大型程序运行),可能会出现此错误.另外,因为 ...

WPS表格快速生成用户名和密码的技巧

首先,新建一个工作簿,在sheet1中输入各列标题及其他信息.如图1所示图1 接下来,就要来生成用户名列和密码啦!单击D2格,在英文半角状态下输入"="cnxx"& ...

怎样在Win7系统下修改网卡MAC地址

MAC地址,又叫做物理地址.硬件地址,是用来定义网络设备的位置,一般情况下,MAC地址在网卡中是固定的,但不排除有人手动去修改自己的MAC地址.其实修改MAC地址的方法很简单,可以通过硬件修改,也可 ...

高性价比条码打印机选择哪款？

条码打印机有很多品牌和型号,对于用户来说希望的就选择一宽既经济实惠.有质量可靠的打印机,下面深圳市互信恒科技介绍一款性价比非常高的条码打印机:博思得POSTEK C168,希望对大家购买条码打印机的时 ...

ios-设置UINavigationBar 的背景图片

问题描述设置UINavigationBar 的背景图片我给导航条设置背景图片在didFinishLaunchingWithOptions 方法的代码: UIImage *navBarImage;n ...

JavaWeb学习----JSP简介及入门（含Eclipse for Java EE及Tomcat的配置）

[前言] JSP本身是JavaWeb中的知识,但是在学习Android网络时,必然要涉及到与服务器之间的交互,所以学一下JSP以及其他JavaWeb的内容还是很有必要的,至少能明白程序在访问服务器时, ...

java对象怎么转json数组

1.ListJava代码boolean[] boolArray =newboolean[]{true,false,true}; JSONArray jsonArray ...

配置文件-请教各位大牛，正则表达式匹配结果的筛选问题

问题描述请教各位大牛,正则表达式匹配结果的筛选问题请教各位大牛,用正则表达式从配置文件里匹配IP地址"10.46.178.77",现在需要将第一个匹配结果的IP修改为108.3 ...

MySQL 第二篇：增删改查

我把MySQL的内容整理成9篇博客,学完这9篇博客虽不能说能成为大神,但是应付一般中小企业的开发已经足够了,有疑问或建议的欢迎留言讨论. 一.新增数据 1.语法:insert [into] <表 ...

请问VB 6.0中怎么才能实现程序图标的拖动

问题描述请问VB 6.0中怎么才能实现程序图标的拖动请问VB 6.0中怎么才能实现程序图标的拖动,添加程序到程序收纳盒的功能,并且可以执行这个程序? 解决方案可以在你的窗体的oledrogove ...

模块化配电系统在高密度数据中心的应用

传统的数据中心配电架构在传统的配电系统当中,数据中心的主进线先至配电柜(配电柜一般额定功率为50~500kW),配电柜一般配有大型电力变压器用以转换电压或改善电力质量.然后,配电柜将主进线分配成一定 ...

Spring定时器一段时间后失效(发生错误)

问题描述我是用的注解的方式(@Scheduled)然后获取获取一个网站的信息,平常是没问题的,但是如果这个网站挂掉了一段时间,那么spring的定时器就失效了. 解决方案解决方案二:估计是你程序的 ...

Lock

也许有朋友会问,既然都可以通过synchronized来实现同步访问了,那么为什么还需要提供Lock?这个问题将在下面进行阐述.本文先从synchronized的缺陷讲起,然后再讲述java.util ...

doT js模板入门 2

doT js 使用{{}} 非常类似于JSP,所以用起来感觉很亲切,很顺手 {{–><% }}–>%> 例如: <div id="evaluationtmpl& ...

PostgreSQL 末尾块收缩(如pg_type pg_attribute)异常和patch

标签 PostgreSQL , 数据块损坏 , pg_type , pg_attribute 背景某些用户遇到的一些问题,报读数据块错误. ERROR: colud not read block 1 ...

杨元庆自掏2000万奖励员工中国区员工可分得2000元

http://www.aliyun.com/zixun/aggregation/34208.html">北京青年报记者昨天从联想集团内部获悉,联想集团董事长杨元庆将从自己的奖金中分出超 ...

Android实现右边抽屉Drawerlayout效果_Android

侧边栏是Android应用中很常见的一个界面效果(抽屉效果).而利用DrawerLayout实现右侧栏是相对简单的.而且这个控件自带滑动效果,十分方便. DrawerLayout属于android-s ...

Android 断点续传原理以及实现_Android

Android 断点续传原理以及实现 0. 前言在Android开发中,断点续传听起来挺容易,在下载一个文件时点击暂停任务暂停,点击开始会继续下载文件.但是真正实现起来知识点还是蛮多的,因此今天有 ...

RequireJS使用注意细节_javascript技巧

RequireJS介绍 RequireJS由James Burke创建,他也是AMD规范的创始人. RequireJS会让你以不同于往常的方式去写JavaScript.你将不再使用script标签在H ...

MySQL命令行导出与导入数据库_Mysql

举例为大家介绍如何运用命令行实现MySQL导出导入数据库一.命令行导出数据库 1.进入MySQL目录下的bin文件夹:cd MySQL中到bin文件夹的目录如:cd C:\Program Fil ...

美公使点评华为并购失败寄望省州长论坛推动

江玮万相辛北京报道华为在美投资受阻,美国投资环境再度成为中国企业关注的议题.与此同时,一个旨在推动中美地方政府交流的中美省州长论坛正在筹备之中.该论坛能否为中企赴美投资提供协助,成为外界关注的焦 ...

pg_squeeze简单使用

概述一般当一个表膨胀时一般使用vacuum full或者cluster进行表重建,在这一过程中会加排他锁,导致该表无法进行读写,只有等整个过程完成后才可以进行正常使用.pg_squeeze就是来解决这 ...

加州大学黑科技：激光使电子设备不再依赖半导体材料

北京时间11月9日消息,据外媒报道,美国加州大学圣地亚哥分校科学家开发了一种新型微电子设备,未来PC中由半导体材料制造的处理器可能被取而代之. 这一新技术还处于早期的开发阶段,但它牵涉一些有趣的研究和 ...

百度百科惊现新成语：“丁磊养猪”

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅丁磊养猪成语发音:dīng l ...

[求助] MAVEN 搭建的Spring MVC 可以跳转但是拿不到model 传过去的值

问题描述 Controller:@ControllerpublicclassTestController{@RequestMapping(value="test",method=R ...

迈入大数据时代 12项实名制助推平安建设精细化

"您好,请出示身份证."在嘉善县城西大道一个圆通快递点,收件员礼貌地提醒准备寄月饼到安徽马鞍山的严女士.在严女士填完快递单后,收件员手持"巴枪",输入自己的编号 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.024 s.