急急，求问如何爬取这个json文件

问题描述

文件地址是：http://chuangshi.qq.com/search/getSearchNovels.html?pageIndex=1&Website=&Subjectid=&Contentid=&Bookwords=all&Updatestatus=all&Lastupdate=all&Sortby=all&Isvip=all&TitlePinyin=all&TagList=all我要获取的是页面中<a>标签中的href，怎样才能获取到，并把它转换成正常的个是呢，真心求教，用的Java语言。

解决方案

解决方案二：
没有人吗，求大神出现
解决方案三：
采用Java第三方包HTMLParser进行解析远程页面,可以直接获取页面所有的<a>标签内容,功能强大!
解决方案四：
引用2楼littlebrain4solving的回复:

采用Java第三方包HTMLParser进行解析远程页面,可以直接获取页面所有的<a>标签内容,功能强大!

一般来说,任何你想获取的标签都是没有问题的;但是此包有一个弊端就是无法识别JS内容,如果想处理JS的话可以采用另外一个第三方工具包HTMLUnit,这个更加强大,已经可以作为浏览器内核了!

时间： 2024-09-20 08:40:01

急急，求问如何爬取这个json文件的相关文章

python-Python爬虫爬取网页源代码为空，求问原因&amp;amp;解决方案（向）

问题描述 Python爬虫爬取网页源代码为空,求问原因&解决方案(向) 代码如下:import urllibimport urllib2import re url ='http://www.yingjiesheng.com/guangzhou-moreptjob-2.html'req = urllib2.Request(url)try: html = urllib2.urlopen(req).read() print htmlexcept urllib2.HTTPError e: print '

大数据-新手求大神推荐网络爬取基础的书籍

问题描述新手求大神推荐网络爬取基础的书籍自己毕设选到了一个与网络爬取有关的题目,自己有些JAVA基础,想请教大神们我这种菜鸟应该看些什么书?会一些数据库基础知识解决方案这种程序也不复杂,所以根本没必要写书,也没有这种书. 你只要在gogle里面搜索 site:download.csdn.net 爬虫 java 找几个例子看下,人家代码怎么写,自己改改也就行了. 解决方案二: 看看http请求相关,学学正则表达式解决方案三: http://download.csdn.net/detail

急急急,求方法,这种json字符串怎么解析

问题描述急急急,求方法,这种json字符串怎么解析 "code" : " D1_3300_0000", // 缴费时作为bussCode上送 "action" : "prepay", "title" : "缴费 - 浙江电力", "form" : [ // FormItem列表,定义了用户缴费时需上送的参数,具体返回字段中的哪些元素需要上送见 7.3.1节基本数据类

求助，python 解析爬取的网页源码中的json部分

问题描述求助,python 解析爬取的网页源码中的json部分爬下来的网页源码有一部分是这样的 : 中间那一部分是json吧?要怎么才能解析成像浏览器那样的好继续抓取所要的信息? 说部分是因为有另外一些是正常的html,就中间这一部分想要的信息就这样两行超级长的延伸...也使用过json.load()来解析,不想显示错误"没有可以解析的json对象". 这两行中还有一部分"}u0026nicku003d${nick}u0026rnu003d${rn}u0026stats.

数据-python 实现爬取网页的审查元素，求大神路过

问题描述 python 实现爬取网页的审查元素,求大神路过网页源代码只有 JavaScript,没有我想要的数据.只能通过审查元素看到,怎样才能抓取审查元素的内容暂时用的是selenium,但只能看源代码.求大神路过解决方案 selenium拿到数据后,用lxml来解析节点,获取你对应的数据解决方案二: beautifulsoup试试吧.. 解决方案三: 我发现了一个在云上写和运行爬虫的网站,http://www.shenjianshou.cn/.被吓到了,之前就有过这种想法,终于有人帮

怎么用java代码爬取网页中视频的源地址，不要用嗅探工具！！求高手帮助啊！！！

问题描述现在在做一个多媒体管理系统,需要像百度一样抓取一些网站的视频的真实连接,但是想优酷.土豆或者各大视频网站的视频的链接都是经过js加密的,求高手怎么才能获得视频的真实地址啊!!不要用字符串拼接,那个只要算法一变就不行了!!!求各位高手指导指导!!! 解决方案解决方案二:网络抓包,分析底层协议?解决方案三:eval 解决方案四:解决没有大神,如果解决了,给个实例,邮箱:2087224217@qq.com.谢谢了解决方案五:楼主你好请问这个问题后来是怎么解决的,我最近在做着一个音乐播放器,

求问这段代码哪错了急急急急急急

问题描述求问这段代码哪错了急急急急急急解决方案提示的非常明显呀,字符串格式有误,强制转换肯定会出错了解决方案二: 打个断点,看下db上来的字符串是个啥模样,必然是个不能转为int的东西. 解决方案三: 代码没错,但是看一下MPrice和labMoney.Text的值,这两个值存在不能转换成Int32的字符解决方案四: MPrice labMoney.Text中某一个无法转换为int 你可以用try catch忽略这个异常. 解决方案五: MPrice labMoney.Text中某一个

nutch1.7/1.8爬取pdf无法解析，全是乱码，求大神！急，好久了。

问题描述最近公司让研究nutch.我测试了好多个版本解析如下url的pdf都不行,全是乱码(英文文档)我使用命令bin/nutchreadseg-list-dirtest01/segments/显示PARSED也是0求大神帮忙啊.为什么我爬取的pdf都是乱码,解析不了.http://www.accessdata.fda.gov/drugsatfda_docs/label/2014/202293s000lbl.pdf 解决方案

诚心求问，如何才能让爬虫爬到看不到的链接呢？

问题描述公司让爬淘宝的数据,可是淘宝具体商品的链接都被隐藏起来了呢.http://list.taobao.com/itemlist/default.htm?cat=50000697&sd=0&as=0&viewIndex=1&spm=a2106.2206569.0.0.gcPy7P&atype=b&style=grid&same_info=1&tid=0&isnew=2&_input_charset=utf-8比如这个链接,

猜你喜欢

ps做自己的创意壁纸

效果图 [文字版教程] [图文版][新手用] 1.打开软件,我用的是CS6,求软件自重并且打开一张素材图打开后,选择<文字工具> ,在图上打字 3.字号稍 ...

网站地图的作用及应具备的几个特点

网站地图的作用是当用户查询到网站时能让用户一目了然的看清楚网站的实质作用,帮助用户更快的查询到所需要的信息.同时为搜索引擎提供绿色通道,使引擎程序迅速收录主要网页.得到较好的排名,让用户更容易找到您的 ...

javascript全屏幕显示的问题

javascript|问题|显示返回某个固定页面:function bk(strUrl){window.location.href=strUrl} bk("A.jsp") 打开页 ...

简述UML中的活动图

活动图(activity diagram)显示动作及其结果,活动图着重描述操作(方法)实现中所完成的工作以及用例实例或对象中的活动.活动图是状态图的一个变种与状态图的目的有一些小的差别,活动图的主要 ...

算法：poj 4045 Power Station （树形dp）

题意 n个城市节点构成的一棵树,节点i到节点j的电量损耗为 I*I*R*(i到j的路径所含边数),现在要在某个结点上修建一个供电站,使得这个结点到所有其它节点的总损耗量最小. 思路典型的树形dp ...

WPS与Word 3招轻松搞定文档排版

无论用微软 Word还是金山WPS OFFICE排版文档时难免会使用文本对齐.段落设置的功能,本文总结了Word和WPS通用的文本排版技巧,希望对大家排版的工作有所帮助. 1.单元格数字小数点对齐选 ...

360tray.exe进程是什么

360tray.exe是奇虎360公司出厂的360安全卫士木马防火墙模块.通常情况下该程序进程是和360安全卫士一起运行的.它的功能是能保存电脑系统的正常运行并且提高系统的安全性能. 电脑常识进程文 ...

eMule中IP过滤器是什么

P过滤器是用来阻挡某些特定的对网络有损害的IP地址的.最常用的就是 Lussnig's IP Filter.从他的网站下载一个名为ip.prefix的文件,重命名为ipfilter.dat然后复制到e ...

wavepad如何调节声音的播放速度

1.首先打开一个声音文件,如图1所示图1 2.点击上方导航栏的"effects",再点击"speed change",如图2所示图2 3.调节& ...

什么情况下需要进入DOS？

DOS是一个操作系统,但是现在几乎已经没有用户在电脑上之安装一个DOS系统.现在大多数用户都将DOS作为一种工具使用.一般进入DOS是为了运行某些DOS命令或者应用程序. 什么情况下需要进入DOS ...

android-在 textview 或者 toast 中显示参数的方法

问题描述在 textview 或者 toast 中显示参数的方法我不能在一个 toast 或者 textfield 中显示 v1,v2,v3 或者 v4 的值,但是可以显示字符串.我调用这些值出错 ...

jquery中$test = &amp;quot;&amp;lt;p&amp;gt;&amp;quot;+123+&amp;quot;&amp;lt;/p&amp;gt;&amp;quot;;然后$($test)为什么没宽度

问题描述 jquery中$test = "<p>"+123+"</p>";然后$($test)为什么没宽度今天突然碰到个问题,求大神解 ...

邮箱系统-jsp+servlet实现邮件收发系统

问题描述 jsp+servlet实现邮件收发系统大家好,我正在做一个基于jsp的邮件收发系统,有哪位好心人可以发个源码借鉴一下,必有重谢! 解决方案 String username="&q ...

使用rsync：配置rsync服务

上一节讲述了使用 rsync 客户命令进行同步和备份的内容.rsync 还可以以守护进程(daemon)方式运行,若一台主机以 daemon 模式运行 rsync,一般称其为 rsync 服务器.rs ...

[华为机试练习题]60.水仙花数

题目描述: 水仙花数又称阿姆斯特朗数. 水仙花数是指一个n 位数( n≥3 ),它的每个位上的数字的n 次幂之和等于它本身.(例如:1^3 + 5^3 + 3^3 = 153) 求输入的数字是否为水 ...

中国人为什么做不出自己的操作系统

前不久在巴塞罗那移动电信世界大会上,业界的关注点从手机硬件转移到了手机操作系统:Mozilla发布了Firefox OS并得到了几大运营商和手机厂商的支持,而Tizen.Ubuntu.Sailfish ...

c#-数据版本管理，请各位大神帮忙看一下

问题描述数据版本管理,请各位大神帮忙看一下数据版本标签,创建新的文件型数据源,并将指定的数据集导入到该数据源中,同时,该数据源通过版本管理的XML文件,记录该数据源的版本,数据源版本时间,数据源版 ...

Maven学习三之新建maven项目

网上有很多教程,都是选择直接新建maven project,会出现有些jar下载不下来,所以可以新建普通项目并添加maven支持. 当然这样新建项目,一开始要等一会,因为新建的时候还是通过网络到m ...

nginx-内网机器通过代理访问外网域名的问题

问题描述内网机器通过代理访问外网域名的问题我的环境是: 客户机都在内网局域网下,无法访问外网: 只有一台服务器可以访问到外网,客户机和服务器之间可以互访: 现在需要客户机通过内网web,访问到外网 ...

ps 图像应用实现皮肤美白教程

一步实现皮肤美白教程,这是超级简单的ps照片美白教程了,我们只用了ps里面的图像应用就可以让你皮肤水嫩美析了, 看看效果图下面来看教程.打开图层,copy一层,把背景层的眼睛关团,在复制图层执行,图 ...

iPhone6怎么省电?iPhone6 iOS 8.1省电技巧(1/2)

不少使用iPhone.iPad 的网友相信已经为爱机更新了iOS 8,甚至iOS 8.1.如果你觉得升级后,电池使用时间较以前短,就可以参考以下的方法,尝试改善电池使用时间. 1.找出耗电量大的App ...

Java实现文件批量重命名具体实例_java

Windows操作系统可以实现重命名文件操作,却不能实现批量重命名.本实例实现了批量重命名功能,可以将一个文件夹内同一类型的文件按照一定的规则批量重命名.用户可以给出重命名模板,程序可以根据模板对相应 ...

关于汉鼎信息科技股份有限公司股票临时停牌的公告

由于汉鼎信息科技股份有限公司于2013年9月23日披露的<关于设立全资子公司浙江汉鼎手游科技有限公司公告>及<关于设立控股子公司浙江汉动信息科技有限公司公告>内容不够完整,根据 ...

nodejs中实现sleep功能实例_node.js

nodejs最让人不爽的就是其单线程特性,很多事情没法做,对CPU密集型的场景,性能也不够强劲.很长一段时间,我想在javascript语言框架下寻求一些解决方案,解决无法操作线程.性能差的问题.曾经 ...

在安装vs2005时不能加载vs.setup.msi,有谁知道是怎么回事吗？谢谢！

问题描述在安装vs2005时不能加载vs.setup.msi,有谁知道是怎么回事吗?谢谢! 解决方案解决方案二:我得很正常,是不是那个文件被破坏了?解决方案三:ding!!!!!!!!!

门雨：网络营销思路觉得出路

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅对于任何营销来说我相信无论是市场营 ...

多表多条件且条件数目不明 java拼接sql问题，求解！

问题描述需要完成的功能如下表结构大概如下目前完成的代码多表多条件且条件数目不明确,所以在java代码中有各种判断目前搞定单条件的,那么2个条件3个条件4个条件算下来的话会有很多条件组合的模式出现,如 ...

代码纠错-WP8应用内购购买的问题

问题描述 WP8应用内购购买的问题我申请成功了一个应用内产品,我将之ID置为Donation,就是开发者捐助.产品也通过了,我在应用中的代码设置如下: private async void Dona ...

rop own ist-mvc4 drodowlist 不能设置选中项，且修改了数据源的数据？

问题描述 mvc4 drodowlist 不能设置选中项,且修改了数据源的数据?

ActionBarSherlock

问题描述本帖最后由天使牛于 2015-2-22 21:09 编辑 ActionBarSherlock 是Android compatibility library 的一个扩展, 不知道什么原因 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.021 s.