网页采集高手进

问题描述

一个淘宝的商品链接,有1个商品的原价。还有一个特价的价格(淘宝价)。用Chrome查看源代码,可以看到源代码中很容易找到这个商品的原价。但是特价的价格(淘宝价),在源代码中找不到。听一个高手朋友说,只要网页上能看到的内容,就应该都能够通过程序获得。所以问题来了,请问如何通过一段程序,获得该商品的淘宝价呢?我自己比较喜欢用C#。链接:http://item.taobao.com/item.htm?spm=a1z10.1-c.w4004-9748322085.2.kHSQ8t&id=45177997418不知哪位高手可以赐教呢?

解决方案

解决方案二:
这个是页面加载后再通过js获取剩余数据的,你可以直接从ajax请求中抓数据
解决方案三:
用fiddler调试下就知道了

时间: 2024-09-15 09:33:15

网页采集高手进的相关文章

ajax-php采集高手进:利用curl模拟登录抓取数据遇到json调用问题不成功,求助!

问题描述 php采集高手进:利用curl模拟登录抓取数据遇到json调用问题不成功,求助! 我在抓取一个页面的信息(假设a.php),这个页面只是一些基本的html框架,其他关键信息是通过ajax请求(b.php)回来的,返回的是json,然后在通过页面js将json解析,绘制到页面上.问题的关键是ajax请求的信息里有个手机号码需要登录后才显示完整,原网站利用ajax请求b.php获得json数据,如果直接访问b.php也是可以直接得到:{"name":"zhangsan&

php curl采集高手请进

问题描述 php curl采集高手请进 http://www.lecai.com/ 这个网站怎么用php/url技术进行模拟登录?求参考程序..... 解决方案 我大致看了一下,个人习惯使用Snoopy.class.php模拟登陆,觉得不好可以忽略 POST http://www.lecai.com/user/ajax_login.php HTTP/1.1Host: www.lecai.comUser-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:3

平台-matlab高手进,不写代码,只说思路

问题描述 matlab高手进,不写代码,只说思路 各位大侠.求解答 题目如下:利用matlab的GUI功能制作pn结的仿真平台,在该平台中,能根据输入的异质结的不同参数,可以展示平衡异质结的能带图,并动态的展示异质结能带图的变化. 针对正偏的异质结,展现其发光特性及异质结其他可能的应用. 请问这个有办法实现吗?大体方案是什么?

大数据-X亿级数据检索速度优化难题,高手进

问题描述 X亿级数据检索速度优化难题,高手进 各位高手,目前碰到一个X亿级数据检索速度优化的难题,大家帮看看怎么解决. 涉及到的表有: KeywordIndex:2.7亿条记录 Original:1014万条记录 KeywordIndex表包括四个字段,ID(PK,int).KeywordID(int).OriginalID(int).ColumnID(int) 建立的索引: PK_KeywordIndex([ID] ASC) IX_KeywordIndex_KeywordID([Keyword

combox-C#或者DEV控件高手进,求助大神!呀,gridview中动态添加COMBOX后出现问题

问题描述 C#或者DEV控件高手进,求助大神!呀,gridview中动态添加COMBOX后出现问题 步骤1:我定义一个全局的COMBOX控件变量: 步骤1:我为GRIDVIEW动态添加了一列,将这一列设置我步骤1中的COMBOX: 步骤2:我为这个COMBOX添加click事件,在事件中我读取GRIDVIEW中的focusROW,读取某一列,判断该列的值来动态为COMBOX添加ITEM; 问题:在click事件中,每次都能正确的获取focusROW,也能为combox添加ITEM,但是就是COM

word文档-急,高手进!word转pdf问题!

问题描述 急,高手进!word转pdf问题! 用freemarker根据xml生成的word文档,在用openOffer插件转换成pdf.转换成功后pdf打开后显示的是xml的源码 问题应该怎么解决!我想要的显示的是内容 不是xml的源码!word是xml类型的!

博弈论-anti-SG博弈的问题,高手进。

问题描述 anti-SG博弈的问题,高手进. anti-SG博弈的胜利条件是(g(s)!=0&&Existg(t)>1)||(g(s)==0&&Anyg(t)<=1) 为什么?? 解决方案 我以前写的 http://blog.sina.com.cn/s/blog_51cea4040100h3l9.html 解决方案二: 这篇博文解释的挺好:http://m.blog.csdn.net/blog/ACM_cxlove/7839276 解决方案三: anti-SG是

java问题-图片压缩时遇到问题,高手进,拜谢啊

问题描述 图片压缩时遇到问题,高手进,拜谢啊 问题描述: 使用thumbnailator时nested exception is java.lang.OutOfMemoryError: Java heap space 上传图片后使用thumbnailator进行压缩,所有手机拍摄的图片没有问题.美工做的图,在压缩过程中报溢出错误. 挣扎,求解

怎么把jsoup抓取到的网页数据放进mysql数据库中,跪大神求详细代码。

问题描述 怎么把jsoup抓取到的网页数据放进mysql数据库中,跪大神求详细代码. package bag; import java.io.IOException; import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class T