请大家帮忙看看这个页面的内容怎么读取不了?

问题描述

这个网页,http://www.qidian.com/Book/BookStore.aspx用一般的方法是读不出它的内容的,所有的采集工具,如火车头,ASP,flash工具等都是读不出来的,但有一个网页可能读不出,就是http://tool.chinaz.com/Tools/Robot.aspx可以把它的内容读出来,在这里向大家求助,希望大家能帮帮我,谢谢大家了!这样网页,http://www.qidian.com/Book/BookStore.aspx用一般的方法是读不出它的内容的,所有的采集工具,如火车头,ASP,flash工具等都是读不出来的,但有一个网页可能读不出,就是http://tool.chinaz.com/Tools/Robot.aspx可以把它的内容读出来,在这里向大家求助,希望大家能帮帮我,谢谢大家了!

解决方案

解决方案二:
privatestringgetWebresourceFile1(stringurl){WebClientmyWebClient=newWebClient();byte[]myDataBuffer=myWebClient.DownloadData(url);stringSourceCode=Encoding.UTF8.GetString(myDataBuffer);returnSourceCode;}我不知道你要读什么,这代码是读取该网页的源代码
解决方案三:
引用1楼luntanyonghu的回复:

privatestringgetWebresourceFile1(stringurl){WebClientmyWebClient=newWebClient();byte[]myDataBuffer=myWebClient.DownloadData(url);stringSourceCode=Encoding.UTF8.GetString(myDataBuffer);returnSourceCode;}我不知道你要读什么,这代码是读取该网页的源代码

怎么可能读不出来。我看了一下,能读出来,而且超简单。并没有防采集。我这里有一段自己写的采集程序:///<summary>///请求失败的时候,反复操作///</summary>///<paramname="PageUrl"></param>///<returns></returns>publicstringToServer(stringPageUrl){stringresponseFromServer="";try{while(1==1){WebRequestrequest=WebRequest.Create(PageUrl);WebProxywp=newWebProxy(al[proxy].ToString(),true);request.Proxy=wp;request.Timeout=1000*45;HttpWebResponseresponse=(HttpWebResponse)request.GetResponse();StreamdataStream=response.GetResponseStream();StreamReaderreader=null;reader=newStreamReader(dataStream,System.Text.Encoding.Default);responseFromServer=reader.ReadToEnd();reader.Close();dataStream.Close();response.Close();if(responseFromServer.Contains("refresh")||responseFromServer==""){proxy++;if(proxy>=al.Count){al=ReadIPproxy("e:\test.txt");//初始化代理IP}//ToServer(PageUrl);}else{break;}}}catch(WebExceptionex){if(ex.Status==WebExceptionStatus.ProtocolError){responseFromServer="";}else{proxy++;if(proxy>=al.Count){al=ReadIPproxy("e:\test.txt");//初始化代理IP}ToServer(PageUrl);}}returnresponseFromServer;}
解决方案四:
至于火车头,ASP,flash工具等都是读不出来的那些工具,我从来没有用过。不知道是什么原理但是手写的采集程序一定能读出来。
解决方案五:
楼上大哥,我是新手,能不能把整个代码发给我调试一下;
解决方案六:
代码如下:usingSystem;usingSystem.Collections;usingSystem.ComponentModel;usingSystem.Data;usingSystem.Drawing;usingSystem.Web;usingSystem.Web.SessionState;usingSystem.Web.UI;usingSystem.Web.UI.WebControls;usingSystem.Web.UI.HtmlControls;usingSystem.IO;usingSystem.Net;usingSystem.Text;usingSystem.Text.RegularExpressions;publicpartialclass_Default:System.Web.UI.Page{protectedvoidPage_Load(objectsender,EventArgse){Response.Write("whatisthis?");Response.Write(ToServer("http://www.qidian.com/Book/BookStore.aspx"));}publicstringToServer(stringPageUrl){stringresponseFromServer="";try{WebRequestrequest=WebRequest.Create(PageUrl);HttpWebResponseresponse=(HttpWebResponse)request.GetResponse();StreamdataStream=response.GetResponseStream();StreamReaderreader=null;reader=newStreamReader(dataStream,System.Text.Encoding.Default);responseFromServer=reader.ReadToEnd();reader.Close();dataStream.Close();response.Close();}catch(WebExceptionex){}returnresponseFromServer;}}经过测试,http://www.qidian.com/Book/BookStore.aspx网页的内容还是保存不回来,其它的网站都可以;
解决方案七:
还请大家继续帮忙看看问题出在哪里啊!

时间: 2024-09-17 04:18:32

请大家帮忙看看这个页面的内容怎么读取不了?的相关文章

请高手帮忙:MPC这个最基本的微软证书,考试关于哪些内容啊?、

问题描述 [请高手帮忙:MPC这个最基本的微软证书,考试关于哪些内容啊?.我是在校的一名大学生,想考一个MCP这样的微软证书,听说微软证书认可度很大,可是不知道它考试的内容是关于哪方面的?我本人学的就是软件开发.如先学的JAVA语言,.net框架.可是我就是不知道微软这个最基本的MCP这个证书考试的考点是关于哪方面的内容,请高手们告诉我一下,谢谢各位了??

js调试-菜鸟请高手帮忙看看两个JS文件为什么会冲突

问题描述 菜鸟请高手帮忙看看两个JS文件为什么会冲突 文件一: var ddsmoothmenu={ //Specify full URL to down and right arrow images (23 is padding-right added to top level LIs with drop downs): arrowimages: {down:['downarrowclass', 'images/down.gif', 10], right:['rightarrowclass',

小弟菜鸟一个,有几C#个简单的问题请大虾帮忙,由于刚来所以没有积分,多谢帮助

问题描述 小弟菜鸟一个,有几C#个简单的问题请大虾帮忙,由于刚来所以没有积分,多谢帮助第一个问题,想做一个上传word文件的页面,文件上传已经实现了,但是在SQL里存入的只是文件名,所以打开的时候不能指向链接,用的是datagrid,就是想一点击文件名称,提示"打开"."保存"的那种,请问这段代码怎么写呀,同时页面显示25条记录不需要个性化的分页,但是需要对类别作筛选,小弟不是学编程的,但是现在单位需要这样一个页面,看了很多文章,也写了很多代码,但是总是不成功,经常

EasyUI实现二级页面的内容勾选的方法

 在使用EasyUI的时候,我们经常回遇到在二级页面进行勾选的时候,这里给大家分享一个比较简单实用的实现方法,希望大家能够喜欢.     EasyUI,在增.删的时候,经常用到二级页面进行勾选. 可以在datagird下面添加onCheck.onUncheck.onSelectAll.onUnselectAll事件. 在这些事件中,将勾选的内容存到map中,并转换成json格式字符串放到隐藏域中.   代码如下: onCheck : function(rowIndex, rowData) if

已有jsp程序,怎样修改图片?jsp页面数据库内容显示不出来怎么解决?具体内容见描述

问题描述 已有jsp程序,怎样修改图片?jsp页面数据库内容显示不出来怎么解决?具体内容见描述 已有jsp程序,发布之后理应是但是我发布出来却是求大神指导这该如何解决?还有,已有的jsp程序,想要功能不变但是把图片换掉,使它看起来像是一个新的网站,该怎么换图片?急求大神!!感激不尽~ 解决方案 上面一张图片看不到. 改图片就是改img标签里的src部分.请参考:http://www.w3school.com.cn/tags/tag_img.asp 解决方案二: 估计连接数据库出了问题,你看看to

母版调用出现的问题,请大家帮忙解决?

问题描述 <%@PageLanguage="VB"MasterPageFile="~/MasterPage.master"AutoEventWireup="false"CodeFile="hyqc.aspx.vb"Inherits="_Default"title="UntitledPage"%><asp:ContentID="Content1"Con

java 方法传值问题:请大家帮忙看看指点指点:代码如下:

问题描述 java 方法传值问题:请大家帮忙看看指点指点:代码如下: package com.imooc; public class Test{ public static void main(String[] args) { Circle c1 = new Circle(1); Circle c2 = new Circle(2); swap1(c1,c2); System.out.println("After swap1:"+c1.radius+c2.radius); swap2(c

app store-AppStore被拒绝,请大家帮忙解决!

问题描述 AppStore被拒绝,请大家帮忙解决! November 3, 2015 at 7:34 AM 发件人 Apple 3.1 - Apps or metadata that mentions the name of any other mobile platform will be rejected Thank you for resolving some of the previously communicated issues. However, we found the foll

javascript-asp.net入门,求大神帮忙!控件的内容传输问题。

问题描述 asp.net入门,求大神帮忙!控件的内容传输问题. 操作步骤: 1 填写用户资料: 2 点击"保存"按钮,则系统保存该用户资料,并在下方"用户列表"中加入新增用户信息: 可以连续填写并新增用户,用户列表应实时刷新(总是显示当前已新增的全部用户). 3 点选用户列表,选择某一用户: 则"用户资料"一栏应更新为相应用户的资料: 4 点击"删除"按钮可删除"用户列表"当前选项用户:删除后,"