重开一贴,非常之急.(在线等) 用C#.net写爬虫抓取网页时为什么出现这种问题?

问题描述

Uriurl=newUri("http://www.baidu.com");WebRequestrequestPage=WebRequest.Create(url);//发送absoluteUri创建请求对象//requestPage.Timeout=1000;WebResponsereponsePage=requestPage.GetResponse();StreamnewsStream=reponsePage.GetResponseStream();//读取页面流Encodingencode=System.Text.Encoding.GetEncoding("gb2312");StreamReaderreader=newStreamReader(newsStream,encode);//读取获得内容流stringboardStream=reader.ReadToEnd();//将内容流转换为文本并存入变量BoardStream,即为所需要的数据流为什么经常读取到的是下面的页面?这好像是电信的一个页面.其中zhsbwensen是我上网的账号,为什么会这样呢?我该怎么做?<html><head><metahttp-equiv="pragma"content="no-cache"/><metahttp-equiv="Cache-Control"content="no-store,no-cache,must-revalidate,post-check=0,pre-check=0,max-age=0"/><metahttp-equiv="expires"content="-1"/><metahttp-equiv="refresh"content="2"/></head><body><iframesrc="about:blank"width="0"height="0"frameborder="0"style="display:none"></iframe><scriptlanguage="javascript">window.frames[0].location="http://219.131.193.229/update/step1.aspx?p="+"zhsbwensen¦"+Math.floor((newDate()).getTime()/1000)+"¦"+navigator.appMinorVersion+"¦"+screen.availHeight+"¦"+screen.availWidth+"¦"+screen.colorDepth+"¦"+screen.height+"¦"+screen.width;</script></body></html>

解决方案

解决方案二:
没人回啊.
解决方案三:
你用个timer2秒一次2秒一次的刷,看看会不会,应该是电信的问题
解决方案四:
楼主用的是adsl?楼主的问题我也遇到过,我在家用的是电信的adsl,获取网页源代码时不时就出现一个讨厌的框架,害得我还得自己写代码转向。原因是电信在监视你访问哪些网站,这太侵犯隐私了!
解决方案五:
3楼的,你说对了,我的就是电信的adsl,怎么转向取得正确地址的内容啊
解决方案六:
再顶上
解决方案七:
从楼主发的代码来看,你访问的是www.baidu.com,但是返回的并不是百度首页的源代码,而是一个包含了Iframe的页面。分析此html代码发现,它每隔2秒把你的浏览器信息及显示器信息发送到219.131.193.229,这个ip收集你的信息到底是干什么的呢?如果它是搞统计,那也应该再加个Iframe把百度的主页显示出来啊?不然浏览器显示此html将是一片空白,且不说这个。我更关注它是怎么替换成这个html的,访问网站一般都要先把域名解析成IP,然后再通过三次握手建立tcp连接,这个连接一旦建立就可以互相通信了。看看楼主的情况,你访问www.baidu.com其实并没有和百度建立tcp连接,而是和另外一个主机,那可以推测是在域名解析的时候有问题。楼主可以用ipconfig/all命令看看自己的DNS服务器是多少?再多pingwww.baidu.com几次看看是不是每次返回的ip相同?是不是你的DNS不稳定,你换个DNS试试?

时间: 2024-11-20 05:46:13

重开一贴,非常之急.(在线等) 用C#.net写爬虫抓取网页时为什么出现这种问题?的相关文章

jsp-百度编辑器1.4.3JSP版 如何修改文件上传路径?急在线等

问题描述 百度编辑器1.4.3JSP版 如何修改文件上传路径?急在线等 RT 默认的上传路径在重启Tomcat的时候会造成图片丢失的情况,请问该如何修改百度编辑器的文件上传路径 急........................在线等 解决方案 在ueditor/jsp/config.json中的 "imagePathFormat": "/ueditor/jsp/upload/image/{yyyy}{mm}{dd}/{time}{rand:6}", /* 上传保存

请问这个C++的dll在C#中怎么调呀?急……在线等!

问题描述 请问这个C++的dll在C#中怎么调呀?急--在线等! C++中的调用: extern "C" _declspec(dllimport) int ReadGzjzzData(char* pData,char* photo,int * iErrCode); void CReadGzjzzDlg::OnBnClickedOk() { // TODO: 在此添加控件通知处理程序代码 // OnOK(); char Data[64*1024] = {0};//各字段用双竖"

jquery-jQuery自动排版,急在线等

问题描述 jQuery自动排版,急在线等 一横排8张图片,我隐藏右边jQuery如何让其余图片自动向右靠 解决方案 右浮动布局就好了, <style> .floatright img{float:right;margin-left:5px} </style> <div class="floatright"> <img alt="image1"/> <img alt="image2"/>

mfc文本框edit ctrl光标焦点问题-急在线等-谢谢

问题描述 mfc文本框edit ctrl光标焦点问题-急在线等-谢谢 有2个文本框A,B 文本框A:作为log输出信息窗口,假设不停地输出log信息,我使用setsel.setfocus.replacesel的方法做的末尾追加:文本框B:一个输入的文本框,在文本框A不停输出的前提下,光标焦点老是跑到文本框A的末尾: 问题:文本框B怎么才能在 文本框A不停输出的前提下 获取光标焦点,焦点不跑到A? 谢谢,描述的应该很清楚了,如果不清楚,请追问,再次谢谢. 解决方案 追加文本用不着设置焦点.Send

java-JAVA ATM类 很急 在线等

问题描述 JAVA ATM类 很急 在线等 初学者急求教,题目如下,谢谢大家了 应用Java面向对象概念编写一个银行ATM系统Java应用,要求实现下列功能: 1.查询余额 2.存款 2.取款: 3.转账 应用技术要求: 1.要应用到Java面向对象技术(封装,基础和多态,也可有接口等技术) 2.要求有图形界面作为界面,后台应用非图形界面 3.可应用其他Java技术 解决方案 http://www.atguigu.com/download.shtml 这个链接你点击进去,这里面的免费视频中有个b

字段-有关oracle11g的问题,急在线等

问题描述 有关oracle11g的问题,急在线等 a5107 这个字段数据类型为varchar2 长度为 1 现在有几笔数据显示是没有值的.我用条件 a5107=' ' 或者 a5107=null 或者 a5107 <> '0' 这几个条件都查不到这几笔数据 .不知有没有大神知道原因 解决方案 你用 is null,is not null,试试 解决方案二: a5107 IS NULL

visual studio-VS2013 c++ 编写与导入dll文件 详细求教 急在线等

问题描述 VS2013 c++ 编写与导入dll文件 详细求教 急在线等 首先想明确动态链接库与静态链接库的区别,以及是否可以通过dll与lib文件判断该接口是动态链接库还是静态链接库.如何判断. 其次,想求教如何用VS2013,在完全空白项目下编写dll文件一步步编写一个最简单的类. 最后,如何导入一个已经编好的dll文件 QQ398612945(答好另有酬谢) 解决方案 加我QQ 893277858 给你整个工程的代码... 解决方案二: 动态库和静态库都需要.h .lib文件,动态库还需要

设计-小白求助 C++编程 急 在线等

问题描述 小白求助 C++编程 急 在线等 1.定义一个职工类CWorker,数据成员包括姓名.职工号.工龄.工资:成员函数有构造函数,设置数据成员值的函数,读取数据成员值的函数.在主函数中定义对象数组,再编写一个CWorker类的友元函数,计算平均工资,查找最高工资. 2.设计一个职工类CWorker,成员包括姓名.职工号.工龄.工资及相关的成员函数.由它派生出教师类CTeacher,包括职称,所属部门等属性和相关的成员函数.编写一个主函数,对设计的类进行测试.

请教一下,代码优化问题,急在线等

问题描述 请教一下,代码优化问题,急在线等 @RequestMapping(value = { "/getaddressmg" }) public ModelAndView getAddressMg(HttpServletRequest request, Model model) { ModelAndView view = this.getBaseModelAndView("custom/addressmg/addressmg"); try { CustomInfo