HttpWebRequest爬虫怎么样获取Status Code:503异常标头的body,这个503请求抓包和浏览器有网页显示

问题描述

HttpWebRequest直接报异常了，怎么样忽略这个503异常，像StatusCode:200一样得到正文呢？

解决方案

解决方案二：
503的错误显示和200的不一样，不通浏览器返回都不同的，在其他位置。
解决方案三：
引用1楼xomix的回复:

503的错误显示和200的不一样，不通浏览器返回都不同的，在其他位置。

他这个只是StatusCode码不一样，网站故意发出来StatusCode503干扰机器人的，实际应该还是200的。但浏览器能显示正文，我机器人直接抛出503异常来了。。
解决方案四：
up..............
解决方案五：
那你trycatch下呗
解决方案六：
引用4楼starfd的回复:

那你trycatch下呗

try过，正文还是未赋值状态。返回的标头里有个set-cookie倒是自动增加了。不知道HttpWebRequest有没有开源，如果开源了的话我去找源码改下对503这处的反应代码应该OK了
解决方案七：
源码，你可以试下HttpClient类在503时会不会自动返回异常
解决方案八：
引用6楼starfd的回复:

源码，你可以试下HttpClient类在503时会不会自动返回异常

用socket和tcpclient方式能获取到正文。但他们不大好用，感觉也怪怪，不知道HttpWebRequest有没有忽略这异常当StatusCode是200的方式去处理的参数

时间： 2024-12-03 18:28:15

HttpWebRequest爬虫怎么样获取Status Code:503异常标头的body,这个503请求抓包和浏览器有网页显示

问题描述

解决方案

HttpWebRequest爬虫怎么样获取Status Code:503异常标头的body,这个503请求抓包和浏览器有网页显示的相关文章

网卡-请问，使用winpcap抓包，怎么设置可以使到达一个数据包后，应用程序尽快获取？

HTTP状态码->HTTP Status Code

python 爬虫怎么获取标签中的注释？我用得lxml解析html

编码-action获取表单信息异常

[原创]分析解决lvs fullnat模式下后端服务器获取真实IP地址异常问题

javascript-Python 爬虫如何获取onclick（非url链接）之后网页？

javascript-微信支付js获取用户code

javascript-python爬虫如何抓取包含JavaScript的网页中的信息

请问数据抓取系统(spider)搜集网页信息是从一些种子URL开始，那么这些种子URL怎样获取的？