关于HttpURLConnection抓取数据502异常问题

问题描述

描述：我想连续抓取2000多组天气数据存储在文件中，使用代理IP和端口号，利用HttpURLConnection获取网络接口数据。问题：[b]1.单个抓取每一组数据都没有问题；2.抓取过程中间断开的地方每次不一样，有抓100多组数据后断开的也有1000多组后断开的；3.程序报异常：java.io.IOException:ServerreturnedHTTPresponsecode:502forURL:http://open.weather.com.cn/data/?areaid=101031400&type=forecast3d&date=201409110939&..................................但是URL是没问题的，每次断开地方也不一样。4.是否是网络原因导致中断？如果不能保证网络怎么能加强程序健壮性，让每次断开后还能继续抓取，直至2000多组数据抓取完毕?求指教~部分代码如下：（原来比这些简化，也没用post，后来看网上说的一步步加了一些setDoOutput、setDoInput、setConnectTimeout之类的，还是不行）[/b]publicStringgetURLContent(StringurlStr,Stringencode)throwsException{if(isProxyEnabled){Propertiesprop=System.getProperties();prop.setProperty("http.proxyHost",proxyHost);prop.setProperty("http.proxyPort",proxyPort);}URLurl=newURL(urlStr);HttpURLConnectionhttpConn=(HttpURLConnection)url.openConnection();httpConn.setDoOutput(true);httpConn.setDoInput(true);httpConn.setUseCaches(false);httpConn.setRequestMethod("POST");httpConn.setInstanceFollowRedirects(true);httpConn.connect();httpConn.setConnectTimeout(3000);httpConn.setReadTimeout(3000);DataOutputStreamout=newDataOutputStream(httpConn.getOutputStream());out.flush();out.close();//OutputStreamoutStrm=httpConn.getOutputStream();BufferedReaderbufReader;StringBuildercontentBuf=newStringBuilder(1024*100);try{bufReader=newBufferedReader(newInputStreamReader(httpConn.getInputStream(),encode));Stringline="";while((line=bufReader.readLine())!=null){contentBuf.append(line);}bufReader.close();}catch(Exceptione){e.printStackTrace();}httpConn.disconnect();returnnewString(contentBuf);}

解决方案

解决方案二：

解决方案三：
我也遇取天气的问题，有牛人帮忙解决一下么

时间： 2024-12-27 08:21:00

关于HttpURLConnection抓取数据502异常问题

问题描述

解决方案

关于HttpURLConnection抓取数据502异常问题的相关文章

使用Scrapy抓取数据

jsoup ip封锁-jsoup 抓取数据如何解决 IP封锁

百度无法解析用户域名抓取压力图异常

利用Jsoup解析网页及抓取数据的简单应用

从网页抓取数据的一般方法

ajax-php采集高手进：利用curl模拟登录抓取数据遇到json调用问题不成功，求助！

php 模拟手机访问页面并抓取数据

源代码乱码问题-抓取数据乱码，不是编码问题

httpwebrequest网页抓取数据乱码