JAVA URL和URLConnection及中文乱码解决方法

 也不多说什么了,就拿urlconnection类举个例子吧,做一个获取网站源码的代码

public class urldemo {
 public static void main(string[] args) {
  scanner scan = new scanner(system.in);
  
        system.out.println("请输入网址:");
  string urlstr ="http://"+scan.next();
  try {
   url url = new url(urlstr);        // 将urlstr字符串网址实例化为url定位地址s

   urlconnection urlconn = url.openconnection();   //打开网站链接s
   bufferedreader reader = new bufferedreader(new inputstreamreader(
     urlconn.getinputstream()));            //实例化输入流,并获取网页代码
   string s;                                         //依次循环,至到读的值为空
   stringbuilder sb = new stringbuilder();
   while ((s = reader.readline()) != null) {
    sb.append(s);    
   }
   reader.close();
   bufferedwriter bw = new bufferedwriter(new filewriter("d:1.html"));     //write写入文件(字节流)
   bw.write(sb.tostring());
   bw.flush();
   bw.close();
   system.out.println("另存为成功!");
  }

  catch (exception e) {
   // todo auto-generated catch block
   e.printstacktrace();
  }

 }

}

大家都知道url就是统一资源定位器

   它由协议名和资源名组成

 
下面一个汉字中文乱码处理方法

package   mynet;
import   java.io.ioexception;
import   java.io.inputstream;
import   java.net.malformedurlexception;
import   java.net.url;
import   java.util.date;

import   sun.net.www.protocol.http.httpurlconnection;

public   class   urldemo   {
public   static   void   main(string[]   args)   {

system.out.println( "starting... ");
int   c;

httpurlconnection   urlcon   =   null;
try   {
url   url   =   new   url( "http://www.111cn.net ");
try   {
urlcon   =   (httpurlconnection)url.openconnection();
}   catch   (ioexception   e)   {

}
system.out.println( "the   date   is   : "   +   new   date(urlcon.getdate()));
system.out.println( "content_type   : "   +   urlcon.getcontenttype());
try   {
inputstream   in   =   urlcon.getinputstream();
int   all=   in.available();
byte[]   b=   new   byte[all];
//   while   (((c   =   in.read())   !=   -1))   {
//   system.out.print((char)   c);
//   }
in.read(b);
string   webpage   =   new   string(b, "utf-8 ");

in.read(b);
string   webpage   =   new   string(b, "utf-8 ");
in.close();
system.out.println(webpage);
}   catch   (ioexception   e)   {
system.out.println( " "   +   e);
}

}   catch   (malformedurlexception   e)   {
system.out.println( " "   +   e);
}

}

}

 

时间: 2024-10-01 21:10:05

JAVA URL和URLConnection及中文乱码解决方法的相关文章

Java Web开发项目中中文乱码解决方法汇总_java

Java Web项目中,解决中文乱码方法总结如下 第一种情况:调用jsp页面中文显示乱码问题描述:通过浏览器调用jsp页面,在浏览器中显示的中文内容出现乱码. 解决方法:首先确认本jsp在编辑器中保存文件内容时,使用的是utf-8的编码格式,然后在jsp页面的开始处添加<%@ pageEncoding="utf-8"%>就可以解决这种中文乱码问题 第二种情况:调用servlet页面显示乱码问题描述:通过浏览器调用servlet,servlet在浏览器中显示的内容出现乱码.

ajax中文乱码解决方法总结

ajax乱码解决办法一: 在服务器指定发送数据的格式: 在jsp文件中: response.setContentType("text/text;charset=UTF-8");//返回的是txt文本文件 或是 response.setContentType("text/xml;charset=UTF-8");//返回的xml文件 PHP:header("Content-Type:text/html;charset=GB2312"); ajax乱码

Jfreechart中文乱码解决方法

Jfreechart中文乱码解决方法 jfreechart对中文的支持部是很好,我开始做的时候也有乱码,下面的方案是在java上运行可以的... <!--[if !supportLists]-->1.     <!--[endif]-->柱状图(CategoryPlot):    CategoryPlot plot=chart.getCategoryPlot();//获取图表区域对象    CategoryAxis domainAxis=plot.getDomainAxis();

zend studio 5.5中文乱码解决方法

zend studio 5.5中文乱码解决方法 购买zend产品的用户太少了还是我安装的问题,装好后桌面选项中竟然没有"简体中文"的语言选项了,到配置文件夹里看了一会,在系统盘中搜索XML文件desktop_options.xml(例如:C:Documents and SettingsAdministratorZDEconfig_5.5 目录下的 desktop_options.xml) <customized_property ID="desktop.language

php excel reader2.21导出excel中文乱码解决方法说明

之前我的PHP教程博客访友询问使用php excel reader2.21导出excel时中文出现乱码如何解决,现我说明下php excel reader导出excel中文乱码的解决方法,希望对使用php excel reader导出excel的朋友有所帮助. php excel reader介绍 php excel reader是一个读取Excel xsl文件内容的一个php excel类,目前最新版本是php excel reader2.21,网上可自行搜索,sourceforge上的php

使用WebLogic的OTN插件时Eclipse控制台输出中文乱码解决方法

  使用WebLogic时控制台输出中文乱码解决方法1.找到weblogic安装目录,当前项目配置的domain2.找到startWebLogic.cmd文件3.打开文件,在"call "%DOMAIN_HOME%\bin\startWebLogic.cmd" %*"上面增加如下代码即可,主要是设置UTF-8啊. @ECHO OFF @REM WARNING: This file is created by the Configuration Wizard. @RE

python 中文乱码解决方法

比如我从网上下载一些信息或写个电子邮件程序下载到本地,以记事本(txt) 形式写入并保存在本地计算机,为什么看到只是英文和乱码的?该怎样做呢? 答 乱码原因: 因为你的文件声明为utf-8,并且也应该是用utf-8的编码保存的源文件.但是windows的本地默认编码是cp936,也就是gbk编码,所以在控制台直接打印utf-8的字符串当然是乱码了. 解决方法: 在控制台打印的地方用一个转码就ok了,打印的时候这么写: print myname.decode('utf-8').encode('gb

SMARTY 中文乱码解决方法

<!doctype html public "-//w3c//dtd xhtml 1.0 transitional//en" "http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="content-

远程linux xshell下输出中文乱码解决方法_unix linux

使用xshell登录中文版CentOS或者redhat时,在xshell下如果输出的是中文的话可能会显示乱码,通过如下办法可以有效的解决乱码问题 linux中文乱码解决方法如下: 复制代码 代码如下: [root@localhost ~]# cd /etc/sysconfig/ [root@localhost sysconfig]# cp i18n i18n.bak #备份i18n文件 [root@localhost sysconfig]# echo "" >i18n [root