问题描述
C#在进行文件的编码转换时,必须同时为其提供字符流的原编码格式和目标编码格式,是否有方法可以在不知道源编码格式的情况下,自动将字符流转换为目标编码格式。比如,我从网络下载了一个网页文件,网页文件的编码格式多种多样,我能否在不知道网页文件源编码的情况下转换为统一的Unicode编码?
解决方案
解决方案二:
yes
解决方案三:
引用1楼swwllx的回复:
yes
能否具体说说如何实现?
解决方案四:
你根据response的charset对应的encoding将byte[]读成string,就是unicode了
解决方案五:
引用3楼fangxinggood的回复:
你根据response的charset对应的encoding将byte[]读成string,就是unicode了
问题是并不是所有网页都那么规范,有些网页连charset都没有,有的虽然有charset,但是文件本身的编码跟charset制定的编码格式不一样。只能通过截断字符流进行解析判断。
解决方案六:
当然可以
时间: 2024-11-01 06:05:14