用javascript解决外部数据抓取中的乱码问题_应用技巧

我们一般会在两个地方用到外部数据抓取，一个是在asp中，一个是在hta中。如果外部数据是gb2312编码的，就涉及到转码的问题，但是传统的用vbs函数进行处理的方法，运算量比较大，有些特殊字符还会出错。
如果用adodb.stream控件来进行转码，就简单多了，不需要借助vbs的二进制处理函数了，同时速度快了很多。

复制代码代码如下:

时间： 2024-10-28 18:21:06

用javascript解决外部数据抓取中的乱码问题_应用技巧的相关文章

用javascript解决外部数据抓取中的乱码问题

我们一般会在两个地方用到外部数据抓取,一个是在asp中,一个是在hta中.如果外部数据是gb2312编码的,就涉及到转码的问题,但是传统的用vbs函数进行处理的方法,运算量比较大,有些特殊字符还会出错. 如果用adodb.stream控件来进行转码,就简单多了,不需要借助vbs的二进制处理函数了,同时速度快了很多. 复制代码代码如下: <script> function loadData(sUrl){ var xh xh=new ActiveXObject(&q

如何解决远程页面抓取中的乱码问题

解决|问题|页面由于平时使用的网页文件基本上都是gb2312编码方式,如果通过xmlhttp控件读取的话,肯定会出现乱码问题,但是要把所有文件都改成utf-8编码,操作上比较麻烦.经过反复比较,我找到了相对实用的解决方法. ff提供了overrideMimeType方法,可以指定返回值的编码,所以解决起来比较简单,只要把这个方法指向gb2312就可以了.对于IE,可以用vbs配合来作编码转换,用gb2utf8来转换接收到的二进制数据,其中利用到execScript方法来调用vbs的函数. [复

如何解决远程页面抓取中的乱码问题_AJAX相关

由于平时使用的网页文件基本上都是gb2312编码方式,如果通过xmlhttp控件读取的话,肯定会出现乱码问题,但是要把所有文件都改成utf-8编码,操作上比较麻烦.经过反复比较,我找到了相对实用的解决方法. ff提供了overrideMimeType方法,可以指定返回值的编码,所以解决起来比较简单,只要把这个方法指向gb2312就可以了.对于IE,可以用vbs配合来作编码转换,用gb2utf8来转换接收到的二进制数据,其中利用到execScript方法来调用vbs的函数. 复制代码代码如下:

PHP中使用file_get_contents抓取网页中文乱码问题解决方法_php技巧

本文实例讲述了PHP中使用file_get_contents抓取网页中文乱码问题解决方法.分享给大家供大家参考.具体方法如下: file_get_contents函数本来就是一个非常优秀的php自带本地与远程文件操作函数,它可以让我们不花吹挥之力把远程数据直接下载,但我在使用它读取网页时会碰到有些页面是乱码了,这里就来给各位总结具体的解决办法. 根据网上有朋友介绍说原因可能是服务器开了GZIP压缩,下面是用firebug查看我的网站的头信息,Gzip是开了的,请求头信息原始头信息,代码如下: 复

ASP.NET抓取网页内容的实现方法_实用技巧

本文实例讲述了ASP.NET抓取网页内容的实现方法.分享给大家供大家参考.具体实现方法如下: 一.ASP.NET 使用HttpWebRequest抓取网页内容复制代码代码如下: /// <summary>方法一:比较推荐 /// 用HttpWebRequest取得网页源码 /// 对于带BOM的网页很有效,不管是什么编码都能正确识别 /// </summary> /// <param name="url">网页地址" </

在Python3中使用asyncio库进行快速数据抓取的教程_python

web数据抓取是一个经常在python的讨论中出现的主题.有很多方法可以用来进行web数据抓取,然而其中好像并没有一个最好的办法.有一些如scrapy这样十分成熟的框架,更多的则是像mechanize这样的轻量级库.DIY自己的解决方案同样十分流行:你可以使用requests.beautifulsoup或者pyquery来实现. 方法如此多样的原因在于,数据"抓取"实际上包括很多问题:你不需要使用相同的工具从成千上万的页面中抓取数据,同时使一些Web工作流自动化(例如填一些表单然后取回

数据抓取的艺术（一）：Selenium+Phantomjs数据抓取环境配置

数据抓取是一门艺术,和其他软件不同,世界上不存在完美的.一致的.通用的抓取工具.为了不同的目的,需要定制不同的代码.不过,我们不必Start from Scratch,已经有许多的基本工具.基本方法和基础框架可供使用.不同的工具.不同的方法.不同的框架的特点也不同.了解这些工具.方法和框架是首要任务,接下来就需要明白它们的差异都在哪里.什么情境该用什么东东,最后才是析出规则.编写代码.运行程序来抓取数据.所以说,其实数据抓取的学习路线,不但很长而且很杂. 为了一个特定的目的,我需要爬取G

百万级别知乎用户数据抓取与分析之PHP开发_php实例

这次抓取了110万的用户数据,数据分析结果如下: 开发前的准备安装Linux系统(Ubuntu14.04),在VMWare虚拟机下安装一个Ubuntu: 安装PHP5.6或以上版本: 安装curl.pcntl扩展. 使用PHP的curl扩展抓取页面数据 PHP的curl扩展是PHP支持的允许你与各种服务器使用各种类型的协议进行连接和通信的库. 本程序是抓取知乎的用户数据,要能访问用户个人页面,需要用户登录后的才能访问.当我们在浏览器的页面中点击一个用户头像链接进入用户个人中心页面的时候,之所以

网站数据抓取之争

对于信息抓取,很多情况下难以通过版权侵权的角度有效阻止,但是仍然可以选择不正当竞争的角度予以解决文赵占领4月16日,大众点评网对外宣布:网易于近日上线的移动客户端"饭饭"大量抄袭来自大众点评网的内容(商户信息以及餐厅特色.推荐菜.人均价格等),而这些内容是大众点评网从2003年开始付出了大量的人力.物力以及时间等经济成本创造起来的.大众点评网表示,网易应立即停止抄袭.停止不正当竞争行为,将网易"饭饭"下架,否则大众点评网将对网易采取相关的法律措施.对于大众点评网

猜你喜欢

Photoshop给河边人物调出暖色调

图片主色有点太浓,不能很好的突出人物部分.调色的时候把主色调淡,颜色用较为鲜艳的暖色,然后给暗部增加一点褐色并调亮,整体就会柔美很多. 原图 <点小图查看大图> 最终效果 1.打开素材图片 ...

linux网络编程之TCP/IP基础（五）分析一帧基于UDP的TFTP协议帧

下图是UDP的段格式: 相比TCP段格式,UDP要简单得多,也没啥好说的,需要注意的是UDP数据长度指payload加上首部的长度. 下面分析一帧基于UDP的TFTP协议帧: 以太网首部 0000 ...

易混淆的几个JAVA术语（转贴）

本帖版权归原作者,其它媒体或网站转载请与e龙西祠胡同[http://www.xici.net]或原作者联系,并注明出处. 作者: 晓风暗月发表日期: 2001-04-25 13:03:44 返回 ...

有趣的多线程编程（4）——死锁

编程|多线程 // DeadLockSample.cs// 分析一下为什么会发生死锁? using System;using System.Threading;public class Test{ s ...

ASP程序实现查看ASP文件源码实例代码

程序 <% SUB PrintLine (ByVal strLine) strLine=server.HTMLEncode(strLine) strLine=replace( ...

php+mysql实现无限级分类 | 树型显示分类关系

无限级分类,主要是通过储存上级分类的id以及分类路径来实现.由于数据的结构简单,所以要将分类的关系由树状显示,我只能想到用递归的方式给于实现,下面是分类数据表结构和自己写的一个树状显示函数,有 ...

70个漂亮的带有灵感的单页面网站设计实例

Beautiful & Inspirational Single Page Website Designs Throughout history, great artists always f ...

用ASP.NET在网页上显示缩略图

asp.net|缩略图|网页|显示网站上可能会有很多图片,比如产品图片等,而且他们可能大小不一,宽度和高度也不一定一样,有的很大有的很小.如果放在一张网页上,可能会破坏版面,但是如果强制让他们按照指 ...

SQL Server压缩日志及数据库文件大小

请按步骤进行,未进行前面的步骤时,请不要做后面的步骤,以免损坏你的数据库. 一般不建议做第4,6两步,第4步不安全,有可能损坏数据库或丢失数据.第6步如果日志达到上限,则以后的数据库处理会失败,在清 ...

jquery简单的div显示和隐藏特效

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...

设置cssClass属性生成的html中check没有class属性问题

使用struts2 checkboxlist标签设置cssClass属性后,发现生成的html代码中 input 标签并没有class属性. 打开checkboxlist.ftl看,内容如下:< ...

5种搜狗输入法打不出汉字卸载重装依然不行的解决方法

方法一.按一下键盘上的"Shift"键或"Caps Lock"键; 方法二.有可能是与别的输入法冲突,卸载掉其他输入法试一试; 方法三.回到桌面打开xTes ...

PS制作淘宝店铺动画店招和店铺公告

每一个在淘宝开店的朋友,都会遇到店铺装修的问题,要么去买些模板,要么自己动手制作,相信大多数人都愿意自己动手做出自己想要的效果.下面我就一步步的教大家如何制作动画,以店铺公告为例.有讲不好的地方请大家 ...

XP系统下AGP纹理加速不可用的解决方案

XP系统下AGP纹理加速不可用的解决方案具体如下: 1.遇到这种情况我们先运行Direct X诊断工具. 在运行中输入 dxdiag 点确定. 2.这时运行Direct X诊断 ...

Win7文件夹搜索功能不可以正常使用处理方法

一.Win7文件夹搜索功能为什么不能使用现象:不但文件夹搜索功能没用了,而且"开始-运行"命令也不能正常使用了处理方法:依次点击"控制面板-程序-程序和功能-打开 ...

开心手机恢复大师通过iTunes备份恢复误删的日历

首先,需要在电脑上安装开心手机恢复大师第一步:打开开心手机恢复大师,点击顶端的[通过iTunes备份恢复],选择您需要恢复的iTunes备份文件,点击[选定]按钮,直接进入扫描iTunes备份恢 ...

WinPE启动一般占用多大的内存

玩精简PE我们需要懂得很多的知识,下面来说说PE启动内存占用大小的计算方法: PE的启动内存和核心有关,大概为下面这个公式(只是大概) 1.用CAB压缩过的核心 X*2+16(单位MB)(X为未压 ...

数据结构——图

1 基本术语有向图:图中的每条边都有方向的图叫有向图.此时,边的两个顶点有次序关系,有向边<u,v>成为从顶点u到顶点v的一条弧,u成为弧尾(始点),v成为弧头(终点),即有向图中弧&l ...

ASP.NET使用Quartz.NET实现定时任务调度

第一步:下载Quartz.NET类库源码下载地址:http://www.quartz-scheduler.net/ 第二步:程序集成: 1.修改网站根目录下的web.config文件,在config ...

c# com组件配置文件问题

问题描述 c# com组件配置文件问题 ie调用c#写的com组件,组件中读取配置文件System.Configuration.ConfigurationManager.AppSettings[&qu ...

我的Android进阶之旅------&gt;Android如何去除GridView的按下或点击选中后的背景效果

今天用GridView做了一个界面,自己自定好了一个组件,并且设置好了点击和不点击组件时候的效果,但是运行的时候发现在我定义好的背景下面还有一层不知道哪儿来的背景,严重影响了我自 ...

《AngularJS深度剖析与最佳实践》一2.9　服务

2.9 服务如果你是一个后端程序员,那么对服务(Service)的概念一定不会陌生.在Angular中,服务的概念是一样的,差别只在于技术细节. 服务是对公共代码的抽象,比如,如果在多个控制器中都出 ...

firefox-火狐浏览器输不了中文验证码

问题描述火狐浏览器输不了中文验证码其他的浏览器都可以,火狐这里输不了,不知道是否是浏览器设置了什么东西还是别的什么原因,望知情人士透露透露解决方案应该是浏览器不兼容导致的吧解决方案二: 你代 ...

《MATLAB神经网络超级学习手册》——导读

前言 MATLAB是国际上公认的最优秀的数值计算和仿真分析软件之一,并且具有很强的开放性.到目前为止,MATLAB平台已经推出了几十种针对不同应用的工具箱,其中为满足神经网络研究而开发的神经网络工具箱 ...

没有想到氪星人居然会和TVB出现在同一个发布会

摘要: 没有想到氪星人居然会和TVB出现在同一个发布会. 今天腾讯旗下的QQ音乐在香港召开战略发布会,宣布与韩国YG Entertainment(YG娱乐)签署独家合作协议,代理后者在中国大陆地区的网 ...

美机构称联想资源有限进军消费者市场存挑战

[赛迪网讯]12月17日消息,据国外媒体报道,美调研机构TBR近日表示,联想明年进军全球个人消费者市场对于联想的长期成功至关重要,但挑战也是显而易见的. TBR认为,从长远角度讲,联想既要成为一家全球 ...

微软发布Visual Studio Mac预览版

日前,微软发布了Visual Studio的Mac预览版.Mac用户终于可以在自己喜欢的平台上使用Visual Studio开发各种应用了. 现在,Mac用户可以使用C#在Visual Studio里 ...

谈手机处理器

北京时间7月26日消息,智能移动技术快速发展,对处理器的要求也越来越高.不过,如果想大幅提升处理能力,最快的方法是在单一芯片上植入更多核心,这样的概念是否正确呢?高通移动运算营销副总裁蒂姆-麦克唐纳( ...

ios-大神看这里!=。=Java怎么接收数据并保存IOS传过来的图片？

问题描述大神看这里!=.=Java怎么接收数据并保存IOS传过来的图片? ios吧图片专程nsdate,并把它放到了http头里,我是写java的,不知到该怎么接收.之前没做过,百度了很多,现在好乱 ...

数据结构-克鲁斯算法中为什么是parents（edges[i].end）=edges[i].begin?

问题描述克鲁斯算法中为什么是parents(edges[i].end)=edges[i].begin? int FIND(int *p,int f) { while(p[f]!=0) f=p[f]; ...

热搜