javascript 高效按字节截取字符串

 做为一个前端开发人员在网页展示中经常会碰到,标题过长,需要截取字符串,用CSS的实现的话各种兼容问题,各种坑。

让后台程序截一下,又各种推托,让后台按字节截一下更是和要了后台老命一样,最后可能只会安字符长度给你截一下,最后不好看,对不齐,还是回头整CSS、调兼容;

有以上有感触的前端同学默默点个赞吧。

 

最近接触一个项目,后台只提供接口(json),所有页面的数据渲染,数据绑定都都交给了前端。终于,不考虑SEO,页面所有的主动权到偶的手中了,不经意间就碰到字节截取老问题了。

网络上流传一个Javascript简单获取字节长度的方法:

String.prototype.Blength = function(){//返回字符串字节长度
    return this.replace(/([^\x00-\xFF])/g, "aa").length;
};

确实很简单,大于ASCII码的字符都算做两个字节,虽然严格来说不正确,但我们是用来辅助展示效果的,真严格起来反而不好了,

但总感觉为了一点投机取巧,而用正则这种较耗时东西不太好,其实也就节省了两行代码,所以我决定还是用正常方式计算:

function getBlength(str){
    for(var i=str.length;i--;){
        n += str.charCodeAt(i) > 255 ? 2 : 1;
    }
    return n;
}

我并没有把方法扩展到String对像的原型上去,还是因为效率问题,以下是测试代码:

//扩展到String的prototype上
String.prototype.Blength = function () {
    var str = this,
    n = 0;
    for (var i = str.length; i--; ) {
        n += str.charCodeAt(i) > 255 ? 2 : 1;
    }
    return n;
}
//给String对像增加一个方法
String.getBlength = function (str) {
    for (var i = str.length, n = 0; i--; ) {
        n += str.charCodeAt(i) > 255 ? 2 : 1;
    }
    return n;
}
//先构造一个中英混合的长字符串
var str = "javascript 高效按字节截取字符串方法 getBlengthjavascript 高效按字节截取字符串方法 getBlength";
str = str.replace(/./g, str).replace(/./g, str);
console.log("创造的字符串长度为:",str.length)
console.log("-------------测试开始--------------")
console.log("str.Blength() >> ",str.Blength())
console.log("String.getBlength(str) >> ",String.getBlength(str))
console.log("--效率测试开始--")

var time1 = new Date()
for(var i=0;i<100;i++){
    str.Blength()
}
console.log("Blength耗时:",new Date() - time1);

var time2 = new Date()
for(var i=0;i<100;i++){
    String.getBlength(str)
}
console.log("getBlength耗时:",new Date() - time2);

结果效率差的不是一点半点,至于原因可能时间花费在了原型链的检索上了,我没有深究,知道的可以留言告诉我:

创造的字符串长度为: 314432
-------------测试开始--------------
str.Blength() >>  425408
String.getBlength(str) >>  425408
--效率测试开始--
Blength耗时: 1774
getBlength耗时: 95

现在要截取字符串的基础函数有了,因为在这种情况下字符占的字节长度最长为2,所以用二分法来找到合适截取位置是再好不过了。

给一个效率应该算不错的截取函数:

 

//简单计算字节长度
String.getBlength = function (str) {
    for (var i = str.length, n = 0; i--; ) {
        n += str.charCodeAt(i) > 255 ? 2 : 1;
    }
    return n;
}
//按指定字节截取字符串
String.cutByte = function(str,len,endstr){
    var len = +len
        ,endstr = typeof(endstr) == 'undefined' ? "..." : endstr.toString();
    function n2(a){ var n = a / 2 0; return (n > 0 ? n : 1)} //用于二分法查找
    if(!(str+"").length !len len<=0){return "";}
    if(this.getBlength(str) <= len){return str;} //整个函数中最耗时的一个判断,欢迎优化
    var lenS = len - this.getBlength(endstr)
        ,_lenS = 0
        , _strl = 0
    while (_strl <= lenS){
        var _lenS1 = n2(lenS -_strl)
        _strl += this.getBlength(str.substr(_lenS,_lenS1))
        _lenS += _lenS1
    }
    return str.substr(0,_lenS-1) + endstr
}

 

拿上面的字符串来测试一下,应该是载得越长越耗时,截个20W的长度试试:

console.log("创造的字符串长度为:",str.length," 字节长度为:",String.getBlength(str))
console.log("-------------测试开始--------------")
console.log("String.cutByte('1开始1',6,'...') >> ",String.cutByte('1开始1',6,'...'))
console.log("String.cutByte(str,12,'...') >> ",String.cutByte(str,12,'...'))
console.log("String.cutByte(str,13,'..') >> ",String.cutByte(str,13,'..'))
console.log("String.cutByte(str,14,'.') >> ",String.cutByte(str,14,'.'))
console.log("String.cutByte(str,15,'') >> ",String.cutByte(str,15,''))
console.log("--效率测试开始--")
var time1 = new Date()
for(var i=0;i<100;i++){
    String.cutByte(str,200000,'...')
}
console.log("耗时:",new Date() - time1);

输出结果:

创造的字符串长度为: 314432  字节长度为: 425408
-------------测试开始--------------
String.cutByte('1开始1',6,'...') >>  1开始1
String.cutByte(str,12,'...') >>  javascrip...
String.cutByte(str,13,'..') >>  javascript ..
String.cutByte(str,14,'.') >>  javascript 高.
String.cutByte(str,15,'') >>  javascript 高
--效率测试开始--
耗时: 155

其实把截取字符长度改到30W 40W的耗时也差不了多少,在二分法面前,这都是一个级别的

对比之前的计算字节长度的耗时,用二分法查找截取只消耗了不到两次字节长度的记算的时间.

时间: 2024-10-24 18:16:31

javascript 高效按字节截取字符串的相关文章

标题过长使用javascript按字节截取字符串_javascript技巧

做为一个前端开发人员在网页展示中经常会碰到,标题过长,需要截取字符串,用CSS的实现的话各种兼容问题,各种坑. 让后台程序截一下,又各种推托,让后台按字节截一下更是和要了后台老命一样,最后可能只会安字符长度给你截一下,最后不好看,对不齐,还是回头整CSS.调兼容: 有以上有感触的前端同学默默点个赞吧. 最近接触一个项目,后台只提供接口(json),所有页面的数据渲染,数据绑定都都交给了前端.终于,不考虑SEO,页面所有的主动权到偶的手中了,不经意间就碰到字节截取老问题了. 网络上流传一个Java

按字节截取字符串java代码

按字节截取字符串java代码 本文章提供三款java截取字符串函数,他们可以按字节不来取截取字符串长度的代码,很方便实例. * 取字符串的前tocount个字符 * * @param str 被处理字符串 * @param tocount 截取长度 * @param more 后缀字符串 * @version 2004.11.24 * @author zhulx * @return string */ public static string substring(string str, int

java按字节截取带有汉字的字符串的解法(推荐)_java

由于接口使用的oracle字段长度为固定字节数,然后传进来的字符串估计比数据库字段的总字节数要大,那么截取小于数据库字节数的字符串. 自己参考网上的例子,整了个递归调用就可以了,因为截取的字符字节长度必须小与数据库的字节长度,即如果最后一个字符为汉字,那么只能去掉往前截取. /** * 判断传进来的字符串,是否 * 大于指定的字节,如果大于递归调用 * 直到小于指定字节数 ,一定要指定字符编码,因为各个系统字符编码都不一样,字节数也不一样 * @param s * 原始字符串 * @param

javascript截取字符串小结

  本文章收藏了多种字符截取的方法,包括常用的js截取字符串,截取字符串函数及常用的截取使用,非常的简单实用,有需要的小伙伴可以参考下. 本文总结介绍了三种使用Javascript截取字符串的方法,同时也总结了两种截取中文字符串的办法,分享一下. 1.substring 方法 定义和用法 substring 方法用于提取字符串中介于两个指定下标之间的字符. 语法 stringObject.substring(start,stop) 参数 描述 start 必需.一个非负的整数,规定要提取的子串的

JavaScript截取字符串的Slice、Substring、Substr函数详解和比较

 这篇文章主要介绍了JavaScript截取字符串的Slice.Substring.Substr函数详解和比较,需要的朋友可以参考下 在JavaScript中,提取子字符串主要是通过 Slice.Substring.Substr 三个方法之一.    代码如下:// slice  // 语法: string.slice(start [, stop]) "Good news, everyone!".slice(5,9);  // 'news'   // substring  // 语法:

PostgreSQL Oracle 兼容性之 - substrb (基于字节的字符串截取)

标签 PostgreSQL , substrb , 字节截取 背景 Oracle的substrb函数,用于基于字节流的截取,需要考虑多字节字符串的编码问题,未截取完整字符,则不截取. https://docs.oracle.com/cd/B12037_01/olap.101/b10339/x_stddev004.htm substr则用于基于字符串的截取. PostgreSQL也可以支持类似的功能. orafce插件 安装orafce插件,里面包含了大量的oracle兼容函数. https://

JavaScript字符串对象substring方法入门实例(用于截取字符串)_基础知识

JavaScript substring 方法 substring 方法用于通过指定开始和结束位置来截取字符串并返回截取部分字符串.其语法如下: 复制代码 代码如下: str_object.substring(start, end) 参数 说明 str_object 要操作的字符串(对象) start 必需.开始截取的位置,非负整数 end 可选.字符串截取结束的位置,非负整数:如果省略,则至字符串结束为止 提示:如果参数 start 与 end 相等,那么该方法返回的就是一个空串.如果 sta

关于javascript正则表达式截取字符串的问题

问题描述 关于javascript正则表达式截取字符串的问题 一字符串:"@bji|北京|BJP|0@sha|上海|SHH|1@tji|天津|TJP|2",我要的结果是:{@bji|北京|BJP|0,sha|上海|SHH|1,@tji|天津|TJP|2},javascript怎么用正则表达式分隔成这三部分.小弟对正则表达式实在太瞎 解决方案 var reg="@bji|北京|BJP|0@sha|上海|SHH|1@tji|天津|TJP|2" alert(reg.mat

javascript截取字符串小结_javascript技巧

本文总结介绍了三种使用Javascript截取字符串的方法,同时也总结了两种截取中文字符串的办法,分享一下. 1.substring 方法 定义和用法 substring 方法用于提取字符串中介于两个指定下标之间的字符. 语法 stringObject.substring(start,stop) 参数 描述 start 必需.一个非负的整数,规定要提取的子串的第一个字符在 stringObject 中的位置. stop 可选.一个非负的整数,比要提取的子串的最后一个字符在 stringObjec