用正则,从指定起始位置,在源字符串之中截取定长字符串

[代码]用正则, 从指定起始位置, 在源字符串之中截取定长字符串(含中文)[第四版]
[代码]用正则, 从指定起始位置开始, 在源字符串之中截取一定长度的字符串[第四版]
[代码]使用正则表达式, 从指定的起始位置开始, 在源字符串之中截取一定长度的字符串[第四次修正]
[代码]使用正则表达式, 从字符串头部开始, 在源字符串之中截取一定字节长度的字符串
[代码]使用正则表达式, 从指定的起始位置开始, 在源字符串之中截取一定长度的字符串

(BTW: 中文编码很复杂也有些不合理的地方 高位是 0xa1-0xfe (不含 0xff 因为 0xff即 255在telnet协议中有重要作用), 低位 0x40-0xfe; 而 GBK 为了和 unicode 映射把高位扩展到了 0x81-0xfe

对于最后字节是否截取错误中文的说明:
最后一个字节,假如截取了中文的一半,那么应该是高位字节,其ASCII码大于0x81的。
因为中文的高位字节都是大于0x81的,而低位字节不限。
一个完整的汉字:[0x81-0xfe][0x40-0xfe]
故使用正则表达式,依次取出汉字和非汉字,汉字优先。
最后一个字节,假如截取了中文的一半,那么她将是一个非汉字,而且是汉字的高位字节
而判定这个字节是否在[0x81-0xfe],即可知道是否截取错误。

<?php

// ---------------------------------------------------------------
// File name : preg_substr.php
// Description : 使用正则表达式, 从指定的起始位置开始, 在源字符串之中截取一定程度的字符串
// -----------------------------------------------------------

/// 函数说明
/// 函数名称 : preg_substr
/// 函数版本 : 第四次修订
/// 函数功能 : 使用正则表达式, 从指定的起始位置开始, 在源字符串之中截取一定程度的字符串
/// 函数参数 :
/// $strSource : 源字符串
/// $intStart : 起始位置, 默认为0表示从头开始
/// $intLen : 截取长度, 默认为32

function preg_substr($strSource, $intStart=0, $intLen=32)
{
is_int($intLen) ?0:die("len isn't a integer");
is_int($intStart) ?0:die("start isn't a integer");
if ($intStart>=0 && $intLen>0 && @preg_match('/^(.{'.$intStart.'})(.{0,'.$intLen.'})/si', $strSource)) {
@preg_match('/^(.{'.$intStart.'})(.{0,'.$intLen.'})/si', $strSource, $regs);
@preg_match_all('/([x81-xFE].|.)/sim', $regs[1], $regs1, PREG_PATTERN_ORDER);
@preg_match('/^[x81-xFE]$/',$regs1[1][count($regs1[1])-1])?$intStart--:0;

@preg_match('/^(.{'.$intStart.'})(.{0,'.$intLen.'})/si', $strSource, $regs);
@preg_match_all('/([x81-xFE].|.)/sim', $regs[2], $regs1, PREG_PATTERN_ORDER);
@preg_match('/^[x81-xFE]$/',$regs1[1][count($regs1[1])-1])?$intLen--:0;

@preg_match('/^(.{'.$intStart.'})(.{0,'.$intLen.'})/si', $strSource, $regs);

$strResult = $regs[2];
}else{
$strResult = "";
}
return $strResult;
}

function preg_substr2($strSource, $intStart=0, $intLen=32)
{
is_int($intLen) ?0:die("len isn't a integer");
is_int($intStart) ?0:die("start isn't a integer");
if ($intStart>=0 && $intLen>=0)
{
$strResult = substr($strSource, 0, $intStart);
@preg_match_all('/([x81-xFE].|.)/sim', $strResult, $regs, PREG_PATTERN_ORDER);
if(@preg_match('/^[x81-xFE]$/',$regs[1][count($regs[1])-1], $regs)){
$intStart--;
}

$strResult = substr($strSource, $intStart, $intLen);
@preg_match_all('/([x81-xFE].|.)/sim', $strResult, $regs, PREG_PATTERN_ORDER);
if(@preg_match('/^[x81-xFE]$/',$regs[1][count($regs[1])-1], $regs)){
$strResult = substr($strSource, $intStart, --$intLen);
}
}
return $strResult;
}

$strHTML = <<<HTML
ab

时间: 2024-10-26 08:21:02

用正则,从指定起始位置,在源字符串之中截取定长字符串的相关文章

急求高手,高手进!!javascript中怎么在指定的起始位置、改变我想要的字符、其他不变??

问题描述 怎么在指定的起始位置.改变我想要的字符.其他不变前后面的不变??高手进.谢谢. 解决方案

c# 2 0-如何将网页中指定DIV中的内容插入到WORD中指定标签位置进行替换?

问题描述 如何将网页中指定DIV中的内容插入到WORD中指定标签位置进行替换? 我用以下代码实现了文本替换指定标签.请问如何实现将网页中指定DIV中的内容对WORD中指定标签进行替换?请给出源码,请尽可能通过这个类进行操作.. protected void ReplaceWordDocAndSave(Microsoft.Office.Interop.Word.Document docObject, object savePath) { object format = Microsoft.Offi

设置UITextView光标从起始位置开始

一.刚开始用的时候,我加载的UITextView一直是这种情况: 当我在ViewController中设置这个属性: self.automaticallyAdjustsScrollViewInsets = NO; 变成了我们所需要的情况: 这个属性官方Doc中介绍的是设置一个BOOL值,用来指示是否视图控制器应该自动调整它的滚动视图插入.当设置不插入的时候,就会从起始位置开始.希望能够帮助到大家.

android-如何在指定的位置处设置一个按钮

问题描述 如何在指定的位置处设置一个按钮 android系统环境下,我想在指定的位置,比如说 (x,y) 处设置一个按钮.这个位置的点是在运行时候生成的. 如何做来实现这个功能呢? 解决方案 LinearLayout.LayoutParams p = new LinearLayout.LayoutParams (LayoutParams.FILL_PARENT,LayoutParams.WRAP_CONTENT); p.topMargin = ; p.bottomMargin = ; p.lef

sql server指定文件位置优化性能

本文介绍SQL Server中指定文件位置优化性能 在缺省情况下,SQL Server把所有文件作为服务器放置在同一个驱动盘中.除此之外,它还将每一数据库的日志文件放置在同一个驱动盘中.这样,所有的磁盘访问都会使系统性能大大下降.在安装SQL Server时,你可以给每个文件类型指定默认驱动器和路径,但是我们建议安装者不要这样安装. 修正这个问题很容易.当建立一个新的数据库时,改变默认设置并且给每个文件指定位置,如下所示: 1. 从一个安装有SQL Server的驱动盘中将数据文件放置在其它驱动

JavaScript获取指定元素位置的方法

 本文实例讲述了JavaScript获取指定元素位置的方法.分享给大家供大家参考.具体如下: 代码如下: function showpane() { var self = document.getElementById("eID"); var left = self.getBoundingClientRect().left + document.documentElement.scrollLeft; var top = self.getBoundingClientRect().top

在windows窗体上滚动条控件的起始位置是怎么自定义的?

问题描述 在windows窗体上滚动条控件的起始位置是怎么自定义的? 在windows窗体上滚动条控件的起始位置是怎么自定义的?怎么修改窗口上滚动条的布局,在上面插入快捷定位的按钮呢? 解决方案 Win32窗体的所有控件都认为是窗体,所以创建一个自定义的控件跟创建一个win32的窗体是相似的 参考此篇文章http://www.codeproject.com/KB/miscctrl/custbutton001.aspx 先通过RegisterClassEx注册一个window class,然后就在

正则匹配指定开头和结尾的代码

问题描述 正则匹配指定开头和结尾的代码 我想要实现的功能是这样的 .一段文本如下中间会有很多标签以"["开头,以"]"结尾,中间可以是字母,数字,我想要删除这些标签:家住新塍镇的[b]小何是[/b]新塍镇"美丽家"的一名员工,23岁,正是一个美好的年纪,看着她阳光的微笑,外人很难看[center]出一个这[center]样乐观的花样年华的女孩子身上所承担的责任与压力--养父去世,养母被诊断为尿[font size=""5&qu

pat-PAT1009 c语言字符串问题 我写的程序输出时起始位置会多一个空格,如何改正才能没有空格

问题描述 PAT1009 c语言字符串问题 我写的程序输出时起始位置会多一个空格,如何改正才能没有空格 #include #include int main(){ int i,j=0,m,k=0; char sen[100]; char s[10][20]; gets(sen); m=strlen(sen)+1; for(i=0;i<m;i++){ if(sen[i]==''){ s[j][k]=''; k=0; j++; } if(sen[i]==' ') { s[j][k]=''; k=0;