php 截取字符串函数(中文字符串)

php教程 截取字符串函数(中文字符串)
这是一款php 截取字符串函数哦,这是一款支持中文字符串哦,它可以截取html与中西文,等混合的内容,并且把html标签不算在字符截取之内,如果html标签没有闭合,程序将自动过滤多余的标签。
*/

function mysubstr( $str, $length ){
   
    $tagcnt = 0;
    $charcnt = 0;
    $tag = '';
    $maxlen = strlen( $str );
    $resultstr = '';
    $tagstack = array();

for( $i = 0; $i < $length; $i++ ){
        if( $str[$i] == '<' ){

$resultstr .= $str[$i];

for( $j=$i; $str[$j]!='>'; $j++,$length++ ){
                $tag .= $str[$j];
            }
            $tagcnt++;
            $length++;
            $tag .= '>';
           
            //如果是开始标记,则入栈,如果是与之相对应的结束标记则出栈
            if( preg_match('/<([^/]+)?>/i', $tag, $r) ){
                echo '入栈:',htmlspecialchars($r[1]),'<br />';
                array_push($tagstack, $r[1]);
            }
            elseif( preg_match( '/'.$tagstack[count($tagstack)-1].'/', $tag ) ){
                echo '出栈:',htmlspecialchars($tagstack[count($tagstack)-1]),'<br />';
                array_pop( $tagstack );
            }

$tag = '';
            continue;
        }

$charcnt++;
        $resultstr .= $str[$i];
    }

echo '<hr size=1>最后结果为:';

//栈是空的直接返回
    if(empty($tagstack)){
        return $resultstr;
    }
    //否则去掉没有结束标记的开始标记
    else{
       
        while(!empty($tagstack)){

$tag = array_pop($tagstack);

$index = strrpos($resultstr, $tag);

for($i = $index-1; $resultstr[$i] != '>'; $i++ ){
                $resultstr[$i] = '';
            }

$resultstr[$i++] = '';
       
        }

return $resultstr;
    }
   
}

$sttime = microtime(true);

$stmem = memory_get_usage();

$str = "a1<body>b2<p>c3<em>d4</em>e5</p>f6</body>g7h8";

echo '处理结果为:<br/><hr size=1>',htmlspecialchars( mysubstr( $str, 18 ) ),'<br />';

echo "内存使用情况:",(memory_get_usage()-$stmem),'<br />';

echo "算法运行时间(microtime):",(microtime(true)-$sttime),'<br/>';
//方法二

/

**
 * 函数名 html_substr
 * 功能 从html串中截取指定长度的字串,html标记不计算在内
 * 参数
 *  $str 要截取的串
 *  $len 要截取的长度
 *  $mode 不匹配的标记的处理方式 0 删去(默认),1 补齐
 * 返回 截取到的串
 * 说明
 *  未考虑多字节字符,仅已字节做计数单位
 *  未考虑可单独存在的标记
 **/
function html_substr($str, $len, $mode=0) {
  $ar= preg_split('/(<!--.*-->|<[^>]*>)/s', $str, -1, preg_split_delim_capture);
  foreach($ar as $k => $v) {
    if($v{0} != '<') {
      $len = $len - strlen($v);
      if($len < 0) $ar[$k] = substr($v, 0, $len);
    }else $ar[$k] = strtolower($v);
    if($len <= 0) break;
  }
  $ar = array_slice($ar, 0, $k+1);
  $len = count($ar);
  foreach($ar as $k=>$v) {
    if($v{0} == '<' && $v[1] != '/') {
      $ch = str_replace('<', '</', $v);
      for($i=$k+1; $i<$len && $ar[$i]!=$ch; $i++);
      if($i == $len)
        if($mode)
          $ar[$len] = $ch . $ar[$len];
        else
          $ar[$k] = '';
    }
  }
  return join('', $ar);
}
$str = "123<em>abc</em>456<em>def</em>789";

echo '<xmp>';
echo html_substr($str, 5) . php_eol;
echo html_substr($str, 5, 1);
$str = "a1<body>b2c3<p><em>d4</em>e</p>5f6</body>g7h8";
$gn  = 7;
$i   = $j = $k = 0;
while( ($c = $str[$i++]) && $j < $gn )
{
    if( $c == '<')
    {
        $tag = 1;
    }
    elseif($c == '>')
    {
        if(trim($tg,'/') == 'em')
        {
            $tgs[$j-1] = '<'.$tg.'>';
        }
        else
        {
            if($tgs[$j-1]) $ogs[$j-1] = '1|'.'<'.$tg.'>';
            else $ogs[$j-1]           = '0|'.'<'.$tg.'>';
        }
        $tag = 0;
        $tg  = '';
    }
    elseif($tag == 1)
    {
        $tg .= $c;
    }
    else
    {
        $tmp[] = $c;
        $j++;
    }
}
$ts = count($tgs);
if($ts % 2) array_pop($tgs);
foreach($tmp as $k=>$v)
{
   $ba = explode('|',$ogs[$k],2);
   if( $tgs[$k] && $ogs[$k])
   {
        if($ba[0])
        {
            $s .= $v.$tgs[$k].$ba[1];
        }   
        else $s .= $v.$ba[1].$tgs[$k];
   }
   else $s .= $v.$tgs[$k].$ba[1];
}
echo htmlspecialchars($s);

时间: 2024-10-29 21:16:35

php 截取字符串函数(中文字符串)的相关文章

C#字符串函数与字符串操作

字符串是由类定义的,如下 public sealed class string : icomparable, icloneable, iconvertible, icomparable<string>, ienumerable<char>, ienumerable, iequatable<string> 注意它从接口ienumerable<char>派生,那么如果想得到所有单个字符,那就简单了, list<char> chars = s.toli

利用PHP分割字符串函数把字符串成分割数组

str_split() 可以将字符串按照需要的长度做分割, 但是如果字符串中有UTF-8编码的中文出现,就会出现乱码. 如果需要实现支持中文的按照长度分割字符串的功能就需要额外处理  代码如下 复制代码 <?php $str = 'hello world'; $arr = str_split($str); print_r($arr); /* Array (     [0] => h     [1] => e     [2] => l     [3] => l     [4]

一个中文字符串截取函数,巨爽~~~!

函数|中文|字符串 PHP代码:-------------------------------------------------------------------------------- <?php /*****@Author:LAD***@URL :<a href="http://www.cnpik.com/" target="_blank">http://www.cnpik.com/</a>***@E_mail:lianxiw

PHP中一个中文字符串截取函数

函数|中文|字符串 <?php /** ***@Author:LAD ***@URL :<a href="http://www.cnpik.com/" target="_blank">http://www.cnpik.com/</a> ***@E_mail:lianxiwoo@sohu.com ***@随便用,不收钱 :-) */ function cnSubStr($string,$sublen) { if($sublen>=s

mysql中字符串截取常用函数

mysql教程中字符串截取常用函数 mysql 字符串截取函数: left()返回字符串str的最左面len个字符, right()返回字符串str的最右面len个字符, substring()从字符串str的起始位置pos返回一个子串, substring_index().回从字符串str的第count个出现的分隔符delim之后的子串.如果count是正数,返回最后的分隔符到左边(从左边数) 的所有字符.如果count是负数,返回最后的分隔符到右边的所有字符(从右边数). 还有 mid(st

php支持中文字符串分割的函数_php技巧

str_split不支持中文,利用mb_xx函数实现个 /** * Convert a string to an array * @param string $str * @param number $split_length * @return multitype:string */ function mb_str_split($str,$split_length=1,$charset="UTF-8"){ if(func_num_args()==1){ return preg_spl

PHP字符串函数教程:PHP字符串分割函数处理

PHP字符串函数在PHP网站开发中广泛使用,比如使用PHP字符串函数对字符串分割.截取.匹配.替换等处理.PHP字符串函数对于PHP入门学习者来说必不可少,本文将主要介绍PHP字符串分割函数处理心得,开启PHP字符串函数入门学习教程之旅. 常用的PHP字符串分割函数 常用的PHP分割字符串函数主要有explode.strtok.str_split,主要用来拆分字符串,并以数组或字符串形式返回,与这三个PHP字符串分隔函数相对应的,以分隔符连接拆分字符串的PHP字符串函数有implode.join

MySQL字符串函数详解(推荐)_Mysql

一.ASCII ASCII(str) 返回字符串str的最左面字符的ASCII代码值.如果str是空字符串,返回0.如果str是NULL,返回NULL. 二.ORD ORD(str) 如果字符串str最左面字符是一个多字节字符,通过以格式((first byte ASCII code)*256+(second byte ASCII code))[*256+third byte ASCII code...]返回字符的ASCII代码值来返回多字节字符代码.如果最左面的字符不是一个多字节字符.返回与A

asp之字符串函数示例_应用技巧

asp之字符串函数示例用字符串函数对字符串进行截头去尾.大小写替换等操作. 函数 语法 功能 Len Len(string|varname) 返回字符串内字符的数目,或是存储一变量所需的字节数. Trim Trim(string) 将字符串前后的空格去掉 Ltrim Ltrim(string) 将字符串前面的空格去掉 Rtrim Rtrim(string) 将字符串后面的空格去掉 Mid Mid(string,start,length) 从string字符串的start字符开始取得length长

asp之字符串函数示例

函数|示例|字符串 asp之字符串函数示例用字符串函数对字符串进行截头去尾.大小写替换等操作. 函数 语法 功能 Len Len(string|varname) 返回字符串内字符的数目,或是存储一变量所需的字节数. Trim Trim(string) 将字符串前后的空格去掉 Ltrim Ltrim(string) 将字符串前面的空格去掉 Rtrim Rtrim(string) 将字符串后面的空格去掉 Mid Mid(string,start,length) 从string字符串的start字符开