php除去字串中的重复词,生成索引字符串

/php除去字串中的重复词,生成索引字符串,字符串参数为已经分词处理的串
  //--------------------------------------------------
  function getindextext($okstr,$ilen=-1)
  {
    if($okstr=="") return "";
    $ws = explode(" ",$okstr);
    $okstr = "";
    $wks = "";
    foreach($ws as $w)
    {
      $w = trim($w);
      //排除小于2的字符
      if(strlen($w)<2) continue;
      //排除数字或日期
      if(!ereg("[^0-9:-]",$w)) continue;
      if(strlen($w)==2&&ord($w[0])>0x80) continue;
      if(isset($wks[$w])) $wks[$w]++;
      else $wks[$w] = 1;
    }
    if(is_array($wks))
    {
      arsort($wks);
      if($ilen==-1)
      { foreach($wks as $w=>$v) $okstr .= $w." "; }
      else
      {
        foreach($wks as $w=>$v){
          if((strlen($okstr)+strlen($w)+1)<$ilen) $okstr .= $w." ";
          else break;
        }
      }
    }
    return trim($okstr);
  }?>

时间: 2024-08-03 14:28:34

php除去字串中的重复词,生成索引字符串的相关文章

除去字串中的重复词,生成索引字符串

  //--------------------------------------------------   function GetIndexText($okstr,$ilen=-1)   {     if($okstr=="") return "";     $ws = explode(" ",$okstr);     $okstr = "";     $wks = "";     foreach(

除去字串中的重复词,生成索引字符串,字符串参数为已经分词处理的串

  //--------------------------------------------------   function getindextext($okstr,$ilen=-1)   {     if($okstr=="") return "";     $ws = explode(" ",$okstr);     $okstr = "";     $wks = "";     foreach(

字符串-linux shell提取字串中的字串

问题描述 linux shell提取字串中的字串 有如下字符串sdfsdf3.45dfsadfa>2.35< 怎么提取其中的3.45和2.35? 解决方案 我自己开个头吧,我知道用grep命令$ echo sdfsdf3.45dfsadfa>2.35< | grep -Eo '[0-9].[0-9]+'$ 3.45$ 2.35还有一种是用awk但,只能提取最右边的一个,即2.35$ echo sdfsdf3.45dfsadfa>2.35< | awk '{print g

如何截取字串中的字符串?

问题描述 {"287":"高白瓷","1085":"传统工艺","100000729":"是","2176":"中国龙瓷","352":"ZGB0003","1835":"摆件","100018425":"瓷","798

js中几种去掉字串左右空格的方法,请看

//Recon 的思路://-------------//去掉字串左边的空格function lTrim(str){    if (str.charAt(0) == " ")    {    //如果字串左边第一个字符为空格    str = str.slice(1);//将空格从字串中去掉    //这一句也可改成 str = str.substring(1, str.length);    str = lTrim(str);    //递归调用    }    return str

js中几种去掉字串左右空格的方法_javascript技巧

//recon 的思路: //------------- //去掉字串左边的空格 function ltrim(str) { if (str.charat(0) == " ") {   //如果字串左边第一个字符为空格   str = str.slice(1);//将空格从字串中去掉   //这一句也可改成 str = str.substring(1, str.length);   str = ltrim(str);   //递归调用 } return str; } //去掉字串右边的

返回字串的拼音首字母

拼音 //////////////////////////////////////////////////////////////file://函数名:gf_getfirstletter(string)file://功能:返回字串的拼音首字母,支持混合字符串(可以包含非汉字)file://参数:as_inputstringfile://返回值:stringfile://created 大同 张和平 dtzhp@yeah.net///////////////////////////////////

PHP编程:探索字串的奥秘

编程 在许多Web编程里,字符串总是会被大量地生成和处理的.正确地使用和处理字符串,对于PHP程 序员来说也同样越来越重要了.本文从最简单的字符串定义一直引导你到高层字符串处理技巧,希望 对大家有所帮助. 一.引号定义字符串 在PHP中,通常一个字符串被定义在一对引号中,如: 'I am a string in single quotes' "I am a string in double quotes" PHP语法分析器是用成对的引号来判断一个字符串的.因此,所有字符串必须使用同一种

C++语言基础-字串操作函数

如果你用过具有string数据类型的编程语言,你可能很不习惯,别人也有同感,所以标准C语言库中提供了几个字串操作函数.表1.3列出了最常用的字串操作函数及其用法说明.关于每个函数的详细说明和实例,见C++ Builder联机帮助. 表1.3字串操作函数 函数 说明 strcat() 将字串接合到目标字串的末尾 strcmp() 比较两个字串是否相等 strcmpi() 比较两个字串是否相等,不考虑大小写 strcpy() 将字串内容复制到目标字串中 strstr() 扫描字串中第一个出现的字串