汉字字符串,怎么按汉字切分!

问题描述

比如是:“我是中国人”,怎么切分成“{“我”“是”中国人}”

解决方案

解决方案二:
随手写的看看对不对stringstr=“我是中国人”;string[]sArray1=str.Split(newchar[2]{'我','是'});foreach(stringiinsArray1){Console.WriteLine(i.ToString());}
解决方案三:
这牵扯到汉字分词了google:luence.net
解决方案四:
google:盘古分词
解决方案五:
用程序实现!!!
解决方案六:
中文分词http://topic.csdn.net/u/20100519/19/45d75f4f-0ef5-486e-8ef2-ae0a6c8e6cb0.html
解决方案七:
lucene.net
解决方案八:
引用5楼的回复:

中文分词http://topic.csdn.net/u/20100519/19/45d75f4f-0ef5-486e-8ef2-ae0a6c8e6cb0.html

惊现如梦!
解决方案九:
lucene.net用的多的就是盘古分词不过lucene.net已经不是apache基金会的正式项目了,不在更新了,没有新版本了,而且好用的中文分词非常少你可以用java版本的
解决方案十:
引用3楼的回复:

google:盘古分词

+1
解决方案十一:
引用7楼的回复:

引用5楼的回复:中文分词http://topic.csdn.net/u/20100519/19/45d75f4f-0ef5-486e-8ef2-ae0a6c8e6cb0.html惊现如梦!

惊现。

时间: 2024-08-20 05:36:19

汉字字符串,怎么按汉字切分!的相关文章

获得汉字字符串的首字母(T-SQL函数)

函数|汉字|字符串 /*--获得汉字字符串的首字母--*/if exists (select * from dbo.sysobjects where id = object_id(N'[dbo].[fGetPy]') and xtype in (N'FN', N'IF', N'TF'))drop function [dbo].[fGetPy]GO --创建取拼音函数create function fGetPy(@Str varchar(500)='')returns varchar(500)as

获得汉字字符串拼音首字母 C#版

汉字|拼音|字符串 获取字符串中的汉字拼音首字母(根据http://blog.csdn.net/iwebsms/archive/2004/09/28/119851.aspx修改) 可能代码比较臃肿,希望有朋友再帮忙改正 //返回给定字符串的首字母 private String IndexCode(String IndexTxt) { String _Temp=null; for(int i=0;i<IndexTxt.Length;i++) _Temp = _Temp + GetOneIndex(

Delphi中从字符串中提取单词及从字符串中提取汉字的函数

{从字符串中提取单词的函数} procedure StrToWordList(str: string; var List: TStringList); var p: PChar; i: Integer; begin if List = nil then List := TStringList.Create; List.Clear; {去除重复} List.Sorted := True; List.Duplicates := dupIgnore; p := PChar(str); {把单词以外的字

使用纯JS代码判断字符串中有多少汉字的实现方法(超简单实用)_javascript技巧

在网站开发中,经常会简单使用js代码来判断字符串中有多少汉字的功能.今天小编抽时间给大家分享实现代码.废话不多说了,直接给大家贴代码了. $("form").submit(function () { var content = editor.getContentTxt(); var sum = 0; re = /[\u4E00-\u9FA5]/g; //测试中文字符的正则 if (content) { if (re.test(content)) //使用正则判断是否存在中文 { if

偶数汉字转utf-8-VB将汉字字符串转换成 UTF-8格式

问题描述 VB将汉字字符串转换成 UTF-8格式 VB将汉字字符串转换成 UTF-8格式后按照JSON格式提交给服务器,偶数个汉字没有问题,但奇数个汉字时,会有问题,请大师指导. Private Declare Function MultiByteToWideChar Lib "kernel32 " (ByVal CodePage As Long, ByVal dwFlags As Long, ByVal lpMultiByteStr As Long, ByVal cchMultiBy

string-关于java中String类型汉字字符串的升序问题

问题描述 关于java中String类型汉字字符串的升序问题 本人新手,遇到一个项目问题:有若干个对象,每个对象里面都有一个String类型的姓名属性,现在要求根据姓名属性的升序将这些对象排列在List集合里,问如何将String类型的汉字升序排列.求大神 解决方案 String[] strs = {""张三(Z)""李四(L)""王五(W)""}; // 定义一个中文排序器 Comparator c = Collator.g

c++怎么将字符串中的汉字和数字分别存入不同字符指针所指空间?

问题描述 c++怎么将字符串中的汉字和数字分别存入不同字符指针所指空间? 如字符串:测试1次 将 测试 存入char*s 将 1 存入char* p 解决方案 只能想到一个一个字符的遍历,然后分别赋值给2个数组.如果确定输入的是"字符,字符,数字,字符"的格式,可以接收的时候就用格式化接收把他们分开. 解决方案二: #include int isalnum(int c); int isalpha(int c); int isascii(int c); int isblank(int c

oracle-请教Oracl如何比较汉字字符串的大小

问题描述 请教Oracl如何比较汉字字符串的大小 Greast(二级Access, C语言, VisualBasic, VisualFoxpro, 三级网络, 计算机一级) 计算机 计算机成绩全是汉字的,分为不合格,合格,优秀三档,但是用以上函数只能得到空格,大神能指点下如何以拼音顺序求几个字段的最大值吗? 谢谢! 解决方案 字符串的比较是按字节比较,参考http://blog.sina.com.cn/s/blog_5384afff0100rznr.html 解决方案二: 好像没有比较字符串大小

c#汉字字符串格式化问题

问题描述 c#汉字字符串格式化问题 我是通过流的方式把字符串输向打印机的,可是系统把一个汉字字符当成一个字节,我 需要控制文本的统一长度,然后问题来了,由于一个汉字占两个字节,我用不足位用0补 足就导致实际长度与我设想的长度不一样,求大神帮忙解决一下,以下是代码段: p.PrintText(liu, "" +sdr["dishname"] + ""); 这段代码中"liu"是流,sdr["dishname"

在线等,求c#加密字符串(包括汉字)算法,用delphi解密的函数算法

问题描述 在线等,求c#加密字符串(包括汉字)算法,用delphi解密的函数算法,需要c#加密函数和delphi解密函数,高分. 解决方案 解决方案二:40分高分..解决方案三:简单点的话,跟语言有毛的关系,C#减一,delphi就是加一如果是复杂的加密,一般各种语言都有封装好解决方案四:什么AES.DES加密算法网上多了去了,如果两种语言你都会大可以研究一下算法照过来翻译一遍就行了