C#实现的字符串相似度对比类

   本类适用于比较2个字符的相似度,代码如下:

  ?

        using System;

  using System.Collections.Generic;

  using System.Text;

  public class StringCompute

  {

  #region 私有变量

  ///

  /// 字符串1

  ///

  private char[] _ArrChar1;

  ///

  /// 字符串2

  ///

  private char[] _ArrChar2;

  ///

  /// 统计结果

  ///

  private Result _Result;

  ///

  /// 开始时间

  ///

  private DateTime _BeginTime;

  ///

  /// 结束时间

  ///

  private DateTime _EndTime;

  ///

  /// 计算次数

  ///

  private int _ComputeTimes;

  ///

  /// 算法矩阵

  ///

  private int[,] _Matrix;

  ///

  /// 矩阵列数

  ///

  private int _Column;

  ///

  /// 矩阵行数

  ///

  private int _Row;

  #endregion

  #region 属性

  public Result ComputeResult

  {

  get { return _Result; }

  }

  #endregion

  #region 构造函数

  public StringCompute(string str1, string str2)

  {

  this.StringComputeInit(str1, str2);

  }

  public StringCompute()

  {

  }

  #endregion

  #region 算法实现

  ///

  /// 初始化算法基本信息

  ///

  /// 字符串1

  /// 字符串2

  private void StringComputeInit(string str1, string str2)

  {

  _ArrChar1 = str1.ToCharArray();

  _ArrChar2 = str2.ToCharArray();

  _Result = new Result();

  _ComputeTimes = 0;

  _Row = _ArrChar1.Length + 1;

  _Column = _ArrChar2.Length + 1;

  _Matrix = new int[_Row, _Column];

  }

  ///

  /// 计算相似度

  ///

  public void Compute()

  {

  //开始时间

  _BeginTime = DateTime.Now;

  //初始化矩阵的第一行和第一列

  this.InitMatrix();

  int intCost = 0;

  for (int i = 1; i < _Row; i++)

  {

  for (int j = 1; j < _Column; j++)

  {

  if (_ArrChar1[i - 1] == _ArrChar2[j - 1])

  {

  intCost = 0;

  }

  else

  {

  intCost = 1;

  }

  //关键步骤,计算当前位置值为左边+1、上面+1、左上角+intCost中的最小值

  //循环遍历到最后_Matrix[_Row - 1, _Column - 1]即为两个字符串的距离

  _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);

  _ComputeTimes++;

  }

  }

  //结束时间

  _EndTime = DateTime.Now;

  //相似率 移动次数小于最长的字符串长度的20%算同一题

  int intLength = _Row > _Column ? _Row : _Column;

  _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);

  _Result.UseTime = (_EndTime - _BeginTime).ToString();

  _Result.ComputeTimes = _ComputeTimes.ToString();

  _Result.Difference = _Matrix[_Row - 1, _Column - 1];

  }

  ///

  /// 计算相似度(不记录比较时间)

  ///

  public void SpeedyCompute()

  {

  //开始时间

  //_BeginTime = DateTime.Now;

  //初始化矩阵的第一行和第一列

  this.InitMatrix();

  int intCost = 0;

  for (int i = 1; i < _Row; i++)

  {

  for (int j = 1; j < _Column; j++)

  {

  if (_ArrChar1[i - 1] == _ArrChar2[j - 1])

  {

  intCost = 0;

  }

  else

  {

  intCost = 1;

  }

  //关键步骤,计算当前位置值为左边+1、上面+1、左上角+intCost中的最小值

  //循环遍历到最后_Matrix[_Row - 1, _Column - 1]即为两个字符串的距离

  _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);

  _ComputeTimes++;

  }

  }

  //结束时间

  //_EndTime = DateTime.Now;

  //相似率 移动次数小于最长的字符串长度的20%算同一题

  int intLength = _Row > _Column ? _Row : _Column;

  _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);

  // _Result.UseTime = (_EndTime - _BeginTime).ToString();

  _Result.ComputeTimes = _ComputeTimes.ToString();

  _Result.Difference = _Matrix[_Row - 1, _Column - 1];

  }

  ///

  /// 计算相似度

  ///

  /// 字符串1

  /// 字符串2

  public void Compute(string str1, string str2)

  {

  this.StringComputeInit(str1, str2);

  this.Compute();

  }

  ///

  /// 计算相似度

  ///

  /// 字符串1

  /// 字符串2

  public void SpeedyCompute(string str1, string str2)

  {

  this.StringComputeInit(str1, str2);

  this.SpeedyCompute();

  }

  ///

  /// 初始化矩阵的第一行和第一列

  ///

  private void InitMatrix()

  {

  for (int i = 0; i < _Column; i++)

  {

  _Matrix[0, i] = i;

  }

  for (int i = 0; i < _Row; i++)

  {

  _Matrix[i, 0] = i;

  }

  }

  ///

  /// 取三个数中的最小值

  ///

  ///

  ///

  ///

  ///

  private int Minimum(int First, int Second, int Third)

  {

  int intMin = First;

  if (Second < intMin)

  {

  intMin = Second;

  }

  if (Third < intMin)

  {

  intMin = Third;

  }

  return intMin;

  }

  #endregion

  }

  ///

  /// 计算结果

  ///

  public struct Result

  {

  ///

  /// 相似度

  ///

  public decimal Rate;

  ///

  /// 对比次数

  ///

  public string ComputeTimes;

  ///

  /// 使用时间

  ///

  public string UseTime;

  ///

  /// 差异

  ///

  public int Difference;

  }

  调用方法:

  ?

       // 方式一

  StringCompute stringcompute1 = new StringCompute();

  stringcompute1.SpeedyCompute("对比字符一", "对比字符二"); // 计算相似度, 不记录比较时间

  decimal rate = stringcompute1.ComputeResult.Rate; // 相似度百分之几,完全匹配相似度为1

  // 方式二

  StringCompute stringcompute2 = new StringCompute();

  stringcompute2.Compute(); // 计算相似度, 记录比较时间

  string usetime = stringcompute2.ComputeResult.UseTime; // 对比使用时间

时间: 2024-12-27 12:46:00

C#实现的字符串相似度对比类的相关文章

javascript中数组和字符串的方法对比_javascript技巧

前面的话 字符串和数组有很多的相同之处,它们的方法众多,且相似度很高:但它们又有不同之处,字符串是不可变值,于是可以把其看作只读的数组.本文将对字符串和数组的类似方法进行比较 可索引 ECMAScript5定义了一种访问字符的方法,使用方括号加数字索引来访问字符串中的特定字符 可索引的字符串的最大的好处就是简单,用方括号代替了charAt()调用,这样更加简洁.可读并且可能更高效.不仅如此,字符串的行为类似于数组的事实使得通用的数组方法可以应用到字符串上 如果参数超出范围或是NaN时,则输出un

经典算法题每日演练——第五题 字符串相似度

        这篇我们看看最长公共子序列的另一个版本,求字符串相似度(编辑距离),我也说过了,这是一个非常实用的算法,在DNA对比,网 页聚类等方面都有用武之地. 一:概念      对于两个字符串A和B,通过基本的增删改将字符串A改成B,或者将B改成A,在改变的过程中我们使用的最少步骤称之为"编辑距离". 比如如下的字符串:我们通过种种操作,痉挛之后编辑距离为3,不知道你看出来了没有? 二:解析   可能大家觉得有点复杂,不好理解,我们试着把这个大问题拆分掉,将"字符串

PHP中计算字符串相似度的函数代码_php技巧

similar_text - 计算两个字符串的相似度 int similar_text ( string $first , string $second [, float &$percent ] ) $first 必需.规定要比较的第一个字符串. $second 必需.规定要比较的第二个字符串. $percent 可选.规定供存储百分比相似度的变量名. 两个字符串的相似程度计算依据 Oliver [1993] 的描述进行.注意该实现没有使用 Oliver 虚拟码中的堆栈,但是却进行了递归调用,这

图片的相似度对比

问题描述 现在在对比图片过程中遇到了这类图片.http://img.bbs.csdn.net/upload/201601/23/1453532447_177941.jpghttp://img.bbs.csdn.net/upload/201601/23/1453532683_139088.jpg1.A图的大小和B图的大小不一致,需要先将图片都归为同样大小.2.A图背景只是纯白色的,而B图的背景是有杂色的如果要实现对比,可能需要将A图缩小,然后对对比B图中的图像.这个要怎么来实现他们的相似度呢??

JPG格式图像相似度对比。

问题描述 JPG格式图像相似度对比. 对jpg格式的图片提取特征需要先对其进行解码转换成位图,然后再利用对应的特征提取方法提取特征吗? 解决方案 最简单的,可以使用灰度直方图作为特征, 解决方案二: 不用吧,看你什么方法能把颜色信息提取出来就行,推荐opencv,psnr

生成随机字符串和验证码的类的PHP实例

 这篇文章主要介绍了生成随机字符串和验证码的类的PHP实例,有需要的朋友可以参考一下 网上有很多的php随机数与验证码的代码与文章,真正适用的没有几个.   索性自己搞一个吧.   开始本节的php教程 吧,以下代码的实现,主要做到可以很好区分一个get_code(),另一个create_check_image(),输出图像直接调用后面的,session()取验证码时直接get_code()就ok,顺带提下使用session时必须将session_star()放在最前面.   代码如下:   代

字符串加解密的类(VB.NET Source Code)

解密|字符串 'EZ_Crypt.vb(字符串加密和解密类) '参考NamespaceImports SystemImports Microsoft.VisualBasicImports System.CollectionsImports System.Configuration Namespace Security    Public Class Crypt    '加密字符串        Public Function Encrypt(ByVal PlainStr As String, B

计算字符串相似度的简易算法

算法设计背景: 最近设计知识管理系统的资源导入功能,为了尽量的做到组件化,方便扩展,方便其他模块使用.简 化组件提供的和需要的接口,设计并实现了基于 Mapping 机制的导入框架.其中有一功能用到了计算两 个字符串相似度的算法,简单设计如下以便参考: 设计思想: 把两个字符串变成相同的基本操作定义如下: 1.修改一个字符(如把 a 变成 b) 2.增加一个字符 (如 abed 变成 abedd) 3.删除一个字符(如 jackbllog 变成 jackblog) 针对于 jackbllog到j

.net-跪求方法把字符串内容转换成类

问题描述 跪求方法把字符串内容转换成类 比如有这么一个方法,其中的T是个类,比如这个类名叫Person,但是我只能知道string p="Person";,怎样才能转换成Person类,然后调用这个方法 public static void ResponoseXml<T>(T response, string code, string msg) { response.GetType().GetProperty("ErrCode").SetValue(re