基本数据结构和算法在Linux内核中使用

根据Knuth、Morris和Pratt[1]实现了一个线性时间的字符串匹配算法。他们的算法避免了转换函数的显式地计算DELTA。对于长度为n的文本，其匹配时间是O(n)，对于长度为m的模式(pattern)，仅使用一个辅助函数PI[1 . .m]，预先计算模式的时间为O(m)。数组PI允许转换函数DELTA被实时有效地计算。粗略地说，对于任何状态"q"= 0,1,…、m和在SIGMA中的任何字符"a",PI["q"]的值包含的信息是独立的"a"并需要计算DELTA("q","a") [2]。既然PI只有m个记录，而DELTA有O(m
|SIGMA|)个记录，在预处理时间计算PI而不是DELTA的时候，我们可以节省一个因数|SIGMA|

[1] Cormen, Leiserson, Rivest, Stein，算法介绍，第二版，MIT出版社

[2] 见有限自动机原理

20.Boyer-Moore 模式匹配是在找替代品时的参考和建议。

实现了Boyer-Moore字符串匹配算法:

[1] 《一个快速的字符串搜索算法》，R.S. Boyer and Moore.计算机通信协会，20(10), 1977, pp. 762-772.http://www.cs.utexas.edu/users/moore/publications/fstrpos.pdf

[2] 《准确的字符串匹配算法手册》，Thierry Lecroq, 2004 http://www-igm.univ-mlv.fr/~lecroq/string/string.pdf

注:由于Boyer-Moore(BM)从右到左搜索匹配，仍然有可能匹配分布在多个块，在这种情况下该算法并没有优势。

如果你希望确保这样的事情永远不会发生，那使用Knuth-Pratt-Morris(KMP)实现。总之，根据您的设置适当地选择字符串搜索算法。

如果你正在用文本搜索器进行过滤，NIDS或任何类似的注重安全的目的，那么使用KMP。否则，如果你真的关心性能，并且你对数据包进行分类以使用服务质量(QoS)政策，当你不介意匹配可能分布分散，那么用BM。

时间： 2024-10-29 14:33:33

基本数据结构和算法在Linux内核中使用

基本数据结构和算法在Linux内核中使用

基本数据结构和算法在Linux内核中使用的相关文章

linux内核中的C语言常规算法(前提:你的编译器要支持typeof和type)

Linux内核中双向链表的经典实现

Linux内核中常见内存分配函数（一）

Linux内核中SPI总线驱动分析

Linux内核中的内存管理浅谈

Linux内核中链表的实现与应用【转】

大话Linux内核中锁机制之RCU、大内核锁

Linux内核中常见内存分配函数【转】

Linux内核中的jiffies及其作用介绍及jiffies等相关函数详解