GUN C正则表达式

最近项目中要处理文本,因此就用了gun的正则表达式,它是posix风格的..我们一般使用的都是perl风格的,所以一开始使用可能会有一些不习惯.详细的区别可以在wiki上看到:

http://en.wikipedia.org/wiki/Regular_expression

头文件是regex.h可以在里面看到他所提供的接口.这里主要是3个函数和一个结构体:

引用

int regcomp (regex_t *compiled, const char *pattern, int cflags) int regexec (regex_t *compiled, char *string, size_t nmatch, regmatch_t matchptr [], int eflags) void regfree (regex_t *compiled) typedef struct { 　 regoff_t rm_so; 　 regoff_t rm_eo; } regmatch_t;

regcomp会将参数pattern编译为compiled,也就是讲字符串编译为正则表达式.

而参数cflags可以是下面1种或者几种的组合:

REG_EXTENDED

使用扩展的 posix　 Regular Expressions.

REG_ICASE

忽略大小写

REG_NOSUB

不存储匹配结果,只返回是否匹配成功.

REG_NEWLINE

可以匹配换行.

regexec执行匹配.compiled为刚才编译好的正则表达式,string为将要匹配的字符串,nmatch为后面的结构体数组的长度 (regmatch_t).matchptr为regmatch_t的一个数组(也就是存储着像perl里面的$0,$1这些的位置,也就是).而 eflag参数则可以是下面中的1个或多个.

REG_NOTBOL

会讲^作为一个一般字符来匹配,而不是一行的开始

REG_NOTEOL

会讲$作为一个一般字符来匹配,而不是一行的结束

regfree每次用完之后需要释放这个正则表达式.compiled为需要释放的正则表达式.

regmatch_t 中的rm_so为匹配字符的开始位置,rm_eo为结束位置.

说了这么多,其实使用很简单的:

引用

POSIX Regexp Compilation: Using regcomp to prepare to match. Flags for POSIX Regexps: Syntax variations for regcomp. Matching POSIX Regexps: Using regexec to match the compiled pattern that you get from regcomp. Regexp Subexpressions: Finding which parts of the string were matched. Subexpression Complications: Find points of which parts were matched. Regexp Cleanup: Freeing storage; reporting errors.

时间： 2024-09-11 04:08:28

GUN C正则表达式

GUN C正则表达式的相关文章

Java基础-14总结正则表达式，Pattern，Mactcher，Math，BigInteger，BigDeximal，System等

linux shell 正则表达式(BREs,EREs,PREs)差异比较

python使用正则表达式分析网页中的图片并进行替换的方法

JAVA正则表达式4种常用功能

请问一个正则表达式

js正则表达式基本知识

关于经纬度正则表达式

求助，正则表达式关于扩展名

IOS中用正则表达式判断输入的内容为8-16位且同时包含数字和字母