使用Ruby re模块创建复杂的正则表达式_ruby专题

例如,考虑下面的匹配日期的正则表达式:

复制代码 代码如下:

/\A((?:19|20)[0-9]{2})[\- \/.](0[1-9]|1[012])[\- \/.](0[1-9]|[12][0-9]|3[01])\z/

使用Re之后,正则表达式可以短小易读的表达式为基础,一步一步地构建出来,例如:

复制代码 代码如下:

require 're'

include Re

delim                = re.any("- /.")
century_prefix       = re("19") | re("20")
under_ten            = re("0") + re.any("1-9")
ten_to_twelve        = re("1") + re.any("012")
ten_and_under_thirty = re.any("12") + re.any("0-9")
thirties             = re("3") + re.any("01")

year = (century_prefix + re.digit.repeat(2)).capture(:year)
month = (under_ten | ten_to_twelve).capture(:month)
day = (under_ten | ten_and_under_thirty | thirties).capture(:day)

date = (year + delim + month + delim + day).all

虽然代码量增加了,但是每个部分都很短小,也很容易验证。同时,捕获的部分可以通过相应的变量名访问:

复制代码 代码如下:

result = date.match("2009-01-23")
result[:year]      # => "2009"
result[:month]     # => "01"
result[:day]       # => "23"

注意,用Re构建正则表达式会很慢,所以推荐创建正则表达式并复用。匹配的时候,性能和原生的正则表达式很接近。(额外的方法调用和创建Re::Result以返回匹配结果影响一点点性能。)如果你需要追求极致的性能,你仍然可以使用Re来构建正则表达式,然后抽取出原始的Ruby Regexp来匹配。这样的话,性能就和使用原生正则表达式一样了。

例如,构建匹配电话号码的正则表达式:

复制代码 代码如下:

PHONE_RE = re.digit.repeat(3).capture(:area) +
               re("-") +
               re.digit.repeat(3).capture(:exchange) +
               re("-") +
               re.digit.repeat(4)).capture(:subscriber)

然后抽取出原始的正则对象,直接使用它来匹配:

复制代码 代码如下:

PHONE_REGEXP = PHONE_RE.regexp

if PHONE_REGEXP =~ string
  # blah blah blah
end

时间: 2024-08-02 11:32:35

使用Ruby re模块创建复杂的正则表达式_ruby专题的相关文章

Ruby中关于模块的一些基础知识_ruby专题

模块与类很相似,它也可以说成是"不能被实例化的类".由于Class类是Module类的子类,所以说成是"类=模块+实例化能力"也许更好. 所谓模块,究竟是用来干什么的呢?其作用主要有两大类:Mix-in和命名空间. Mix-in实际上是受限制的多重继承.利用实际做成的继承关系,可以实现对某些类进行一些"点缀"的目的.事实上,Mix-in这种说法就来自于在冰激凌上面的饼干或者坚果. 在面向对象设计的历史中,由多重继承机制造成的问题早已众所周知了.所

Ruby的语法和语言特性总结_ruby专题

Ruby是一种解释型.面向对象.动态类型的语言.Ruby采取的策略是在灵活性和运行时安全之间寻找平衡点.随着Rails框架的出现,Ruby也在2006年前后一鸣惊人,同时也指引人们重新找回编程乐趣.尽管从执行速度上说,Ruby谈不上有多高效,但它却能让程序员的编程效率大幅提高.本文将讲述Ruby语言的基础语言特性,包括基本的语法及代码块和类的定义. 1. 基础在Ruby交互命令行中输入以下命令(>>为命令行提示符,=>为返回值:下文将把=>符号和语句写在一行内表明其返回值): &g

在Ruby程序中连接数据库的详细教程_ruby专题

本章节将向您讲解如何使用 Ruby 访问数据库.Ruby DBI 模块为 Ruby 脚本提供了类似于 Perl DBI 模块的独立于数据库的接口. DBI 即 Database independent interface,代表了 Ruby 独立于数据库的接口.DBI 在 Ruby 代码与底层数据库之间提供了一个抽象层,允许您简单地实现数据库切换.它定义了一系列方法.变量和规范,提供了一个独立于数据库的一致的数据库接口. DBI 可与下列进行交互:     ADO (ActiveX Data Ob

使用Ruby来处理JSON的简单教程_ruby专题

环境配置 在使用 Ruby 编码或解码 JSON 数据前,我们需要先安装 Ruby JSON 模块.在安装该模块前你需要先安装 Ruby gem,我们使用 Ruby gem 安装 JSON 模块. 但是,如果你使用的是最新版本的 Ruby,可能已经安装了 gem,解析来我们就可以使用以下命令来安装Ruby JSON 模块: $gem install json 使用 Ruby 解析 JSON 以下为JSON数据,将该数据存储在 input.json 文件中: { "President":

Ruby迭代器的7种技巧分享_ruby专题

Ruby由于吸收了Perl的正则表达式和Python的可读性,所以其中的计数取值方法,是非常人性化和灵活的,这里可以举例来说明下:一.打印7次"hello,world",如下: 复制代码 代码如下: 7.times{puts "hello,world"} #在这里,puts的作用等同于print+"\n" 二.依次打印1..9,在ruby中的方法就更多了,这里用比较简单的方式来实现,如下: 复制代码 代码如下: (1..9).each{|i| p

深入理解Ruby中的代码块block特性_ruby专题

block是什么? 在Ruby中,block并不罕见.官方对block的定义是"一段被包裹着的代码".当然,我觉得这样的解释不会让你变的更明白. 对block的一种更简单的描述是"一个block就是一段存储在一个变量中的代码,它和其他的对象一样,可以被随时的运行" 然后,咱们通过看一些代码,之后再把这些代码重构成Ruby中的block形式.通过代码来实际的感受,更加直观. 比如,对两个数做加法? puts 5 + 6 # => 11 嗯,这样写是可以的.但是,

举例初步讲解Ruby中的正则表达式_ruby专题

 正则表达式是一个特殊的字符序列可以帮助匹配或者找到其他字符串或串套,使用的模式保持一个专门的语法. 正则表达式文本是一个模式之间的斜线之间或任意分隔符 %r 如下: 语法: 复制代码 代码如下: /pattern/ /pattern/im    # option can be specified %r!/usr/local! # general delimited regular expression 例如: #!/usr/bin/ruby line1 = "Cats are smarter

使用Ruby编写脚本进行系统管理的教程_ruby专题

简介 Ruby 是一种功能极其丰富的.免费的.简单的.可扩展的.可移植的.面向对象的脚本编程语言.最近,它在 Web 领域广受欢迎.这在一定程度上要归因于非常强大的 Web 应用程序开发框架 Rails,Rails 正是用 Ruby 编写的.Rails,也称 Ruby on Rails(ROR),顾名思义,它为快速.有效地开发 Web 应用程序提供一个非常强大的平台.它是高度可伸缩的,Web 上有很多站点就是用 Ruby on Rails 构建的. 除了与 Rails 一起用作 Web 应用程序

Ruby的面向对象方式编程学习杂记_ruby专题

打开类 可以重新打开已经存在的类并对之进行动态修改,即使像String或者Array这样标准库的类也不例外.这种行为方式称之为打开类(open class) 猴子补丁 如果你粗心地为某个类添加了新功能,同时覆盖了类原来的功能,进而影响到其他部分的代码,这样的patch称之为猴子补丁(Monkeypatch) 类与模块 Ruby的class关键字更像是一个作用域操作符,而不是类型声明语句.class关键字的核心任务是把你带到类的上下文中,让你可以在里面定义方法. 每个类都是一个模块,类就是带有三个