Ruby笔记–正则表达式

七 19th, 2011

发表评论 | Trackback

Ruby对正则表达式支持非常好，下面将对我经常使用到的做一个总结，包括Ruby中正则的写法，匹配的方法，替换，分组匹配等。

1、Ruby中正则表达式的写法

主要有三种

在//之间，要进行转义
在%r{}内，不用进行转义
Regexp.new()内，不用进行转义

/mm\/dd/，Regexp.new(“mm/dd”)，%r{mm/dd}三者效果相同，实质都是新建了一个Regexp的类。

2、匹配的两种方法

=~肯定匹配, !~否定匹配。=~表达式返回匹配到的位置索引，失败返回nil，符号左右内容可交换
regexp#match(str)，返回MatchData，一个数组，从0开始，还有match.pre_match返回匹配前内容，match.post_match返回匹配后内容

/cat/ =~ "dog and cat" 	#返回8
mt = /cat/.match("bigcatcomes")
"#{mt.pre_match}->#{mt[0]}<-#{mt.post_match}" #返回big->cat<-comes

3、替换

很多时候匹配是为了替换，Ruby中进行正则替换非常简单，两个方法即可搞定，sub()+gsub()。
sub只替换第一次匹配，gsub（g:global）会替换所有的匹配，没有匹配到返回原字符串的copy

str = "ABDADA"
new_str = str.sub(/A/, "*") 	#返回"*BDADA"
new_str2 = str.gsub(/A/, "*")	#返回"*BD*D*"

如果想修改原始字符串用sub!()和gsub!()，没有匹配到返回nil。

方法后面还可以跟block，对匹配的字符串进行操作

a.gsub(/[aeiou]/) {|vowel| vowel.upcase } # => "qUIck brOwn fOx"

4、分组匹配

Ruby的分组匹配与其它语言差别不大，分组匹配表达式是对要进行分组的内容加()。
对于匹配到的结果，可以用系统变量#$1，#$2…索引，也可用matchData数组来索引

md = /(\d\d):(\d\d)(..)/.match("12:50am") # md为一个MatchData对象
puts "Hour is #$1, minute #$2"
puts "Hour is #{md[1]}, minute #{md[2]}"

5、匹配所有

regexp#match()只能匹配一次，如果想匹配所有要用regexp#scan()
用法示例：

"abcabcabz".scan(%r{abc}).each {|item| puts item} # 输出2行abc

6、贪婪匹配vs懒惰匹配

这两种匹配属于标准正则表达式内容，与Ruby没关，但新手如果不明白匹配时会发生莫名其妙的错误，所以特别总结一下。

贪婪匹配：尽可能多匹配，正则默认是贪婪匹配。例子：a.*b它将会匹配最长的以a开始，以b结束的字符串。对于aabab的匹配结果是aabab。
懒惰匹配：尽可能少匹配。例子：a.*?b对于aabab的匹配结果是aab和ab。

一般是在原来表达式结尾加?就由贪婪匹配变成了懒惰匹配。常用的懒惰限定符有（去年最后的问题就是贪婪匹配）：

?重复任意次，但尽可能少重复
+?重复1次或更多次，但尽可能少重复
??重复0次或1次，但尽可能少重复
{n,m}?重复n到m次，但尽可能少重复
{n,}?重复n次以上，但尽可能少重复

标签: Ruby

>>原创文章，欢迎转载。转载请注明：转载自Ruby迷，谢谢！
>>原文链接地址：Ruby笔记–正则表达式

猜你也喜欢

RubyMine 4正式版发布，知名的Ruby IDE (7)
RubyMine是JetBrain公司研...
一次有意思的“最大公约数”算法优化历程 (3)
最近在微博上闲扯出最大公约数（GCD：g...
使用spreadsheet操作Excel (0)
使用spreadsheet操作Excel...
Ruby,Rails分享PPT (7)
Ruby rails分享View mor...
使用Net::SSH和Net::SCP编写Linux服务器管理脚本 (0)
有没有这样一个需求：同时向几十上百台...

删除svn脚本 Rails 调试和记录日志方法总结

目前还没有任何评论.

Ruby迷