导读:在Javascript中验证邮件的代码十分常见,网上能找到许多,主要是通过JS的正则表达式来实现,本文主要讨论这一十分常见的代码,适合新手阅读学习
白天总是玩着不看书,这两晚却很神奇地因为睡不着起来看书,正则表达式。很好玩的东西。《Javascript 高级程序设计》是本好书,写得很系统。不过,在正则表达式那一章,看到验证电子邮件那里,似乎把正式表达式给写错了,也被我不小心发现了。
原代码是这样的:
function isValidMail(sText){ var reMail = /^(?:\w+\.?)*\w+@(?:\w+\.?)*\w+$/; return reMail.test(sText); } |
似乎这样验证像sofish@163.com这样的邮箱是没问题的。但,由于仔细看一下在AT(@)后面的非捕获性引用中,使用的是*(出现任意次):
var reMail = /^(?:\w+\.?)*\w+@(?:\w+\.?)*\w+$/; |
那么,也包括出现0次,这样的话。像sofish@163com这样的邮箱也是通过验证的。 显然,"."是必须至少出现一次的,因此,而"+"才表示至少出现一次。但这里,在AT后面,我们可以写像163.com.cn这样的结尾,但直接改成"+"的话,这样163..com.cn也可以通过验证。下面是我的方法:
function isValidMail(sText) { var reMail = /^(?:\w+\.?)*\w+@(?:\w+\.)+\w+$/; alert(reMail.test(sText)) } |
规定"."号只出现一次。然后在非捕获引用后面,让其他至少显示1次,再以任意的字符结束。不过,这里的"\w"是包括下划线的,也就是说,像 sofish@163_.com_这样的邮件也是可能通过难的,显然,这是一个不合法的邮件,在AT后面的"."号后前,是不可以出现下划线的,而后面,只能是英文字母的(至少目前我没有见过用后面是数字的域名)。并且,这里应该注意到的是,"\w"所代表的字符包括下划线,不用缩写是这样的:
[a-zA-Z_0-9] |
因此,上面的代码可以这样进行改装:
function isValidMail(sText) { var reMail = /^(?:[a-z\d]+[_\-\+\.]?)*[a-z\d]+@(?:([a-z\d]+\-?)*[a-z\d]+\.)+([a-z]{2,})+$/i; alert(reMail.test(sText)) } |
其实,通常这样写就可以了,对吧。要更深入,还可以考虑AT后面的各个点后面,不应该用相同的字母,比如.com.cn.com.cn(很显然,这样的域名还是有的,我错了,感谢@StonyWang同学的提醒,真的有人这么囧这样做么?)这样是不被请允许的。可以考虑一下利用捕获性引用进行储存,并进行比较验证。当做一道练习题吧(突然感觉好像在学高中的数学题)。