总结基本的正则表达式符号 及 简单用法, 以备忘, 长篇大论, 不喜勿喷…o.o\\\

1.正则表达式基本符号

两个特殊的符号 ‘^’ 和 ‘$’。他们的作用是分别指出一个字符串的开始和结束。例子如下:

1
2
3
"^The":表示所有以 "The" 开始的字符串("There""The cat"等);
"of despair$":表示所以以 "of despair" 结尾的字符串;
"notice":表示任何包含 "notice" 的字符串。

最后那个例子,如果你不使用两个特殊字符,你就在表示要查找的串在被查找串的任意部分——你并不把它定位在某一个位置。

其它还有 ‘*‘,’+’ 和 ‘?’, 这三个符号,表示一个或一序列字符重复出现的次数。它们分别表示 “没有或更多”,”一次或更多” 还有 “没有或一次”。下面是几个例子:

1
2
3
4
"ab*":表示一个字符串有一个a后面跟着零个或若干个b。("a", "ab", "abbb",……);
"ab+":表示一个字符串有一个a后面跟着至少一个b或者更多;
"ab?":表示一个字符串有一个a后面跟着零个或者一个b;
"a?b+$":表示在字符串的末尾有零个或一个a跟着一个或几个b。

你也可以使用范围,用大括号括起,用以表示重复次数的范围。

1
2
3
"ab{2}":表示一个字符串有一个a跟着2个b("abb");
"ab{2,}":表示一个字符串有一个a跟着至少2个b ("abb…");
"ab{3,5}":表示一个字符串有一个a跟着35个b。

注意 你必须指定范围的下限 (如:”{0,2}” 而不是 “{,2}” ).
还有, 你可能注意到了,’*‘,’+’ 和 ‘?’ 相当于 “{0,}”,”{1,}” 和 “{0,1}”。

还有一个 ‘|’,表示 “或” 操作:

1
2
3
"hi|hello":表示一个字符串里有 "hi" 或者 "hello"
"(b|cd)ef":表示 "bef""cdef"
"(a|b)*c":表示一串 "a" "b" 混合的字符串后面跟一个 "c"

‘.’ 可以替代任何字符:

1
2
"a.[0-9]":表示一个字符串有一个 "a" 后面跟着一个任意字符和一个数字;
"^.{3}$":表示有任意三个字符的字符串(长度为3个字符);

[] 方括号表示某些字符允许在一个字符串中的某一特定位置出现:

1
2
3
4
5
6
"[ab]":表示一个字符串有一个 "a""b"(相当于 "a|b");
"[a-d]":表示一个字符串包含小写的'a''d'中的一个(相当于"a|b|c|d"或者"[abcd]");
"^[a-zA-Z]":表示一个以字母开头的字符串;
"[0-9]%":表示一个百分号前有一位的数字;
",[a-zA-Z0-9]$":表示一个字符串以一个逗号后面跟着一个字母或数字结束。
你也可以在方括号里用'^'表示不希望出现的字符,'^' 应在方括号里的第一位。(如:"%[^a-zA-Z]%"表示两个百分号中不应该出现字母)。

为了逐字表达,你必须在 “^.$()|*+?{“ 这些字符前加上转移字符 ‘\’。
请注意在方括号中,不需要转义字符。

特殊字符作用

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
. 匹配任何字符、空格和Tab键
eg. 正则表达式:a.b 匹配:abb, acb, a@b等
\d 匹配数字 <==> [0-9]
eg. 正则表达式: \dd 匹配:1d, 2d
\D 匹配非数字 <==> [^0-9]
eg. 正则表达式: \Dd 匹配:ad, bd等,不匹配1d,2d
\s 匹配空白字符串
eg. 正则表达式:\sd 匹配:(空格)d
\S 匹配非空白字符
eg. 正则表达式:\Sd 匹配: ad, bd等
\w 匹配单词字符 <==> [a-zA-Z0-9]
eg. 正表表达式:\wd 匹配:ad, bd等,不匹配: _d , @d
\W 匹配非单词字符 <==> [^\w]
eg. 正则表达式:\Wd 匹配: !d, @d, 不匹配1d,ad
[] 匹配包含其中的单个字符
eg. 正则表达式:a[bcd]m 匹配: abm, acm
() 匹配一组表达式(可以由特殊字符组成)
eg. 正则表达式:a([bcd]n)m 匹配:abnm, acnm,adnm

正则表达式中/i,/g,/ig,/gi,/m的区别和含义

1
2
3
4
5
/i (忽略大小写 ignore )
/g (全文查找出现的所有匹配字符 global)
/m (多行查找 multiple)
/gi (全文查找、忽略大小写)
/ig (全文查找、忽略大小写)

2. 零宽断言

零宽断言分为4类
• 正向零宽先行断言(?=exp)
目标字符出现的位置的右边必须匹配到exp这个表达式

• 负向零宽先行断言(?!exp)
目标字符出现的位置的右边不能匹配到exp这个表达式

• 正向零宽后发断言(?\<=exp)javascript不支持后瞻
目标字符出现的位置的左边必须匹配到exp这个表达式

• 负向零宽后发断言(?\<!exp)但javascript不支持后瞻
目标字符出现的位置的左边不能匹配到exp这个表达式

3. 贪婪模式和非贪婪模式

  • 贪婪模式
    正则表达式去匹配时,会尽量多的匹配符合条件的内容
    标识符
    +,?,*,{n},{n,},{n,m}
    匹配时,如果遇到上述标识符,代表是贪婪匹配,会尽可能多的去匹配内容

  • 非贪婪模式
    正则表达式去匹配时,会尽量少的匹配符合条件的内容
    也就是说,一旦发现匹配符合要求,立马就匹配成功,而不会继续匹配下去(除非有g,开启下一组匹配)
    标识符
    +?,??,*?,{n}?,{n,}?,{n,m}?
    可以看到,非贪婪模式的标识符很有规律,就是贪婪模式的标识符后面加上一个?

1
2
3
4
5
var str='aaabccbcxxxxabcxxxxbcmmm';
var reg=/abc.*bc/g;
var reg2 =/abc.*?bc/g;
var res=str.match(reg); // abccbcxxxxabcxxxxbc
var res2 = str.match(reg2); // [ 'abccbc', 'abcxxxxbc' ]

4.常用的正则表达式

校验是否全由数字组成

1
2
3
4
5
6
7
8
^[0-9]{1,20}$
^ 表示打头的字符要匹配紧跟^后面的规则
$ 表示打头的字符要匹配紧靠$前面的规则
[] 内部的内容是可选字符集
[0-9] 表示要求字符范围在0-9之间
[1,20] 表示数字字符串长度合法为120,即为[0-9]中的字符出现次数的范围是120次。
^和$ 成对使用应该是表示要求整个字符串完全匹配定义的规则,而不是只匹配字符串中的一个子串。


校验登录名:只能输入5-20个以字母开头、可带数字、”_“、”.” 的字串

1
2
3
^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$
^[a-zA-Z]{1} 表示第一个字符要求是字母。
([a-zA-Z0-9]|[._]){4,19} 表示从第二位开始(因为它紧跟在上个表达式后面)的一个长度为49位的字符串,它要求是由大小写字母、数字或者特殊字符集[._]组成。


校验用户姓名:只能输入1-30个以字母开头的字串

1
^[a-zA-Z]{1,30}$


校验密码:只能输入6-20个字母、数字、下划线

1
2
3
^(\w){6,20}$
\w:用于匹配字母,数字或下划线字符


校验普通电话、传真号码:可以 “+” 或数字开头,可含有 “-“ 和 “ “

1
2
3
4
5
^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$
\d:用于匹配从09的数字;
"?" 元字符规定其前导对象必须在目标对象中连续出现零次或一次
可以匹配的字符串如:+123 -999 999;+123-999 999123 999 999;+123 999999


校验URL

1
2
3
4
5
^http[s]{0,1}:/.+$ 或 ^http[s]{0,1}:/.{1,n}$ (表示url串的长度为length("https://") + n )
/ 表示字符 "/"
. 表示所有字符的集
+ 等同于{1,},就是1到正无穷吧。


校验纯中文字符

1
^[\u4E00-\u9FA5]+$


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
^\d+$   // 非负整数(正整数 + 0)
^[0-9]\*{1-9}[0-9]\*$   // 正整数
^((-\d+)|(0+))$   // 非正整数(负整数 + 0)
^-[0-9]\*{1-9}[0-9]\*$   // 负整数
^-?\d+$     // 整数
^\d+(.\d+)?$   // 非负浮点数(正浮点数 + 0)
^(([0-9]+.[0-9]*{1-9}0-9*)|([0-9]*{1-9}[0-9]*.[0-9]+)|([0-9]*{1-9}[0-9]*))$   // 正浮点数
^((-\d+(.\d+)?)|(0+(.0+)?))$  // 非正浮点数(负浮点数 + 0)
^(-(([0-9]+.[0-9]\*{1-9}[0-9]\*)|([0-9]\*{1-9}[0-9]\*.[0-9]+)|([0-9]\*{1-9}[0-9]\*)))$   // 负浮点数
^(-?\d+)(.\d+)?$    // 浮点数
^[A-Za-z]+$   // 由26个英文字母组成的字符串
^[A-Z]+$   // 由26个英文字母的大写组成的字符串
^[a-z]+$   // 由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$   //由数字和26个英文字母组成的字符串
^\w+$   // 由数字、26个英文字母或者下划线组成的字符串
^[\w-]+(.[\w-]+)\*@[\w-]+(.[\w-]+)+$    // email地址
^[a-zA-z]+://(\w+(-\w+)\*)(.(\w+(-\w+)\*))\*(?\S\*)?$  // url
/^(\d{2}|\d{4})-((0([1-9]{1}))|(11|2))-(([0-2][1])|(3[0|1]))$ // 年-月-日
/^((0([1-9]{1}))|(1[1|2]))/(([0-2][2])|(3[0|1]))/(\d{2}|\d{4})$/ // 月/日/年
^([w-.][3]+)@(([[0-9][4]1,3.[0-9][5]1,3.[0-9][6]1,3.)|(([w-][7]+.)+))(
[a-zA-Z][8]2,4|[0-9][9]1,3)(]?)$ // Email
^([0-9A-F][10]2)(-[0-9A-F][11]2)5$ // MAC地址的正则表达式
^[-+][12]?d+(.d+)?$ // 值类型正则表达式