1、正则表达式中的特殊字符
1.1 正则表达式的组成
一个正则表达式可以由简单的字符构成 ,比如 /abc/,也可以是简单和特殊字符的组合 ,比如 /ab*c/ 。其中特殊字符也被称为元字符 ,在正则表达式中是具有特殊 意义的专用符号 ,如 ^ 、$ 、+ 等。
特殊字符非常多,可以参考:
- MDN:https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Guide/Regular_Expressions
- jQuery 手册:正则表达式部分
- 正则测试工具: http://tool.oschina.net/regex
1.2 边界符
正则表达式中的边界符(位置符)用来提示字符所处的位置 ,主要有两个字符。
边界符 | 说明 |
---|
^ | 表示匹配行首的文本(以谁开头) | $ | 表示匹配行尾的文本(以谁结束) |
如果 ^ 和 $ 在一起,表示必须是精确匹配。
代码:
<script>
var regexp = /abc/;
console.log(regexp.test('abc'));
console.log(regexp.test('abcd'));
console.log(regexp.test('aabc'));
console.log(regexp.test('acb'));
console.log('---------------------------');
var regexp1 = /^abc/;
console.log(regexp1.test('abc'));
console.log(regexp1.test('abcd'));
console.log(regexp1.test('aabc'));
console.log('---------------------------');
var reg1 = /^abc$/;
console.log(reg1.test('abc'));
console.log(reg1.test('abcd'));
console.log(reg1.test('aabcd'));
console.log(reg1.test('abcabc'));
</script>
1.3 字符类
字符类表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内。
1. [] 方括号
/[abc]/.test('andy')
后面的字符串只要包含 abc 中任意一个字符,都返回 true 。
2. [-] 方括号内部 范围符-
/^[a-z]$/.test(c')
方括号内部加上 - 表示范围,这里表示 a 到 z 26个英文字母都可以。
3. [^] 方括号内部 取反符^
/[^abc]/.test('andy')
方括号内部加上 ^ 表示取反 ,只要包含方括号内的字符,都返回 false 。
注意和边界符 ^ 区别,边界符写到方括号外面。
4. 字符组合
/[a-z1-9]/.test('andy')
方括号内部可以使用字符组合,这里表示包含 a 到 z 的26个英文字母和 1 到 9 的数字都可以。
代码:
<script>
var rg = /[abc]/;
console.log(rg.test('andy'));
console.log(rg.test('baby'));
console.log(rg.test('color'));
console.log(rg.test('abc'));
console.log(rg.test('red'));
console.log('------------------');
var rg1 = /^[abc]$/;
console.log(rg1.test('aa'));
console.log(rg1.test('a'));
console.log(rg1.test('b'));
console.log(rg1.test('c'));
console.log(rg1.test('abc'));
console.log('------------------');
var reg = /^[a-z]$/;
console.log(reg.test('a'));
console.log(reg.test('z'));
console.log(reg.test(1));
console.log(reg.test('A'));
console.log('------------------');
var reg1 = /^[a-zA-Z0-9_-]$/;
console.log(reg1.test('a'));
console.log(reg1.test('B'));
console.log(reg1.test(8));
console.log(reg1.test('-'));
console.log(reg1.test('_'));
console.log(reg1.test('!'));
console.log('----------------');
var reg2 = /^[^a-zA-Z0-9_-]$/;
console.log(reg2.test('a'));
console.log(reg2.test('B'));
console.log(reg2.test(8));
console.log(reg2.test('-'));
console.log(reg2.test('_'));
console.log(reg2.test('!'));
</script>
1.4 量词符
量词符用来设定某个模式出现的次数。
量词 | 说明 |
---|
* | 重复0次或更多次 | + | 重复1次或更多次 | ? | 重复0次或1次 | {n} | 重复n次 | {n,} | 重复n次或更多次 | {n,m} | 重复n到m次 |
代码:
<script>
var reg = /^a$/;
console.log(reg.test('a'));
console.log(reg.test('aa'));
console.log('--------------------------------------');
var reg1 = /^a*$/;
console.log(reg1.test(''));
console.log(reg1.test('a'));
console.log(reg1.test('aa'));
console.log(reg1.test('aaaaaa'));
console.log('--------------------------------------');
var reg2 = /^a+$/;
console.log(reg2.test(''));
console.log(reg2.test('a'));
console.log(reg2.test('aa'));
console.log(reg2.test('aaaaaa'));
console.log('--------------------------------------');
var reg3 = /^a?$/;
console.log(reg3.test(''));
console.log(reg3.test('a'));
console.log(reg3.test('aa'));
console.log(reg3.test('aaaaaa'));
console.log('--------------------------------------');
var reg4 = /^a{3}$/;
console.log(reg4.test(''));
console.log(reg4.test('a'));
console.log(reg4.test('aa'));
console.log(reg4.test('aaaaaa'));
console.log(reg4.test('aaa'));
console.log('--------------------------------------');
var reg5 = /^a{3,}$/;
console.log(reg5.test(''));
console.log(reg5.test('a'));
console.log(reg5.test('aa'));
console.log(reg5.test('aaaaaa'));
console.log(reg5.test('aaa'));
console.log('--------------------------------------');
var reg6 = /^a{3,16}$/;
console.log(reg6.test(''));
console.log(reg6.test('a'));
console.log(reg6.test('aa'));
console.log(reg6.test('aaaaaa'));
console.log(reg6.test('aaa'));
console.log(reg6.test('aaaaaaaaaaaaaaaaaaaaa'));
</script>
1.5 括号总结
- 大括号 量词符。里面表示重复次数。
- 中括号 字符集合。匹配方括号中的任意字符。
- 小括号 表示优先级。
可以在线测试:正则表达式在线测试小工具
1.6 预定义类
预定义类指的是某些常见模式的简写方式 。
预定类 | 说明 |
---|
\d | 匹配0-9之间的任意数字,相当于[0-9] | \D | 匹配所有0-9以外的字符,相当于[^0-9] | \w | 匹配任意的字母、数字和下划线,相当于[A-Za-z0-9_] | \W | 除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9_] | \s | 匹配空格(包括换行符、制表符、空格符等),相当于[\t\r\n\v\f] | \S | 匹配非空格的字符,相当于[^\t\r\n\v\f] |
|