元字符
\b
——元字符——代表单词的开头或结尾,单词分界处
\*
——元字符——指定前边的内容可以连续重复使用任意次
.
——元字符——匹配除了换行符以外的任意字符
.\*
——任意数量的不包含换行符的字符
\d
——元字符——匹配一位数字
+
——元字符——重复1次或更多次
\d+
——匹配一个或更多连续的数字
\w
——元字符——匹配字母或数字或下划线或汉字等(可以理解为一个字符串)
\w\*
——任意数量的字母或数字或下划线或汉字等(可以理解为任意数量的字符串)
举例 \ba\w\*\b
匹配以字母a开头的单词
^
——元字符——匹配字符串的开始
$
——元字符——匹配字符串的结束
举例 \b\w{6}\b
匹配6个字符的单词
举例 ^\d{5,12}$
匹配整个字符串为5位到12位数字,若是没有^$则表达的是字符串里包含5到12连续位数字。
字符转义
若是要找元字符本身例如查找.
和\*
的时候,采取\.
和\\*
就可以找到本身
举例 deerchao\.cn
匹配deerchao.cn
,C:\\Windows
匹配C:\Windows
。
重复
代码/语法 | 说明 |
* | 重复零次或更多次 |
+ | 重复一次或更多次 |
? | 重复零次或一次 |
重复n次 | |
重复n次或更多次 | |
重复n到m次 |
举例:
Windows\d+
匹配Windows后面跟1个或更多数字
^\w+
匹配一行的第一个单词(或整个字符串的第一个单词,具体匹配哪个意思得看选项设置)
\b\w{2,4}\b匹配