正则表达式是一种强大的文本匹配工具,可以用于在文本中查找特定的模式
正则表达式由不同类型的字符组成,包括普通字符、元字符、分隔符和转义字符等。其中:
普通字符:用于匹配文本中出现的相同字符
元字符:用于匹配特定的字符或字符集合。例如.
表示匹配任意字符,\d
表示匹配数字等
分隔符:用于标记正则表达式的开始和结束,通常为/
或者#
转义字符:使用\
将有特殊作用的字符(元字符、分隔符等)转义为普通字符。例如\.
表示匹配半角句号
一些常用的字符及含义如下:
1)匹配单个字符:
符号 | 含义 |
---|---|
. | 匹配任意字符(除了换行符\n ) |
\d | 匹配任意数字,等价于[0-9] |
\D | 匹配任意非数字字符,等价于[^0-9] |
\w | 匹配任意字母、数字或下划线,等价于[A-Za-z0-9_] |
\W | 匹配任意非字母、数字或下划线字符,等价于[^A-Za-z0-9_] |
\s | 匹配任意空白字符,包括空格、制表符、换行符等 |
\S | 匹配任意非空白字符 |
2)匹配特定次数:
符号 | 含义 |
---|---|
* | 匹配前面的字符0次或多次 |
+ | 匹配前面的字符1次或多次 |
? | 匹配前面的字符0次或1次 |
{n} | 匹配前面的字符n次 |
{n,} | 匹配前面的字符至少n次 |
{n,m} | 匹配前面的字符至少n次,但不超过m次 |
[abc] | 匹配字符集中的任意一个字符 |
[^abc] | 匹配任意非字符集中的字符 |
3)锚点和边界:
符号 | 含义 |
---|---|
^ | 匹配字符串的开头 |
$ | 匹配字符串的结尾 |
() | 分组,将括号内的一组字符看作一个整体 |
/ | 分隔符,用于标记正则表达式的开头和结尾 |
\ | 转义字符,将有特殊作用的字符转义为普通字符 |
\b | 匹配单词的边界 |
4)或运算:
符号 | 含义 |
---|---|
| | 将两个匹配逻辑进行或运算 |
更多内容参考阿里云文档:https://help.aliyun.com/zh/sls/user-guide/getting-started-with-regular-expressions
使用注意:在不同的编程语言和正则表达式引擎中,支持的符号和语法可能有所差异。在实际编程中,需要结合具体的语言和工具了解其支持的正则表达式语法
? 校验数字的表达式
? 数字:^[0-9]*$
? n位的数字:^\d{n}$
? 至少n位的数字:^\d{n,}$
? m-n位的数字:^\d{m,n}$
? 零和非零开头的数字:^(0|[1-9][0-9]*)$
? 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
? 带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})?$
? 正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$
? 有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
? 有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
? 非零的正整数:^[1-9]\d*$
或^([1-9][0-9]*){1,3}$
或^\+?[1-9][0-9]*$
? 非零的负整数:^\-[1-9][]0-9"*$
或^-[1-9]\d*$
? 非负整数:^\d+$
或^[1-9]\d*|0$
? 非正整数:^-[1-9]\d*|0$
或^((-\d+)|(0+))$
? 非负浮点数:^\d+(\.\d+)?$
或^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
? 非正浮点数:^((-\d+(\.\d+)?)|(0+(\.0+)?))$
或^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
? 正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$
或^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
? 负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$
或^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
? 浮点数:^(-?\d+)(\.\d+)?$
或^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
? 校验字符的表达式
? 汉字/中文:^[\u4e00-\u9fa5]{0,}$
或/[\u4E00-\u9FA5]/
? 英文和数字:^[A-Za-z0-9]+$
或^[A-Za-z0-9]{4,40}$
? 长度为3-20的所有字符:^.{3,20}$
? 由26个英文字母组成的字符串:^[A-Za-z]+$
? 由26个大写英文字母组成的字符串:^[A-Z]+$
? 由26个小写英文字母组成的字符串:^[a-z]+$
? 由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$
? 由数字、26个英文字母或者下划线组成的字符串:^\w+$
或^\w{3,20}
? 中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
? 中文、英文、数字但不包括下划线等符号:^[\u4E00-\u9FA5A-Za-z0-9]+$
或^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
? 可以输入含有^%&',;=?$\"
等字符:[^%&',;=?$\x22]+
? 禁止输入含有~的字符:[^~\x22]+
? 匹配除\n
以外的任何字符:.*
? 全角符号:/[\uFF00-\uFFFF]/
? 半角符号:/[\u0000-\u00FF]/
? 特殊需求表达式
? Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
? 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
? InternetURL:[a-zA-z]+://[^\s]*
或^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
? 手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
? 电话号码(“xxx-xxxxxxx”、“xxxx-xxxxxxxx”、“xxx-xxxxxxx”、“xxx-xxxxxxxx”、"xxxxxxx"和"xxxxxxxx):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
? 国内电话号码(“xxx-xxxxxxx”、“xxx-xxxxxxxx”):\d{3}-\d{8}|\d{4}-\d{7}
? 身份证号(15位、18位数字):^\d{15}|\d{18}$
? 短身份证号码(数字、字母x结尾):^([0-9]){7,18}(x|X)?$
或^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
? 账号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
? 密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
? 强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
? 日期格式:^\d{4}-\d{1,2}-\d{1,2}
? 一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
? 一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
? 四种金额的表示形式(“10000.00"和"10,000.00”,和没有"分"的"10000"和"10,000"):^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
? 空白行(可以用来删除空白行):\n\s*\r
? 首尾空白字符(可以用来删除行首行尾的空白字符包括空格、制表符、换页符等):^\s*|\s*$
或(^\s*)|(\s*$)
? 腾讯QQ号(腾讯QQ号从10000开始):[1-9][0-9]{4,}
? 中国邮政编码(中国邮政编码为6位数字):[1-9]\d{5}(?!\d)
? IP地址(提取IP地址时使用):\d+\.\d+\.\d+\.\d+
或((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))
? 提取页面超链接:(<a\\s*(?!.*\\brel=)[^>]*)(href="https?:\\/\\/)((?!(?:(?:www\\.)?'.implode('|(?:www\\.)?', $follow_list).'))[^" rel="external nofollow" ]+)"((?!.*\\brel=)[^>]*)(?:[^>]*)>
? 提取网页图片:\\< *[][^\\\\>]*[src] *= *[\\"\\']{0,1}([^\\"\\'\\ >]*)
? 文件扩展名校验:^([a-zA-Z]\\:|\\\\)\\\\([^\\\\]+\\\\)*[^\\/:*?"<>|]+\\.txt(l)?$
更多使用参考阿里云文档:https://developer.aliyun.com/article/863099 和 https://developer.aliyun.com/article/821179