python对于正则支持-re
正则表达式的学习:
? ? ? ? 元字符[单个符号]
? ? ? ? .? ? ? ? ? ? ? ? #点可以匹配任何符号
? ? ? ? \w? ? ? ? ? ? ? ?#匹配有效符号[注意:各国的语言符号也是可以匹配的,但是不建议]?
? ? ? ? \d? ? ? ? ? ? ? ? #匹配数字
? ? ? ? \s? ? ? ? ? ? ? ? #匹配空白位[空格,\t]
? ? ? ? [abcde]? ? ? ? #列举中括号中的某个来匹配
? ? ? ? [0789456123]? ? ? ? #===? \d
? ? ? ? [0-9]? ? ? ? ? ? ? ? #? ? ? ? ===? ?\d
? ? ? ? [a-z]?????
? ? ? ? [a-zA-Z]
? ? ? ? [a-zA-Z0-9_]? ? ? ? #有效符号
? ? ? ? ^? ? ? ? ? ? ? ? ? ? ?#以...开始
? ? ? ? $? ? ? ? ? ? ? ? ? ? ?#以...结束? ? ??
转义符:
? ? ? ? ? ? ? ? 以后python的正则表达式建议前面加上????????r"正则字符串"? ? ? ? 避免python字符串自身的转义符和正则之间的转义符冲突。
注意:转义符的问题
sub---将第一个" "转换成第二个" "
匹配HTML标签的正则:
? ? ? ? ? ? ? ? r"</?\w+>"
邮箱的正则:
分组---正则表达式中的二次筛选,正则表达式匹配后,会再次获取()中的值
正则表达式的表达模式:
? ? ? ? 贪婪模式|非贪婪模式[懒惰模式]
贪婪模式:尽可能多的去匹配结果
懒惰模式:只要匹配到结果,会立刻返回
?