匹配开头结尾

字符功能
^匹配字符串开头
$匹配字符串结尾

示例1:$

 

需求:匹配163.com的邮箱地址
email_list = [ " xiaoWang@163.com " , " xiaoWang@163.comh eihei" , ". com.xiaowang@qq.com " ]
 
for email in email_list:
    ret = re.match("[\w]{4,20}@163\.com$", email) \.代表只是一个点 $代表以xxx结尾的字符串
    if ret:
        print("%s ---是符合规定的邮件地址” % email)
    else:
        print("%s ---不符合要求" % email)

 

 
运行结果:
 
xiaoWang@163.com            # ---是符合规定的邮件地址
xiaoWang@163.comheihei      # ---不符合要求   # 如果没有$,这个字符串会匹配出来
.com.xiaowang@qq.com        # ---不符合要求

 

匹配分组

字符功能
|匹配左右任意一个表达式
(ab)将括号中字符作为一个分组
\num引用分组num匹配到的字符串
(?P<name>)分组起别名
(?P=name)引用别名为name分组匹配到的字符串

示例1:|

需求:匹配出0-100之间的数字
 
#coding=utf-8
import re

ret = re.match("[1-9]?\d","8”) # ?匹配前面的字符出现1次或者0次 类似78也可以匹配
print(ret.group())  



# 结果:8

 

 
# 可能匹配不成功时?
 
import re

ret = re.match("[1-9]?\d$","08")
if ret:
    print(ret.group())
else:
    print("不在0-100之间”)           



# 结果:不在0-100之间

 

 
# 添加|
 
 
import re


ret = re.match("[1-9]?\d$|100","78")
print(ret.group())                          

# 结果: 78




ret = re.match("[1-9]?\d$|100","100")
print(ret.group())                         


# 结果: 100

 

示例2:( )

需求:匹配出163、126、qq邮箱
 
#coding=utf-8

import re

ret = re.match("\w{4,20}@163\.com", "test@163.com”)  
print(ret.group())                               


# 结果: test@163.com



ret = re.match("\w{4,20}@(163|126|qq)\.com", "test@gmail.com")
if ret:
    print(ret.group())
else:
    print("不是163、126、qq邮箱")                  


# 结果: 不是163、126、qq邮箱

 

 

需求:不是以4、7结尾的手机号码(11位)

 

import re
tels = ["13100001234", "18912344321", "10086", "18800007777"]

for tel in tels:
    ret = re.match("1\d{9}[0-3,5-6,8-9]", tel)
    if ret:
        print(ret.group())
    else:
        print("%s 不是想要的手机号" % tel)

 

结果如下:

13100001234 不是想要的手机号
18912344321
10086 不是想要的手机号
18800007777 不是想要的手机号

 

示例三:分组匹配

 

需求:提取区号和电话号码

import re

ret = re.match("([^-]*)-(\d+)", "010-12345678")

print(ret.group())
print(ret.group(1))
print(ret.group(2))

 

结果如下:

010-12345678
010
12345678

 

 

 

 

^在[ ]里面代表非的含义:

例如:
[^-]*   *代表前所有字符0个或者多个,非-的字符串

[^abc]  代表非a、且非b 、且非c的字符

 

 

 

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐