400-650-7353
您所在的位置:首页 > IT干货资料 > python > 【Python基础知识】常用内建模块-re

【Python基础知识】常用内建模块-re

  • 发布: 优就业it培训
  • 来源:
  • 2021-10-29 14:50:16
  • 阅读()
  • 分享
  • 手机端入口

编程语言中的正则表达式用于描述搜索模式的特殊文本字符串。这对于从文本(如代码、日志、文档、电子表格等)中提取信息非常有用。使用正则表达式时,首先要认识到的是,所有内容本质上都是一个字符。ASCII或拉丁字母是键盘上的字母,Unicode用于匹配外来文本,它包括数字和标点符号以及所有特殊字符,如$、#、@、!、%等。

例如,正则表达式可以告诉程序从字符串中搜索特定文本,然后相应地打印出结果。正则表达式可以包括文字匹配、重复、分支、模式组成等。

在Python中,正则表达式通过re模块导入。元字符是具有特殊含义的字符,用来匹配特定文本。常用的元字符如表所示。

re模块中定义了一些函数,分别对应不同的匹配模式。

findall()函数用于返回包含所有匹配项的字符串列表:

  1. >>> import re   # 导入re模块,以下示例都将省略这行代码 
  2. >>> s = 'hello 12 hi 89. How 34' 
  3. >>> pattern = '\d+'   # 匹配数字 
  4. >>> result = re.findall(pattern, s) 
  5. >>> print(result) 
  6. ['12''89''34'

split()函数用于在存在匹配项的情况下拆分字符串,并返回发生拆分的字符串列表:

  1. >>> s = 'python:234, java 90'   # 将数字作为分隔符 
  2. >>> pattern = '\d+' 
  3. >>> result = re.split(pattern, s) 
  4. >>> print(result) 
  5. ['python:'', java '''

如果不存在匹配项,那么split()函数返回一个包含空字符串的列表。可以将maxsplit参数传递给split()函数,maxsplit代表最大拆分次数:

  1. >>> s = 'python:234, java 90' 
  2. >>> pattern = '\d+' 
  3. >>> result = re.split(pattern, s, 1)   # 分割最大值是1,即拆成两份 
  4. >>> print(result) 
  5. ['python:'', java 90'

sub()函数用于返回一个字符串,其中匹配到的匹配项被替换变量的内容替换:

  1. >>> s = 'abc 12
  2. ... de 23 \n f45 6
  3. >>> pattern = '\s+'   # 匹配空白字符 
  4. >>> replace = ''   # 用空字符串替换匹配项 
  5. >>> new_string = re.sub(pattern, replace, s) 
  6. >>> print(new_string)  # 完成替换 
  7. abc12de23f456 

如果不存在匹配项,那么sub()函数返回原始字符串。

subn()函数与sub()函数类似,只不过subn()函数返回一个包含2个项的元组,其中包含新字符串和进行替换的次数:

  1. >>> s = 'abc 12
  2. ... de 23 \n f45 6
  3. >>> pattern = '\s+' 
  4. >>> replace = '' 
  5. >>> new_string = re.subn(pattern, replace, s) 
  6. >>> print(new_string) 
  7. ('abc12de23f456'4

search()函数采用两个参数,分别是匹配模式和字符串。该函数查找正则表达式模式与字符串匹配的第一个位置。如果匹配成功,那么search()函数返回一个match对象;否则返回None:

  1. >>> s = 'Python is fun' 
  2. >>> match = re.search('\APython', s)   # 检查'Python'是否在开头 
  3. >>> print(match)   # 返回一个对象 
  4. <_sre.SRE_Match object; span=(06), match='Python'

上面的match变量包含着match对象,match对象的re属性返回一个正则表达式对象,string属性返回传递的字符串:

  1. >>> match.re 
  2. re.compile('\\APython'
  3. >>> match.string 
  4. 'Python is fun' 

 

文章“【Python基础知识】常用内建模块-re”已帮助

更多内容

>>本文地址:https://www.ujiuye.com/zhuanye/2021/70621.html

THE END  

声明:本站稿件版权均属中公教育优就业所有,未经许可不得擅自转载。

1 您的年龄

2 您的学历

3 您更想做哪个方向的工作?

获取测试结果
  • 大前端大前端
  • 大数据大数据
  • 互联网营销互联网营销
  • JavaJava
  • Linux云计算Linux
  • Python+人工智能Python
  • 嵌入式物联网嵌入式
  • 全域电商运营全域电商运营
  • 软件测试软件测试
  • 室内设计室内设计
  • 平面设计平面设计
  • 电商设计电商设计
  • 网页设计网页设计
  • 全链路UI/UE设计UI设计
  • VR/AR游戏开发VR/AR
  • 网络安全网络安全
  • 新媒体与短视频运营新媒体
  • 直播带货直播带货
  • 智能机器人软件开发智能机器人
 

快速通道fast track

近期开班时间TIME