当前位置:  编程技术>python

python正则表达式re模块详细介绍

    来源: 互联网  发布时间:2014-10-04

    本文导语:  本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以是Unicode字符,这点不用担心,python会处理地和Ascii字符一样漂亮。正则表达式使用反斜杆()来转义特殊字符,使其可以匹配...

本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以是Unicode字符,这点不用担心,python会处理地和Ascii字符一样漂亮。

正则表达式使用反斜杆()来转义特殊字符,使其可以匹配字符本身,而不是指定其他特殊的含义。这可能会和python字面意义上的字符串转义相冲突,这也许有些令人费解。比如,要匹配一个反斜杆本身,你也许要用'\\'来做为正则表达式的字符串,因为正则表达式要是\,而字符串里,每个反斜杆都要写成\。

你也可以在字符串前加上 r 这个前缀来避免部分疑惑,因为 r 开头的python字符串是 raw 字符串,所以里面的所有字符都不会被转义,比如r'n'这个字符串就是一个反斜杆加上一字母n,而'n'我们知道这是个换行符。因此,上面的'\\'你也可以写成r'\',这样,应该就好理解很多了。可以看下面这段:

代码如下:

>>> import re
>>> s = 'x5c'  #0x5c就是反斜杆
>>> print s

>>> re.match('\\', s)  #这样可以匹配

>>> re.match(r'\', s)  #这样也可以

>>> re.match('\', s)  #但是这样不行
Traceback (most recent call last):
  File "", line 1, in
  File "/usr/lib/python2.6/re.py", line 137, in match
    return _compile(pattern, flags).match(string)
  File "/usr/lib/python2.6/re.py", line 245, in _compile
    raise error, v # invalid expression
sre_constants.error: bogus escape (end of line)
>>>

另外值得一提的是,re模块的方法,大多也就是RegexObject对象的方法,两者的区别在于执行效率。这个在最后再展开吧。

正则表达式语法

正则表达式(RE)指定一个与之匹配的字符集合;本模块所提供的函数,将可以用来检查所给的字符串是否与指定的正则表达式匹配。
正则表达式可以被连接,从而形成新的正则表达式;例如A和B都是正则表达式,那么AB也是正则表达式。一般地,如果字符串p与A匹配,q与B匹配的话,那么字符串pq也会与AB匹配,但A或者B里含有边界限定条件或者命名组操作的情况除外。也就是说,复杂的正则表达式可以用简单的连接而成。
正则表达式可以包含特殊字符和普通字符,大部分字符比如'A','a'和'0'都是普通字符,如果做为正则表达式,它们将匹配它们本身。由于正则表达式可以连接,所以连接多个普通字符而成的正则表达式last也将匹配'last'。(后面将用不带引号的表示正则表达式,带引号的表示字符串)

下面就来介绍正则表达式的特殊字符:

'.'
点号,在普通模式,它匹配除换行符外的任意一个字符;如果指定了 DOTALL 标记,匹配包括换行符以内的任意一个字符。

'^'
尖尖号,匹配一个字符串的开始,在 MULTILINE 模式下,也将匹配任意一个新行的开始。

'$'
美元符号,匹配一个字符串的结尾或者字符串最后面的换行符,在 MULTILINE 模式下,也匹配任意一行的行尾。也就是说,普通模式下,foo.$去搜索'foo1nfoo2n'只会找到'foo2′,但是在 MULTILINE 模式,还能找到 ‘foo1′,而且就用一个 $ 去搜索'foon'的话,会找到两个空的匹配:一个是最后的换行符,一个是字符串的结尾,演示:

代码如下:

>>> re.findall('(foo.$)', 'foo1nfoo2n')
['foo2']
>>> re.findall('(foo.$)', 'foo1nfoo2n', re.MULTILINE)
['foo1', 'foo2']
>>> re.findall('($)', 'foon')
['', '']

'*'
星号,指定将前面的RE重复0次或者任意多次,而且总是试图尽量多次地匹配。

'+'
加号,指定将前面的RE重复1次或者任意多次,而且总是试图尽量多次地匹配。

'?'
问号,指定将前面的RE重复0次或者1次,如果有的话,也尽量匹配1次。

*?, +?, ??
从前面的描述可以看到'*','+'和'?'都是贪婪的,但这也许并不是我们说要的,所以,可以在后面加个问号,将策略改为非贪婪,只匹配尽量少的RE。示例,体会两者的区别:

代码如下:

>>> re.findall('', 'title')
['H1>title' 和 'user@host.com',但是不会匹配 '

    
 
 

您可能感兴趣的文章:

  • Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法
  • python正则表达式去掉数字中的逗号(python正则匹配逗号)
  • Python 匹配任意字符(包括换行符)的正则表达式写法
  • python 正则式使用心得
  • python ip正则式
  • python 正则表达式 反斜杠(/)的麻烦和陷阱
  • python正则表达式判断字符串是否是全部小写示例
  • Python常用正则表达式符号浅析
  • python正则表达式re模块详解
  • python使用正则表达式检测密码强度源码分享
  • python正则匹配抓取豆瓣电影链接和评论代码分享
  • python正则匹配查询港澳通行证办理进度示例分享
  • python正则分组的应用
  • Python模块学习 re 正则表达式
  • python正则表达式修复网站文章字体不统一的解决方法
  • python实现统计汉字/英文单词数的正则表达式
  • python正则表达式抓取成语网站
  • python 正则式 概述及常用字符
  • python 正则表达式 概述及常用字符
  • Python中正则表达式的用法实例汇总
  • Python正则表达式的七个使用范例详解
  • python实现问号表达式(?)的方法
  • Python 执行字符串表达式函数(eval exec execfile)
  • python基础教程之lambda表达式使用方法
  • python之yield表达式学习
  • python 中的列表解析和生成表达式
  • python中 ? : 三元表达式的使用介绍
  • Python正则表达式介绍
  • Python 中文正则表达式笔记
  • python的正则表达式re模块的常用方法
  • PYTHON正则表达式 re模块使用说明
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • Python异常模块traceback用法举例
  • Python的多媒体模块 PyMedia
  • Python的MySQLdb模块安装
  • Python的视频设备访问模块 VideoCapture
  • python的urllib模块显示下载进度示例
  • 在Python安装MySQL支持模块的方法
  • linux下用eclipse进行开发,尤其打开较大的python代码模块,老是会卡,请问大家有没有好点的解决办法,如能提供具体设置,不胜感激
  • python使用os模块的os.walk遍历文件夹示例
  • 让python同时兼容python2和python3的8个技巧分享 iis7站长之家
  • WebSphereMQ的Python模块 PyMQI
  • python发布模块的步骤分享
  • python进阶教程之模块(module)介绍
  • python sys模块sys.path使用方法示例
  • python中的hashlib和base64加密模块使用实例
  • python pickle 和 shelve模块的用法
  • Python下的Mysql模块MySQLdb安装详解
  • python 多进程通信模块的简单实现
  • 从零学python系列之新版本导入httplib模块报ImportError解决方案
  • python爬虫常用的模块分析
  • python使用urllib模块开发的多线程豆瓣小站mp3下载器
  • Python Deque 模块使用详解
  • Python GUI编程:tkinter实现一个窗口并居中代码
  • 让python同时兼容python2和python3的8个技巧分享
  • Python不使用print而直接输出二进制字符串
  • 使用setup.py安装python包和卸载python包的方法
  • Python中实现json字符串和dict类型的互转
  • 不小心把linux自带的python卸载了,导致安装一个依赖原python的软件不能安装,请问该怎么办?
  • python异常信息堆栈输出到日志文件
  • Python开发者社区整站源码 Pythoner
  • python下用os.execl执行centos下的系统时间同步命令ntpdate
  • python读取csv文件示例(python操作csv)




  • 特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3