当前位置:  编程技术>其它

自己学正则时做的笔记,其实正则也不难哦 php

    来源: 互联网  发布时间:2014-10-13

    本文导语:  RT,正则可以搞定的东西很多哦,大家学习学习吧 一.正则表达式 1.匹配符     1)头匹配符"^":如^0754,只匹配开头为0754的字符串     2)尾匹配符"$":如0754$,只匹配结尾为0754的字符串     3)全字匹配:将^和$结合,如^0754$,匹配0754...

RT,正则可以搞定的东西很多哦,大家学习学习吧

一.正则表达式
1.匹配符
    1)头匹配符"^":如^0754,只匹配开头为0754的字符串
    2)尾匹配符"$":如0754$,只匹配结尾为0754的字符串
    3)全字匹配:将^和$结合,如^0754$,匹配0754字符串
2.转义字符
    1)空字符:
        换行n
        回车r
        制表符t
    2)其他字符:
        "$" $
        "^" ^
        "+" +
        "/" /
3.通配符
    1)*号:用来匹配前面一个字符是否在字符串中出现零次或多次.
    例1:'abc*',匹配含有ab的所有字符串。
    2)+号:......................................一次或多次.
    例2:'abc+',匹配含有abc的所有字符串。
    3)?号:......................................零次或一次.
    例3:只匹配含有ab、abc结尾不再含c的字符串。如abca,aabc,aaab都可以,但abcc就不行。
4.关于转义字符$与双、单引号(php4环境)
    1)正则表达式本身就是一个字符串。
    2)当引号中含有$时,用双、单引号定义就有区别,区别如下:
        (1)使用单引号定义时,解释器会把引号内所有字符(包括$在内)都原封不动的赋值给字符串变量。
        (2)使用双引号定义时,解释器会把引号内"$"字符以及其后的合法字符(字母、数字、下划线)翻译成变量,直到遇到一个非法字符才认为变量名结束,该非法字符及其后面的字符都被视为一般字符赋给字符串变量,直到遇到下一个"$"为止。
        (3)注意:单个$出现在双引号的尾部,并且其后面不再有任何字符的时候,解释器不会将其翻译成变量。也不需要加转义,当然不提倡。
        (4)如果待匹配的字符中本身就有$,就无法用双引号来定义这个正则表达式,原因是转义字符$在单,双引号中表示的意义不同:
            双引号中,$和单个的$意义是一样的,都是代表尾匹配符,因此c$$=c$=c$$=c$=c$$;双引号中,$在任何时刻都只代表一个字符"$",echo "c$$"结果是c$$,并且$和单个的$(单个的$是指该$无法和其后字符组成变量名)是完全等效的,都是尾匹配符,所以双引号中是无法写入作为非尾匹配字符的字符"$"的,也正是这个原因,大多数需要匹配$时定义正则表达式只能用''。
            单引号中,$的意义仅仅表示字符"$",尾匹配符是$,不管后面是否有合法变量名字符;单引号中,$其实是两个字符,如不用于正则匹配将没有任何意义,echo 'c$$'结果仍是c$$。单作为正则表达式来使用,单引号中的$表示的是特殊字符"$",而尾匹配符就是单独的$字符。
    3)正则表达式的尾匹配符"$"和变量的定义符是相同的:
        例1:定义正则表达式为^ab$:$pattern="^ab$";转义字符$在双引号中就表示字符$,结果是^ab$。
        例2:如上题,使用$pattern="^ab$";显然是错误的,但是由于$在尾部,后面没有其他字符,所以依然适用。
        例3:以字符组合c$结尾的正则表达式:$pattern='c$$';
        例4:如上题,$pattern="c$$";正则表达式将$视为尾匹配符,故只匹配以c结尾。
5."[]"方括号(字符簇)用法
    1)[]匹配一个字符,在[]中使用^开头表示取非,即其后的字符全部是不匹配的。
    例1:[a-zA-Z0-9]匹配所有大小写字母和数字。
    例2:[ntrf]匹配所有空字符。
    例3:[^A-Z]不匹配大写字母。
    例4:^[^0-9]匹配不以数字开头的字符或字符串
    2)特殊字符"."(句点)匹配除了"新行"之外的所有字符,模式^.abc$匹配任何以abc结尾的字符,但是不能匹配其本身。模式"."则可以匹配任何字符串,除了空字符串和只有一个"新行"字符的字符串。
    例1:'^.abc$';匹配所有尾部含有abc的字符串,不匹配小数(新行),当不匹配abc。
    例2:'.';匹配所有字符串,但不匹配空值。
    例3:'.abc';匹配所有含abc的字符串,小数等等都可以,前提是不以abc为首,不匹配abc。
    例4:'.abc$';匹配所有以abc结尾的字符串,任何小数等等都可以,不匹配abc。
    3)php提供了内置通用字符簇:
    [[:alpha:]]任何字母
    [[:digit:]]任何数字
    [[:alnum:]]任何字母和数字
    [[:space:]]任何空白字符
    [[:upper:]]任何大写字母
    [[:lower:]]任何小写字母
    [[:punct:]]任何表点符号
    [[:xdigit:]]任何十六进制数字
    [[:cntrl:]]任何ASCII值小于32的字符
    注意:以上字符簇有个特点,只要被匹配的字符或字符串中有此字符,即匹配正确,不管字符串是以什么方式组成的。
6."{}"大括号用法
    1)方括号只能匹配一个字符,而匹配多个字符只能用{}实现:{}用来确定前面内容出现的次数。{n}表示出现n次;{m,n}表示出现m~n次,包括m和n次;{n,}表示出现n次或者n次以上。
    例1:^a{10}$;匹配aaaaaaaaaa。
    例2:[0-9]{1,}$;匹配所有>0的数。
    2)"{}"与通配符之间的关系
    ?  相当于 {0,1} 零次或一次
    *  ..... {0,} 零次或无数次
    +  ..... {1,} 一次或无数次
7."()"用法
    圆括号"()"括住的pattern表示子模式,如$pattern='([1-9]{1}[0-9]{3})-([0-1]{1}[1-2]{1})-([0-3]{1}([0-9]|))';()扩住的就是一个个子模式,()相当于把他们独立起来,分别匹配而相互不干扰。
二.POSIX风格正则表达式函数
1.ereg
    ereg(pattern,string,[array $regs]);
    eregi(pattern,string,[array $regs]);
    ereg函数在string中找到满足pattern模式的文本,如果找到true,没找到false。如果有第三个参数$regs,那找到的文本将放在$regs[0]中,并且regs数组中将一次存放各个圆括号表达的子模式匹配的结果。$regs[1]中存放了第一个子模式所匹配的结果,$regs[2]中是第二个,顺序从左到右,依次类推。如果没有找到匹配的文本,$regs数组的值不会被改变。
    注意:如果找到了匹配的文本,不管找到的子模式是多少个>9还是5个的地方符合pattern,string也只被分割为5个部分,最后一个部分是string去掉前四个部分后剩下的部分。返回值中也只有5个元素。
三.perl风格正则表达式及相关函数
1.perl正则语法
    perl分隔符,可使用"/","!"和"{}"。
    例1:/^[^0-9]/     !^[0-9]!    {^[0-9]}三个都一样。
    在分隔符内部,分隔字符本身就是一个特殊敏感字符,要进行转义。如果用分隔符"/",正则中又用了表达字符的"/",则必须要用"/"。如果混合用"/"和"!"就没问题。
    例2:///$/    !//$! 两者也相同
    例3:!^!![0-9]$!    /^!![0-9]$/ 两者也相同
2.perl特殊意义字符
    a ASCII值为7的告警符
    b 词的边界
    A 和脱出符号("/")等价
    B 非词边界
    cn 控制字符
    d 单个数字
    D 单个非数字
    s 单个空白
    S 单个非空白
    w 单个的字母或下划线
    W 单个的非词字符(不是字母也不是下划线)
    Z 从目标字串的尾部开始匹配
3.高级特性
    1)或运算"|":
        例如!^ex|em!匹配条件是ex或em开头的字符串,还可以写成!^e(x|m)!。
        注意:()内的内容代表子模式
    2)逻辑符号后面的模式选项
        !正则表达式!逻辑选项
        A:只匹配位于目标字串开头的字符。
        E:该选项使转义字符$构成的正则表达式只匹配目标字符串的结尾字符。如果选择m选项,该选项就被忽略。
        U:该选项禁止最大长度的搜索。一般情况下,搜索会尽量找最长的匹配字符串。例如模式/a+/在"caaaaab"字符串中的匹配结果是"aaaaa",但是使用该选项的模式/a+/U匹配的结果会是"a"。
        S:对模式进行学习,提高查找速度。
        i:该选项忽略大小写。
        m:该选项将含有换行符的字符串视为多行而不是一行。这个时候"$","^"等字符会匹配每个换行符。
        s:该选项使句点"."也匹配换行符。
        x:该选项通知PHP解释器在分析的时候忽略正则表达式定义中的非转义空格符。这样可以在正则表达式中使用空格来增强其可读性,但这时在表达式中使用空格符必须使用转义字符。
    3)扩展模式符号。
        (?#comment)    添加注释comment,可以增强正则可读性。
        (?=pattern)    指定在模式之后必须跟随值pattern。
        (?!pattern)    指定在模式之后不能跟随值pattern。
        (?n)           在模式内部而非结尾处定义模式选项n。
        (?: )           消耗字符,不捕获匹配结果。
        例:echo ereg("?:^a$","a");//无任何输出。
4.per正则函数
    1.preg_grep函数
        preg_grep(pattern,array input);
        输入数组input中寻找匹配模式pattern的字串,并将所有的匹配字符串返回。返回值就是所有匹配的字符串组成的数组。
    2.preg_match函数
        preg_match(pattern,string subject,[array matches])
        该函数在subject字符串中寻找匹配pattern的字符串。如果找到则返回一个非零值,否则返回零值。如果选用了可选项matches,那么匹配的字符串将被放到第一个元素的位置,可以用$matches[0]来读取,圆括号匹配的结果也按顺序放在这个数组中,第一个是$matches[1],第二个是$matches[2],依次类推。
    3.preg_match_all函数
        preg_match_all(pattern,subject,array matches,[int order])
        该函数在subject字符串中寻找匹配pattern的互不重叠的文本,找到了匹配的文本则返回匹配文本的个数,否则返回0。匹配文本被放在二维数组matches中,matches[0]中存放的是所有符合的字符串。各种嵌入的子模式匹配的结果依次放在数组matches[1]~[n]中。
        order参数可选,可取的值为PREG_PATTERN_ORDER和PREG_SET_ORDER。
    4.preg_replace函数
        preg_replace(pattern,replacement,subject,[int limit])
        该函数将subject中符合pattern模式的部分替换成replacement,返回值类型和subject类型一样,如果有替换,则返回替换后的值,反之则返回原来的值。
        参数可以是数组也可以是变量,有几种情况:
            如果subject参数是数组类型。函数对每一个数组元素进行替换操作;
            如果pattern是数组则函数根据每一个pattern中的类型进行替换;
            如果pattern和replacement都是数组,则按两个数组中的元素对应完成替换;
            如果replacement中的元素个数少于pattern中的元素个数。那么不够的部分将有空字符串来代替。
    5.preg_split函数
        preg_split(pattern,subject,[int limit][flages])
        该函数以pattern定义的模式为分隔符将subject字符串分隔为若干个部分,返回数组,其中存放被分隔后的字符串。limit可限制返回字符串的数目,如果设置为-1表示对返回的字符串数目不加任何限制。flags也是可选项,其有两个值:PREG_SPLIT_NO_EMPTY设定函数不返回空字符串,PERG_SPLIT_DELIM_CAPTURE,该选项设定pattern中的嵌入子模式也会被函数匹配。

    
 
 

您可能感兴趣的文章:

  • HTML标签参考手册 iis7站长之家
  • JS 正则表达式(学习笔记2)匹配网址url参数
  • 又一篇正则表达式学习笔记
  • js 正则表达式学习笔记之匹配字符串
  • 基于preg_match_all采集后数据处理的一点心得笔记(编码转换和正则匹配)
  • 正则表达式笔记三则
  • 重温JavaScript中的正则表达式 js学习笔记
  • 比较实用的正则表达式学习笔记
  • php 正则表达式学习笔记
  • 正则表达式学习笔记
  • Python 中文正则表达式笔记
  • MySql官方手册学习笔记2 MySql的模糊查询和正则表达式
  • javascript高级程序设计(第三版)学习笔记(一) 正则表达式整理
  • Shell正则表达式之grep、sed、awk实操笔记
  • PHP html标签正则替换并可自定义正则规则
  • php使用正则过滤js脚本代码实例
  • 正则表达式php函数库 ABNF to REGEX
  • php正则验证邮箱的函数
  • php利用正则表达式取出图片的URL
  • 一个正则的写法 php
  • php正则表达式转义字符的例子
  • PHP正则匹配图片并给图片加链接详解
  • php 正则 不包含某字符串的正则表达式
  • php password密码验证正则表达式(8位长度限制)
  • php正则表达式中的非贪婪模式匹配
  • PHP下ereg实现匹配ip的正则
  • php 手机号码验证正则表达式
  • PHP过滤★等特殊符号的正则
  • php正则表达式验证手机电话
  • PHP 正则表达式验证中文的问题
  • php正则过滤特殊字符的方法
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • Perl 正则表达式之角色化记忆
  • 正则表达式 表示 非指定字符串开头的正则
  • Linux c++ boost库正则表达式用法
  • c#正则过滤图片标签 asp.net正则过滤的例子
  • Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法
  • 正则匹配后面非指定字符的正则 原创
  • linux bash shell命令:文本搜索工具grep正则表达式元字符集(基本集)
  • java使用正则表达校验手机号码示例(手机号码正则)
  • js正则表达式之RegExp对象之compile方法 编译正则表达式
  • jQuery中的正则表达式分析 正则基础
  • 正则表达式问题,使用正则表达式找出指定字符串并替换?
  • 正则表达式概述 什么是正则表达式 .
  • 常用正则表达式及评注-学习正则必备
  • python正则表达式去掉数字中的逗号(python正则匹配逗号)
  • 正则表达式口诀_学习正则的朋友值得一看
  • Javascript里的两种使用正则的方法
  • java 正则表达式基础,实例学习资料收集大全 原创
  • (菜鸟飞飞)问个正则表达式的问题
  • 哪些命令可以使用正则表达式
  • 向大家推荐一个收集整理正则表达式的网站
  • 常用正则 常用的C#正则表达式


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3