当前位置:  编程技术>其它

正则表达式不包含属性

    来源: 互联网  发布时间:2014-10-14

    本文导语:  找出所有img标签的,没有带说明属性alt的标签: 正则:).*?> 例子:        扩展,如果要找没有带title属性的a应该是: 正则:).*?> 例子:        用正则表达式找出不包含连续字符串abc的单词 [^abc]表示不包含a、b、c中任...

找出所有img标签的,没有带说明属性alt的标签:

正则:).*?>
例子:       


扩展,如果要找没有带title属性的a应该是:

正则:).*?>
例子:       
用正则表达式找出不包含连续字符串abc的单词

[^abc]表示不包含a、b、c中任意字符, 我想实现不包含字符串abc应该如何写表达式?

就我自己而言,这个问题最简单的解决方法是使用编程语言的配合,找出那些包含abc的,剩下的就是不包含的了——懒人的风格。但我写的是教程,读者未必都有编程的基础,有些只是使用一些工具从txt文档中抽取出一些信息,所以要回答还是必须完全通过正则表达式来完成。

于是打开了RegexTester,开始试验,先是试了使用((?'test'abc)|.)*(?(test)(?!))(含意是:查找abc,或任意的字符,如果找到了abc,就把它存入命名为test的组里,到最后检查test组里是否有内容,如果有就匹配失败,相关说明见教程),结果是"abc","aabc","abcd","aa"都能通过测试,看来是到最后测试到test组存在后又回溯了,此解决方案不可行。

然后又试了(.(?!abc))*(找出所有后面不是abc的字符),结果是"abc","abcd"通过测试,"aabc"则只截取了后面的"abc",显然不行。

那加强条件试试:((?
现在看来有点戏了,但是怎么把那些内部包含abc的字符串过滤掉呢?这个问题换句话说也就是怎么匹配整体而不是部分呢?现在需要明确用户的需求了:如果用户想要找的是单词,那就在表达式的两端加上b,如果要找的是行,就加上^和$。由于用户的问题没有明确说明,我就当作是单词吧。

于是等到了这样的表达式:b((?
怎么排除单词abc?经过一番思考,最后我认为判断单词是否以a开头的方式最为方便:b(a(?!bc)|[^a](?!abc))((?
使用正则表达式查找不包含连续字符串abc的单词,最终结果:b(a(?!bc)|[^a](?!abc))((?----------------
更新:根据maple的评论,更简洁的作法是:b((?!abc)w)+b

正则表达式-不包含某个字符串

在使用正则表达式的场合,常常有这种需求,就是匹配一个不包含某个子串的子符串。比如说,我要从“eabcdfgh”得到"cd"之前的子串。有些人可能会写:

([^cd]*)

这种写法是彻底错误的,因为[]中的是集合,也就是说,[^cd]表示不等于c或者d,而不是cd。下面的程序中没有cd,但eab还是被匹配出来了。

代码如下:

String s = "([^cd]*)"; 
Match m = Regex.Match("eabcfgh", s); 
MessageBox.Show(m.Value);//eab 
MessageBox.Show(m.Groups[1].Value);//eab

上面这种写法是错的比较离谱的,正常青年一般都可以避免这种错误。在特殊情况下,正则表达式可以这么写,而且效率是比较高的。

([/s/S]*cd)

先说明下/s/S是表示匹配任何字符。所谓特殊情况,就是我知道这个字符串中必有cd的存在。假如,我的要求是匹配不包含cd的部分(为了描述方便,只匹配cd之前的部分),也就是说,当cd不存在时,应该把整个字符串都取出来。

代码如下:

String s = "((.(?!cd))*.)"; 
//String s = "([/s/S]*cd)"; 
Match m = Regex.Match("eabcdfgh", s); 
MessageBox.Show(m.Value);//eab 
MessageBox.Show(m.Groups[1].Value);//eab

这种写法终于符合要求了。不过值得一提的是,相较前一种而言,它的效率比较低。
回顾一下相关的语法:
(?:子表达式)         定义非捕获组。

代码如下:

//定义非捕获组 
String s = "e(?:ab)(.*)"; 
Match m = Regex.Match("eabcd", s); 
MessageBox.Show(m.Value);//eabcd 
MessageBox.Show(m.Groups[1].Value);//cd

ab是被匹配的,但是它所在的组没有被捕获,Group[1]是cd

(?=子表达式)       零宽度正预测先行断言。

代码如下:

//零宽度正预测先行断言 
//String s = "b(cd|de)(.*)"; 
String s = "b(?=cd|de)(.*)"; 
Match m = Regex.Match("eabcdfg", s); 
MessageBox.Show(m.Value); 
MessageBox.Show(m.Groups[1].Value);//区别 cd  cdfg

这种写法和注释掉的写法是有区别的,区别就是“零宽度”,这种写法会被捕获,也就是不占一个Group。

(?!子表达式)       零宽度负预测先行断言。

!表示非,就是不包含,同样是零宽度,不会被捕获。

(?

“1851 1999 1950 1905 2003”中的“51”和“03”


    
 
 

您可能感兴趣的文章:

  • Perl 正则表达式之角色化记忆
  • js正则表达式之RegExp对象之compile方法 编译正则表达式
  • Linux c++ boost库正则表达式用法
  • 正则表达式 表示 非指定字符串开头的正则
  • Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法
  • 正则表达式问题,使用正则表达式找出指定字符串并替换?
  • linux bash shell命令:文本搜索工具grep正则表达式元字符集(基本集)
  • 正则表达式概述 什么是正则表达式 .
  • JS 正则表达式的相关方法(正则学习笔记1)
  • jQuery中的正则表达式分析 正则基础
  • java 正则表达式基础,实例学习资料收集大全 原创
  • 哪些命令可以使用正则表达式
  • 常用正则表达式及评注-学习正则必备
  • (菜鸟飞飞)问个正则表达式的问题
  • 向大家推荐一个收集整理正则表达式的网站
  • 正则表达式的问题
  • 关于正则表达式匹配问题
  • Python 匹配任意字符(包括换行符)的正则表达式写法
  • php 正则 不包含某字符串的正则表达式
  • Java正则表达式 reb4j
  • 大虾,请问谁有正则表达式的资料?谢谢!
  • js正则表达式之input属性($_)RegExp对象属性介绍
  • js正则表达式之RegExp对象属性lastIndex,lastMatch,lastParen,lastContext,rightContext属性讲解
  • php正则表达式匹配img中任意属性的方法
  • js正则表达式讲解之index属性(RegExp对象)
  • 用正则查找html中有id属性的html标签
  • C#正则表达式获取下拉菜单(select)的相关属性值
  • js正则表达式之$1$2$3$4$5$6$7$8$9属性,返回子匹配的结果
  • JavaScript 正则表达式之RegExp属性、方法及应用分析
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • c#正则过滤图片标签 asp.net正则过滤的例子
  • 正则匹配后面非指定字符的正则 原创
  • java使用正则表达校验手机号码示例(手机号码正则)
  • PHP html标签正则替换并可自定义正则规则
  • python正则表达式去掉数字中的逗号(python正则匹配逗号)
  • 正则表达式口诀_学习正则的朋友值得一看
  • Javascript里的两种使用正则的方法
  • 常用正则 常用的C#正则表达式
  • 寻求正则表达试
  • 学习IP地址的正则表达式
  • asp.net正则表达式提取中文的代码示例
  • 正则表达式中使用变量赋值
  • 用正则表达式来表示中文
  • java正则表达式验证函数
  • linux下有什么函数可以处理正则表达式?
  • emacs里空行的正则表达式如何写?
  • 正则式 ^[^ ](.*[^ ])?$ 的含义
  • 正则式如何只匹配一个汉字?
  • 关于sed的正则表达式
  • 正则表达式小疑问


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3