PHP正则匹配中文UTF-8 和 gb2312的正则区别

作者:enenba | 发表于:2012-01-08 23:32 | 分类:正则表达式

在ANSI(gb2312)环境下
匹配全部的gb2312编码表的字符:/[".chr(0xb0)."-".chr(0xf7)."]+/
单纯匹配汉字而不匹配全角标点:/([".chr(0xb0)."-".chr(0xf7)."][".chr(0xa1)."-".chr(0xfe)."])/
该表达式能匹配一个中文字符。
匹配全角标点而不匹配汉字:/([".chr(...

阅读全文>>

0人成功匹配 5340人撸过

正反向预搜索(前后查看)初解

作者:enenba | 发表于:2012-01-07 23:04 | 分类:正则表达式

这次是对正则的研究,前一天看了正向预搜索(向前查看)、和反向预搜索(向后查看)

“向前查看”和“向后查看”。他们也被称作“零长度断言”。他们和锚定一样都是零长度的,“前后查看”会实际匹配字符,只是他们会抛弃匹配只返回匹配结果:匹配或不匹配。

其正则的特点

正向预搜索:"(?=xxxxx)"

反向预搜索:"(?<=xxxxx)"

 

以下两个PHP正则的例子,简单解释下我对前后查看的理解...

阅读全文>>

0人成功匹配 2641人撸过

关于零宽断言的解释

作者:enenba | 发表于:2012-01-06 23:25 | 分类:正则表达式

以下内容是网上收集的对于零宽断言的解释比较有用尤其解释了(?=exp) 和(?<=exp)的作用

 

如果我的一个页面里有如下的内容
xxxxxxx<a href="/233109" title="GossipGirl">GossipGirl</a><cite title=xxxxxxxxx
我需要查出所有在“ title="Gos...

阅读全文>>

0人成功匹配 2210人撸过

PHP判断字符串由数字和大小写字母组成、长度至少6位

作者:enenba | 发表于:2012-01-06 22:25 | 分类:正则表达式

PHP判断字符串由数字和大小写字母组成、长度至少6位一般是密码的组合。

用此正则可以判断字符串

阅读全文>>

1人成功匹配 4105人撸过

PHP判断字符串是否为utf8编码

作者:enenba | 发表于:2012-01-05 21:43 | 分类:php源码

使用PHP判断字符串是否为UTF-8编码,这是采集中常使用的,因为有很多的网站编码不一样,对采集到的字符串先做一个字符集判断,以下是PHP判断函数。

阅读全文>>

0人成功匹配 3958人撸过

深入浅出之正则表达式 之前言介绍

作者:enenba | 发表于:2012-01-05 21:36 | 分类:正则表达式

前言:
       半年前我对正则表达式产生了兴趣,在网上查找过不少资料,看过不少的教程,最后在使用一个正则表达式工具RegexBuddy时发现他的教程写的非常好,可以说是我目前见过最好的正则表达式教程。于是一直想把他翻译过来。这个愿望直到这个五一长假才得以实现,结果就有了这篇文章。关于本文的名字,使用“深入浅出”似乎已经太俗。但是通读原文以后,觉得只有用“深入浅出”才能准确的表达出该教程给我的感受,所以也就不能免俗了。
       本文是Jan Goyvaerts为RegexBuddy写的教程的译文,版权归原作者所有,欢迎转载。但是为了尊重原作者和译者的劳动,请注明出处!谢谢!

阅读全文>>

0人成功匹配 1700人撸过
«... 39 40 41 42 43 44 45 46 47 48 49