php使用strip_tags的完整去除所有html标签

作者:enenba | 发表于:2012-05-12 00:17 | 分类:php采集

     PHP中的strip_tags函数是PHP自带的函数,在采集中可以效率地处理采集到的数据,当然使用正则也可以达到一样的效果,在使用strip_tags后发现其过滤有遗漏。

如:

<style>中的样式内容

<script>JS 中的代码。

一般在PHP采集时。JS和CSS不是我们想要的,如果JS或CSS里面有干扰的内容会影响到strip_tags的效果,所以,我一般在strip_tags函数处理前先对JS和CSS进行过滤:

如下代码:

// 先去掉javascript  和 CSS
$str = preg_replace('#<script[^>]*?>.*?</script>#si','',$str);  
$str = preg_replace('#<style[^>]*?>.*?</style>#si','',$str);  
//去除所有html标签 
$str = strip_tags($str); 

这样处理后剩下的就是完全的内容了

 

去JS 解释: 《PHP正则过滤JS代码 》

enenba原创,转载请保留出处:http://enenba.com/?post=163

end..

上一篇: 如何用php正则去掉得到img标签中的 border属性   |   下一篇:php正则匹配图片路径» 标签: php源码 php过滤

评论: