PHP中的strip_tags函数是PHP自带的函数,在采集中可以效率地处理采集到的数据,当然使用正则也可以达到一样的效果,在使用strip_tags后发现其过滤有遗漏。
如:
<style>中的样式内容
<script>JS 中的代码。
一般在PHP采集时。JS和CSS不是我们想要的,如果JS或CSS里面有干扰的内容会影响到strip_tags的效果,所以,我一般在strip_tags函数处理前先对JS和CSS进行过滤:
如下代码:
// 先去掉javascript 和 CSS $str = preg_replace('#<script[^>]*?>.*?</script>#si','',$str); $str = preg_replace('#<style[^>]*?>.*?</style>#si','',$str); //去除所有html标签 $str = strip_tags($str);
这样处理后剩下的就是完全的内容了
去JS 解释: 《PHP正则过滤JS代码 》
enenba原创,转载请保留出处:http://enenba.com/?post=163
end..
评论: