使用此正则可以采集网页中的img标签中的src部分。此PHP正则表达式算是我找到比较完美的正则匹配了。
它可以很好的避免样式的影响,如<img class="b12" src…………/>也能采到src部分。
不多说了上PHP正则:
<?php $html = file_get_contents('http://www.qq.com'); $search = '|<img[^>]+src="([^"]*)"[^>]+>|si'; preg_match_all($search, $html, $images); printf("<p>输出images数据为:</p><pre>%s</pre>\n",var_export( $images ,TRUE)); ?>
输出的信息是数组
0=》是<img> 标签的整个语句。
1=》是<img> 标签SRC部分。
很用有是吧
你也可以过滤掉非src的属性,看此文:http://enenba.com/?post=164
附件下载/演示源码:
【 get_img.htm 】 5.97KB
评论: