PHP匹配图片的路径部分

作者:enenba | 发表于:2011-12-14 18:43 | 分类:php采集

抓取网页图片的url 部分,也就是<img>标签中的src部分
如:<img src="test.jpg" /> 或<img src="test.jpg" …………………… > 或<img src=test.jpg ………… >
要排除 class ID alt 等样式和标签
抓到 test.jpg

<?php
$html = 'bsdbsbsd<img src="http://c.baidu.com/c.gif?t=0&q=asp&p=0&pn=1" style="display:none">1243124<img src="test.jpg" />124';
$html.= '124124<a><img src="http://www.baidu.com/img/baidu_jgylogo3.gif" width="117" height="38" border="0" alt="到百度首页"></a>';
preg_match_all('/<img[ ]*src=["\']?([^"\' ><]+)/i',$html, $arr);

printf("<p>输出数据为:</p><pre>%s</pre>\n",var_export( $arr[1] ,TRUE));
?>

1

 

此例输出:

输出数据为:
array (
  0 => 'http://c.baidu.com/c.gif?t=0&q=asp&p=0&pn=1',
  1 => 'test.jpg',
  2 => 'http://www.baidu.com/img/baidu_jgylogo3.gif',
)

上一篇: PHP正则 去掉所有html的属性部分   |   下一篇:PHP过滤用户发布的信息中的危险代码» 标签: php采集 数据采集 PHP正则

评论: