很多时候要采集网站数据,如果你想要采到一些与样式有关的东西也可以采集一些文件如CSS 文件这样的东东。
以下只是简单地写出如何采集一个页面下的CSS文件名,记住只是CSS文件名。想要更深入采集,比如采集CSS文件内容,还有图片,那就等以后再分析,不多说上简单代码:
form.html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <title></title> </head> <form method="get" action="post.php"> <input type="text" name="q" style="width:500px"> <input type="submit" value="提交"> </form>
post.php
<?php if($_GET) { $url= $_GET['q']; $data = file_get_contents($url); //http://www.qq.com $preg = '/<link (.*?)href="(.*?\.css)"(.*?)\/>/i'; preg_match_all($preg,$data,$css_data,PREG_SET_ORDER); echo '<ol>'; foreach ( $css_data as $v){ echo '<li>'; echo $v[2].'<br>'; echo '</li>'; } echo '</ol>'; } ?>
附件下载/演示源码:
【 getcss.rar 】 655字节
评论: