php采集百度MP3 TOP500歌曲

作者:enenba | 发表于:2012-07-14 00:36 | 分类:php采集

   最近又写了php获取百度top500的歌曲名,因为百度歌曲的排行是实时更新的,写出了匹配规则后基本没什么大问题。就是下载需要时间比较长,百度top500的页面数据还是挺大的。

结果图:

点击查看原图

上源码:

 

<?php
$start_time = microtime(true);
$url = 'http://list.mp3.baidu.com/top/top50...

阅读全文>>

8人成功匹配 3177人撸过

PHP获取页面的JS和CSS的总数和文件

作者:enenba | 发表于:2012-07-09 00:58 | 分类:php采集

    我又写了个采集php函数,可以获取JS和CSS的总数,有些的站长工具可能也有这个功能,比如百度的网站速度测试。我写这个小东西也注意到了一些细节问题,比如网站做了301、302重定向的问题,还有相对绝对路径,可能还会其它的问题,不过已经完成了一个雏形。上源码:

 

<?php
/**
 * 获取页面所有的js 和 css 总数 和文件
 * 
...

阅读全文>>

4人成功匹配 2956人撸过

[PHP类] 分享一个强大的HTTP访问类(可做采集)

作者:enenba | 发表于:2012-07-05 23:40 | 分类:php采集

做采集的时候,可以使用file_get_contents()去获取网页源代码,但是使用file_get_contents采集,速度慢,而且超时时间,不好控制。如果采集的页面不存在,需要等待的时间很长。一般来说,curl的速度最快,其次是socket,最后是file_get_contents。
现在跟大家分享一个很强大的采集类,会根据你的服务器当前的配置,自动选择最快的方式。已经封装了curl和s...

阅读全文>>

2人成功匹配 7709人撸过

php获取百度MP3(baidu mp3)下载列表

作者:enenba | 发表于:2012-06-27 10:03 | 分类:php采集

     百度mp3在近几年已经不给出下载地址,所以想用php获取已经不能直接获取下载地址,想要采集MP3的下载地址可以在baidu mp3在线播放器的歌曲url做采集。百度也做了相应的防盗链处理,不能直接盗链在线播放,只能下载。

不多说,上代码。

     php源码说明: 通过输入歌曲 得到百度mp3 第一页的歌曲名、歌手和歌曲url。文件编码请使用gb2312

上效果图:

php获取百度mp3

 

<?php
/*
php获取百度MP3 by enenba  2012-6-27
$param  str 歌曲名
$return array $result
		$result['songurl'] =>歌曲url
		$result['singer']  =>歌手
		$result['songname']=>歌曲名
*/

阅读全文>>

4人成功匹配 3642人撸过

php采集li标签的链接与文本内容

作者:enenba | 发表于:2012-06-21 15:47 | 分类:php采集

一般在个网站中最适合堆砌文章列表的就是<ul><li>标签,型如以下的形式:

ull标签+li标签

<ul>
	<li>……<li>
<ul>

这样可以获取一个文章的主要内容列表,那也不用管他们的是怎么分布在什么地方只要输入网址,他就自动找出li标签部分,然后目测出是否是主要的列表部分内容,然后就可以使用正则OOXX 采集了吧,

...

阅读全文>>

3人成功匹配 2682人撸过

php获取某网站的百度快照日期

作者:enenba | 发表于:2012-06-18 22:00 | 分类:php采集

php获取某网站的百度快照日期,这是百度快照是使用“site:域名的快照”呢,还是直接搜“域名的快照”。我查了站长工具和爱站,是直接搜域名的结果。

点击查看原图

阅读全文>>

0人成功匹配 3168人撸过
1 2 3 4 5 6 7 ... »