采集论坛的小程序(已过期)

作者:enenba | 发表于:2012-02-19 22:19 | 分类:php采集

写了个采集论坛的小程序。里面包括了模拟登陆,获取页面源代码,正则匹配结果等部分,希望对大家有用。

这个是09年的东西了,例子中的论坛已经不存在,是不是discuz我也不知道。不过还是可以学到一些东西。

阅读全文>>

0人成功匹配 1852人撸过

php采集网站的title部分

作者:enenba | 发表于:2012-02-15 00:05 | 分类:php采集
采集网站数据最多的就是采集title部分,因为<title>标签内容是一个网页的主题的标志,以下是采集<title>部分的PHP正则,可以针对不同的网站结构进行分析。

阅读全文>>

0人成功匹配 5800人撸过

php保存文件(自动创建目录)

作者:enenba | 发表于:2012-02-14 10:29 | 分类:php源码

php保存文件,还可以根据文件路径自动连续创建目录,注意PHP要版本5以上。

<?php
	/**
	 * 保存文件
	 * 
	 * @param string $fileName 文件名(含相对路径)
	 * @param string $text 文件内容
	 * @return boolean 
	 */
	function saveFile($fileName, $t...

阅读全文>>

0人成功匹配 4326人撸过

php正则,匹配.php和.html和.asp结尾的文件

作者:enenba | 发表于:2012-01-19 23:59 | 分类:php采集
问:
我的写法不行,正确的要怎样?
"/.*?[\.php|\.htm|\.html|\.asp]/"
 

阅读全文>>

0人成功匹配 1645人撸过

删除HTML中的JS部分

作者:enenba | 发表于:2012-01-18 23:13 | 分类:php采集

     可以删除HTML中的<script>……</script>内容,包括<script>,过滤script代码减少错误。

代码如下

<?php
function delJS($html) {
	$search = '~<script[^>]*?>.*?</script>~si'...

阅读全文>>

0人成功匹配 1755人撸过

用php求两个文件的相对路径

作者:enenba | 发表于:2012-01-17 10:42 | 分类:php采集

网上又找到一个很好很强大的函数!用php求两个文件的相对路径,如: * 文件一:/usr/local/log/test/test.log * 文件二:/usr/local/apache/conf/logs/tests.log

阅读全文>>

0人成功匹配 1846人撸过
1 2 3 4 5 6 7 8 9