php获取百度关键词查询结果总数

作者:enenba | 发表于:2012-06-07 23:49 | 分类:php采集

这一次采集,使用php采集百度某关键词结果的总数。这个在很多的站长工具都有,可以了解某关键词热度。上几张效果图

1、搜索我的enenba

enenba搜索结果 

阅读全文>>

5人成功匹配 2789人撸过

使用Snoopy来获取某网页的所有链接

作者:enenba | 发表于:2012-05-24 23:27 | 分类:php采集

Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。现用Snoopy来获取某网页的所有链接。

下面使用Snoopy一个页面的所有链接

<?php
/**
 * 使用Snoopy来获取某网页的所有链接 by enenba
 * 2012-5-24
 * @param str $url 搜索目标url
 * @return array $result 链接数组
 */

阅读全文>>

1人成功匹配 3736人撸过

php采集百度某关键词搜索结果的网址

作者:enenba | 发表于:2012-05-23 22:35 | 分类:php采集

       使用php采集搜索结果简单应用1——采集百度某关键词搜索结果的网址,搜索结果网址都在<span class="g">……</span>标签中,很容易采集到。 以下就上代码:

php源码

<?php
/**
 * 采集某百度某关键词搜索结果的网址 by enenba
 * 2012-6-6
 * 
 * @param str $keyword 关键词
 * @return array $result 搜索结果网址数组
 */

.........

阅读全文>>

3人成功匹配 3541人撸过

使用curl获取页面的meta中keywords和description

作者:enenba | 发表于:2012-05-22 21:54 | 分类:php采集

meta获取前面的文章《php正则得到网页的keywords和description部分》已经提到正则提取keywords和description了,现在再介绍使用curl的来提取meta中的keywords和description。相对get_meta_tags,cURL拿来采集更为强大。
下面cURL拿来采集meta ,php函数:

阅读全文>>

0人成功匹配 3668人撸过

使用curl获取页面所有链接

作者:enenba | 发表于:2012-05-21 22:55 | 分类:php采集

一般php采集网络数据会用file_get_contents、file和cURL。当然我听说cURL会比file_get_contents、file更快更专业,更适合采集。今天我试试用cURL来获取网页上的所有链接。

<?php
/*
 * 使用curl 采集hao123.com下的所有链接。  
 */
include_once('function.php');

$ch =...

阅读全文>>

2人成功匹配 4603人撸过

如何用php正则去掉得到img标签中的 border属性

作者:enenba | 发表于:2012-05-13 00:07 | 分类:php采集

    请问php正则如何去掉得到img标签中的 border属性,例如:<img src="test.gif" border="0" alt="test1" />   替换后的  <img src="test.gif" alt="test1" />

 

一开始我就想到要 只去掉border="" 很简单的写出

$search = '/(<img.*?)(border=".*?")([^>]+\/?>)/is';

它只能去掉形如<img src="囧1" border="囧2" />这样的border,一般的 <img>标签会有这样几种含有boder的情况

阅读全文>>

9人成功匹配 4781人撸过
1 2 3 4 5 6 7 8 ... »