phpQuery—基于jQuery的PHP实现

作者:enenba | 发表于:2012-05-25 13:59 | 分类:php源码

phpQuery—基于jQuery的PHP实现

Query的选择器之强大是有目共睹的,phpQuery 让php也拥有了这样的能力,它就相当于服务端的jQuery。

先来看看官方简介: 

phpQuery is a server-side, chainable, CSS3 selector driven Document Object Model (DOM) API based on jQuery JavaScript Library.
Library is written in PHP5 and provides additional Command Line Interface (CLI). 
 

存在的意义
我们有时需要抓取一个网页的内容,但只需要特定部分的信息,通常会用正则来解决,这当然没有问题。正则是一个通用解决方案,但特定情况下,往往有更简单快捷的方法。比如你想查询一个编程方面的问题,当然可以使用Google,但stackoverflow 作为一个专业的编程问答社区,会提供给你更多,更靠谱的答案。
对于html页面,不应该使用正则的原因主要有3个
1、编写条件表达式比较麻烦
尤其对于新手,看到一堆”不知所云”的字符评凑在一起,有种脑袋都要炸了的感觉。如果要分离的对象没有太明显的特征,正则写起来更是麻烦。
2、效率不高
对于php来说,正则应该是没有办法的办法,能通过字符串函数解决的,就不要劳烦正则了。用正则去处理一个30多k的文件,效率不敢保证。
3、有phpQuery
如果你使用过jQuery,想获取某个特定元素应该是轻而易举的事情,phpQuery让这成为了可能。
 
浅析phpQuery
phpQuery是基于php5新添加的DOMDocument。而DOMDocument则是专门用来处理html/xml。它提供了强大xpath选择器及其他很多html/xml操作函数,使得处理html/xml起来非常方便。那为什么不直接使用呢?这个,去看一下官网的函数列表 就知道了,如果对自己的记忆力很有信心,不妨一试。
 
几个简单的例子
获取Google首页logo(google首页的源码可不是一般的乱啊)

<?php   
	include 'phpQuery.php';   
	phpQuery::newDocumentFile('http://www.google.com.hk/');   
	$companies = pq('#hplogo'); 
	highlight_string($companies);
?>

 
获取蓝色理想最热的招聘职位 

<?   
	include 'phpQuery.php';   
	phpQuery::newDocumentFile('http://job.blueidea.com');   
	$companies = pq('#hotcoms .coms')->find('div');   
	foreach($companies as $company)   
	{   
	   echo pq($company)->find('h3 a')->text()."<br>";   
	}
?>

 


小结
• pq()就像jQuery里的$()
• 基本上jQuery的选择器都可以用在phpQuery上,只要把’.'变成’->’
• phpQuery提供了好几种载入文件的方法,有的使用字符串,有的使用文件(包括url),选择的时候要注意
• 基本上这一页 就很能说明问题了

 

 

以上都是转载网络,对采集是巨有用,以后有时间做个专题。

phpQuery下载 : http://code.google.com/p/phpquery/

待续..... 

上一篇: 正则用(?>…)实现固化分组提高效率   |   下一篇:使用Snoopy来获取某网页的所有链接» 标签: php源码 jquery php函数库 phpquery

评论:

2013-06-05 21:36

不知道与simple_html_dom相比如何?

2013-06-06 17:04

simple_html_dom效率会搞些。