织梦采集侠获取文章标题原理,附上php源码

作者:enenba | 发表于:2012-08-02 17:28 | 分类:php采集
我这几天看了下织梦采集侠的源码,发现有很多成熟的技术,比如这个采集网站文章的题目,源码一会再上,先做简单解释:
首先,很多人会一直会认为这不是很简单,就是<title>标签中的内容嘛,不是很容易获取吗?其实不然,很多的title部分不一定放文章的题目,很多的网站还加入了关键字,而且一定加入网站名。

阅读全文>>

2人成功匹配 4777人撸过