php采集链接优秀正则

作者:enenba | 发表于:2015-09-17 22:30 | 分类:php采集

这两天在用PHP写个采集程序,采集程序采集链接是最开始也是最基础的部分。在链接这个正则上还真是花的时间长。主要是花在一些网站的代码不规范,但是这些不规范的代码偏偏浏览器又能同样解析,好了,不啰嗦了,直接说主题。

浏览器能解析成功的链接代码有:

  1.  <a href= http://www.huoyue.org  target=_blank >一</a>...

阅读全文>>

0人成功匹配 3929人撸过

浏览器useragent大全

作者:enenba | 发表于:2014-10-10 11:31 | 分类:php采集

浏览器useragent大全

chrome

Mozilla/5.0 (Windows NT 5.2) AppleWebKit/534.30 (KHTML, like Gecko) Chrome/12.0.742.122 Safari/534.30

Firefox

Mozilla/5.0 (Windows NT 5.1; rv:5.0) Gecko/20100101 Firefox/5.0

IE8

Mozill...

阅读全文>>

1人成功匹配 57831人撸过

windows下 curl命令行下载工具使用方法小结

作者:enenba | 发表于:2014-09-19 17:33 | 分类:php采集
获取curl

curl 命令行下载工具

curl的官方网站为:
http://curl.haxx.se
官方下载页面为:http://curl.haxx.se/download.html

你可能并不清楚你需要下载哪个版本,没关系,官方提供了下载向导:

http://curl.haxx.se/dlwiz/你可以根据自己的情况一步步选择后下载。我使用的版本
我的最终选择页面为:

ht...

阅读全文>>

2人成功匹配 2005人撸过

判断用户使用的浏览器种类

作者:enenba | 发表于:2014-08-23 11:58 | 分类:php采集

php用 $_SERVER['HTTP_USER_AGENT'] 或 get_browser() 获取到的用户浏览器信息,集合一下,有些判断内涵的东西如下加亮

IE8.0:
浏览器版本:
4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; QQDownload 667; Mozilla/4.0 (compatible; MSIE...

阅读全文>>

1人成功匹配 3898人撸过

curl模块模拟登录后采集页面【详解】

作者:enenba | 发表于:2013-10-10 12:01 | 分类:php采集

今天接到的功课是从一个网站获取商品库存,但是这个网站需要登录,我用fsockopen传递了整个header头都没用,只能求助于curl了。
  附带说一下curl模块的开启办法:
  (1)从php目录下拷贝:libeay32.dll,ssleay32.dll 到windows目录下。
  (2)打开php.ini,查找“extension_dir = xxxxx”,确认后面的文件目录内有p...

阅读全文>>

6人成功匹配 2665人撸过

【转】php CURL模拟访问网页

作者:enenba | 发表于:2013-10-10 11:56 | 分类:php采集

CURL参数详解:

bool curl_setopt (int ch, string option, mixed value)

curl_setopt()函数将为一个CURL会话设置选项。option参数是你想要的设置,value是这个选项给定的值。

下列选项的值将被作为长整形使用(在option参数中指定): 

*CURLOPT_INFILESIZE: 当你上传一个文件到远程站点,这个选项告诉PHP你上...

阅读全文>>

4人成功匹配 2285人撸过
1 2 3 4 5 6 ... »