浏览器useragent大全

作者:enenba | 发表于:2014-10-10 11:31 | 分类:php采集

浏览器useragent大全

chrome

Mozilla/5.0 (Windows NT 5.2) AppleWebKit/534.30 (KHTML, like Gecko) Chrome/12.0.742.122 Safari/534.30

Firefox

Mozilla/5.0 (Windows NT 5.1; rv:5.0) Gecko/20100101 Firefox/5.0

IE8

Mozill...

阅读全文>>

1人成功匹配 57831人撸过

PHP中header() 有什么用?常见header 状态

作者:enenba | 发表于:2014-10-09 10:14 | 分类:php源码

什么是头信息?
这里只作简单解释,详细的自己看http协议。
在 HTTP协议中,服务器端的回答(response)内容包括两部分:头信息(header) 和 体内容,这里的头信息不是HTML中的<head></head>部分,同样,体内容也不是<BODY>< /BODY>。头信息是用户看不见的,里面包含了很多项,包括:服务器信息、日...

阅读全文>>

0人成功匹配 1832人撸过

php常用正则函数 中文、邮箱、手机号和电话

作者:enenba | 发表于:2014-10-09 10:12 | 分类:正则表达式

//关于文字

//判断是否为中文

function isChinese($str){
return preg_match(“/[\x7f-\xff]/”, $str);
}

//关于邮箱
//判断是否为邮箱
function checkEmail($email){
return (ereg(“^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(.[a-z...

阅读全文>>

0人成功匹配 2283人撸过

【转】php文章相似度计算 不用similar_text()函数

作者:enenba | 发表于:2014-10-08 15:50 | 分类:php源码
php默认有个函数similar_text()用于计算字符串之间的相似度,该函数也可以计算两个字符串的相似度(以百分比计)。不过这个函数感觉对中文计算很不准确比如:
echo similar_text("吉林禽业公司火灾已致112人遇难","吉林宝源丰禽业公司火灾已致112人遇难");

这两个新闻标题其实都是一样的,如果使用similar_text()相似对结果为:42,即只相似42%,所以这...

阅读全文>>

2人成功匹配 2882人撸过

dede自动采集功能研究

作者:enenba | 发表于:2014-09-29 10:40 | 分类:php源码

首先分析一下,采集过程主要包括:

1.采集文档

2.生成文档

3.更新页面

三部分

由于这三部分都可以用dede后台完成,所以肯定有对应的函数可以调用。现在目标就是将这些函数找出来,然后自己写一个func把所有流程整理出来,让php实现自动采集

现在以5.6为例.打开后台页面,采集节点管理,找到真正的页面地址:

dede/co_main.php

然后将鼠标移动到“采集"按钮上,可以看到指向js 函数

Gather...

阅读全文>>

1人成功匹配 2601人撸过

windows下 curl命令行下载工具使用方法小结

作者:enenba | 发表于:2014-09-19 17:33 | 分类:php采集
获取curl

curl 命令行下载工具

curl的官方网站为:
http://curl.haxx.se
官方下载页面为:http://curl.haxx.se/download.html

你可能并不清楚你需要下载哪个版本,没关系,官方提供了下载向导:

http://curl.haxx.se/dlwiz/你可以根据自己的情况一步步选择后下载。我使用的版本
我的最终选择页面为:

ht...

阅读全文>>

2人成功匹配 2006人撸过
1 2 3 4 5 6 7 8 ... »