php 获取301跳转后真实的url

作者:enenba | 发表于:2012-05-22 11:35 | 分类:php源码

301在php采集中经常遇到有URL 301重定向的情况,如果出现了这样的情况,有可能出现造成未知的结果,因为主机名不一样了。我们的采集中主机名不能用301重定向前的URL,要用重定向之后的URL。

我在以下PHP的例子中介绍下怎么获取301定向后真实的URL,目前我知道有两种方法,

1、用get_headers函数2、用cURL

现介绍利用get_headers() 函数获取http头
   php 自带的get_headers()取得服务器响应一个 HTTP 请求所发送的所有标头。 获取301状态肯定没问题。

 

301定向的例子:
 google.com 会301跳转至 www.google.com
  再www.google.com 会302跳转至 www.google.com.hk

我写了个php函数 其php函数作用:
 输入 google.com 得到 www.google.com.hk
 输入 www.google.com 得到 www.google.com.hk
 输入 www.google.com.hk 得到 www.google.com.hk

……

阅读全文>>

0人成功匹配 5306人撸过

用正则使html合法闭合标签

作者:enenba | 发表于:2012-05-15 23:31 | 分类:php源码

在html代码中,大部分标签是有开始和结束的,但是有一些标签是没有结束标签的,比如<input /> ,还有空元素如:<br />,他有两种写法,第一种:<input>,第二种:<input/>,现在html5中,做了统一规范,要求所有的标签必须闭合。

当然自己写了没注意闭合,写成了 <input>全部都有,都要一一修改岂不麻烦死,于是写了一个PHP正则用于闭合标签函数

阅读全文>>

0人成功匹配 2115人撸过

PHP修正相对路径链接

作者:enenba | 发表于:2012-05-06 13:42 | 分类:php源码

一般上来说,a标签的链接有两种形式:1、绝对路径;2、相对路径。采集数据时都会碰到如此的两种链接形式。

对于绝对路径的链接就很简单。相对路径需要修正才能得到完整URL,以下是一个修正相对路径的php函数。

阅读全文>>

0人成功匹配 2111人撸过

php自动转换字符集函数,从thinkphp中提取

作者:enenba | 发表于:2012-04-28 21:29 | 分类:php源码

php自动转换字符集函数,这个是从thinkphp中提取出来的函数,可以单独使用。

支持数组转换,也就是数组下的所有变量转换成想要的字符集,

小分析下此函数,先使用mb_convert_encoding转换字符集,不行再使用iconv转换。

阅读全文>>

0人成功匹配 2462人撸过

php验证时间格式,只有年月日

作者:enenba | 发表于:2012-04-17 10:21 | 分类:php源码

php验证时间格式,只有年月日

主要有以下的格式才符合: 

2012-04-17

2012-4-7

2012/4/17

源码:

阅读全文>>

0人成功匹配 2477人撸过

将一个数组拆分为N个数组,所有的子数组的数量相差不超过1

作者:enenba | 发表于:2012-03-20 11:16 | 分类:php源码
想把一个数组$array(10个元素) 拆为4个子数组,其中数量为:3 3 2 2
如果使用PHP函数 array_chunk()只会生成 3 3 3 1      。不符合要求需要自写函数

阅读全文>>

0人成功匹配 2209人撸过
«... 5 6 7 8 9 10 11 12 13 14 15 ... »