php删除html5废弃的标签属性

作者:enenba | 发表于:2012-06-01 15:04 | 分类:php源码

html5已经废弃了一些标签属性,在一此编辑器中有可能不能直接删除,我写了一个尽量去掉非html5属性标签php函数。代码附上:

<?php
/**
 * php删除html5废弃的标签属性 by enenba
 * 2012-6-1
 * 如:align valign bgcolor height width hspace vspace
 * body中link、vlink、ali...

阅读全文>>

0人成功匹配 1730人撸过

php将HTML标签转成小写

作者:enenba | 发表于:2012-05-28 21:08 | 分类:php源码

使用正则将html标签转换成小写,毕竟xhtml要的是小写。此函数使用php正则将html标签源码全部转成小写,当然,此正则是php手册中的例子, 只不过手册是小写转大写,我把他弄成大写转小写。
手册还对/e 修正符进行了解释:

/e 修正符使 preg_replace() 将 replacement 参数当作 PHP 代码(在适当的逆向引用替换完之后)。提示:要确保 replacement 构成...

阅读全文>>

0人成功匹配 2302人撸过

php格式化html函数

作者:enenba | 发表于:2012-05-27 15:04 | 分类:php源码

此函数从wp中提取出来的,能够格式化html,让html相应缩进,增加输出html的可读性。

上源码:

<?php

/**
 * Merge user defined arguments into defaults array.
 *
 * This function is used throughout WordPress to allow for both string or a...

阅读全文>>

0人成功匹配 3114人撸过

php 获取301跳转后真实的url

作者:enenba | 发表于:2012-05-22 11:35 | 分类:php源码

301在php采集中经常遇到有URL 301重定向的情况,如果出现了这样的情况,有可能出现造成未知的结果,因为主机名不一样了。我们的采集中主机名不能用301重定向前的URL,要用重定向之后的URL。

我在以下PHP的例子中介绍下怎么获取301定向后真实的URL,目前我知道有两种方法,

1、用get_headers函数2、用cURL

现介绍利用get_headers() 函数获取http头
   php 自带的get_headers()取得服务器响应一个 HTTP 请求所发送的所有标头。 获取301状态肯定没问题。

 

301定向的例子:
 google.com 会301跳转至 www.google.com
  再www.google.com 会302跳转至 www.google.com.hk

我写了个php函数 其php函数作用:
 输入 google.com 得到 www.google.com.hk
 输入 www.google.com 得到 www.google.com.hk
 输入 www.google.com.hk 得到 www.google.com.hk

……

阅读全文>>

0人成功匹配 5307人撸过

使用curl获取页面所有链接

作者:enenba | 发表于:2012-05-21 22:55 | 分类:php采集

一般php采集网络数据会用file_get_contents、file和cURL。当然我听说cURL会比file_get_contents、file更快更专业,更适合采集。今天我试试用cURL来获取网页上的所有链接。

<?php
/*
 * 使用curl 采集hao123.com下的所有链接。  
 */
include_once('function.php');

$ch =...

阅读全文>>

2人成功匹配 4603人撸过

用正则使html合法闭合标签

作者:enenba | 发表于:2012-05-15 23:31 | 分类:php源码

在html代码中,大部分标签是有开始和结束的,但是有一些标签是没有结束标签的,比如<input /> ,还有空元素如:<br />,他有两种写法,第一种:<input>,第二种:<input/>,现在html5中,做了统一规范,要求所有的标签必须闭合。

当然自己写了没注意闭合,写成了 <input>全部都有,都要一一修改岂不麻烦死,于是写了一个PHP正则用于闭合标签函数

阅读全文>>

0人成功匹配 2116人撸过
1 2 3 4 5 6 7 8 9 ... »