删除HTML标签中指定属性外的其它属性函数

作者:enenba | 发表于:2012-07-18 00:13 | 分类:php源码

ECSHOP系统导出数据包里,如果IMG标签中有其它属性,淘宝会屏蔽掉,因此需要写此函数。

临时所作,难免有考虑不周之处,望朋友们多做指正,则个!

<?php
//取得标签中的一个属性的值 标签全代码 属性名
function getPropertyValue($str,$prty)
{
if (substr($str,-2)=="/>")
    $str=substr($str,1,strlen($str)-3);
else
    $str=substr($str,1,strlen($str)-2);
$tmp=explode(" ",$str);
foreach($tmp as $p)
{
    $ts=trim($p);
    if (!empty($ts))
{
   $ta=explode("=",$ts);
   if (strtoupper($ta[0])==strtoupper($prty))
   {
   return str_replace('"',"",$ta[1]);
   }
}
}
return "";
}


//清除HTML标签中不需要的属性
//代码段str 处理的标签 str 要保留的属性str or arr
function clearHtmlTagProperty($str,$findtag,$saveprty)
{
$l=0;$ol=0;$e=0;
$nstr="";
if (!is_array($saveprty)) $saveprty=array($saveprty);
     $l=0;
$ol=0;
$l=strpos($str,"<",$l);
       $nstr.=substr($str,$e,$l-$e);
while (! ($l===false))
{
    $ol=$e;
    //得到标签串
       $e=strpos($str,">",$l)+1;
       $tmp=substr($str,$l,$e-$l);
   if (strtoupper(substr($tmp,1,strlen($findtag)))==strtoupper($findtag))
   {
     //循环处理要保留的属性记入新字符串
    $nstr.='<'.$findtag;
     foreach($saveprty as $prty)
     {
     //加入保留属性
    $nstr.=' '.$prty.'="'.getPropertyValue($tmp,$prty).'"';
     }
     if (substr($tmp,-2)=="/>")
    $nstr.='/>';
     else
    $nstr.=">";
    }
    else
         $nstr.=substr($str,$ol,$e-$ol);
    $l=strpos($str,"<",$l+1);
}
if ($ol==0) 
    $nstr=$str;
else
    $nstr.=substr($str,$e);
return $nstr;
}

/*使用方法一,标签参数为ARRAY
$xxxx=htmlspecialchars(clearHtmlTagProperty('abcde<img src=123345 id="imgid" border="12" />xxxx<table></table>s',"img",array("src","border")));
使用方法二,标签参数为STRING
$xxxx=htmlspecialchars(clearHtmlTagProperty('abcde<img src=123345 id="imgid" border="12" />xxxx<table></table>s',"img",array("src","border")));
*/

   echo $xxxx;
?>


20090331

修正:属性值中有空格时会出现问题
修正:属性值使用单引号包括时出现问题

替换函数:

 

//取得标签中的一个属性的值 标签全代码 属性名
function getPropertyValue($str,$prty)
{
if (substr($str,-2)=="/>")
    $str=substr($str,1,strlen($str)-3);
else
    $str=substr($str,1,strlen($str)-2);
$tmp=explode(" ",$str);
//如果属性中有空格的,直接连上
$i=$j=0;
$e=count($tmp);
while ($j<$e)
{
    $j++;
if (strspn('=',$tmp[$i])>0 && strspn('=',$tmp[$j])==0 && (strspn('"',$tmp[$i])/2!=0 || strspn('"',$tmp[$i])==0))
{
   $tmp[$i].=" ".$tmp[$j];
   $tmp[$j]="";
}
else
$i=$j;
}
foreach($tmp as $p)
{
    $ts=trim($p);
    if (!empty($ts))
{
   $ta=explode("=",$ts);
   if (strtoupper($ta[0])==strtoupper($prty))
   {
   return str_replace("'","",str_replace('"',"",$ta[1]));
   }
}
}
return "";
}
 

上一篇: 【转】EditPlus正则表达式删除文档多余空行   |   下一篇:让URL只允许一些字符的正则表达式» 标签: php函数 html标签 IMG标签

评论:

2012-10-06 17:00

再收藏一个PHP代码

2012-07-18 14:37

不懂不懂,向博主学习!!

2012-07-18 00:22

HTML5到底是什么概念,我还是不太懂。

2012-07-18 00:27

催眠?你懂我就就完了。