使用php 将html 转成wml WAP标记语言

作者:enenba | 发表于:2013-01-06 18:27 | 分类:php源码

WML(无线标记语言,Wireless Markup Language)是一种脚本语言, 它比HTML 编写的内容要消耗网络浏览器更少的内存和CPU时间, 使得WML对广域网和移动设备来说更加友好。

WML 是无线标记语言。它是一种从 HTML 继承而来的标记语言,但是 WML 基于 XML,因此它较 HTML 更严格。

因为也是基于xml 应该可以由html转成wap ,cms中的源码,有个将html转成wml的php函数,貌似正则也挺多的,贴出来。

 

<?php
//---------------------------------------
// Html 标记WAP语言
//----------------------------------------
function html2wml($content)
{
     //保留图片
     preg_match_all("/<img([^>]*)>/isU", $content, $imgarr);
     if(isset($imgarr[0]) && count($imgarr[0])>0 )
     {
         foreach($imgarr[0] as $k=>$v) $content = str_replace($v, "WAP-IMG::{$k}", $content);
     }
     // 过滤掉样式表和脚本
     $content = preg_replace("/<style .*?<\/style>/is", "", $content);
     $content = preg_replace("/<script .*?<\/script>/is", "", $content);
     // 首先将各种可以引起换行的标签(如<br />、<p> 之类)替换成换行符"\n"
     $content = preg_replace("/<br \s*\/?\/>/i", "\n", $content);
     $content = preg_replace("/<\/?p>/i", "\n", $content);
     $content = preg_replace("/<\/?td>/i", "\n", $content);
     $content = preg_replace("/<\/?div>/i", "\n", $content);
     $content = preg_replace("/<\/?blockquote>/i", "\n", $content);
     $content = preg_replace("/<\/?li>/i", "\n", $content);
     // 将"&nbsp;"替换为空格
     $content = preg_replace("/\&nbsp\;/i", " ", $content);
     $content = preg_replace("/\&nbsp/i", " ", $content);
     // 过滤掉剩下的 HTML 标签
     $content = strip_tags($content);
     // 将 HTML 中的实体(entity)转化为它所对应的字符
     $content = html_entity_decode($content, ENT_QUOTES, "GB2312");
     // 过滤掉不能转化的实体(entity)
     $content = preg_replace('/\&\#.*?\;/i', '', $content);
     // 上面是将 HTML 网页内容转化为带换行的纯文本,下面是将这些纯文本转化为 WML。
     $content = str_replace('$', '$$', $content);
     $content = str_replace("\r\n", "\n", htmlspecialchars($content));
     $content = explode("\n", $content);
     for ($i = 0; $i < count($content); $i++)
     {
        $content[$i] = trim($content[$i]);
        // 如果去掉全角空格为空行,则设为空行,否则不对全角空格过滤。
        if (str_replace(' ', '', $content[$i]) == '') $content[$i] = '';
     }
     $content = str_replace("<p><br /></p>\n", "", '<p>'.implode("<br /></p>\n<p>", $content)."<br /></p>\n");
     
     //还原图片
     if(isset($imgarr[0]) && count($imgarr[0])>0 )
     {
                foreach($imgarr[0] as $k=>$v)
                {
                    $attstr = (preg_match('#/$#', $imgarr[1][$k])) ? '<img '.$imgarr[1][$k].'>' : '<img '.$imgarr[1][$k].' />';
                    $content = str_replace("WAP-IMG::{$k}", $attstr, $content);
                }
     }
     
     $content = preg_replace("/&amp;[a-z]{3,10};/isU", ' ', $content);
     
     return $content;
}

function text2wml($content)
{
     $content = str_replace('$', '$$', $content);
     $content = str_replace("\r\n", "\n", htmlspecialchars($content));
     $content = explode("\n", $content);
     for ($i = 0; $i < count($content); $i++)
     {
        // 过滤首尾空格
        $content[$i] = trim($content[$i]);
        // 如果去掉全角空格为空行,则设为空行,否则不对全角空格过滤。
        if (str_replace(" ", "", $content[$i]) == "") $content[$i] = "";
     }
     //合并各行,转化为 WML,并过滤掉空行
     $content = str_replace("<p><br /></p>\n", "", "<p>".implode("<br /></p>\n<p>", $content)."<br /></p>\n");
     return $content;
}
?>

end....

上一篇: php检查用户名是否符合规定   |   下一篇:php获取当前页面完整URL地址» 标签: php函数 html转wml WAP标记语言

评论:

2013-03-06 16:48

现在大多智能手机均支持html,wml应该很快就没啥用处了~
说起wap时代输出wml,我当时用过一个HAWHAW(HTML and WML hybrid adapted Webserver http://www.hawhaw.de/),这货才够强大呢~

2013-01-22 08:53

好纠结的问题哦

2013-01-10 11:17

看着这么一堆的代码就头疼!

2013-01-07 19:58

注释 很详细啊。不知道是不是楼主自己写的。代码很规范

2013-01-08 12:00

已经写明了,从某cms提取,肯定不是我写的。

2013-01-07 18:03

学习了哈