文章正文内容相似度查询

作者:enenba | 发表于:2013-06-17 15:24 | 分类:php采集

文章正文内容相似度查询Similar Page Checker,没写成正文提取工具,倒写了个相似度比较的工具,写这个工具是参照了http://www.webconfs.com/similar-page-checker.php这个国外的seo工具。

具体原理不清楚,反正我也写了一个版本,我的这个工具主要对正文进行相似度查询,还不完善,有部分网站不能查询。

工具演示:

演示地址

 

 

仅测试 百度搜索相同新闻的比例

其相似比基本90% 以上

 点击查看原图

 

点击查看原图

 

 

end...

上一篇: php程序检测页面是否被百度收录   |   下一篇:标题重复判断 emlog插件 低调发布» 标签: 百度 正文内容 相似度

评论:

2013-06-17 21:33

好东西,博主能共享下吗,发我邮箱吧!

2013-06-18 08:42

还没完善呢,测试老有问题。