首页 » SEO优化 » php曲线类似度技巧_php 比较两篇文章的相似度

php曲线类似度技巧_php 比较两篇文章的相似度

duote123 2024-11-22 0

扫一扫用手机浏览

文章目录 [+]

在网上搜索了一些php用户比较两个中笔墨符串的类,记录下来,以备往后时时之需。

php 比较两个字符串的类

php类代码

php曲线类似度技巧_php 比较两篇文章的相似度

<?phpclass LCS { var $str1; var $str2; var $c = array(); /返回串一和串二的最长公共子序列/ function getLCS($str1, $str2, $len1 = 0, $len2 = 0) { $this->str1 = $str1; $this->str2 = $str2; if ($len1 == 0) $len1 = strlen($str1); if ($len2 == 0) $len2 = strlen($str2); $this->initC($len1, $len2); return $this->printLCS($this->c, $len1 - 1, $len2 - 1); } /返回两个串的相似度/ function getSimilar($str1, $str2) { $len1 = strlen($str1); $len2 = strlen($str2); $len = strlen($this->getLCS($str1, $str2, $len1, $len2)); return $len 2 / ($len1 + $len2); } function initC($len1, $len2) { for ($i = 0; $i < $len1; $i++) $this->c[$i][0] = 0; for ($j = 0; $j < $len2; $j++) $this->c[0][$j] = 0; for ($i = 1; $i < $len1; $i++) { for ($j = 1; $j < $len2; $j++) { if ($this->str1[$i] == $this->str2[$j]) { $this->c[$i][$j] = $this->c[$i - 1][$j - 1] + 1; } else if ($this->c[$i - 1][$j] >= $this->c[$i][$j - 1]) { $this->c[$i][$j] = $this->c[$i - 1][$j]; } else { $this->c[$i][$j] = $this->c[$i][$j - 1]; } } } } function printLCS($c, $i, $j) { if ($i == 0 || $j == 0) { if ($this->str1[$i] == $this->str2[$j]) return $this->str2[$j]; else return \公众\公众; } if ($this->str1[$i] == $this->str2[$j]) { return $this->printLCS($this->c, $i - 1, $j - 1).$this->str2[$j]; } else if ($this->c[$i - 1][$j] >= $this->c[$i][$j - 1]) { return $this->printLCS($this->c, $i - 1, $j); } else { return $this->printLCS($this->c, $i, $j - 1); } }}?>类的调用方法

1、返回两个字符串的公共部份

php曲线类似度技巧_php 比较两篇文章的相似度
(图片来自网络侵删)

<?php$lcs = new LCS();//返回最长公共子序列echo $lcs->getLCS(\"大众飞鸟慕鱼博客\公众,\"大众你的,我的博客名为:飞鸟慕鱼\"大众);?>

输出结果:飞鸟慕鱼

2、比较两串字符串的相似度

<?php$lcs = new LCS();//飞鸟慕鱼博客$str = '秋日,在我的夏梦里款款而来,阳光温馨宁静,微风和煦柔柔,蓝天白云洒脱。
';$str2 = '秋日,在我的梦里逐步走来,阳光温暖而舒适,微风柔柔和煦,白云在蓝天洒脱。
';//返回相似度echo $lcs->getSimilar($str,$str2);?>

输出结果:

0.72300469483568

标签:

相关文章

C语言缓冲区,介绍高效编程的秘密武器

在C语言编程的世界里,缓冲区(Buffer)犹如一位默默无闻的守护者,它悄无声息地守护着数据传输的秩序,确保程序运行的稳定与高效。...

SEO优化 2024-12-26 阅读0 评论0

C语言程序中的四个区域及其功能介绍

C语言作为一门经典的编程语言,具有高效、灵活、简洁等特点,广泛应用于操作系统、嵌入式系统、系统软件等领域。C语言程序主要由四个区域...

SEO优化 2024-12-26 阅读0 评论0

C语言流处理,数据处理的得力助手

随着信息时代的到来,数据量呈爆炸式增长。如何在海量数据中提取有价值的信息,成为了当今社会的一大挑战。C语言作为一种历史悠久、应用广...

SEO优化 2024-12-26 阅读0 评论0