php 教程自动获取关键字代码
来源:互联网 发布:知网数据库 编辑:程序博客网 时间:2024/05/21 02:21
$mincipin=5;//最小词频
$minlen=4;//关键字最小长度
tiqukeyword($tiqustr,$minlen,$mincipin);
function tiqukeyword($tiqustr,$minlen,$mincipin)
{$strlong=strlen($tiqustr);
$arr=array();
$k=-1;
for($i=0;$i<($strlong-$mincipin*$minlen);$i++){
$end=ceil(($strlong-$i)/$mincipin+$i);
for($j=$minlen;$j<$end;$j++){$num=0;
if(($guanjianzi=substr($tiqustr,$i,$j))!==false){
$wz=$i+$j;
$num++;}
else{break;}
while($wz<$strlong){if(($wz=strpos($tiqustr,$guanjianzi,$wz))!==false)
{$num++;
$wz=$wz+strlen($guanjianzi);}
else break;
}
if($j==$minlen){
if($num>=$mincipin){$maxnum=$num;$k++;$str=substr($tiqustr,$i,$j);
$arr[$k]=array($i,$j,$str,$num,0);
}
else{break;}
}
else{
if($num>=$maxnum){
$maxnum=$num;
$str=substr($tiqustr,$i,$j);
$arr[$k]=array($i,$j,$str,$num,0);
}
else break;
}
}
}
echo '初步得到的数组:';
print_r($arr);
//echo '<br/><br/><br/><br/>';
$arrlong=count($arr);
for($i=0;$i<$arrlong;$i++){
$bjarr=$arr[$i];
$nowid=$i;
if($bjarr[4]==1)continue;
for($j=$i+1;$j<$arrlong;$j++){
if($arr[$j][4]==1)continue;
$qujianks=$bjarr[0];
$qujianjs=$bjarr[1]+$bjarr[0]-1;
$a=$arr[$j][0];
$b=$arr[$j][1]+$arr[$j][0]-1;
if(($bjarr[2]==$arr[$j][2])&&($bjarr[3]>$arr[$j][3]))$arr[$j][4]=1;
if($a<=$qujianks&&$qujianks<=$b&&$a<=$qujianjs&&$qujianjs<=$b)
{if($bjarr[3]<=$arr[$j][3]){
$arr[$nowid][4]=1;$nowid=$j;$bjarr=$arr[$j];
}
}
elseif($qujianks<=$a&&$a<=$qujianjs&&$qujianks<=$b&&$b<=$qujianjs){
$arr[$j][4]=1;
}
}
}
echo '<br/><br/><br/><br/>重叠加标记后的数组:';
print_r($arr);
$jieguoarr=array();
for($i=0;$i<$arrlong;$i++)
{if($arr[$i][4]==0)$jieguoarr[]=$arr[$i];
}
echo '<br/><br/><br/><br/>';
echo '最后得到的数组:';
print_r($jieguoarr);
}
- php 教程自动获取关键字代码
- 如何使用php自动获取文章内容关键字
- PHP自动提取关键字
- php正则获取网页标题、关键字、网页描述代码
- php教程如何获取域名ip地址代码函数
- php 程序设计代码教程
- php教程:经典PHP代码
- 自动获取城市天气代码
- c#ip138自动获取代码
- PHP自动生成月历代码
- PHP/EclipsePHP代码自动提示
- [php] 类自动载入代码
- php/js获取客户端mac地址的实现代码_PHP教程
- PHP 获取服务器详细信息代码
- php,java获取天气预报代码
- PHP星期几获取代码
- [PHP代码] PHP远程获取网页内容
- php自动获取字符串编码函数mb_detect_encoding
- 钉箱机的维护保养
- Xcode使用过程中的问题集锦(不断更新中)
- 加密与解密 17
- OpenGL Performance Optimization
- Http和Socket区别
- php 教程自动获取关键字代码
- Mac下用vi查看二进制文件
- HTTP 响应Response
- 工信部发言人张峰:将大力扶植并研究大数据发展,密切关注智慧城市建设
- 定时任务 Timer
- maven(4)--版本管理介绍
- hdu - 1823 - Luck and Love(线段树)
- 隐藏在背后的交互设计
- amf0 amf3 解析