php实习tips(如何生成简单摘要)
来源:互联网 发布:淘宝风云团队怎么联系 编辑:程序博客网 时间:2024/06/11 22:45
产生摘要
最近需要加一个需求,有一个send_article的接口,需要从html代码里提取出来中文字符,变成摘要,先后试了很多方法,比如:
//匹配中文utf8编码function utf8_summary($article) { $match = "/^[\x{4e00}-\x{9fa5}]+$/u";//正则表达式,匹配中文 preg_match_all($match,$article,$temp); $summary = ""; foreach ($temp as $key => $value) { $sum = implode('' , $value); $summary = $sumary . $sum; }//将中文拼接起来return $summary;}
问题为:
1.当出现连续的中文时,会出现无法取出的情况
2.当出现中文与字符混排时,该方法有效
原因:
可能当纯中文时,会使编码改变为其他的,所以正则表达式无法匹配,但是当出现有中文与字符混排时,字符编码为utf8,所以可以匹配,其实客户端可以将中文包裹在标签里,并加入head头,使用setchars=utf8来指明,但是客户端的实体类已经写好,改动太麻烦,只有后台想办法,于是尝试了第二个办法:
$function url_summary($article) { $article = urlencode(); $match = "/^%[a-zA-Z0-9]{2}/"; preg_match_all($match,$article,$temp); $summary = ""; foreach ($temp as $key => $value) { $sum = implode('' , $value); $summary = $sumary . $sum; }$summary = decode($summary);return $summary;}
该方法的思路是:观察到当非字母与数字经过url编码以后,会变成类似于%e7的字符串,所以是取出这些,再把这些字符串拼接起来,在解码,会得到中文。
后来发现:其实是一个函数的事儿
发现有一个函数,可以改变编码
iconv("gbk","utf-8","php中文转码");//把中文gbk编码转为utf8iconv("utf-8","gbk","php中文转码");//把中文utf8编码转为gbk
但是该函数,要使用的话,需要到php.ini文件中去把extension=php_iconv.dll这一项打开,并且安装iconv函数库才可以使用
,比较麻烦。
最后发现,使用strip_tags()函数可以解决
该函数可以去除html标签,然后截取一段即可,
mb_substr(summary,0,50);//截取一段字符
并且需要去除转义字符,比如 ;
str_replace(’ ’,‘’,summary);//去除转义字符
即可生成摘要,后期可以加入更多功能,比如断句,换行;
0 0
- php实习tips(如何生成简单摘要)
- php实习的tips(in_array函数)
- php实习tips(正则表达式)
- php实习的tips(结束符的问题)
- php实习的tips(mysql_fetch_assoc返回值问题)
- php实习的tips(常用的head头)
- php实习的tips(常见的字符串处理函数)
- 如何自动生成文本摘要
- php实习tips(mysql_query的结果返回值与判断)
- php的tips(生成随机函数rand与srand)
- Word文档如何自动生成文献摘要?
- PHP实习(三)
- php实习(四)
- 基于PHP与XML的PDF文档生成技术(摘要)
- 简单查询(章节摘要)
- JavaIO简单摘要(一)
- JavaIO简单摘要(二)
- PHP生成简单验证码(例子)
- HDU 1005 Number Sequence(循环周期是关键)
- 从底部弹出或滑出选择菜单或窗口
- java 实现操作windows共享文件
- 【分享/转】用js写一个模板引擎
- 设置Linux环境变量的方法和区别_Ubuntu
- php实习tips(如何生成简单摘要)
- Ubuntu搭建Openstack平台(kilo)(二.keystone)
- strstr_strchr.php
- 网络层协议之报文控制机协议ICMP
- 改变毕其功于一役的想法
- 【Cocos2d-x(1)】魔塔MagicTown第一章之游戏地图篇
- Anniversary party(树形dp第一步)
- Android Studio修改默认Activity继承AppCompatActivity
- IOS开发 轻松掌握AFN网络框架