PHP的Trim截取乱码
来源:互联网 发布:linux vsftpd 怎么使用 编辑:程序博客网 时间:2024/06/06 06:43
一直使用Trim过滤首尾两端的字符串,关于Trim的官方描述:
trim — 去除字符串首尾处的空白字符(或者其他字符)
今天发现一个很奇怪的问题, 代码如下:
<?php$str = '研发、产品、';echo trim($str, '、');
猜下这个会返回什么?“研发、产品”?NO,这个居然很奇怪的返回了“研发、产��”。
难道是我的打开方式不对,怎么会返回乱码呢。
经过一番测试,发现一个很有趣的问题。
<?phpecho trim('abacabb', 'ab'); //print 'c'
原本以为这个会返回acabb的,但是居然只返回了c。这就是对trim函数的误解了。
其实这个在官方说明文档的Example是有的,只是我没注意看而已。
trim会循环去掉字符串首位存在的字符。如上面的例子,则执行过程如下:
字符串abacabb会从下标0开始循环,如果存在ab中的字符就去掉,一直到没有就停止循环。
所以执行为:
循环a存在字符串ab中,去掉,剩下bacabb
循环b存在字符串ab中,去掉,剩下acabb
循环a存在字符串ab中,去掉,剩下cabb
循环c不存在字符串ab中,停止循环,所以去掉首字符就剩下:cabb。
但是trim是过滤首尾字符,所以还会从末尾循环去掉。
循环b存在字符串ab中,去掉,剩下cab,
循环b存在字符串ab中,去掉,剩下ca,
循环a存在字符串ab中,去掉,剩下c,
循环c不存在字符串ab中,停止循环,所以去掉末端字符就剩下:c。
所以整个结束后,abacabb就剩下了c了。看到这里对trim函数有所了解了吧。
好了,说回乱码的问题,为什么会出现返回乱码的情况呢。
这是因为在PHP中,字符串函数默认都不是multibyte-safe的。如果需要multibyte-safe则需要使用mb_系列的函数。
“、”的十六进制码为0xe3 0x80 0x81,对于不是multibyte-safe的函数会把它当做三个字符。
而“品”的十六进制码为0xe5 0x93 0x81。这里最后一个0x81刚好符合了,被过滤了。所以才会导致出现乱码的情况。
ok,问题找到了,trim没有mb函数,但是我们可以自己封装一个。Function mb_trim.
Ps:用了trim好久了,但是一直没有真正了解。看官方文档还是很重要的。
转自:http://www.vckai.com/p/23
- PHP的Trim截取乱码
- 中文截取无乱码的PHP
- 中文截取无乱码的PHP方法
- PHP 中文字符串截取无乱码的方法以及php汉字截取函数_preg_split()
- php截取中文无乱码
- php 中文截取防止乱码
- PHP 字符截取没有乱码
- PHP截取中文无乱码
- php字符串截取防止乱码
- PHP截取汉字乱码问题
- PHP 中英文截取无乱码
- php 中文字符串截取乱码
- PHP字符串截取,无乱码
- php 截取utf8 无乱码
- php中文截取无乱码
- PHP 中文无乱码截取
- PHP中可以避免乱码的截取汉字
- PHP实现中文字串截取无乱码的方法
- 【小熊刷题】Two Sum <Array/String>
- 程序员编程常用的字体
- dll文件
- java 封装、继承和多态
- android工程下怎么查看System.out.println()信息
- PHP的Trim截取乱码
- hdu--5347--2015 Multi-University Training Contest 5--MZL's chemistry
- IntelliJ IDEA 工具的常见使用
- iOS图形库CorePlot
- hdoj密码
- Linux7 安裝 snmp/mrtg/httpd 監控 cisco 交換機流量
- 推理逻辑题1
- jQuery中事件的解除问题
- Ftp服务器主动模式与被动模式的区别