异常空格,ASCII (194,160)问题

来源:互联网 发布:翻页相册制作软件 编辑:程序博客网 时间:2024/05/02 02:16

今天遇到了个异常空格的问题,与:http://www.cnblogs.com/wangyuyu/p/3711887.html 一致。

写了两行hive语句,看起来完全一样,但是就是一个可以执行,一个不可以。diff出两者不同,但是死活看不出来。

后来发现,由于一个是从qq中copy到onenote中再copy出来的,可能中间发生了转化。具体见下。

-------------------------------------------------------------

今天运营的同学反映有一些店铺的名称后面带空格,我下意识的说不可能啊,我已经处理过了啊。然后就找出来看。

其中有个店铺的名称是“安踏 ”,第一眼看上去好像是带了个空格。然后我就仔细的看了下。

  

1  pry(main)> "安踏 ".strip2 => "安踏 "

竟然没有变化。

1 pry(main)> "安踏 "[-1] == " "2 => false

怪不得,原来不是一个空格。

到底是什么呢? 对,查一下ascii码

1 pry(main)> " ".bytes2 => [32]

空格的ascii 是32

1 pry(main)> "安踏 "[-1].bytes2 => [194, 160]

这个竟然是194,160. 原来如此。

  原因是字符串中的一个空格(ASCII:32)被UTF-8编码之后变成了字符(ASCII:194 和 160的组合)。在 UTF-8编码里面存在一个特殊的字符,其编码是“0xC2 0xA0”,转换成字符的时候表现为一个半角空格,跟一般的半角空格(ASCII 0x20)不同的是它的宽度不会被压缩,所以排版中常能用到它。但是GB2312、Unicode之类并没有这样的字符,所以转换后前台会显示为“?” 号,只是显示为问号而不是真正的问号,所以无法被替换。

 

解决方法是:

1 Shop.each do |shop|2    if shop.name.include?(" ")  3      shop.name = shop.name.split(" ")[0]    4      shop.save5   end  6 end 

0 0
原创粉丝点击