Unicode不可见字符的显示
来源:互联网 发布:鬼刀精装画册淘宝 编辑:程序博客网 时间:2024/06/05 11:20
Unicode的学名是”Universal Multiple-Octet Coded Character Set”,简称为UCS
- 不可见字符”/u200b”为 Unicode Character ‘ZERO WIDTH SPACE’ (U+200B),可用于内容标识,不占位数。
echo $LANG可以显示出Linux系统的编码方式,一般默认为UTF-8。
在Linux终端中”/u200b”为不可见字符。为了显示出内容中加入的不可见字符,可将内容保存到文本中,利用less命令打开文本。
less
less 与 more 类似,但使用 less 可以随意前后浏览文件,而 more 仅能向前移动,却不能向后移动,而且 less 在查看之前不会加载整个文件。
eg:
在查看日志时grep xxxxxx info.log |less以less分页显示的形式查看日志, 用less打开的日志可以展示出不可见字符less info.log |grep xxxxxx打开的日志无法展示出不可见字符
java中打印unicode的例子
import static org.assertj.core.api.Assertions.assertThat; /** * Created by wenjia3 on 16/12/1. */ public class unicode { public static void main(String[] args){ String contentOri="test unicode"; String content1="\u200b" + contentOri + "\u200b" ; String content2="\u0021" + contentOri + "\u0021"; String str = ""; for (int i = 0; i < content1.length(); i++) { int ch = (int) content1.charAt(i); if (ch == '\u200b') str += content1.charAt(i) + "\\u" + Integer.toHexString(ch); else str += content1.charAt(i); } System.out.println(content1); System.out.println(content2); System.out.println(str); assertThat(content1).as("不含有/U200B字符").contains("\u200b"); } }
运行结果
test unicode !test unicode! \u200btest unicode\u200b
直接打印content1、content2,unicode字符会自动编译成当前标准输出的编码。即\u200b为不可见字符,\u0021为“!”。
可以利用charAt()在程序中进行转换,将字符的unicode值打印出来。
0 0
- Unicode不可见字符的显示
- eclipse显示不可见字符
- notepad 显示不可见字符
- 注意不可见的字符!
- Vim中显示不可见字符
- shell 之 cat 显示不可见字符
- vim显示不可见特殊字符
- Vim中显示不可见字符
- 小心不可见字符组成的不可见字符串
- c# 不可见的字符,删除?
- 坑爹的不可见字符
- EXCEL中的神秘的不可见字符
- 查找不可见字符的正则表达式
- Javascript 不可见字符的输入
- vimcasts视频教程系列学习笔记1.显示不可见的字符(Show invisbles)
- Android EditText里的密码显示可见与不可见
- 常用不可见字符
- 不可见字符
- MFC非客户区自绘标题栏的实现(不断更新)
- 移动端处理触控滑块的js框架
- js中的delete使用方法详解
- 匹夫细说C#:可以为null的值类型,详解可空值类型
- 笔记
- Unicode不可见字符的显示
- MyBatis 动态SQL语句
- sdh
- mysql最后一步未响应
- jdbc增删改查操作 存储过程
- 可空类型Nullable到底是什么鬼
- 微信小程序全套使用指南
- task_struct结构体成员详解
- PAT乙级1031