XML 和 Unicode
来源:互联网 发布:excel复制一列数据 编辑:程序博客网 时间:2024/05/16 10:15
XML及其子集HTML采用UTF-8作为标准字集,理论上我们可以在各种支持XML标准的浏览器上显示任何地区文字的网页,只要电脑本身安装有合适的字体即可。可以利用&#nnn;的格式显示特定的字符。nnn代表该字符的十进制 Unicode 代码。如果采用十六进制代码,在编码之前加上x字符即可。但部分旧版本的浏览器可能无法识别十六进制代码。
然而部分由于 Unicode 版本发展原因,很多浏览器只能显示 UCS-2 完整字符集也即现在使用的 Unicode 版本中的一个小子集。
Unicode 目前已经有5.0版本。世界上有一大批计算机、语言学等科学家专门研究Unicode,到了现在Unicode标准已经不单是一个编码标准,还是记录人类语言文字资料的一个巨大的数据库,同时从事人类文化遗产的发掘和保护工作。
对于中文而言,Unicode 16编码里面已经包含了GB18030里面的所有汉字(27484个字),目前Unicode标准准备把康熙字典的所有汉字放入到Unicode 32bit编码中。
简单地说,Unicode扩展自ASCII字元集。在严格的ASCII中,每个字元用7位元表示,或者电脑上普遍使用的每字元有8位元宽;而Unicode使用全16位元字元集。这使得Unicode能够表示世界上所有的书写语言中可能用於电脑通讯的字元、象形文字和其他符号。Unicode最初打算作为ASCII的补充,可能的话,最终将代替它。考虑到ASCII是电脑中最具支配地位的标准,所以这的确是一个很高的目标。
Unicode影响到了电脑工业的每个部分,但也许会对作业系统和程序设计语言的影响最大。从这方面来看,我们已经上路了。Windows NT从底层支持Unicode(不幸的是,Windows98只是小部分支援Unicode)。先天即被ANSI束缚的C程序设计语言通过对宽字元集的支持来支持Unicode。
- XML 和 Unicode
- 001_023 Python 对Unicode数据编码并应用于XML和HTML
- UNICODE to ANSI 和 ANSI to UNICODE
- char区分Unicode和非Unicode
- PHP unicode解码 和 utf8与unicode
- 转码utf8 - unicode 和 unicode - utf8
- Unicode标准规范和Unicode编码方案
- UTF-8和Unicode
- unicode 和 UTF-8
- UNICODE 和 ANSI 互转
- Unicode 和 UTF-8
- Python、Unicode和中文
- ASCII码 和 Unicode
- unicode 和字符集
- UNICODE和ASCII
- Unicode和utf-8
- unicode和utf-8
- ANSI和Unicode互转
- 球,你别跑。爸爸等你呢
- Web套打方案集锦
- PHP向右侧拉菜单,测试使用中
- log4j日志文件乱码问题的解决方法
- hibernate3.0以上处理批量删除批量修改
- XML 和 Unicode
- C#委托基础:谈委托和接口
- DB2临时表在SQL过程
- solidworks 二次开发
- sql server 2000 全文索引全解
- iPhone开发指南-应用程序核心
- FLEX在datagrid中的itemreader中渲染combobox使用outerDocument
- 深入理解C#委托的实质
- 如何使用Windows Live Writer在博客园发布文章