editplus乱码--------charset的奇怪问题

来源:互联网 发布:sql语句列名无效 编辑:程序博客网 时间:2024/05/21 09:55

/*摘自http://blog.csdn.net/aifox/archive/2005/12/07/546393.aspx*/

今天下了forestgan的网站首页,想学习他的布局
editplus打开后显示全是乱码
但是我输入新的内容能够正常显示
查了一下
charset的设置为unicode的utf-8?
关于charset在blueidea的帖子
http://www.blueidea.com/bbs/newsdetail.asp?id=1831362&posts=current
有详细的讨论,不过这个帖子是讨论在asp的编程过程中的字符集的问题,
我觉得我遇到的好像还没有到这么复杂的程度。
另外一个发现,在将文件另存为时
editplus有一个转换的选项,如果选择unicode则文件的大小会发生很大变化
在我试验时,文件就从11k变成了27k,当再次另存为utf-8则文件恢复为原来的大小
后来用ultraedit打开没有问题,作了一些修改,在转到editplus的窗口
居然好了,奇怪。

以前的时候也了解网页中的charset的指定比较重要
这才能保证用户看到的不是乱码
今天更是知道了原来使用utf-8也是可以显示中文的
因为我以前一直使用gb2312
以后要注意了,尽量都用unicode的utf-8 charset来写网页

这是今天经典上看到的一些题外话,觉得蛮有用,拾人牙慧了 ^_^
==========================================================
相关的题外话:
一、操作系统
window系统内部都是unicode的。文件夹名,文件名等都是unicode的,任何语言系统下都能正常显示。
二、输入法:
微软拼音输出的是Unicode的,智能ABC输出是简体中文的(所以智能ABC在非简体中文系统根本不能用,只能打英文)。
三、网页的textarea
网页的textarea是用unicode显示的。所以往里打什么字都能显示。而一些flash做的输入框就不行了。
四、Access2000
access里面保存的数据是unicode的,在任何语言系统下都能显示。
如果数据视图查看有些字符不正常,那是因为显示所用的字体不是Unicode字体,
换用Arial Unicode MS 字体就能全部显示了。(access帮助,搜索,输入unicode,有说明)
五、Word
word里的繁简转换,简体转换到繁体后,内码仍是简体中文的,其实只是简体中的繁体字。
六、ASP内部是Unicode的,所有文本都是Unicode存储的。需要时转换到指定字符集。