关于ISO-8859-1 的相关知识

来源:互联网 发布:dota2简单英雄知乎 编辑:程序博客网 时间:2024/06/14 06:24

ISO/IEC 8859-1


ISO 8859-1,正式编号为ISO/IEC 8859-1:1998,又称Latin-1或“西欧语言”,是国际标准化组织内ISO/IEC 8859的第一个8位字符集。它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入96个字母及符号,藉以供使用附加符号的拉丁字母语言使用。曾推出过 ISO 8859-1:1987 版。

此字符集支持部分于欧洲使用的语言,包括阿尔巴尼亚语、巴斯克语、布列塔尼语、加泰罗尼亚语、丹麦语、荷兰语、法罗语、弗里西语、加利西亚语、德语、格陵兰语、冰岛语、爱尔兰盖尔语、意大利语、拉丁语、卢森堡语、挪威语、葡萄牙语、里托罗曼斯语、苏格兰盖尔语、西班牙语及瑞典语。

英语虽然没有重音字母,但仍会标明为ISO/IEC 8859-1编码。除此之外,欧洲以外的部分语言,如南非荷兰语、斯瓦希里语、印尼语及马来语、菲律宾他加洛语等也可使用ISO/IEC 8859-1编码。

法语及芬兰语本来也使用ISO/IEC 8859-1来表示。但因它没有法语使用的 œ、Œ、Ÿ 三个字母及芬兰语使用的 Š、š、Ž、ž ,故于1998年被ISO/IEC 8859-15所取代。(ISO 8859-15同时加入了欧元符号)

ISO/IEC 8859-1 x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF0x 1x 2xSP!"#$%&'()*+,-./3x0123456789:;<=>?4x@ABCDEFGHIJKLMNO5xPQRSTUVWXYZ[\]^_6x`abcdefghijklmno7xpqrstuvwxyz{|}~ 8x 9x AxNBSP¡¢£¤¥¦§¨©ª«¬SHY®¯Bx°±²³´µ¶·¸¹º»¼½¾¿CxÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏDxÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßExàáâãäåæçèéêëìíîïFxðñòóôõö÷øùúûüýþÿ

在上表中,0x20是空格、0xA0是不换行空格、0xAD是选择性连接号。

0x00-0x1F、0x7F、0x80-0x9F在此字符集中未有定义。(控制字符是由ISO/IEC 6429定义)。

参看[编辑]

  • ASCII
  • ISO/IEC 646
  • ISO/IEC 8859 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -13 -14 -15 -16

外部链接[编辑]

  • 到国际标准化组织购买此标准
  • ISO/IEC 8859-1:1998 - 8-bit single-byte coded graphic character sets, Part 1: Latin alphabet No. 1 (draft dated February 12, 1998, published April 15, 1998)
  • Standard ECMA-94:8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986)
  • ISO-IR 100 Right-Hand Part of Latin Alphabet No.1 (February 1, 1986)
  • 中国国家标准(中华民国)CNS 13246
[隐藏]
字符编码
分类 字符集
 早期电信
  • ASCII 
  • ISO/IEC 646 
  • ISO/IEC 6937 
  • T.61 
  • sixbit code pages 
  • Baudot code 
  • 摩斯电码 
  • 中文电码
 ISO/IEC 8859
  • -1 
  • -2 
  • -3 
  • -4 
  • -5 
  • -6 
  • -7 
  • -8 
  • -9 
  • -10 
  • -11 
  • -12 
  • -13 
  • -14 
  • -15 
  • -16
 书目使用
  • ANSEL 
  • ISO 5426 / 5426-2 / 5427 / 5428 / 6438 / 6861 / 6862 / 10585 / 10586 / 10754 / 11822 
  • MARC-8
 国家标准
  • ArmSCII 
  • CNS 11643 
  • GOST 10859 
  • GB 18030 
  • HKSCS 
  • ISCII 
  • JIS X 0201 
  • JIS X 0208 
  • JIS X 0212 
  • JIS X 0213 
  • KPS 9566 
  • KS X 1001 
  • PASCII 
  • TIS-620 
  • TSCII 
  • VISCII 
  • YUSCII
 EUC
  • CN 
  • JP 
  • KR 
  • TW
 ISO/IEC 2022
  • CN 
  • JP 
  • KR 
  • CCCII
 MacOS代码页 (“文字”)
  • 阿拉伯语 
  • 中欧 
  • 简体中文 / EUC-CN 
  • 繁体中文 / Big5 
  • 克罗地亚语 
  • 西里尔文 
  • 梵文 
  • Dingbats 
  • 波斯语 
  • 希腊语 
  • 古吉拉特语 
  • 古木基文 
  • 希伯来语 
  • 冰岛文 
  • 日文 / ShiftJIS
  • 韩文 / EUC-KR 
  • 罗马文 
  • 罗马尼亚语 
  • 符号 
  • 泰文 / TIS-620 
  • 土耳其语 
  • 乌克兰文
 DOS代码页
  • 437 
  • 720 
  • 737 
  • 775 
  • 850 
  • 852 
  • 855 
  • 857 
  • 858 
  • 860 
  • 861 
  • 862 
  • 863 
  • 864 
  • 865 
  • 866 
  • 869 
  • Kamenický 
  • Mazovia 
  • MIK 
  • Iran System
 Windows代码页
  • 874 / TIS-620 
  • 932 / ShiftJIS 
  • 936 / GBK 
  • 949 / EUC-KR 
  • 950 / Big5 
  • 1250 
  • 1251 
  • 1252 
  • 1253 
  • 1254 
  • 1255 
  • 1256 
  • 1257 
  • 1258 
  • 1361 
  • 54936
 EBCDIC代码页
  • 37/1140 
  • 273/1141 
  • 277/1142 
  • 278/1143 
  • 280/1144 
  • 284/1145 
  • 285/1146 
  • 297/1147 
  • 420/16804 
  • 424/12712 
  • 500/1148 
  • 838/1160 
  • 871/1149 
  • 875/9067 
  • 930/1390 
  • 933/1364
  • 937/1371 
  • 935/1388 
  • 939/1399 
  • 1025/1154 
  • 1026/1155 
  • 1047/924 
  • 1112/1156 
  • 1122/1157 
  • 1123/1158 
  • 1130/1164 
  • JEF 
  • KEIS
 特定平台
  • ATASCII 
  • CDC display code 
  • DEC-MCS 
  • DEC Radix-50 
  • Fieldata 
  • GSM 03.38 
  • HP roman8 
  • PETSCII 
  • TI calculator character sets 
  • WISCII 
  • ZX Spectrum character set
 Unicode / ISO/IEC 10646
  • UTF-8 
  • UTF-16/UCS-2 
  • UTF-32/UCS-4 
  • UTF-7 
  • UTF-1 
  • UTF-EBCDIC 
  • GB 18030 
  • SCSU 
  • BOCU-1
 杂项代码页
  • APL 
  • Cork 
  • HZ 
  • IBM code page 1133 
  • KOI8 
  • TRON
 相关主题
  • 控制字符 (C0 C1) 
  • CCSID 
  • HTML字符编码 
  • 字符集探测 
  • 中日韩越统一表意文字 
  • ISO 6429/IEC 6429/ANSI X3.64 
  • 乱码

0 0
原创粉丝点击