ISO-8859 不是一個標準,而是一系列的標準, 這套字集與編碼系統的共同特色是,以同樣的碼位對應不同字集。 其基本精神是
- 與 ASCII 相容,所以所有的低拜皆不使用。
- 高拜中的前 32 個碼位 (0x80 -- 0x9F 或 128--159), 保留給擴充定義的 32 個控制碼,稱為 C1 控制碼 (0--31 稱為 C0 控制碼)。
- 高拜中第 33 個碼位 (0xA0 或 160),也就是對應 ASCII 中 SP (空格) 的碼位, 總是代表 Non-breakable space,也就是不准許折行的空格。
- 每個字集定義至多 95 個字符,其碼位都在 0xA1 -- 0xFF 或 161--255。
- 每個字集收錄歐洲某地區的共同常用字符。
以下是 C1 控制碼的號碼和名稱。
號碼
(HEX)號碼
(DEC)功能 80 128 PADDING CHARACTER 81 129 HIGH OCTET PRESET 82 130 BREAK PERMITTED HERE 83 131 NO BREAK HERE 84 132 INDEX 85 133 NEXT LINE 86 134 START OF SELECTED AREA 87 135 END OF SELECTED AREA 88 136 CHARACTER TABULATION SET 89 137 CHARACTER TABULATION WITH JUSTIFICATION 8A 138 LINE TABULATION SET 8B 139 PARTIAL LINE FORWARD 8C 140 PARTIAL LINE BACKWARD 8D 141 REVERSE LINE FEED 8E 142 SINGLE-SHIFT TWO 8F 143 SINGLE-SHIFT THREE 90 144 DEVICE CONTROL STRING 91 145 PRIVATE USE ONE 92 146 PRIVATE USE TWO 93 147 SET TRANSMIT STATE 94 148 CANCEL CHARACTER 95 149 MESSAGE WAITING 96 150 START OF GUARDED AREA 97 151 END OF GUARDED AREA 98 152 START OF STRING 99 153 SINGLE GRAPHIC CHARACTER INTRODUCER 9A 154 SINGLE CHARACTER INTRODUCER 9B 155 CONTROL SEQUENCE INTRODUCER 9C 156 STRING TERMINATOR 9D 157 OPERATING SYSTEM COMMAND 9E 158 PRIVACY MESSAGE 9F 159 APPLICATION PROGRAM COMMAND ISO8859-1 字集,也就是 Latin-1,是西歐常用字符,包括德法兩國的字母。 因為它對我們來說比較常見,所以用比較大的圖片呈現如下。
Latin-1 character set, 0xA0 -- 0xBF (160--191)
Latin-1 character set, 0xC0 -- 0xDF (192--223)
Latin-1 character set, 0xE0 -- 0xFF (224--255)
以下是 ISO8859-2 字集,也稱為 Latin-2,收集了東歐字符。
以下是 ISO8859-3 字集,也稱為 Latin-3,收集了南歐字符。
以下是 ISO8859-4 字集,也稱為 Latin-4,收集了北歐字符。
以下是 ISO8859-5 字集,也稱為 Cyrillic,收集了斯拉夫語系字符。
以下是 ISO8859-6 字集,也稱為 Arabic,收集了阿拉伯語系字符。
以下是 ISO8859-7 字集,也稱為 Greek,收集了希臘字符。
以下是 ISO8859-8 字集,也稱為 Hebrew,收集了西伯萊 (猶太人) 字符。
以下是 ISO8859-9 字集,也稱為 Latin-5 或 Turkish,收集了土耳其字符。
以下是 ISO8859-10 字集,也稱為 Latin-6 或 Nordic, 收集了北歐 (主要指斯堪地那維亞半島) 的字符。
以下是 ISO8859-11 字集,也稱為 Thai,它是從泰國的 TIS620 標準字集演化而來。
目前尚未定義 ISO8859-12 字集。
以下是 ISO8859-13 字集,也稱為 Latin-7,主要函蓋波羅的海 (Baltic) 諸國的文字符號, 也補充一些在 Latin-6 中遺漏的拉托維亞 (Latvian) 字符。
以下是 ISO8859-14 字集,也稱為 Latin-8, 它將 Latin-1 中的某些符號換成塞爾特語 (Celtic) 的字符。 塞爾特族是指英倫外圍的威爾斯人 (Welsh) 和蓋爾人 (Gaelic)。
以下是 ISO8859-15 字集,也稱為 Latin-9,或者被匿稱為 Latin-0, 它將 Latin-1 中較少用到的符號刪除, 換成當初遺漏的法文和芬蘭字母;還有,把英鎊和日元之間的金錢符號, 換成了歐盟貨幣符號。
單維彰 (00/10/03) ---