ISO-8859 字集與編碼

ISO-8859 不是一個標準,而是一系列的標準, 這套字集與編碼系統的共同特色是,以同樣的碼位對應不同字集。 其基本精神是

  1. 與 ASCII 相容,所以所有的低拜皆不使用。
  2. 高拜中的前 32 個碼位 (0x80 -- 0x9F 或 128--159), 保留給擴充定義的 32 個控制碼,稱為 C1 控制碼 (0--31 稱為 C0 控制碼)。
  3. 高拜中第 33 個碼位 (0xA0 或 160),也就是對應 ASCII 中 SP (空格) 的碼位, 總是代表 Non-breakable space,也就是不准許折行的空格。
  4. 每個字集定義至多 95 個字符,其碼位都在 0xA1 -- 0xFF 或 161--255。
  5. 每個字集收錄歐洲某地區的共同常用字符。

以下是 C1 控制碼的號碼和名稱。
號碼
(HEX)
號碼
(DEC)
功能
80128PADDING CHARACTER
81129HIGH OCTET PRESET
82130BREAK PERMITTED HERE
83131NO BREAK HERE
84132INDEX
85133NEXT LINE
86134START OF SELECTED AREA
87135END OF SELECTED AREA
88136CHARACTER TABULATION SET
89137CHARACTER TABULATION WITH JUSTIFICATION
8A138LINE TABULATION SET
8B139PARTIAL LINE FORWARD
8C140PARTIAL LINE BACKWARD
8D141REVERSE LINE FEED
8E142SINGLE-SHIFT TWO
8F143SINGLE-SHIFT THREE
90144DEVICE CONTROL STRING
91145PRIVATE USE ONE
92146PRIVATE USE TWO
93147SET TRANSMIT STATE
94148CANCEL CHARACTER
95149MESSAGE WAITING
96150START OF GUARDED AREA
97151END OF GUARDED AREA
98152START OF STRING
99153SINGLE GRAPHIC CHARACTER INTRODUCER
9A154SINGLE CHARACTER INTRODUCER
9B155CONTROL SEQUENCE INTRODUCER
9C156STRING TERMINATOR
9D157OPERATING SYSTEM COMMAND
9E158PRIVACY MESSAGE
9F159APPLICATION PROGRAM COMMAND

ISO8859-1 字集,也就是 Latin-1,是西歐常用字符,包括德法兩國的字母。 因為它對我們來說比較常見,所以用比較大的圖片呈現如下。

Latin-1 character set, 0xA0 -- 0xBF (160--191)


Latin-1 character set, 0xC0 -- 0xDF (192--223)


Latin-1 character set, 0xE0 -- 0xFF (224--255)

以下是 ISO8859-2 字集,也稱為 Latin-2,收集了東歐字符。

以下是 ISO8859-3 字集,也稱為 Latin-3,收集了南歐字符。

以下是 ISO8859-4 字集,也稱為 Latin-4,收集了北歐字符。

以下是 ISO8859-5 字集,也稱為 Cyrillic,收集了斯拉夫語系字符。

以下是 ISO8859-6 字集,也稱為 Arabic,收集了阿拉伯語系字符。

以下是 ISO8859-7 字集,也稱為 Greek,收集了希臘字符。

以下是 ISO8859-8 字集,也稱為 Hebrew,收集了西伯萊 (猶太人) 字符。

以下是 ISO8859-9 字集,也稱為 Latin-5 或 Turkish,收集了土耳其字符。

以下是 ISO8859-10 字集,也稱為 Latin-6 或 Nordic, 收集了北歐 (主要指斯堪地那維亞半島) 的字符。

以下是 ISO8859-11 字集,也稱為 Thai,它是從泰國的 TIS620 標準字集演化而來。

目前尚未定義 ISO8859-12 字集。

以下是 ISO8859-13 字集,也稱為 Latin-7,主要函蓋波羅的海 (Baltic) 諸國的文字符號, 也補充一些在 Latin-6 中遺漏的拉托維亞 (Latvian) 字符。

以下是 ISO8859-14 字集,也稱為 Latin-8, 它將 Latin-1 中的某些符號換成塞爾特語 (Celtic) 的字符。 塞爾特族是指英倫外圍的威爾斯人 (Welsh) 和蓋爾人 (Gaelic)。

以下是 ISO8859-15 字集,也稱為 Latin-9,或者被匿稱為 Latin-0, 它將 Latin-1 中較少用到的符號刪除, 換成當初遺漏的法文和芬蘭字母;還有,把英鎊和日元之間的金錢符號, 換成了歐盟貨幣符號。


[ 發表感想或意見 ] ‧ [ 讀者推薦課外讀物 ]

BCC16 Home Up Chap 0 Chap 1 Chap 2 Chap 3 Chap 4 Chap 5 Chap 6 Chap 7 Chap 8 Chap 9 Chap A Chap B Chap C Chap D Chap E Chap F Copyright Pool User
製作人、
修改記錄
單維彰 (00/10/03) ---