WinZip 壓縮中文檔名

無論是用英文WinZip7.0還是用中文化WinZip7.0,用中文檔名就有可能出問題!要想弄清這一問題,還要從BIG-5 碼說起。

◎ 關於Big5 碼及其先天缺陷

中文Windows95/98/NT4.0是使用BIG5碼為系統內碼。BIG5碼系統為兩位元組內碼系統,其標準字(STDFONT)之中,常用字有5401字使用範圍是A440-C67E,即高位元組由A4H-C6H,低位組由40H-7EH。

BIG5碼是由台灣資策會策劃制定,其宗旨原是儘量不使用到控製碼範圍,並配合當時台灣的五大(BIG-5)套裝軟體,目前台灣市面上絕大數的套裝軟體確是在 BIG-5內碼系統發展出來的,但它使用某些特殊表格符號時會和一些英文套裝軟體中的「半繪圖字元」衡突。

根據 Windows 檔案名稱命名的規則,不可以包含「\ / : * ? " |」等字元。低位元組為「7CH」的中文字,WinZip視為「|」;為「5CH」的中文字,WinZip視為「/」,WinZip認不出來雙位元的中文字,因而引至中文字元撞碼,違背了Windows 檔案名稱命名的規則,令壓縮檔內的文件再也解不開了。

中文檔案名稱中不用這些字有時是很不方便的,僅在常用字5401中低位元組「7CH」的中文有35個,低位元組「5CH」的中文也有35個,共70字!如下所示:

BIG-5碼常用字低位元組「5CH」「7CH」字型一覽表

 

A45C 么
AE5C 娉
B85C 稞
C25C 擺
A97C 尚
B37C 逖
BD7C 罵
A55C 功
AF5C 珮
B95C 鈾
C35C 黠
AA7C 泜
B47C 揉
BE7C 魯
A65C 吒
B05C 豹
BA5C 暝
C45C 孀
AB7C 咽
B57C 稅
BF7C 糕
A75C 吭
B15C 崤
BB5C 蓋
C55C 髏
AC7C 洱
B67C 閏
C07C 嚐
A85C 沔
B25C 淚
BC5C 墦
C65C 躡
AD7C 迢
B77C 會
C17C 舉
A95C 坼
B35C 許
BD5C 穀
A47C 弋
AE7C 徑
B87C 腮
C27C 甕
AA5C 歿
B45C 廄
BE5C 閱
A57C 四
AF7C 砝
B97C 頌
C37C 牘
AB5C 俞
B55C 琵
BF5C 璞
A67C 帆
B07C 院
BA7C 漏
C47C 辮
AC5C 枯
B65C 跚
C05C 餐
A77C 坑
B17C 悴
BB7C 誡
C57C 疊
AD5C 苒
B75C 愧
C15C 縷
A87C 育
B27C 琍
BC7C 慝
C67C 鸛

 

目前最簡單的解決的方法:避開用這 70 個中文字做壓縮檔內的文件的檔案名