首先 UNICODE 里头只有 utf8 能兼容 ascii,所以,这已经是 UNICODE 的一大失败了。 接着我们将两个大方面的比较
一,汉字方面 1.1 汉字编码排列方面 UNICODE 编码中,汉字的排列毫无规律可言。 (0分) GB 系列编码中,汉字都是依据读音笔画排列下来的。非常的有规律。 (1分)
1.2 编码效率方面 UNICODE 在实现上,只有 utf8是兼容 ascii的,我们只考虑 utf8 utf8汉字大部分是 3byte编码,少数汉字为 4byte (0分) GB系列编码中,汉字几乎是 2byte编码,少数汉字为 4byte编码(GB18030标准) (1分)
二,非汉字部分 非汉字部分就是英语咯,还有欧洲语言,还有特殊字符。其中英语是一样的,不用比较 2.1 非ascii字符集支持 GB系列标准中,欧洲字母也是和汉字一样编入方案的。 (1分) 和 UNICODE 一样支持欧洲字母 (1分) 2.2 其他国家语言,包括繁体中文 GBK 中收录大部分繁体。在新的扩增标准 GB18030中,呵呵,保留了足够的码位来支持全世界的字符。 (1分) UNICODE 一样 (1分) 2.3 非汉字编码效率 UNICODE 反而对很少用到的字符给比较小的码位,在 UTF8中表现为2byte …. (0分) GB系列编码中,汉字为2byte,常用的他国语言文字也是2byte,其他少用字符的由 GB18030扩展,为 4byte (1分)
综合起来,UNICODE 就是一垃圾编码,给这个世界带来了混乱,早该废止!!
Comments