字符编码
- ASCII: A:65,a:97
- GB2312:1980年,6763 个汉字(缺点:无法处理部分罕见字和繁体字)
- GBK:21886 个汉字,ASCII 字符使用一个字节表示,汉字使用两个字节表示。(缺点:通用性差)
- Unicode 字符集:世界通用码(缺点:空间效率不是最优,没考虑码率)
- UTF-8:变长编码,国际规范,使用 1 到 4 字节来表示一个字符,根据字符的复杂性而变。ASCII 字符只需 1 字节,拉丁字母和希腊字母需要 2 字节,常用的中文字符需要 3 字节,其他的一些生僻字符需要 4 字节。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Min的博客!
评论