• ASCII: A:65,a:97
  • GB2312:1980年,6763 个汉字(缺点:无法处理部分罕见字和繁体字)
  • GBK:21886 个汉字,ASCII 字符使用一个字节表示,汉字使用两个字节表示。(缺点:通用性差)
  • Unicode 字符集:世界通用码(缺点:空间效率不是最优,没考虑码率)
  • UTF-8:变长编码,国际规范,使用 1 到 4 字节来表示一个字符,根据字符的复杂性而变。ASCII 字符只需 1 字节,拉丁字母和希腊字母需要 2 字节,常用的中文字符需要 3 字节,其他的一些生僻字符需要 4 字节。