可想而知,特定的笔墨一定对应着固定的二进制,否则将无法转换。那么,若何将笔墨与二进制对应呢?这就须要有一套规范,打算机公司和软件开拓者都必须遵守。
ASCII码
我们知道,一个二进制位(Bit)有0、1两种状态,一个字节(Byte)有8个二进制位,有256种状态,每种状态对应一个符号,便是256个符号,从00000000到11111111。

打算机出身于美国,早期的打算机利用者大多利用英文,上世纪60年代,美国制订了一套英笔墨符与二进制位的对应关系,称为ASCII码,沿用至今。
ASCII码规定了128个英笔墨符与二进制的对应关系,占用一个字节(实际上只占用了一个字节的后面7位,最前面1位统一规定为0)。例如,字母a的的ASCII码为 01100001,那么你暂时可以理解为字母 a 存储到内存之前会被转换为 01100001,读取时碰着 01100001 也会转换为 a。
Unicode编码
随着打算机的盛行,利用打算机的人越来越多,不仅限于美国,全体天下都在利用,这个时候ASCII编码的问题就凸现出来了。
ASCII编码只占用1个字节,最多只能表示256个字符,我大中华区10万汉字怎么表示,日语韩语拉丁语怎么表示?以是90年代又制订了一套新的规范,将全天下范围内的字符统一利用一种办法在打算机中表示,这便是Unicode编码(Unique Code),也称统一码、万国码。
Unicode 是一个很大的凑集,现在的规模可以容纳100多万个符号,每个符号的对应的二进制都不一样。Unicode 规定可以利用多个字节表示一个字符,例如 a 的编码为 01100001,一个字节就够了,”好“的编码为 0101100101111101,须要两个字节。
为了兼容ASCII,Unicode 规定前0~127个字符与ASCII是一样的,不一样的只是128~255的这一段。
热门开拓板、芯片免费申请,以及更多C措辞教程,请关注云汉电子社区微信"大众年夜众号ickeybbs