首页 » 网站建设 » ansiunicodephp技巧_SBCSDBCSASCIIMBCSANSIUnicode

ansiunicodephp技巧_SBCSDBCSASCIIMBCSANSIUnicode

访客 2024-11-30 0

扫一扫用手机浏览

文章目录 [+]
小编1.编码办法和字符类型。
第一种编码办法是单字节字符集,称之为SBCS,它的所有字符用一个字节存储。
ASCII码便是SBCS。
第二种编码办法是多字节字符集,称之为MBCS,它包含的字符中有单字节长的字符,也有多字节长的字符。
Windows用到的MBCS只有二种字符类型,单字节字符和双字节字符。
因此Windows中用得最多的字符是双字节字符集,即DBCS,常日用它来代替MBCS。
第三种编码办法是Unicode。
Unicode只是一个字符集,它只规定了符号的二进制代码,却没有规定这个二进制代码该当如何存储,常日说Unicode字符,指的是UTF16,既所有字符都以双字节存储,故有时也将Unicode称为宽字符集(wide characters)。
2.ASCII、MBCS、ANSI、Unicode关系和差异ASCII编码 0~127 利用一个字节即可表示;为了扩充ASCII编码,以用于显示本国的措辞,不同的国家和地区制订了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准。
这些利用 2 个字节来代表一个字符的各种汉字延伸编码办法,称为 ANSI 编码,又称为MBCS(Muilti-Bytes Charecter Set,多字节字符集),它是编码的一种类型,而不是某个特定编码的名称。
在简体中体裁系下,ANSI 编码代表 GB2312 编码,在日文操作系统下,ANSI 编码代表 JIS 编码,以是在中文 windows下要转码成gb2312,gbk只须要把文本保存为ANSI 编码即可。
不同 ANSI 编码之间互不兼容,当信息在国际间互换时,无法将属于两种措辞的笔墨,存储在同一段 ANSI 编码的文本中。
一个很大的缺陷是,同一个编码值,在不同的编码体系里代表着不同的字。
这样就随意马虎造成混乱。
导致了unicode码的出身。
为防止编码冲突,将所有措辞都统一成Unicode编码,该编码内存存储办法有UTF-8,UTF-16和UTF-32,我们习气说的Unicode实际是说的UTF-16这种内存存储办法,这个很多博客都没有说清楚,很多初学者很随意马虎稠浊编码和内存表示办法;3.Unicode和MBCS字符串之间的转换Windows编程中常常看到有WideCharToMultiByte类似的函数,一样平常都是把UTF-16表示的Unicode字符串(WCHAR)转化为MBCS(CHAR)
ansiunicodephp技巧_SBCSDBCSASCIIMBCSANSIUnicode
(图片来自网络侵删)

ansiunicodephp技巧_SBCSDBCSASCIIMBCSANSIUnicode

标签:

相关文章

微信第三方登录便捷与安全的完美融合

社交平台已成为人们日常生活中不可或缺的一部分。微信作为我国最受欢迎的社交软件之一,拥有庞大的用户群体。为了方便用户在不同平台间切换...

网站建设 2025-02-18 阅读0 评论0

广东高速代码表解码高速公路管理智慧

高速公路作为国家交通动脉,连接着城市与城市,承载着巨大的物流和人流。广东作为我国经济大省,高速公路网络密布,交通流量巨大。为了更好...

网站建设 2025-02-18 阅读0 评论0