请注意\"字符\"和\"字节\"两个术语的是不同的。在我们常见的GB2312和GBK字符集中,一个汉字是两个字节,ANSI字符集中,一个英文字符是一个字节。至于一个汉字是多少个字符?可以这样说,一个汉字就是一个字符,但它占用了两个英文字符的空间(两个字节) 在unicode中,一个汉字是4个字节,英文字符是2个字节。
一个汉字=2字节
官方标准:
1字节(Byte)=8字位=8个二进制数
1字位(bit)=1个二进制数
1B=8b
1KB=1024B
1MB=1024KB
1GB=1024MB
请注意\"字符\"和\"字节\"两个术语的是不同的。在我们常见的GB2312和GBK字符集中,一个汉字是两个字节,ANSI字符集中,一个英文字符是一个字节。至于一个汉字是多少个字符?可以这样说,一个汉字就是一个字符,但它占用了两个英文字符的空间(两个字节) 在unicode中,一个汉字是4个字节,英文字符是2个字节。
一个汉字占用两个字符。
8个位(bit),最多可以表示256个对应字符,如果是2个字节则是16个位(bit),也就是2的16次方,最多可以表示65536个对应字符。同时也是为了计算机系统原有电子逻辑,则采用2个字节的汉字编码。这就是GB2312编码,用两个字节来表示一个汉字。
1个字节是1个字符
英文一个字母是一字节。中国字比较复杂,1字节=8位,8位从0000 0000到1111 1111只能表示256个字符,2个字节是2*8=16位,从0000 0000 0000 0000到1111 1111 1111 1111可以表示65535个字符。
6万多个足以表示我们经常用的那些字了。所以我们用2字节表示汉字。如果用3个字节有很多不常用的字又占了很多不必要的存储空间,所以我们用2个字节而不是1个或者3个表示汉字的国际码。