一个汉字有几个字节

投稿:醉闻晚风 优质问答领域创作者 发布时间:2023-10-23 13:16:30
一个汉字有几个字节

两个

一个汉字是两个字节。可能有人会想为什么1个字母是1个字节,而1个汉字需要2个字节。主要可以是说我们中文汉字比字母多很多,使用字母那套编码无法兼容完我们的汉字。

一个字节是8个位(bit),最多可以表示256个对应字符(2的8次方),如果是2个字节则是16个位(bit),最多可以表示65536个对应字符(2的16次方)。同时也是为了计算机系统原有电子逻辑,则采用2个字节的汉字编码。

ASCII(美国信息交换标准代码)是美国人用来对拉丁字符进行的编码。因为计算机是美国人发明的,所以他们也没考虑其他国家可能也要用到计算机。

后来随着计算机的发展,一些不是拉丁字母的国家也开始用计算机了,发现一个字节只能表示256个字符,这明显不够,像我们汉字博大精深,常用的都有几千个,于是常见的中文的编码GB2312(国家简体中文字符集)就出现了。GB2312用两个字节来表示一个汉字。

字节是计算机信息技术用于计量存储容量的一种计量单位,通常情况下一字节等于八位,也表示一些计算机编程语言中的数据类型和语言字符。

B与bit

数据存储是以“字节”(Byte)为单位,数据传输大多是以“位”(bit,又名“比特”)为单位,一个位就代表一个0或1(即二进制),每8个位(bit,简写为b)组成一个字节(Byte,简写为B),是最小一级的信息单位。

B与iB

1KiB(Kibibyte)=1024byte

1KB(Kilobyte)=1000byte

1MiB(Mebibyte)=1048576byte

1MB(Megabyte)=1000000byte

字符与字节

ASCII码:一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。如一个ASCII码就是一个字节。

UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。

Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。

符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小。