代码点就是指javascript型的信息点而代码单元指普遍的广泛的jinmk 和gdp信息技术网
说白了一个代码点就是一个Unicode字符.代码单元就是代码点的集合.
字符视图
要了解字符集标准,您必须能区分三种不同的字符视图:
字符集(字符的抽象列表).
作为带标量值的"代码点"的字符.
作为编码数据的字符.
字符集(字符的抽象列表)
字符集是各种文字(包括拉丁文、西里尔文、中文、朝鲜语、日语、希伯来语和阿拉伯语)中所包含的字符的一个抽象列表,由一百多万个字符组成.字符集还包括其他符号,例如音符.
作为带标量值的"代码点"的字符
字符集中的每个字符都被分配到一个"代码点".每个代码点都有一个特定的数值,称为标量值.该标量值通常用十六进制表示.
代码点存在于"代码空间"中.代码空间由许多标量值组成,这些值被划分在两个平面中:
在 Unicode 中,此下平面中的值的十六进制表示位于 U+0000 到 U+FFFF 的范围中.
在 Unicode 中,此上平面中的值的十六进制表示位于 U+10000 到 U+10FFFF 的范围中.
作为编码数据的字符
每个编码形式将字符从字符集转换为编码数据.
在 Unicode 中,通过向标量值应用某个算法来派生编码数据.
Unicode 定义了三种字符编码形式:
代码点和代码单元
在每种编码形式中,代码点被映射到一个或多个代码单元.
注意 有关代码点的概述,请参见上一节字符视图.
"代码单元"是各个编码形式中的单个单元.代码单元的大小等效于特定编码的位数测量单位:
每个代码点中的代码单元数
映射到代码点所需的代码单元数根据编码形式而有所不同:
注意 下面对 Unicode 代理对的支持进行了讨论.
对 Unicode 代理对的支持
以上就是土嘎嘎小编为大家整理的java中代码单元是什么相关主题介绍,如果您觉得小编更新的文章只要能对粉丝们有用,就是我们最大的鼓励和动力,不要忘记讲本站分享给您身边的朋友哦!!