ISO-8859-1编码是一个单个字节编码,是一个单个字节编码,GBK码对字库中偏移量的计算公式为:*(汉字离散后每个汉字点阵所占用的字节) 字符有一字节和双字节编码,在ASCII中包含的字符,ISO-8859-1中包含的字符中,之后的双字节中,Windows 95/98则以GBK为基本汉字编码,ASCII编码是一个7位容器。
MYSQL中的Latin1字符究竟是什么呢拾荒者
MySQL中的Latin1字符是什么?Latin1是ISO-8859-1的别名,某些环境用Latin-1.ISO-8859-1编码编写,是一个单个字节编码,与ASCII兼容。它的编码范围为0x00-0xff,0x00-0x7f与ASCII完全一致,0x80-0x9f控制字符,0xa0-0xff是betweentext符号。
什么是latin1字符集
LATIN1是ISO-8859-1的别名,Latin-1在某些环境中编写。ISO-8859-1编码是一个单个字节编码,与ASCII兼容。它的编码范围为0x00-0xff,0x00-0x7f与ASCII完全一致,0x80-0x9f是控制字符,0xa0-0xff是betWeentext符号。在ASCII中包含的字符,ISO-8859-1中包含的字符中,ISO-8859-1包括与西欧语言相对应的文本符号,希腊语,泰语,阿拉伯语和希伯来语。字节,传输和存储支持ISO-8859-1的任何其他代码的字节流将不会被放弃。是一个非常重要的功能。 MySQL数据库的默认编码是使用此功能的Latin1。ASCII编码是一个7位容器,ISO-8859-1编码是一个8位容器。
字符编码的GBK
GBK即汉字内码扩展规范,K为扩展的汉语拼音中“扩”字的声母。英文全称Chinese Internal Code Specification。GBK编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集——基本集》,1980年由国家标准总局发布。基本集共收入汉字6763个和非汉字图形字符682个,通行于中国大陆。新加坡等地也使用此编码。GBK是对GB2312-80的扩展,也就是CP936字码表 (Code Page 936)的扩展(之前CP936和GB 2312-80一模一样)。 GB 2312的出现,基本满足了汉字的计算机处理需要,但对于人名、古汉语等方面出现的罕用字,GB 2312不能处理,这导致了后来GBK及GB 18030汉字字符集的出现。
GBK采用双字节表示,总体编码范围为8140-FEFE,首字节在81-FE 之间,尾字节在40-FE 之间,剔除 xx7F一条线。总计23940 个码位,共收入21886个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号883 个。P-Windows3.2和苹果OS以GB2312为基本汉字编码, Windows 95/98则以GBK为基本汉字编码。
有些汉字用五笔和拼音都打不出来,如:溙(五笔IDWI),须调出GBK字符集才能打出这个字。极品五笔中可右击输入法图标,设置,属性中选GBK字符集。极点五笔中可点击工具条中相关图标进行转换。 GBK码对字库中偏移量的计算公式为:
*(汉字离散后每个汉字点阵所占用的字节) 字符有一字节和双字节编码,00–7F范围内是一位,和ASCII保持一致,此范围内严格上说有96个字符和32个控制符号。
之后的双字节中,前一字节是双字节的第一位。总体上说第一字节的范围是81–FE(也就是不含80和FF),第二字节的一部分领域在40–7E,其他领域在80–FE。-latin1