考点3文字编码知识梳理典型例题及训练解析 下载本文

考点三 文字编码

基础再现 1、ASCII码 ASCII码全称为“美国国家信息交换标准代码”,通常用来对英文字符进行编码。该编码使用7位二进制数,共可以表示128个字符。一个ASCII码存储时占用1字节,存储ASCII时在最高位加“0”。ASCII码中的数字、字母按顺序依次排列。

2、汉字编码

汉字在计算机内采用二进制编码,我国最早采用的汉字编码是GB2312。每个汉字用2个字节进行编码,每个字节的最高位用“1”填充。

汉字的输入码(外码):是利用汉字相关特征对指定汉字进行编制的输入代码,包括:音码、形码、音形结合码、自然码、流水码等。 汉字的输出码(字形码):用来存储汉字的字体形状

汉字的交换码:计算机系统间交换汉字通常采用GB2312标准。 处理码又称内码,用UltraEdit或WinHex工具软件观察内码时,ASCII码只占1个字节,汉字占2个字节。 典例3.

(2008.10月高考) 小王用“UltraEdit”软件观察“春眠不觉晓’,这几个字.显示的十六进制内码如第4题图(见附图页)所示,从中可以看出字符”眠”的内码是

A.C3DFH B.B4BAH C.B4H D.C3H

解析:在计算机内部一个汉字占两个字节,一个ASCII占一个字节。选A。 即时训练3

1、(考试说明) 用WinHex软件观察“IT行业”四个字符,显示的十六进制内码如图所示,则字符“T”的内码用二进制数表示应该是

第5题图

(A)(10011000)(B)(1010100)2 (C)(110110)2 (D)(1101)2 2

解析:在计算机内部一个汉字占两个字节,一个ASCII占一个字节。字符T对应十六进制54,再转化为二进制为1010100。故选B。

2.(2008年10月浙江省高考)制订ASCII码、汉字国标码、商品条形码等标准化

山西省翼城县清华园中学 电教科

1

编码主要是为了信息表达的

A.自由化 B.规范化 C.形象化 D.通俗化 解析:考查信息标准化编码的意义,故选B。

3.(2009年3月浙江省高考) 汉字点阵是一种用黑白两色点阵来表示汉字字形的编码,一个16×16点阵字模的存储容量为 A.1字节 B.16字节 C.32字节 D.64字节

解析:一个点阵对应二进制1位(比特,bit或b),16×16÷8=32字节。选C 1.上述概念只适用于GB2312-80,现代已不大适用; 2.机内码:实际存储在内、外存上的2进制信息,由国家制定的汉字编码; 区位码:与机内码有一一对应关系,当年也许是为了输入方便。可当作一种输入法。 3.机内码与区位码有简单的轮换关系。两字节的机内码,(高字节-A0)->区号,(低字节-A0)->位号。举例如下: ?码?的机内码是C2EB,C2-A0->34(区号),EB-A0->75(位号).前者是16进制,后者是10进制. 4.在现在操作系统中,若用区位输入法输入汉字?码?,即可输入3475(区位码),也可输入C2EB(机内码). 计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。汉字交换码:汉字信息处理系统之间或通信系统之间传输信息时,对每一个汉字所规定的统一编码,我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集——基本集”,代号为GB 2312—80,又称为“国标码”。国标码:所有汉字编码都应该遵循这一标准,汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出设备的汉字地址码等,都以此标准为基础。GB 2312—80就是国标码。该码规定:一个汉字用两个字节表示,每个字节只有7位,与ASCII码相似。区位码:将GB 2312—80的全部字符集组成一个94×94的方阵,每一行称为一个“区”,编号为0l~94;每一列称为一个“位”,编号为0l~94,这样得到GB 2312—80的区位图,用区位图的位置来表示的汉字编码,称为区位码。机内码:为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加20H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。 山西省翼城县清华园中学 电教科

2

国标码=区位码+2020H 机内码=国标码+8080H 机内码=区位码+A0A0H

区位码、国标码与机内码的转换关系方法:

(1)区位码先转换成十六进制数表示

(2)(区位码的十六进制表示)+2020H=国标码; (3)国标码+8080H=机内码

举例:以汉字“大”为例,“大”字的区内码为2083

解:1、区号为20,位号为83

2、将区位号2083转换为十六进制表示为1453H

3、1453H+2020H=3473H,得到国标码3473H

4、3473H+8080H=B4F3H,得到机内码为B4F3H 小结:

字符编码的两种表示方式:ASCII(字符的表示);GB2312(国标码,汉字编码)

山西省翼城县清华园中学 电教科

3