1981年我国颁布了第一个汉字编码的国家标准——《信息交换汉字编码字符集·基本集》(GB 2312)。该标准选出6 763个常用汉字和682个非常用汉字字符,为每个字符规定了标准代码,这个标准所收集的字符及其编码为国标码,又称为国标交换码。
GB 2312国标字符集由3部分组成。第一部分是字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个;第二部分为一级常用汉字,共3 755个,按汉语拼音排列;第三部分为二级常用汉字,共3 008个,因不太常用,所以按偏旁部首列。
GB 2312的所有字符分布在一个94行×94列的二维平面内,行号称为区号,列号称为位号。区号和位号的组合就可以作为汉字字符的编码,称为汉字的区位码。 区号和位号各用8个二进位表示,它们的最高位均设置为1。这样得到的高位匀为1的双字节汉字编码就称为GB 2312汉字的“机内码”,又称为内码。PC中GB 2312汉字的表示都采用这种方式。 2.GBK汉字内码扩充规范
GBK是我国1995年发布的又一个汉字编码标准,全称为《汉字内码扩展规范》。 2.UCS/Unicode与GB 18030编码标准
UCS/Unicode规定,全世界现代书面文字所使用的所有字符和符号都集中在一个字符集中统一进行编码。目前的做法是采用双字节编码。 1.3.3 计算机中的文字处理 1.文稿的输入
汉字输入的编码方法大体可分成以下4类: 1. 数字编码。 2. 字音编码。 3. 字形编码。 4. 音形混合编码。
2.文本的编辑与排版
文本编辑就是对已输入的文字内容进行增加、删除或修改,直到满意为止。使用文字处理软件(如Word、WPS等)。 3.文档的存储与输出
制作的文档可以多种不同的文件格式在外存储器上进行存储。 1. doc:微软公司专用的Word文档格式 2. .txt:纯文本格式 3. .rtf:丰富文本格式
4. .html:超文本标记语言格式
5. .xhtml:超文本标记语言单个文件格式 6. .xml:扩展标记语言格式
1.4 图形在计算机中的表示与处理
图在计算机中有两种表示方法,一种称为点阵图像(dot matrix image)或位图图像(bitmap image),简称图像(image);另一种称为几何图形或矢量图形(vector graphics),简称图形(graphics)。
1.4.1 图像及其处理
1.数字图像的获取及基本参数
现实世界的景物输入到计算机的过程称为图像的获取。 图像获取的过程实质上是信号扫描和数字化的过程,它的处理步骤大体分为以下3步: 1. 取样。 2. 分色。 3. 量化。
每一幅数字图像至少具有下列几个基本参数。
1. 图像的大小,也称为图像分辨率。
2. 位平面(bitplane)的数目,即像素色彩分量的数目。 3. 彩色空间的类型,指彩色图像使用哪些基色进行描述。 4. 像素的深度,指每个像素需要使用多少二进位来表示。像素深度是像素的所有分量的位数之和,它决定着该图像可能出现的不同颜色(灰度)的最大数目。
5. 图像压缩编码与图像文件格式
数字图像在计算机中处理时,其数据量可按下面的公式进行计算(以字节为单位)。
图像数据量=水平分辨率×垂直分辨率×图像深度/8
数据压缩可分成两种类型,一种是无损压缩,另一种是有损压缩。
数字图像保存在存储器中时,其数据文件的格式繁多,PC上常用的就有下列几种:
1. JPEG格式: 2. BMP格式。 3. GIF文件格式: 4. TIFF文件格式: 5. PNG格式。
1.4.2 计算机图形 1.景物的计算机表示
表1.8 图形(graphics)与图像(image)的比较
数据量 可编辑性 3D景物表现能力 图形(graphics) 很小 较好 能准确表示3D景物 图像(image) 很大 较差 3D信息已部分丢失 自然景物表现能力 视图生成能力 视图生成的复杂性 困难 能生成多个视图 需要大量计算 容易 只能生成1个视图 计算比较简单 1.5 音频与视频信息的表示与处理 1.5.1 音频信息的处理与应用 声音是模拟信号。为了使用计算机进行处理,必须将它转换成二进制数字编码的形式,这个过程称为声音信号的数字化。声音信号数字化的过程分为以下几个步骤:
? 取样。
取样也称为采样,就是用时间上离散的一组值(称为取样值或样本)来代替一个时间连续的信号。 ? 量化。
量化就是把每个样本的模拟值转换成数字量来表示,因此量化过程往往也称为A/D转换(模数转换)。
? 编码。 2.波形声音的压缩编码
数字波形声音的数量比较大,每秒钟的数据量(码率)是:码率=取样频率×量化位数×声道数
所谓“MP3播放器”,就是专门用于播放MPEG-1层的编码的高质量数字音乐的电子装置。
3. 计算机合成声音
MIDI是乐谱的数字表示方法,使用MIDI描述的音乐称为MIDI音乐。
MIDI音乐与高保真的波形声音相比,虽然在音质方面还有一些差距,也无法合成出所有各种不同的声音(例如歌词),但它的数据量很少(比CD少3个数量级),又易于编辑修改,还可以与波形声音同时播放,因此,在多媒体文档中得到了广泛的使用。
1.5.2数字视频的压缩编码
表1.10 视频压缩编码的标准及其应用 源图像格式 压缩后的码率 主要应用 名称 MPEG-1 360×288 1.2~1.5 Mbps 适用于VCD、数码相机、数字摄像机等 H.261 360×288或 P×64kbps(P=1、2时,只应用于视频通信,如可视180×144 支持180×144格式,P≥6电话 、电视会议等 时,可支持360×288格式) MPEG-2 720×576 5~15 Mbps 用途最广,如DVD、数字(MP@ML) 卫星电视直播、数字有线电话等 MPEG-2High 1 440×1 152 80~100 Mbps 高清晰度电视(HDTV)领Profile 1 920×1 152 域 MPEG-4 多种不同的视与MPEG-1、MPEG-2相当,适合于交互式和移动多媒(H.26L) 频格式 但最低可达到64kbps 体应用,包括虚拟现实、远程教学、手机、MP4播放器等 数字视频在PC中保存或在互联网上传输时,其文件格式有多种。除了使用MPEG进行压缩编码的视频(其文件扩展名为.mpeg、.mpg、.mp2、.mp3、.dat和.mpa等)一些公司还开发了自己的文件格式。如微软公司的AVI、ASF、WMV文件格式(.avi、.asf、.wmv)、苹果公司的QuickTime格式(.mov、.qt),以及Real Networks公司的RealVideo格式(.rm、.rmvb)等。 1.6 计算机网络基础
1.6.1 计算机网络的功能和分类 1.计算机网络的组成
计算机网络是利用通信设备、通信线路和网络软件,把地理上分散的许多具有独立工作能力计算机(及其他智能设备)以相互共享资源(硬件、软件和数据等)为目的连接起来的一个系统。
实质上,计算机网络是一种数据通信系统。 计算机网络一般由下列几个部分组成:
1. 计算机
2. 数据传输介质 3. 通信控制设备
4. 通信协议(protocol),为了确保网络中的计算机能正确地交换数据,计算机和通信控制设备必须共同遵循的一组规则和约定,这些规则、约定或标准就称为通信协议,简称协议 5. 网络操作系统 6. 网络应用程序 2.计算机网络的功能与服务 1. 文件服务 2. 打印服务 3. 消息服务 4. 应用服务
计算机网络有两种基本工作模式:对等(peer-to-peer)模式和客户/服务器(client/server,C/S)模式。 3. 计算机网络的类型
人们按网络所覆盖的地域范围把计算机网络分为局域和广域网两大类。 1.6.2 计算机局域网 1. 局域网的特点与组成
局域网(LAN)指较小地域范围(1千米或几千米)内的计算机网络,计算机局域网的主要特点是:
① 为一个单位所拥有,地理范围有限 ② 使用专门铺设的传输介质进行数据通信
③ 数据传输速率高(10 Mbps~1 Gbps),延迟时间短
④ 可靠性高、误码率低(10-8~10-11) 2. 常用局域网简介
局域网有多种不同的类型。按照它所使用的传输介质,可分为有线网和无线网;按照网络中各个结点互连的拓扑结构,可以分为星状网、环状网、总线网等;按照结点对传输介质的访问控制方法,可以分为以太网、FDDI网和令牌网等。 (1) 以太网
以太网(Ethernet)最常用的一种局域网,网络中所有结点都使用以太网卡和双绞线(或光纤)连接到网络中,实现相互间的通信。 实际的以太网大多数以集线器(hub)为中心构成。 (2) 光纤分布式数据接口网
光纤分布式数据接口网(FDDI)采用环状结构,利用光将多个结点环接起来,环上的结点依次获得对环路的访问权,进行数据帧的发送或接收。 (3) 无线局域网
无线局域风(WLAN)是局域网与无线通信技术相结合的产物。它采用无线电波进行数据通信,具有有线局域网的所有功能,同时还能方便地移动结点的位置或改变网络的组成。
无线局域网通过无线网卡、无线hub、无线网桥等设备使无线通信得以实现。IEEE802.11是无线局域网目前最常用的传输协议。其中802.11a和802.11g的传输速率分别可达25 Mbps和54Mbps。
蓝牙是一种近距离无线数字通信的技术标准,它是802.11的补充。蓝牙的最高数据传输速率为1 Mbps(有效传输率为721 kbps),传输距离通常为10cm~10m。 1.6.3 互联网及其应用
世界上规模最大的计算机网络是因特网(Internet),因特网通常也称“互联网”。互联网起源于美国国防部ARPANET计划,后来与美国国家科学基金会的科学教育网合并。从20世纪90年代起,政府机构和公司企业的计算机也纷纷入网,并迅速扩大到全世界几乎所有的国家和地区。 3. 互联网的接入 (1) IP地址
为了实现互联网中计算机的相互通信,网络中的每一台计算机(也称为主机,host)必须有一个唯一的标识,核标识就称为IP地址。凡是入网的计算机,都必须获得IP地址授权机构分配的IP地址。
IP地址需指明计算机所在的网络号(net-id)以及它在该网络中的主机号
(host-id)。由于计算机所在局域网的规模大小不完全相同,IP地址分为5类(A、B、C、D、E),所以每个IP地址由3部分构成: IP地址=类型号+网络号(net-id)+主机号(host-id) 目前广泛使用的IP协议第4版规定,IP地址使用4个字节(32个二进位)表示,A类地址用于拥有大量主机(≤16 777 214)的超大型网络,只有少数网络(不超过126个)可获得A类IP地址,它的特征是其二进制表示的最高位为“0”(首字节的值小于128)。B类IP地址的特征是其二进制表示的最高两位为“10”(首字节大于等于128但小于192),规模适中的网络(≤65 534台主机)使用B类地址。C类地址用于主机数量不超过254的小型网络,其IP地址的特征是二进制表示的最高3位为“110”(首字节大于等于192但小于224)。
为了便于记忆,通常采用“点分十进制”来表示IP地址,即使用4个十进制数来表示一个IP地址,每个十进制数对应IP地址中的一个字节,十进制数之间采