湖南农大多媒体技术基础(第3版)期末复习重点资料

多媒体复习重点汇总

1.1.1 多媒体的定义

? 媒体:(medium)在计算机领域有两种含义:即媒质和媒介。

? 媒质:存储信息的实体,如磁盘、光盘、磁带、半导体存储器等。 ? 媒介:传递信息的载体,如数字、文字、声音、图形和图像等。 通常概念的“媒体” ,可分为以下

五种类型:感觉媒体、表示媒体、表现媒体、存储媒体、传输媒体

1.1.2 多媒体技术的关键特性 多维性:信息媒体的多样化

交互性:使用者对信息处理的全过程,能进行完全有效的控制,并将结果进行综合表现 集成性

? 多媒体信息的集成;

? 处理媒体的设备与设施的集成

3、音频压缩标准

? G.711标准:电话质量的语音压缩(PCM),64kbit/s ? G.722标准:广播质量的音频压缩(子带编码)

? G.723标准:用于多媒体传输的5.3kbit/s或6.4kbit/s双码率语音编码 ? G.728标准:16kbit/s

? G.729.A标准:主要用于无线移动网、数字多路复用系统和计算机通信系统。

4、存储局域网SAN

? 以数据为存储中心 ? 网络拓扑结构可伸缩 ? 光通道直接连接

? 内部任意节点之间多路可选择的数据交换 ? 多种操作系统下共享

5、多媒体技术发展的新颖技术

1. 流媒体技术

2. 影视制作及其动画的平台技术 3. 虚拟现实技术

4. 多媒体数字水印技术 5. 多媒体数据挖掘技术 6. 跨媒体技术

6、数字水印技术 :用信号处理的方法,在数字化的多媒体数据中嵌入隐蔽的标记,这种标记不可见,只有通过专用的检测器才能提取。

特征:隐蔽性、隐藏位置的安全性、鲁棒性 数字水印应用领域有哪些?

数字作品的知识产权保护、商务交易的票据防伪、声像数据的隐藏标识和篡改提示、隐蔽通信及对抗等 7、多媒体数据挖掘技术

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、有用信息和知识的过程。

基于内容的信息检索,只能找出“信息”,无法分析出“知识”。多媒体数据挖掘,通过综合分析视听特性和语义,发现隐含的、有效的、有价值的、可理解的模式,进而发现知识,得出事件的趋向和关联。为用户提供决策依据。

2.1.1 声音与听觉器官

声音是通过空气传播的一种连续的波,叫声波。 声音的强弱(音强),音调的高低(频率),声波的特性: 反射 (reflection)、折射 (refraction)和衍射 (diffraction) 声音信号由许多频率不同的信号组成。

带宽:它用来描述组成复合信号的频率范围。

20~20000 Hz(音频,人能感知的),低于20的是次音,高于2万的是超声波。 80~3400 Hz (话音)

0~120 dB(人能感知的音强) 声音方向的确定

人可以从声波中判断出声音的来源、强度以及声音的特殊空间效果。 人是根据三个现象来确定声音的方向: (a)声音在时间上的差别(相位) (b)声音强弱的差别(音量),声音衰减;声音频率对声音的强度差别有影响。 (c)声音的遮挡效果(阴影) 头部与障碍物的遮挡。

判别声源的其他方法:视觉帮助、声音知识、耳廓等。 声音的方向性是产生立体声效果和空间效果的基础。

2、声音质量的度量

? 声音的质量与声音的带宽有关,一般来说频率范围越宽,声音质量也就越高。 声音类型 电话语音 调幅广播 调频广播 CD DAT 带 宽 200Hz-3.4kHz 50Hz-7kHz 20Hz-15kHz 20Hz-20kHz 20Hz-20kHz ? 客观质量度量:信噪比(SNR) ? 主观平均判分法(MOS):由评委打分,声音质量评分标准参见P48 ? 采样频率

奈奎斯特理论指出:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,称为无损数字化。

3、话音编译码器的分类(1)

? 波形编译码器(waveform coder):不利用生成话音的信号的任何知识,将话音视为一种普通的声音,直接

对波形信号进行采样和量化。例如PCM、DPCM、ADPCM等。 ? 音源编译码器(Source coder):也叫参数编译码器、声码器(vocoder)。它从话音波形信号中提取生成话音

的参数,使用这些参数通过话音生成模型重构出话音。 ? 混合编译码器(Hybrid coder):综合使用上述两种技术。使用的激励信号波形尽可能接近于原始话音信号的

波形。例如CELP。

? 基于音频数据的统计特性(波形编码) ? 基于音频声学参数的编码(线性预测编码) ? 基于人的听觉特性编码(掩蔽效应)

? MPEG中高频编码 ? Dolby AC3

4、脉冲编码调制(PCM)

5、自适应脉冲编码调制(APCM)

? APCM是一种根据输入信号幅度大小自动改变量化阶大小的一种波形编码技术。

? 前向自适应 ? 后向自适应

? DPCM是利用相邻样本之间冗余信息来进行编码的一种数据压缩技术。 ? ADPCM综合了APCM的自适应特性和DPCM系统的差分特性

6、线性预测编码(LPC)的概念

? 线性预测编码(Linear Predictive Coding,LPC)

是一种非常重要的编码方法。从原理上讲,LPC是通过分析话音波形来产生声道激励和转移函数的参数,对声音波形的编码实际就转化为对这些参数的编码,这就使声音的数据量大大减少。在接收端使用LPC分析得到的参数,通过话音合成器重构话音。

3.1.1多媒体数据冗余类型

? 多媒体数据有大量的冗余数据,如将重复的数据,改用数学方法表示,就可以减少数据量。 ? 将人的眼睛和耳朵感觉不到的信息去掉,也可以压缩数据。 数据冗余类型有六种:

? 空间(空域)冗余

如一幅图像,规则物体和规则背景的表面物理特性具有相关性。 时间(时域)冗余

如图像序列的后一幅图像与前一幅之间有较大的相关。人在说话时声音的音频是一个连续渐变的过程,也存在时间冗余。

? 信息熵冗余(编码冗余)

信息熵是指一组数据所携带的平均信息量。 结构冗余 数字化图像中的物体表面纹理(如草席的纹理)等结构,存在冗余。 ? 知识冗余

许多图像的理解与某些基础知识有相关性,如人脸的结构可由先验知识和背景知识得到。 视觉冗余 人类的视觉系统对于图像的注意是非均匀和非线性的,视觉系统并不是图像的任何变化都能感知的。

2、算术编码

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4