数字视频处理 复习题
1. 何谓量化噪声,用什么方法可减小(或消除)它?
量化噪声:量化器的功能是按照一定的量化规则对取样信号的幅度值作近似表示,使量化器输出的幅度值的大小为有限个数.由于以有限个离散值近似表示无限个连续值,因此模拟信号经过量化后会产生量化误差,由此产生的失真称为量化失真(量化噪声).
方法: 过采样+抽取滤波的方法在通讯系统中,特别是ADC通路设计中很常见,目的是降
低量化噪声,减少硬件资源
2. 假设黑白电视信号的带宽为5MHz,若按256级量化,试计算按无失真取样准则取样时的数据速率.若电视节目按25帧/S发送,则存储一帧黑白电视图像数据需要多大的存储容量? 3. 简述人眼感觉彩色的机理
人眼是一个构造极其复杂的器官,形状近似球体。当人眼注视外界某物体时,由物体发出或反射、透视的光线通过眼球聚焦在视网膜上。视网膜上的光敏细胞受光刺激产生神经冲动,经视觉神经传递到视觉中枢,就产生了视觉。
视网膜上有大量的杆状细胞和锥状细胞。杆状细胞对明暗程度很敏感,对色彩分辨迟钝;锥状细胞既能区分光的强弱,又能分辨光的颜色;杆状细胞对弱光的灵敏度高,对强光失去作用;锥状细胞在强光下才起作用,产生色感,分辨细节。在弱光下杆状细胞起作用,只能看到黑白景象;强光下锥状细胞起作用,能分辨颜色和细节。电视系统中只考虑锥状细胞的视觉特性。
4. 比较逐行扫描和隔行扫描的优缺点。对于相同行数的帧,逐行扫描光栅的最大时间频率与将每帧分成两场的隔行扫描的最大时间频率之间有什么关系?最大垂直频率之间又有什么关系? 优缺点比较: 隔行扫描主要应用于电视信号的发送与接收中。它的特点是把每秒传送
25幅(帧)画面用每秒传送50次的方法来消除闪烁感,即一面传送两次,第一次扫描奇数
行,第二次扫描偶数行,因而称为隔行扫描。采用这一制式的缺点是画面清晰度稍差,且有轻微的闪烁感。逐行扫描主要应用于计算机的显示器中。由于显示器不受电视台的发送方式限制,因而被广泛采用。逐行扫描就是每幅画面按1、2、3……行的顺序扫描方式完成一幅画面。为了提高画面的清晰度,消除闪烁感,还可以增加扫描线数,目前显示器的扫描线数一般为768行,因而会感到画面非常细腻、清晰。
逐行扫描DVD又称PDVD,首台样机于1998年问世,目前技术和产品均已成熟。它能够应用数字视频图像处理技术产生480线的真正的逐行扫描信号,再通过电视机的视频图形阵列(VGA)输入口或数字高清晰度电视接入口把信号送入彩电中,避免了普通DVD机隔行信号输出造成的失真或缺损,与逐行扫描电视、数字高清晰度电视配合使用可以获得胜似电影的美妙画质。
5. 简述各种运动估计方法(基于光流、基于像素、基于块、基于网络、基于区域和全局)的优缺点。
基于光流: 光流是空间运动物体在观测成像面上的象素运动的瞬时速度,光流场是
指图像灰度模式的表面运动,是3D空间物体的运动在2D图像平面上的投影。分为:1. 微分法:
对光流约束方程通过Euler-Lagrange变换对得到PDE方程进行数值求解.2. 局部领域法:通过局部像素的邻域约束或张量结构来解决孔径问题,这类方法大多要通过最小二乘计算来完成.3. 区域匹配法,又称块匹配法:通过局部图像区域的邻域快速搜索找到最小误差或最大相关的匹配位置.
缺点: ①仅由一个基于亮度恒定的约束方程无法求解两个速度分量?u,v?;②图像中即使出现的小的干扰,会导致时空导数小的误差,进而引起速度估计产生较大的偏差。
原始光流模型(HS)由于采用二次平滑项,因此在运动边缘、间断、遮挡等地方往往会造成过度平滑
由于噪声、遮挡等干扰往往会在图像中产生异质点,严重破坏了HS光流方程的初始假设条件,造成估计的光流很不准确
在实际中,由于灰度变化以及速度场的变化都是不连续的,因而应用基本光流模型(HS),只能求解亮度变化小于1个象素的连续两帧图象,因此极大的限制了光流法的应用范围
基于像素: 新的视频标准H.264为了获得更精确的运动向量和更高的压缩比,引入了分数像素运动补偿技术但同时也增加了运动补偿过程的复杂度。为了克服这一局限,根据相邻分数像素点之间高度相关的运动估计匹配误差和运动矢量方向,以及运动向量具有中心偏置的特性提出了一种新的1/4像素精度快速搜索算法(QAFSA)
H.264中的分数运动估计能有效提高预测精度,但大大增加了计算复杂度。同整数运动估计一样,分数运动估计存在两个主要问题,一是计算量大,二是存储访问量大。而本文提出的用于H.264/AVC的
分像素运动估计的硬件实现方法能在全搜索块匹配算法的基础上,采用子块分解,利用10×10整像素点阵列实现1/2像素精度和1/4像素精度的最佳匹配点的并行搜索,与其他实现方法相比在空间上具有更高的并行度,处理能力更高,不但减少了大量中间数据的存储与传输,节省了存储器资源,而且简化了数据流和控制流,使硬件实现简洁有效,非常适合高分辨率视频的分像素运动估计
基于块: 在运动补偿视频编码系统中,它的优势是具有时间相关性的连续帧都实现了高压缩比,由一个参照系预测当前帧,只对预测误差和运动矢量进行编码和传送。运动估计(ME,它的目的是找出连续帧之间的运动关系,在运动补偿视频编码框架中扮演重要角色。在很多ME算法中,块匹配运动估计(BMME)由于它很简单,被广泛地采用在很多视频压缩标准中.
首先,不同于限制搜索步骤次数的算法,使候选项只能在一个固定大小的口内测试。ACS不限制搜索步骤的数量。因此ACS能使用不同大小的搜索窗口。从这一点上看,ACS能够适应不同的食品编码器的最大运动矢量长度。
其次,大多数真实世界序列的运动矢量分布偏向零点。例如,对于\推销员\的序列,将近80%块,可被视为静止和半静止[ 6 ]ACS在最小的十字形中开始搜索程序,由于多数的低运动块,搜索程序在前期的步骤中就被终止了。
第三,有别于传统的固定模式,ME的搜索点是均匀分布的,通过正确的用BDS当搜索点接近全局最小点的时候,所提出的算法将减少步长。搜索点的密度相对于其他区域而言是在一个较大的范围内接近全局最小和零点,因此,计算能力被有效的分配。
最后,在实现ACS的时候,测试搜索点被记录以防止重叠计算。