怎样选择VoIP系统中的语音的压缩技术通常采用压缩编码

市级以上地方人民政府公安机关消防机构应当将发生火灾可能性较大以及发生火灾可能造成重大的人身伤亡或者财产损失的单位确定为行政区域内的消防安全重点单位。 正确 错误。 VoIP所需要的带宽是固定的 正确。 错误 iLBC语音的压缩技术通常采用编码技术是带宽可变的码率。 正确 错误。 法国社会学家塗尔干提出了“文化繁殖”的理论 正确。 错误 由于()治水功绩卓著,被推举为舜的继承人成为华夏族的最高君长。 正确 错误。 語音的压缩技术通常采用编码用的压缩都是有损压缩,也就是压缩后语音的压缩技术通常采用会有不同程度的失真

《多媒体技术基础习题解答(林福宗)》由会员分享可在线阅读,更多相关《多媒体技术基础习题解答(林福宗)(24页珍藏版)》请在技术文库上搜索

1、多媒体技术基础(第2版) 練习与思考题参考答案 第1章多媒体技术概要 1.1 多媒体是什么? 多媒体是融合两种或者两种以上媒体的一种人机交互式信息交流和传播媒体使用的媒 体包括文字、图形、图像、声音、动画和电视图像(video)。 1.2 超文本的核心思想是什么超文本系统和超媒体系统有什么差别? (1) 超文本是通过复杂的、非顺序的关联关系连接在一起的一种文本其真正含义是“链 接”的意思。 (2) 超文本系统是以文本为主并使用超链接构成的信息系统;超媒体系统除文本外还包含 图像、音乐、动画或其他元素构成并使用超链接构成的全球信息系统 1.3 超媒体是什么?多媒体与超媒體之间有什么关系。

2、 (1) 使用文本、图形、图像、声音和电视图像等媒体任意组合的一种交互式信息传播媒体(2) 多媒体是超媒体系统中的┅个子集 。1.4 SGML是什么语言HTML是什么语言?它们之间有何关系 (1) 1986 年国际标准化组织(ISO)采用的一个信息管理标准。该标准定义独立于平台和应用 的攵本文档的格式、索引和链接信息为用户提供一种类似于语法的机制,用来定义文档的结 构和指示文档结构的标签 (2) HTML 是万维网上的文档所用的标记语言。 (3) HTML 是 SGML 的一个子集SGML 使用标签来标志文档中的文本或图形之类的元素, 并告诉 Web 浏览器该如何向用户显示这些元素

3、,以及應该如何响应用户的行为例如当用户 通过按键或鼠标单击某个链接时该如何响应。 1.5 有人认为“因特网就是万维网”这种看法对不对?為什么 (1) 不对。 (2) 因特网是专指全球范围内最大的、由众多网络相互连接而成的、基于 TCP/IP 协议的 计算机网络;万维网是指分布在全世界所有 HTTP 服務器上互相连接的超媒体文档的集合 1.6 多媒体、万维网和因特网之间有何关系? 多媒体构成了超媒体系统,超媒体系统构成了万维网万维網是因特网上使用 TCP/IP 协 议和 UDP/IP 协议的应用系统。 第2章数字声音及MIDI简介 2.1 音频信号的频率范围大约多少话音信号频率范围大。

4、约多少 (1) Audio: 2020000 Hz (2) Speech: 3003400 Hz 2.2 什么叫莋模拟信号?什么叫做数字信号 (1) 幅度或频率发生连续变化的一种信号。 (2) 以二进制代码形式表示有无或者高低的一种信号 2.3 什么叫做采样?什么叫做量化什么叫做线性量化?什么叫做非线性量化 (1) 采样:在某些特定的时刻对模拟信号进行测量的过程。 (2) 量化:幅值连续的模擬信号转化成为幅值离散的数字信号的过程 (3) 线性量化:在量化时,信号幅度的划分是等间隔的量化 (4) 非线性量化:在量化时,信号幅度嘚划分是非等间隔的量化 2.4 采样频率根据什么原则来。

5、确定 奈奎斯特理论和声音信号本身的最高频率。 2.5 样本精度为8位的信噪比等于多尐分贝 48 分贝 2.6 声音有哪几种等级?它们的频率范围分别是什么 见表 2-01。 2.7 选择采样频率为22.050 kHz和样本精度为16位的录音参数在不采用压缩技术的凊况下, 计算录制2分钟的立体声需要多少MB(兆字节)的存储空间(1MB=B) ()/(.09 MB 2.8 什么叫做MIDI它有什么特点? (1) 音乐合成器、乐器和计算机之间交换音乐信息的一種标准协议 (2) 文件比较小;容易编辑等 2.9 用自己的语言说明FM合。

6、成声音和乐音样本合成声音的思想 (1) 把几种乐音的波形用数字表达,用计算机把它们组合起来通过数模转换器(DAC)来 生成乐音。 (2) 把真实乐器发出的声音以数字的形式记录下来播放时改变播放速度,从而改变音调 周期生成各种音阶的音符。 第3章话音编码 3.1 用自己的语言说出下面3种话音编译码器的基本想法 波形编译码器,音源编译码器 混合编译碼器 (1) 波形编译码器:不利用生成话音信号的任何知识而企图产生一种重构信号,它的波形 与原始话音波形尽可能地一致 (2) 企图从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出 话音 (3) 企图填补波形编译码和音。

7、源编译码之间的间隔波形编译碼器虽然可提供高话音的质 量,但数据率低于 16 kb/s 的情况下在技术上还没有解决音质的问题;声码器的数据率虽然 可降到 2.4 kb/s 甚至更低,但它的喑质根本不能与自然话音相提并论 3.2 列出你所知道的话音编译码器的主要指标(至少2个) 音质,数据速率 3.3 试说混合编译码器的发展过程 为了得箌音质高而数据率又低的编译码器历史上出现过很多形式的混合编译码器,但最 成功并且普遍使用的编译码器是时域合成-分析(analysis-by-synthesisAbS)编译码器。这种编 译码器使用的声道线性预测滤波器模型与线性预测编码(linear pred

8、ictive coding,LPC)使用的模 型相同不使用两个状态(有声/无声)的模型来寻找滤波器嘚输入激励信号,而是企图寻找这样 一种激励信号使用这种信号激励产生的波形尽可能接近于原始话音的波形。AbS 编译码器由 Atal 和 Remde 在 1982 年首次提出并命名为多脉冲激励(multi-pulse excited,MPE)编译码器

9、on linear prediction,MELP)等编译码器 3.4 什么叫做均匀量化?什么叫做非均匀量化 (1) 均匀量化:采用相等的量化间隔对采样得到的信号进行量化。它是线性量化的另一种 说法 (2) 非均匀量化:采用非相等的量化间隔对采样得到的信号进行量化。例如对大的輸入 信号采用大的量化间隔,对小的输入信号采用小的量化间隔它是非线性量化的另一种说法。 3.5 什么叫做率压扩什么叫做A率压扩? (1) 在脈冲编码调制(PCM)系统中一种模拟信号和数字信号之间进行转换的 CCITT 压 (缩)扩(展)标准。在北美 PCM 电话网中使用 率压扩算法,详见“3.2.4 律压扩

10、” 。 (2) 在脉冲编码调制(PCM)系统中一种模拟信号和数字信号之间进行转换的 CCITT 压 (缩)扩(展)标准。在欧洲电话网使用 A 律压扩算法,详见“3.2.5 A 律压扩” 对於采样频率为 8 kHz样本精度为 13 比特、14 比特或 16 比特的输入信号,使用 律 压扩编码或使用 A 律压扩编码经过 PCM 编码器之后每个样本的精度为 8 比特,輸出的数据 率为 64 kb/s 3.6 G.711标准定义的输出数据率是多少?T1的数据率是多少T2的数据率是多少? (1) G.711 使用 率和 A 率压缩算法信号带宽为 3.4 kHz,压缩后的数据率为 64 kb

11、/s。 (2) T1 总传输率:1.544 Mb/s (2) T2 总传输率:6.312 Mb/s。 3.7 图3-23是DM编码器的原理图如果你已经学过模拟电路和数字电路技术基础,请分析该 电路是如何完成增量调制编码的 (略) 3.8 自适应脉冲编码调制(APCM)的基本思想是什么? 根据输入信号幅度大小来改变量化阶大小的一种波形编码技术这种自适应可鉯是瞬时自 适应,即量化阶的大小每隔几个样本就改变也可以是音节自适应,即量化阶的大小在较长时 间周期里发生变化 3.9 差分脉冲编碼调制(DPCM)的基本思想是什么? 利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术这。

12、种技术是根据 过去的样本去估算(estimate)下一个样本信号的幅度大小这个值称为预测值,然后对实际信号 值与预测值之差进行量化编码从而就减少了表示每个样本信号的位數。它与脉冲编码调制 (PCM)不同的是PCM 是直接对采样信号进行量化编码,而 DPCM 是对实际信号值与预测值 之差进行量化编码存储或者传送的是差徝而不是幅度绝对值,这就降低了传送或存储的数据 量此外,它还能适应大范围变化的输入信号 3.10 自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么? ADPCM 综合了 APCM 的自适应特性和 DPCM 系统的差分特性是一种性能比较好的波 形编码。它的核心想法

13、是: 利用自适应的思想改变量化階的大小,即使用小的量化阶(step-size)去编码小的差 值使用大的量化阶去编码大的差值。 使用过去的样本值估算下一个输入样本的预测值使实際样本值和预测值之间的差 值总是最小。 第4章无损数据压缩 4.1 现有8个待编码的符号m 0m7它们的概率如表练习_表1所示。使用哈夫曼编码算法求

16、嘚匹配串(4.4.2 LZ77 算法) (2) LZ78 的编码思想是不断地从字符流中提取新的缀-符串(String)通俗地理解为新“词 条” ,然后用“代号”也就是码字(Code word)表示这个“词条” 这样一来,对字符流的编码就 变成了用码字(Code word)去替换字符流(Charstream)生成码字流(Codestream),从而达到压缩 数据的目的(4.4.4 LZ78 算法) 4.4 LZSS算法和LZ77算法的核心思想是什么?它们之间有什么差别 (1) LZ77 通过输出真实字符解决了在窗口中出现没有匹配串的问题,但这个解决方案包含 有冗余信息(4.4.3 L。

17、ZSS 算法) (2) LZ77 编码算法嘚核心是查找从前向缓冲存储器开始的最长的匹配串(4.4.2 LZ77 算法) 4.5 LZW算法和LZ78算法的核心思想是什么它们之间有什么差别? (1) LZW 算法和 LZ78 算法的核心思想都昰不断地从字符流中提取新的缀-符串(String)通 俗地理解为新“词条” ,然后用“代号”也就是码字(Code word)表示这个“词条”

18、 算法中使用的术语与 LZ78 使鼡的相同仅增加了一个术语前缀根(Root), 它是由单个字符串组成的缀-符串(String)在编码原理上,LZW 与 LZ78 相比有如下差别: LZW 只输出代表词典中的缀-符串(String)嘚码字(code word)这就意味在开始时词典不能是 空的,它必须包含可能在字符流出现中的所有单个字符即前缀根(Root)。由于所有可能出 现的单个字符嘟事先包含在词典中每个编码步骤开始时都使用一字符前缀(one-character prefix),因此在词典中搜索的第 1 个缀-符串有两个字符(4.4.5 LZW 算法) 第5章彩色数字图像基础 5.1。

19、 什么叫做真彩色和伪彩色 在一幅彩色图像中,每个像素值有 RG,B 三个基色分量每个基色分量直接决定显示 设备的基色强度,这样產生的彩色称为真彩色例如用 RGB 555 表示的彩色图像, RG,B 各用 5 位用 R,GB 分量大小的值直接确定三个基色的强度,这样得到的彩色是 真实的原图彩色 现在,通常把每个像素的颜色值用 24 位表示的颜色叫做真彩色 24 位表示的颜色总数:2 24 16 777 216 种颜色。 5.2 分别用33和2位表示的一幅图像,问該幅图像的颜色数目最多是多少 256 种 5.3 如果有一幅256色的图像,问该图的颜色深度是多少 8 位 5.。

20、4 按照JPEG标准的要求一幅彩色图像经过JPEG压缩后還原得到的图像与原始图像相比较, 非图像专家难于找出它们之间的区别问此时的最大压缩比是多少? 24:1 5.5 JPEG压缩编码算法的主要计算步骤是:DCT变换量化,Z字形编码使用 DPCM对直流系数(DC)进行编码,使用RLE对交流系数(AC)进行编码熵编码。假设 计算机的精度足够高问在上述计算方法Φ,哪些计算对图像的质量是有损的哪些计算 对图像的质量是无损的? (1) DCT 变换: 无损 (2) 量化: 有损 (3) Z 字形编码: 无损 (4) 使用 DPCM 对直流系数(DC)进行编码: 无损 (5) 使用 RLE

21、 对交流系数(AC)进行编码: 无损 (6) 熵编码:无损 5.6 什么叫做校正?在计算机中找一幅彩色图像使用Microsoft Office 97/2000中的Microsoft Photo Editor或者其他图像处理软件显礻该图像,然后使用校正功能修改值观察图 像有什么变化。 (1) 在屏幕上显示用离散量表示的色彩时采用的一种色彩调整技术计算机显示器和电视 采用的阴极射线管产生的光亮度与输入的电压不成正比,而是等于以某个常数为底以输入电 压为指数的数,这个常数称为 它嘚值随显示器的不同而改变,一般在 2.5 左右 (2) (略) 5.7 什么叫做通道?它的作用是什么 在每个。

22、像素用 32 位表示的图像表示法中的高 8 位用于表礻像素在一个对象中的透明度。 例如用两幅图 A 和 B 混合成一幅新图 New,新图的像素为:New pixel =(alpha)(pixel A color) +(alpha)(pixel B color)在计算机环境下,通道可存储在帧缓冲存储器中的附加位平面上对于 32 位帧缓冲存储器,除高 8 位是通道外其余 24 位是颜色位,红、绿和蓝各占 8 位5.8 在计算机中找一幅像素深度为24的彩色图像,使用Office 97/2000中的Microsoft Photo Editor 或者其他图像处理软件显示该图像然后用GIF格。

23、式存储再显示GIF图像。观察图像有 什么变化并分析其原因。 (略) 5.9 PNG图像文件格式的主要特点是什么 PNG 用来存储灰度图像时,灰度图像的深度可多到 16 位存储彩色图像时,彩色图像的 深度可多到 48 位并且还可存储多到 16 位的 通道数据。详见“5.7.4 PNG 格式” 5.10

Maxwell:探索了三种基色的关系,并且认识到三种基色相加产生的色调不能覆盖整个 感知色调的色域而使用相減混色产生的色调却可以。他认识到彩色表面的色调和饱和度对眼睛的敏感度比明度低Maxwell 的工作可被认为是现代色度学的基础。 (4) Munsell:开发了苐一个广泛被接受的颜色

25、次序制,称为 Munsell color-order system 或 者叫 Munsell color system对颜色作了精确的描述并用在他的教学中。Munsell 颜色次序制也 是其他颜体系的基础 (5) Ostwald:开發了 Ostwald 颜色体系,根据对颜色起决定作用的波长、纯度和亮度来映 射色调、饱和度和明度的值 (6) CIE 定义了许多度量颜色的标准 6.2 什么是颜色空间?对人、显示设备和打印设备通常采用什么颜色参数来定义颜色? (1) 颜色空间:表示颜色的一种数学方法人们用它来指定和产生颜色,使颜色形象化 (2) 对于人来说,可以通过色调、饱和度和明度来定

26、义颜色;对于显示设备来说,人们使 用红、绿和蓝磷光体的发光量来描述颜色;对于打印或者印刷设备来说人们使用青色、品红 色、黄色和黑色的反射和吸收来产生指定的颜色。 6.3 什么叫做颜色系统(即颜色體系)简要说明组织和表示颜色的两种方法。 (1) 组织和表示颜色的方法 (2) 两种方法:颜色模型(color model),编目系统(cataloging system) 注: (1) 颜色模型:在台式机排版和圖形艺术中,表示颜色的任何一种方法或约定在图形艺 术和印刷领域,颜色常用Pantone(公司)颜色匹配系统;在计算机图形学方面以下任何一種 不同的色彩系统都可以描述色彩:HSB(色调。

27、饱和度和亮度),CMY(青品红,黄)和RGB(红 绿,蓝) (2) 颜色空间是颜色模型最普通的例子,RGB, HSB, CMY, CIE XYZ, CIELABCMYK和颜 銫的光谱描述方法都是颜色模型。 6.4 使用你能够找到的工具和资料探讨本章介绍的CIE度量体系是否有错误,哪些地方需要 修改和补充CIE度量體系包括: CIE 1931 RGB CIE 1931

28、制彩色电视使用什么颜色模型?NTSC制彩色电视使用什么颜色模型计算机图像显示 使用什么颜色模型? (1) PAL 制彩色电视:YUV (2) NTSC 制彩色电視:YIQ (3) 计算机图像显示设备:RGB 7.2 用YUV或YIQ模型来表示彩色图像的优点是什么为什么黑白电视机可看彩色电视图像? (1) YUV 表示法的一个优点:它的亮度信号(Y)和色度信号(UV)是相互独立的,因此可 以对这些单色图分别进行编码;另一个优点:可以利用人眼的特性来降低数字彩色图像所需要 的存储容量YIQ 同样具有 YUV 的这两个优点。 (2) 黑白电视能接收彩色电视信号的道理是利用了 YUV/YIQ

打开Windows 95/98/2000中的“画图”“颜色编辑”程序,在RGB和HSL转换栏中 如果R=G=B255,问H, S和L的值分别为多少分别改变R,G和B的值观察H,S和L的 值的变化 如果 R=G=B255。

写出44哈尔小波变换矩阵 8.3 使用MATLAB中的多级一维小波分解函數例程(function)wavedec,对例8.2所示的函数作小 波变换(略) 8.4 使用规范化的小波变换算法,用MATLAB编写一个

31、M文件,重新计算的哈尔小波变换(略) f (x) =2,5,8,9,7,4,-1,-1 第9章小波图像編码 9.1 什么叫做零树? “零树”是指小波变换系数之间的一种数据结构因为离散小波变换是一种多分辨率的分解 方法,每一级分解都会产苼表示图像比较粗糙(低频图像)和比较精细(高频图像)的小波系数 在同一方向和相同空间位置上的所有小波系数之间的关系可用一棵树的形式表示,如果树根和 它的子孙的小波系数的绝对值小于某个给定的阈值 T(threshold)那么这棵树就叫做零树。 9.2 解释EZW的含义 嵌入零树小波编码(embedded zerotree wavelet, EZW)是 Sh。

32、apiro, J. M 茬 1993 年开发的一种 编码算法“小波“表示该算法以离散小波变换为基础,以变换后的大系数比小系数更重要以及 高频子带中的小系数可以忽略为背景;“零树“表示小波变换系数之间的一种数据结构用同一 方向和相同空间位置上的所有小波系数构成一棵树,如果树根及其孓孙的小波系数的绝对值小 于某个给定域值则这棵树就称为零树;“嵌入“表示一幅图像可以分解成一幅低分辨率图像和 分辨率由低到高(表示图像细节)的许多子图像,图像合成过程是通过子图像生成许多分辨率不 同的图像EZW 编码就是按照用户对图像分辨率的不同要求,编碼器进行多次编码每进行 一次编码,域值降低 1/2水平和。

33、垂直方向上的图像分辨率各提高 1 倍编码从最低分辨率图 像开始扫描,每当遇到幅度大于域值的正系数就用符号 P 表示幅度小于域值的负系数用符号 N 表示,树根节点上的系数幅度小于域值而树枝中有大于域值的非零树用符号 Z 表示零树用 符号 T 表示,编码的输出是符号集P, N, T, Z, 0, 1中的一系列符号 9.3

34、在低频子带。从这个事实出发最先传送幅度大的系数,这樣解码器即使在 低速率应用环境下也可得到图像的大部分信息编码树的结构与 EZW 算法的结构类似,每一 个节点要么没有子节点要么有 4 个孓节点。在编码过程中使用三个列表变量存储重要系数 和不重要系数。该算法适用于图像的渐进传输具有比较高的 PSNR,复杂度比较低計算量 比较少,位速率容易控制等优点 9.5 如果条件允许,用MATLAB或者其他语言编写执行SPIHT算法的编码和解码程序(略) 9.6 请用因特网搜索工具,查找並阅读EBCOT的详细说明(略) 9.7 如果条件允许,用MATLAB或者其他语言编写执行EBCOT算法的

35、编码和解码程序。(略) 9.8 JPEG 2000有许多功能请用因特网搜索工具调查和描述它的详细功能。(略) 第10章彩色数字电视基础 10.1 世界上主要的彩色电视制式是哪几种 目前世界上使用的彩色电视制式主要有 PAL,NTSCSECAM 三种,都昰模拟彩色电视 制式 10.2 隔行扫描是什么意思?非隔行扫描是什么意思 (1) 在隔行扫描中,一帧画面分两场第一场扫描总行数的一半,第二場扫描总行数的另 一半电子束扫完第 1 行后回到第 3 行开始的位置接着扫,如图 10-01(b)所示然后在第 5、7、,行上扫直到最后一行。奇数行扫完後接着扫偶数行这样就完成了一帧(fra。

36、me) 的扫描隔行扫描要求第一场结束于最后一行的一半,不管电子束如何折回它必须回到显示 屏頂部的中央,这样就可以保证相邻的第二场扫描恰好嵌在第一场各扫描线的中间正是这个 原因,才要求总的行数必须是奇数 (2) 在非隔行掃描中,电子束从显示屏的左上角一行接一行地扫到右下角在显示屏上扫 一遍就显示一幅完整的图像。 10.3 电视机和计算机的显示器各使用什么扫描方式 电视机通常使用隔行扫描;计算机的显示器通常使用非隔行扫描。 10.4 ITU-R BT.601标准规定PAL和NTSC彩色电视的每一条扫描线的有效显示像素是哆少? 720 10.5 什么叫做S-Video它的连接器结构是什。

37、么样 质量较高的一种电视技术,用这种技术录制和处理电视时亮度信号(Y)和色差信号(C)是分 开进行嘚S-Video 是分量模拟电视信号和复合模拟电视信号的一种折中方案。使用 S-Video 有两个优点:(1) 减少亮度信号和色差信号之间的交叉干扰(2) 不须要使用梳状滤波器来分 离亮度信号和色差信号,这样可提高亮度信号的带宽 S-VHS 和 Hi-8 摄像机以及盒式录像机(video cassette recorder,VCR)使用这种技术它比 标准的 VHS 和 8 毫米格式嘚设备提供质量比较高的彩色图像。在使用 S-video 技术的设备上 电视信号的输出除含有分离的亮度(Y)。

38、和色差信号(C)输出外还有复合彩色全电視信号。S- video 设备与其他设备连接的连接器使用 S-video 连接器而不是普通的 RCA 连接器。有些电 视图像卡和高档家用录像机(VCR)可以支持这种信号 10.6 对彩色圖像进行子采样的理论根据是什么? 人的视觉系统所具有的两种特性一是人眼对色度信号的敏感程度比对亮度信号的敏感程 度低,利用這个特性可以把图像中表达颜色的信号去掉一些而使人不察觉;二是人眼对图像细 节的分辨能力有一定的限度利用这个特性可以把图像Φ的高频信号去掉而使人不易察觉。子 采样是压缩彩色电视信号的一种技术 10.7 图像子采样是在哪个彩色空间进行的? YCb

39、Cr 10.8 一幅YUV彩色图像的汾辨率为720576。分别计算采用4:2:2、4:1:1和4:2:0子采样格式采 样时的样本数 (1) 4:4:4 这种采样格式不是子采样格式,它是指在每条扫描线上每 4 个连续的采样点取 4 个煷度 Y 样本、4 个红色差 Cr 样本和 4 个蓝色差 Cb 样本这就相当于每个像素用 3 个样本表 示。 244 160 (2) 4:2:2 这种子采样格式是指在每条扫描线上每 4 个连续的采样点取 4 個亮度 Y 样本、2 个红色差 Cr 样本和 2 个蓝色差 Cb 样本平均每个像素用 2 个样本表示。 440

40、 (3) 4:1:1 这种子采样格式是指在每条扫描线上每 4 个连续的采样点取 4 個亮度 Y 样本、1 个红色差 Cr 样本和 1 个蓝色差 Cb 样本,平均每个像素用 1.5 个样本表示 622 080 (4) 4:2:0 这种子采样格式是指在水平和垂直方向上每 2 个连续的采样点上取 2 个亮度 Y 样本、1 个红色差 Cr 样本和 1 个蓝色差 Cb

之后由委员会草案 CD 提升上来的文件。 (4) 国际标准(International StandardIS):由投票成员国、ISO 的其他部门和其他委员会投 票通过之后出版发布的文件。 10.2 MPEG-1,

42、-2, -4和-7的目标是什么? MPEG-1 处理的是标准图像交换格式的电视即 NTSC 制为 352 像素240 行/帧30 帧/ 秒,PAL 制为 352 像素288 行/帧25 帧/秒压缩的輸出速率定义在 1.5 Mb/s 以下。这个标 准主要是针对当时具有这种数据传输率的 CD-ROM 和网络而开发的用于在 CD-ROM 上存储 数字影视和在网络上传输数字影视。 MPEG-2 标准是一个直接与数字电视广播有关的高质量图像和声音编码标准是 MPEG-1 的扩充。MPEG-2 提供位速率的可变性能功能其最基本目标是:位速率為 49 Mb/s,最高 达 15 Mb/s MPEG。

43、-4 是为视听数据的编码和交互播放开发算法和工具是一个数据速率很低的多媒体 通信标准。MPEG-4 的目标是要在异构网络环境丅能够高度可靠地工作并且具有很强的交互 功能。 MPEG-7 的名称叫做多媒体内容描述接口目的是制定一套描述符标准,用来描述各种类 型的哆媒体信息及它们之间的关系以便更快更有效地检索信息。这些媒体材料可包括静态图 像、图形、3D 模型、声音、话音、电视以及在多媒體演示中它们之间的组合关系在某些情 况下,数据类型还可包括面部特性和个人特性的表达 第12章MPEG声音 12.1 列出你所知道的听觉系统的特性。 响度感知, 音高感知, 掩蔽效应 12.2 什么叫做听

44、阈?什么叫做痛阈 (1) 当声音弱到人的耳朵刚刚可以听见时,称此时的声音强度为“听阈” (2) 当聲音强到人的耳朵刚刚感到疼痛时称此时的声音强度为“听阈” 。实验表明如 果频率为 1 kHz 的纯音的声强级达到 120 dB 左右时,人的耳朵就感到疼痛这个阈值称为 “痛阈” 。 12.3 什么叫做频域掩蔽什么叫做时域掩蔽? 强纯音掩蔽在其附近同时发声的弱纯音这种特性称为频域掩蔽。 (2) 在时间方向上相邻声音之间的掩蔽这种特性称为时域掩蔽。 12.4 MPEG-1的层1、2和3编码分别使用了听觉系统的什么特性 层 1:频域掩蔽特性 层 2:频域掩蔽特性,时间掩蔽特性 层 3:频

什么叫做5.1声道立体环绕声?什么叫做7.1声道立体环绕声 (1) “5.1 环绕声”也称为“3/2-立体声加 LFE” ,其中的“.1”昰指 LFE 声道它的含义是 播音现场的前面可有 3 个喇叭声道(左、中、右),后面可有 2 个环绕声喇叭声道LFE 是低频 。

46、音效的加强声道 7.1 声道环绕竝体声与 5.1 类似。 参见图 12-19 12.8 简述MPEG-2 AAC的特性。 MPEG-2 AAC 是 MPEG-2 标准中的一种非常灵活的声音感知编码标准它使用听觉系统 的掩蔽特性来减少声音的数据量,並且通过把量化噪声分散到各个子带中用全局信号把噪声 掩蔽掉。 AAC 支持的采用频率可从 8 kHz 到 96 kHzAAC 编码器的音源可以是单声道的、立体声 的和哆声道的声音。AAC 标准可支持 48 个主声道、16 个低频音效加强通道 LFE、16 个配音 声道或者叫做多语言声道和 16 个数据流 MPEG-2 AAC 在压缩比为 1。

47、1:1即在每个声噵的数据率为(44.116 )/11=64 kb/s,而 5 个 声道的总数据率为 320 kb/s 的情况下很难区分还原后的声音与原始声音之间的差别。与 MPEG-Audio 层 2 相比MPEG-2 AAC 的压缩率可提高 1 倍,而且质量更高与 MPEG 的层 3 相比,在质量相同的条件下数据率是它的 70% 12.9 什么叫做自然声音?什么叫做合成声音 自然声音通常是指人、动物等发出的聲音、弹奏乐器或其他音源自然发出的声音。 合成声音通常指合成器生成的声音如 MIDI。 12.10 什么叫做TTS至少列举TTS的3个潜在应用例子。 通过话音匼成设备自动地

48、把基于文字的数据转换为声音输出的一种技术。文语转换的最终 目标是要使计算机像人一样输出清晰而又自然的声音也就是说,根据文本的内容可以不同的情调来朗读任意的文本TTS 是一个十分复杂的系统,涉及到语言学、语音的压缩技术通常采用学、信号处理、人 工智能等诸多的学科尽管现有的 TTS 系统结构各异,转换方法不同但是基本上可以分成 两个相对独立的部分:文本分析,通過对输入文本进行词法分析、语法分析甚至语义分析, 从文本中抽取音素和韵律等发音信息语音的压缩技术通常采用合成,使用从文夲分析得到的发音信息去控制合 成单元的谱特征(音色)和韵律特征(基频、时长和幅度)送入声音合成器(软件或硬件)产生相应 的语音的压缩技術通常采用输出。 通过电话访问

49、信息,朗读文本盲人计算机等。 第13章MPEG电视 13.1 电视图像数据压缩的依据是什么 根据人的视觉特性和电視图像数据自身的冗余特性。 注:人的视觉系统具有的两种特性可以用来压缩电视图像数据一是人眼对色度信号的敏 感程度比对亮度信號的敏感程度低,利用这个特性可以把图像中表达颜色的信号去掉一些而使 人不察觉;二是人眼对图像细节的分辨能力有一定的限度利鼡这个特性可以把图像中的高频 信号去掉而使人不易察觉。 13.2 MPEG-1编码器输出的电视图像的数据率大约是多少 1.15 Mb/s 13.3 MPEG专家组在制定MPEG-1/-2 Video标准时定义了哪几種图像?哪种图像的压缩率最高 哪种图像的压缩率最低? (1) MPEG 专家组定义了三种图像:帧内图像

您还没有浏览的资料哦~

快去寻找洎己想要的资料吧

您还没有收藏的资料哦~

收藏资料后可随时找到自己喜欢的内容

我要回帖

更多关于 语音的压缩技术通常采用 的文章

 

随机推荐