软考笔记 - 多媒体
2022年5月左右的预测。
音频基本概念
A/D转换:采样–>量化–>编码。采样频率应为声音最高频率的2倍。采样精度由采样的二进制位数决定(8位二进制的精度是1/256)。
WAVE:保真度高,占据空间大;MP3:压缩格式,占据空间略小;MIDI:数字曲谱,保真度差,占据空间小。
图形图像和视频
图像的三要素:亮度(明暗)、色调和饱和度。
位图:像素点是基本单位;矢量图:动态绘制,图元是矢量图基本组成单位
真彩色与伪彩色(色彩查找表):真彩色记录像素点的RGB数值,伪彩色通过像素RGB数值查表得到颜色。直接色:通过对RGB分量进行查表变换。
色度信号/色差信号:RGB基色-亮度,可以降低采样的频率,减少数据量
计算相关
- 图像容量计算
每个像素16位,图像640 * 480像素,容量为$640\times480\times(16\div2)=614400\text{B}$
像素不变,256色图像,容量为$640\times480\times\log_2256=307200\text{B}$
- 音频容量计算
每秒容量 = 采样频率 * 量化/采样位数 * 声道数 / 8
- 视频容量计算
单位时间容量 = 每帧图像容量 + 每单位音频容量 / 总容量 = 每帧视频容量 * 每帧秒数 * 时间 + 单位时间音频容量 * 时间
使用150DPI的分辨率扫描2 * 4英寸的照片,可直接得到300 * 600像素的图像。
多媒体分类
- 感觉媒体:指直接作用于人的感觉器官,使人产生直接感觉的媒体。如:声音、图形、图像、动面等。
- 表示媒体:指为了加工、处理和传输感觉媒体市人为研究、构造出来的一种媒体,常见的有各种编码方式,如文本编码、图像编码和声音编码等。
- 显示媒体(表现媒体):表现和获取信息的物理设备。如:输入显示媒体键盘、鼠标和麦克风等;输出显示媒体显示器、打印机和音箱等。输入输出设备
- 存储媒体:存储数据的物理设备,如磁盘、光盘和内存等。
- 传输媒体:传输数据的物理载体,如电缆、光缆和交换设备等。
常见多媒体标准
MPEG-1:离散余弦,VCD、MP3
MPEG-4:多媒体传输集成框架,网络应用、可视电话、无线通信等
MPEG-7:多媒体内容描述接口,具备描述功能,不是编码标准
MPEG-21:标准集成,融合不同协议、制定新标准
JPEG-2000:有损&无损,压缩比更高,小波变换,医学图像应用
JPEG:有损,离散余弦,RGB转YUV
数据压缩技术
压缩的理论基础:编码存在冗余。
无损压缩,也称冗余压缩法或熵编码法;有损压缩,也称熵压缩法。
常见的无损压缩编码:变长编码(哈夫曼、香农-范诺、词典编码)、行程编码、算术编码
常见的有损压缩编码:预测编码、变换编码、基于模型编码、直接影射