音频
https://www.bilibili.com/video/BV1hg411V7Bm?p=25
1)基本参数
幅度
声波的振幅
以分贝(dB)为单位
频率
说话:300-3400Hz 带宽
人耳:20Hz-20kHz
乐器:20Hz-20kHz
次声波和超声波的频率是多少?
次声波 <20Hz
超声波 >20kHz
2)声音信号的数字化
数据传输率(bps)=采样频率(Hz)*量化位数(bit)*声道数
数字声音有两种:
波形声音:对实际声音的波形信号进行数字化(采样、量化)而获得,典型的是.wav
非波形声音:使用符号、脚本及模型对声音进行描述,用合成的方法重构声音信号
收集人声的时候一定要大于6800kHz,因为人说话最大是3400kHz,所以要是它的两倍,一定要超过6800kHz,目前所采用的话筒基本上设置的值是8000kHz
声音的大小不影响最终编码文件的大小
3)音频文件格式
(.wav):微软公司发布的音频文件格式,Windows 系统使用的标准音频文件格式。记录音乐的模拟信号的采样数值。为波形文件,质量高,数据量大。
(.mod):乐谱和乐曲使用的各种音色样本
(.mp3):最流行的音频文件格式
(.ra):网络上的音频格式,流媒体技术,强大压缩比和极小失真
(.mid):非波形采样点音乐格式,工业标准,文件非常小
(.voc):Create 公司发布的波形音频文件格式
(.snd):数字声音文件格式,支持压缩
(.aif):Apple 计算机上的音频格式
(.au):Unix 系统中的数字文件格式
常见音频格式:WAVE、SOUND、VOICE、MOD、MP3、Real Audio、CD Audio、MIDI等
考点
考点1:声音信号的数字化
以数字表示的声音在时间上是离散的,而模拟声音在时间上是连续的。
要把模拟声音转换为数字声音,就需在某些特定的时刻获取模拟声音,该过程称为()。
A、采样 √
B、量化
C、编码
D、模/数变换
考点2:音频的频率
数字话音的采样频率定义为8kHz,这是因为()。
A、话音信号定义的频率范围最高值小于4kHz √
B、话音信号定义的频率范围最高值小于8kHz
C、数字话音传输线路的带宽只有8kHz
D、一般声卡的采样处理能力只能达到每秒8k次
考点3:声音文件格式
以下文件格式中,()属于声音文件格式。
A、XLS
B、AVI
C、WAV √
D、GIF