语音模块有哪些语音格式呢?【广州唯创】
2020-12-18 20:50:25
声音一直是人类生活中不可缺少的,好的声音就像歌声更是人类的精神食粮。就拿语言模块来说,语言模块具有播放功能和储藏功能的录音芯片模块,想在不失真的情况下播放复杂多样的声音,良好的语言格式很重要。下面广州唯创给大家分享下有哪几种语言模块格式。
PCM文件格式:
PulseCodeModulation单脉冲编号解调,取样声音模拟信号获得量化分析后的视频语音统计数据,是最基本的最初的视频语音文件格式。与此相似的是RAW文件格式和SND文件格式。他们都是纯语音格式。
WAV文件格式:
WaveAudioFiles是微软公司开发设计的这种声音格式文件,也称为波形声音文件,广泛支持Windows服务平台和手机应用。WAV格式支持多种压缩算法,支持多种音位、采样频率和通道。但而,WAV格式需要太多的存储空间来促进通信和传输。wav文件中存储的每个数据都有自己的识别信息,根据这些识别信息,可以向用户传递样品的频率和位数,单个或立体声等。
ADPCM格式:
使用过去的几个样本值预测当前输入的样本值,将自适应预测功能与实际检测值进行比较,自动量化测量差值,始终与信号同步变化。适用于语音变化率适中的情况,语音回放过程较短。其优点是真实处理人的声音,一般达到90%以上,广泛应用于电话通信领域。
MP3格式:
MovingPictureExpertsGroupAudioLayerIII,简称MP3。编码时,首先分析音频文件的频谱,通过滤波器过滤噪音电平,然后将剩下的各个比特分散量化排列,最后形成压缩比高的mp3文件,压缩后的文件在播放时可以接近原始声源的声音。其本质是vbr(VariantBitrate可变性波特率)可以根据编号内容动态选择合适的波特率,因此编号的结果是确保音色并照顾文件的尺寸。MP3的压缩率是10到12倍。首先出现的高压压缩率的声音格式。
Linear Scale文件格式:
根据声音的变化率尺寸,将声音分为几个部分,缩小第一部分的线形占有率,但其占有率可变。
Logpcm文件格式:
大部分对所有声音进行线性缩小,最终去除几个位置。这种缩小方法在硬件配置上非常容易确立,但音色比LinearScale差,在声音小的声音细致的情况下实际效果弱。主要用于pure speech。