音频编码器

16 音频编码器

介绍当前可用的音频编码器

aac

AAC(Advanced Audio Coding )编码器

当前原生(内置)编码器还处于实验阶段,而且只能支持AAC-LC(低复杂度AAC)。要使用这个编码器,必须选择 ‘experimental’或者'lower'

因为当前还处于实验期,所以很多意外可能发生。如果需要一个更稳定的AAC编码器,参考libvo-aacenc,然而它也有一些负面报告。

aac选项

b

 
设置码率,单位是bits/s,是自动恒定比特率(CBR)模式的码率

q

 
设置为可变比特率(VBR)模式。此选项仅用于ffmpeg命令行工具。库接口是`global_quality`

stereo_mode

 
设置立体声编码模式,可能值有:

 

 
‘auto’

 

 
在编码时自动判断

 
‘ms_off’

 

 
禁止中端的(即2.0声道,而不是2.1声道)编码,这时默认值

 
‘ms_force’

 

 
强制中端编码,即强制2.1声道 encoding.

aac_coder

 
设置AAC编码方法,可能值:

 

 
‘faac’

 

 
FAAC-启发方法.

 

 
这个方法是显示方法的简化实现版,它为频带能量比设置阀值,降低所有量化步骤找到合适的量化失真阀值,对低于频带阀值的频带进行编码

 

 
这种方法的质量稍微好于下面介绍的两回路搜索法,但很慢

 
‘anmr’

 

 
基于网格的ANMR(平均噪音Average noise to mask ratio)掩比方案

 

 
理论上它效果最好,但最慢

 
‘twoloop’

 

 
双环搜索(Two loop searching)法

 

 
该方法首先根据波段阀值量化并试图通过添或调整个别量化点减去一个特征值得到一个最佳组合

 

 
这种方法和FAAC方法质量相当,是默认值

 
‘fast’

 

 
固定量化法

 

 
该方法设置所有带定量化,这是最快的方法,但质量最差

ac3和ac3修订版

AC-3音频编码器

这一编码器定义在 ATSC A/52:2010 和ETSI TS 102 366,以及RealAudio 3 (通过dnet)

AC3编码器使用浮点运算,而ac3_fixed编码器仅用定点整数的数学运算。这并不意味着一个人总是更快,只是一个或另一个可能更适合一个特定的系统。浮点编码通常会产生一个给定的比特率,更好的音频质量。ac3_fixed编码器没有任何输出格式的默认编码,所以它必须显式使用选项-acodec ac3_fixed指定。

AC-3元数据

AC-3元数据选项用于设置音频参数的描述,它们大多数情况下不影响音频编码本身。这些选项不直接影响比特流或影响解码播放,只是提供信息。几个选项会增加音频数据比特输出流,从而影响输出质量。这将在下面的选项列表中注记出来:

下面文档介绍了几个公开文件文档:

AC-3元数据控制选项
  • -per_frame_metadata boolean

    允许每个框架的元数据。指定编码器应该检测每帧变化的元数据

    0

     
    初始化的元数据用于每帧(不再管变化,默认)

    1

     
    每帧都要检测元数据改变

AC-3中置混合水平
  • -center_mixlev level

    AC-3中置混合水平。该值决定编码时根据立体声产生中置音量的标准。它只会写入存在中置通道的输出中。该值为规模因子,有3个有效值:

    0.707

     
    应用-3dB增益

    0.595

     
    应用-4.5dB增益(默认值)

    0.500

     
    应用-6dB增益

  • -surround_mixlev level

    环绕混合水平。适用于环绕声道增益。它只会写入存在环绕声通道的输出中。该值为规模因子,有3个有效值:

    0.707

     
    应用-3dB增益

    0.500

     
    应用-6dB增益(默认值)

    0.000

     
    静默环绕声道(即没有环绕)

AC-3音频制作信息

音频制作信息描述了可选的混合环境信息,应用中要么都没有,要么同时有两个(即下面两个需要同时设置/或不设置)

  • -mixing_level number

    混合水平. 指定在环境中混合的峰值声压级(SPL-Specifies peak sound pressure level)。 有效值是80 - 111或者-1(表示未知)或不指定。 默认值为-1,但如果room_type不为默认值,则mixing_level不能为-1.

  • -room_type type

    空间类型。介绍了混音环境。是按大房间还是按小房间。如果没有指定mixing_level则写入默认值

    0 notindicated

     
    没有指定 (默认)

    1 large

     
    大房间

    2 small

     
    小房间

其他AC-3元数据选项
  • -copyright boolean

    版权指示。

    0 off

     
    不包含 版权(默认iansbaq)

    1 on

     
    版权信息

  • -dialnorm value

    对话常态化。表明对于低于平均值的音量保持原样(0dBFS)。 这个参数决定了匹配源的目标音量。值过小会导致相对于源没有变化。有效值为整数,范围为-31至-1,-31是默认值。 -dsur_mode mode

    杜比环绕模式。指定是否使用杜比环绕立体声信号。只对音频流是立体声的输出有效。使用了这个选项并不意味着实际处理会产生杜比环绕。

    0 notindicated

     
    未指定 (默认)

    1 off

     
    不采用

    2 on

     
    采用杜比环绕解码

-original boolean

 
原始流指示器。指音频是原始源而不是副本。

 

 
0

 
off

 

 
非原始源

 
1

 
on

 

 
原始源 (默认)

其他扩展比特流信息

这些扩展比特流选项都被定义在A/52:2010标准的附录D中。它分为2个部分(组)。如果组中任意一个参数被指定,则组中所有的值将以默认值写入到流中。如果mixing levels被设置,则对支持备用比特流语法( Alternate Bit Stream Syntax)的解码器将采用这个值以替代center_mixlevsurround_mixlev选项定义。

其他扩展比特流信息 第一部分
  • -dmix_mode mode

    优化立体声缩混模式。允许在Lt/Rt (杜比环绕)或者Lo/Ro (常规立体声) 作为优化立体声缩混模式

    0 notindicated

     
    未指定(默认)

    1 ltrt

     
    Lt/Rt 缩混优化

    2 loro

     
    Lo/Ro 缩混优化

  • -ltrt_cmixlev level

    Lt/Rt模式下中置混合层次。在Lt/Rt模式下解码器输出中置通道的增益

    1.414

     
    使用+3dB增益

    1.189

     
    使用 +1.5dB增益

    1.000

     
    使用 0dB

    0.841

     
    使用 -1.5dB

    0.707

     
    使用 -3.0dB

    0.595

     
    使用 -4.5dB 增益 (默认值)

    0.500

     
    使用 -6.0dB

    0.000

     
    禁用中置通道

  • -ltrt_surmixlev level

    Lt/Rt模式下环绕增益。在Lt/Rt模式下解码器输出环绕通道的增益

    0.841

     
    使用 -1.5dB

    0.707

     
    使用 -3.0dB

    0.595

     
    使用 -4.5dB 增益 (默认值)

    0.500

     
    使用 -6.0dB

    0.000

     
    禁用环绕通道

  • -loro_cmixlev level

    Lo/Ro模式下中置混合层次。在Lo/Ro模式下解码器输出中置通道的增益.

    1.414

     
    使用+3dB增益

    1.189

     
    使用 +1.5dB增益

    1.000

     
    使用 0dB

    0.841

     
    使用 -1.5dB

    0.707

     
    使用 -3.0dB

    0.595

     
    使用 -4.5dB

    0.500

     
    使用 -6.0dB 增益(默认值)

    0.000

     
    禁用中置通道

  • -loro_surmixlev level

    Lo/Ro模式下中置混合层次。在Lo/Ro模式下解码器输出环绕通道的增益.

    0.841

     
    使用 -1.5dB

    0.707

     
    使用 -3.0dB

    0.595

     
    使用 -4.5dB

    0.500

     
    使用 -6.0dB 增益(默认值)

    0.000

     
    禁用环绕通道

其他扩展比特流信息 第二部分
  • -dsurex_mode mode

    Dolby环绕EX模式. 标识是否使用Dolby环绕EX模式(7.1矩阵转5.1).使用了此选项并不意味着编码器将实际应用Dolby环绕EX模式

    0 notindicated

     
    未标识 (default)

    1 on

     
    Dolby环绕EX模式关闭

    2 off

     
    Dolby环绕EX模式打开

  • -dheadphone_mode mode

    杜比耳机模式。标识编码为杜比耳机(多通道矩阵合成为2个声道)使用这个选项并不意味着实际应用了杜比耳机模式。

    0 notindicated

     
    未标识 (default)

    1 on

     
    Dolby 耳机模式关闭

    2 off

     
    Dolby 耳机模式打开

  • -ad_conv_type type

    A/D(模数转换) 转换类型。标识音频需要HDCD A/D 转换。

    0 standard

     
    标准 A/D转换 (默认)

    1 hdcd

     
    HDCD A/D 转换

其他AC-3编码器选项

  • -stereo_rematrixing boolean

    Stereo 再混(Rematrixing)。通过Enables/Disables 来对应立体声输入。它是可选功能,通过选择左/右而当作立体声输出,从而提高输出效果。默认是启用的。因为该编码器会增加程序现象,所以只建议用于测试。

浮点AC-3编码特有选项

这些选项只在浮点AC-3编码时有效,整形AC-3时是不起作用的。

  • -channel_coupling boolean

    Enables/Disables通道的耦合。这是一个可选的音频选项,它从多个通道中获取高频带信息整合输出到一个通道中。这允许更多的比特位用于较低频率音频的同时保持足够的信息重建高频部分。这个选项对浮点AC-3来说主要用于测试或者提高编码速度。

    -1 auto

     
    由编码器选择 (默认)

    0 off

     
    禁用通道耦合

    1 on

     
    允许通道耦合

  • -cpl_start_band number

    耦合开始带。设置通道耦合的开始带,从1-15可选。如果设置的值大于通道数,则处理为需耦合最后通道减一。如果auto(自动)被设置,则开始带将根据码率、通道布局、采样率有编码器自动计算。如果通道耦合设置为禁用,则本选项失效。

    -1 auto

     
    由编码器 选择(默认)

flac

FLAC(自由低损失音频编码——Free Lossless Audio Codec)编码器

flac选项

下面是FFmpeg中flac编码可用选项

  • compression_level

    设置压缩级别,如果没有显式设置即采用默认值

  • frame_size

    设置各个通道的帧大小

  • lpc_coeff_precision

    设置LPC系数精度,有效值从1到15, 15是默认值

  • lpc_type

    设置第一阶段LPC算法

    ‘none’

     
    不采用LPC

    ‘fixed’

     
    整数LPC

    ‘levinson’ ‘cholesky’

  • lpc_passes

    用Cholesky分解LPC的次数

  • min_partition_order

    最小分区顺序

  • max_partition_order

    最大分区顺序

  • prediction_order_method

    ‘estimation’ ‘2level’ ‘4level’ ‘8level’ ‘search’

     
    强力搜索

    ‘log’

  • ch_mode

    通道模式

    ‘auto’

     
    自动模式,对每帧自动匹配通道

    ‘indep’

     
    通道独立编码

    ‘left_side’ ‘right_side’ ‘mid_side’

  • exact_rice_parameters

    是精确还是近似.如果设置为1表示精确,会减慢编码速度以提高压缩率。

  • multi_dim_quant

    多维量化。如果设置为1,那么第二阶段LPC应用第一阶段结果进行算法调整。这很慢,但可以提高压缩率

libfaac编码

libfaac 是AAC(Advanced Audio Coding)编码器的再封装

要使用它需要libfaac头文件和库存在配置。你还需要在编译ffmpeg时通过--enable-libfaac --enable-nonfree进行配置。

该编码器高质量版本参考[aacenc]

对更多信息,参考libfaac项目介绍http://www.audiocoding.com/faac.html/

libfaac相关选项

下面是ffmpeg工具编码时的可用选项

下面的选项适用于libfaac封装,faac-XXXX等效选项列在括号中

  • b (-b)

    设置ABR(平均码率),单位bits/s。如果码率没有特别指定,会自动匹配所选特性(属性配置)。 faac比特率单位是 kilobits/s.

    注意libfaac不支持CBR(Constant Bit Rate——固定码率),只支持ABR (Average Bit Rate——平均码率).

    如果VBR模式设置为允许,则本选项被忽略

  • ar (-R)

    设置音频采样率,单位Hz

  • ac (-c)

    设置音频通道数

  • cutoff (-C)

    设置截至频率。如果没有设置或者设置为0,则自动根据库计算。默认为0

  • profile

    设置音频特性(属性配置)文件

    下面的音频特性文件有效:

    ‘aac_main’

     
    主要的AAC (Main)

    ‘aac_low’

     
    低复杂度AAC (LC)

    ‘aac_ssr’

     
    可扩展采样 (SSR)

    ‘aac_ltp’

     
    长期预测(LTP——Long Term Prediction )

    如果没有指定则表示为‘aac_low’.

  • flags +qscale

    设置VBR(动态码率Variable Bit Rate)下的品质

  • global_quality

    设置VBR下的品质,其为一个数字或者lambda表达式

    仅仅在VBR模式,且 flags +qscale 被设置为有效才起作用。它将被FF_QP2LAMBDA转换成QP值,并应用于libfaac。QP值的范围为[10-500],越大品质越好

  • q (-q)

    允许VBR模式,但设置为负数值,则值作为双精度浮点数

    值应用于libface。值的可能范围是[10-500],数字越大QP值越高。

    选项只用于ffmpeg命令行,或者通过global_quality属性描述问中rs。

libfaac例子

  • 使用ffmpeg把一个音频转换为ABR 128kbps AAC编码格式流放置在M4A(MP4音频)文件中

    ffmpeg -i input.wav -codec:a libfaac -b:a 128k -output.m4a

  • 使用ffmpeg把一个音频转换为VBR AAC编码(采用LTP AAC)格式流放置在M4A(MP4音频)文件中

    ffmpeg -i input.wav -c:a libfaac -profile:a aac_ltp -q:a 100 output.m4a

libfdk aac ###libfdk-aac

libfdk-aac的再封装

该库只用于Fraunhofer FDK AAC 编码格式

要使用,必须有libfdk-aac有头和预配的库,并在编译ffmpeg时用配置选项--enalbe-libfdk-aac启用。这个库可能不兼容于GPL,如果你要使用GPL,你必须--enable-gpl --enable-nonfree --enable-libfdk-aac

这个编码器被认为品质高于 内置的[AACenc] 和[libfaac]

VBR编码可以通过 vbr 或者flags + qscale选项启用,它们是实验性质的,只适合于某些参数组合。

libfdk-aac 0.1.3或者更高版本支持7.1声道

更多信息请参考fdk-aac项目http://sourceforge.net/p/opencore-amr/fdk-aac/

libfdk-aac选项

下面是可用的一些选项:

  • b

    设置码率,如果未指定,则根据属性特性自动匹配

    如果工作于VBR模式,本选项被忽略、

  • ar

    设置采样率 (单位Hz).

  • channels

    设置通道数

  • flags +qscale

    可以调整品质,VBR (Variable Bit Rate)模式。注意 当vbr为正表示VBR模式被隐含启用

  • cutoff

    设置截止频率,如果没有设置或者为0,表示自动根据库计算默认为0

  • profile

    设置音频属性预设文件,可以有:

    ‘aac_low’

     
    低复杂度AAC(LC)

    ‘aac_he’

     
    高效率AAC (HE-AAC)

    ‘aac_he_v2’

     
    高效率AAC版本2 (HE-AACv2)

    ‘aac_ld’

     
    低延迟AAC(LD)

    ‘aac_eld’

     
    增强低延迟AAC (ELD)

    如果没有特别指定则为‘aac_low’.

下面是libfdk_aac私有选项

  • afterburner

    设置为1表示允许助力,否则为0,它可以增强品质,但要求更多处理能力。

    默认为1

  • eld_sbr

    1表示允许对ELD采样SBR (Spectral Band Replication-频带复制),否则为 0.

    默认为 0

  • signaling

    设置SBR/PS 指令方式

    接受下面的值:

    ‘default’

     
    选择含蓄信号模式 (默认明确为 hierarchical, 如果全局头设置为禁止,则隐式表达)

    ‘implicit’

     
    隐式向后兼容指令信号

    ‘explicit_sbr’

     
    明确为SBR, 隐式PS信号

    ‘explicit_hierarchical’

     
    明确为hierarchical信号

    默认为‘default’.

  • latm

    设为1表示输出LATM/LOAS封装数据,否则为0

    默认为0

  • header_period

    设置StreamMuxConfig 和 PCE 重复周期 (在帧上), 把LATM/LOAS包含着配置发送缓冲中

    必须为16bit的非负整数

    默认为 0.

  • vbr

    设置VBR模式,从1最低品质(但仍足够好), 5是最高品质。如果值为0表示禁用VBR,而是采用CBR(固定码率)

    当前只有 ‘aac_low’属性预设支持VBR

    VBR模式1-5代表的平均码率:

    ‘1’

     
    32 kbps/channel

    ‘2’

     
    40 kbps/channel

    ‘3’

     
    48-56 kbps/channel

    ‘4’

     
    64 kbps/channel

    ‘5’

     
    about 80-96 kbps/channel

    默认0.

libfdk_aac 例子

  • 转换为VBR AAC M4A

    ffmpeg -i input.wav -codec:a libfdk_aac -vbr 3 output.m4a

  • 转换为CBR 64k AAC,使用高效率AAC属性预设

    ffmpeg -i input.wav -c:a libfdk_aac -profile:a aac_he -b:a 64k output.m4a

libmp3lame

LAME (Lame Ain’t an MP3 Encoder) MP3 编码器封装

需要在编译时配置 libmp3lame 头和库,并且显式设置--enable-libmp3lame

参考libshine 这个整数修正MP3编码器(虽然质量较低)

libmp3lame选项

下面是支持的选项(lame-XXX等效选项列在括号中):

  • b (-b)

    设置码率CBR/ABR,单位为bits/s,LAME的码率为kilobits/s\

  • q (-V)

    设置VBR下的品质。它只用于ffmpeg命令行工具,对于库接口,使用global_quality

  • compression_level (-q)

    设置算法品质。通过0-9的参数,表示不同的品质,0最高但最慢,9最低但最快

  • reservoir

    为1(默认)表示允许bit池,否则为0. LAME 也是默认允许但可以被--nores覆盖

  • joint_stereo (-m j)

    1表示允许在(每帧)中编码L/R立体声或者mid/side立体声。默认为1 Default value is 1.

  • abr (--abr)

    为1表示允许ABR,lame --abr设置为一共的码率,这里只是表示采用ABR,码率还是由b设置

libopencore-amrnb

开放核心自适应多速率窄带(OpenCORE Adaptive Multi-RateNarrowband)编码器

需要相应的头和库进行编译,并利用 --enable-libopencore-amrnb --enable-version3以允许编译配置

是单声道编码器,常用于8k采样率,可以通过设置strict 到 unofficial或者更低来选用更低采样率

libopencore-amrnb选项

  • b

    设置码率,只有下面的码率被支持,设置为其他值将自动用最近的替代

    4750 5150 5900 6700 7400 7950 10200 12200

  • dtx

    设置为1表示允许连续传输 (产生少量噪音),默认为0

libshine

Shine整形Mp3编码的封装

Shine是一种整形MP3编码器,它在没有FPU(浮点协处理)的平台上可以更快更好,例如一些armel CPU或者一些电话或者平板上。但是不要期望获得更好的品质(与LAME或者其他产品级编码器比较)。同时,根据项目主页,该编码器可能并不提供给免费bug修正,代码是很久以前写的,已经有5年以上没有更新了。

只支持立体声和单声道,而且是CBR模式。

项目在(最后更新2007年)http://sourceforge.net/projects/libshine-fxp,我们的支持更新放置在github上的Savonet/Liquidsoap中,地址是https://github.com/savonet/shine

需要头和库支持,并需要配置--enable-libshine打开编译

参考[libmp3lame]

libshine选项

这个库封装支持如下选项,其对应的shineenc-XXXXX形式等效选项列在括号中

  • b (-b)

    设置CBR码率,单位bits/s ,shineenc -b 单位是kilobits/s

libtwolame

双Lame Mp2 编码器封装

编译需要头和库,并且显式打开--enable-libtwolame

libtwolame选项

下面是支持的选项,等效的libtwolame-XXX选项列在括号中

  • b (-b)

    设置CBR码率单位bits/s,twolame会扩展为以kilobits/s为单位。默认128k

  • q (-V)

    对VBR设置品质等级,从-50 至50,常见范围为-10-10.越高品质越好。只适用于ffmpeg命令行,接口需要使用global_quality.

  • mode (--mode)

    设置结果音频模式,允许如下参数:

    ‘auto’

     
    基于输入自动适配模式,选项默认值.

    ‘stereo’

     
    立体声

    ‘joint_stereo’

     
    Joint立体声

    ‘dual_channel’

     
    双声道

    ‘mono’

     
    单声道

  • psymodel (--psyc-mode)

    为1设置为psychoacoustic(心理声学)模式,接受-1到4的参数,越大效果越好,默认为3

  • energy_levels (--energy)

    为1设置能量扩展模式,否则为0(默认) (disabled).

  • error_protection (--protect)

    为1设置CRC错误保护,否则为0(默认)

  • copyright (--copyright)

    为1设置MPEG音频复制标志,否则为0(默认)

  • original (--original)

    为1设置MPEG音频原音标志,否则为0(默认)

libvo-aacenc

VisualOn AAC编码器

编译时需要头和库文件,以及利用配置选项--enable-libvo-aacenc --enable-version3打开

它类似于[原生FFmpeg AAC],可以处理多个源

libvo-aacenc选项

VisualOn AAC编码器只支持AAC-LC和最多2个声道,而且是CBR

  • b

    码率,单位秒

libvo-amrwbenc

VisualOn 自适应多速率宽带编码器

编译时需要头和库文件,以及利用配置选项--enable-libvo-amrwbenc --enable-version3打开

只支持单声道,通常为16000Hz采样,可以通过设置strict 和 unofficial来覆盖为更低采样

libvo-amrwbenc选项

  • b

    设置码率,单位bits/s,只允许下列参数,否则自动选取最接近的有效参数

    ‘6600’ ‘8850’ ‘12650’ ‘14250’ ‘15850’ ‘18250’ ‘19850’ ‘23050’ ‘23850’

  • dtx

    为1允许连续传输 (产生少量噪音),默认为0

libopus

libopus (Opus交互音频编码) 的封装

编译时需要头和库文件,以及利用配置选项--enable-libopus打开

libopus

更多选项可以通过opus-tools的 opusenc查询,下面仅仅是一些封装中支持的选项(对应的opusenc-XXXX选项列在括号中):

  • b (bitrate)

    设置码率,单位 bits/s, opusenc 中单位为kilobits/s.

  • vbr (vbr, hard-cbr, and cvbr)

    设置VBR模式,下面为有效参数,其等效于opusenc中对应参数:

    ‘off (hard-cbr)’

     
    使用CBR码率控制

    ‘on (vbr)’

     
    使用合适的动态码率(默认)

    ‘constrained (cvbr)’

     
    使用约束变比特率编码

  • compression_level (comp)

    设置集编码算法复杂度. 有效参数是0-10整数,0最快,但质量最差,10最慢,质量最好,默认为10

  • frame_duration (framesize)

    设置最大帧尺寸,或者帧对应毫秒时间。有效参数为: 2.5, 5, 10, 20, 40, 60,越小的帧延迟越低,但会降低编码率控制质量,尺寸大于20ms在低码率时有较有趣表现,默认20ms

  • packet_loss (expect-loss)

    设置预期分组丢失率,默认为0

  • application (N.A.)

    设置预期应用类型,下面为有效参数:

    ‘voip’

     
    有利于提高语音清晰度

    ‘audio’

     
    有利于音频输入,默认值

    ‘lowdelay’

     
    有利于低延迟模式

  • cutoff (N.A.)

    设置截止屏幕,单位Hz。参数必须是: 4000, 6000, 8000, 12000, 或者 20000(分别对应媒体带宽窄带、常规、宽带、超宽带和全频),默认为0,表示禁用cutoff。

libvorbis

libvorbis编码器封装

编译要求头文件和库,还需要专门用--enable-libvorbis以允许使用

libvorbis选项

下面的选项支持libvorbis封装。等效的oggenc-XXX选项部分列在括号中。

为了更多的了解libvorbisoggenc选项,请参考http://xiph.org/vorbis/http://wiki.xiph.org/Vorbis-tools,以及oggenc(1)手册

  • b (-b)

    设置ABR模式码率,单位bits/s。oggenc-b单位是kilobits/s.

  • q (-q)

    设置VBR的品质。选项参数是浮点数,范围-1.0至10.0,越大越好,默认‘3.0’.

    该选项只用于ffmpeg命令行工具,要在库中使用则需要global_quality

  • cutoff (--advanced-encode-option lowpass_frequency=N)

    设置截止频率,单位Hz,如果为0表示禁用截止频率。oggenc等效选项单位是kHz。默认值为‘0’ (表示不设置截止频率)。

  • minrate (-m)

    设置最小码率,单位bits/s. oggenc -m 的单位是kilobits/s.选项只在ABR模式起效

  • maxrate (-M)

    设置最大码率,单位bits/s. oggenc -M 的单位是kilobits/s. 选项只在ABR模式起效

  • iblock (--advanced-encode-option impulse_noisetune=N)

    设置负偏压(底噪偏置),选项参数是浮点数,范围-15.0-0.0。指示编码器花费更多资源用于瞬态,这样可以使得获得更好的瞬态响应。

libwavpack

wavpack的通过libwavpack的封装

当前只支持无损32位整数样本模式

编译要求头文件和库,还需要专门用--enable-libwavpack以允许使用

注意libavcoder原生编码器已支持wavpack编码,而不用使用这个扩展编码器了。相关参考[wavpackenc]

libwavpack选项

wavpack命令行工具相应选项都列在括号中:

  • frame_size (--blocksize)

    默认32768.

  • compression_level

    设置速度与压缩的平衡,允许下面的参数:

    ‘0 (-f)’

     
    快速模式.

    ‘1’

     
    常规模式 (默认)

    ‘2 (-h)’

     
    高质量模式

    ‘3 (-hh)’

     
    非常高质量模式

    ‘4-8 (-hh -xEXTRAPROC)’

     
    类似‘3’, 但允许扩展处理 enabled.

     

     
    ‘4’ 类似于 -x2 ‘8’类似于 -x6.

wavpack

wavpack无损音频压缩

是libavcodec的原生wavpack编码。这个编码也可以利用libwavpack完成,但现在看来完全没有必要。

参看[libwavpack]

wavpack选项

等效的wavpack命令行工具列在括号中

wavpack通用选项

下面是wavpack编码的通用选项,下面只介绍了个别特别用于wavpack的选项,其他更多选项参考[编码选项部分]

  • frame_size (--blocksize)

    对于这个编码器,参数范围128 至 131072。默认为自动检测(根据采样率和通道数)

    为了了解完整的计算公式,可以看libavcodec/wavpackenc.c

  • compression_level (-f, -h, -hh, and -x)

    这个选项同于libwavpack的语法

wavpack私有选项
  • joint_stereo (-j)

    设置是否启用联合立体声, 下列值有效:

    ‘on (1)’

     
    强制mid/side (中置和边)音频编码

    ‘off (0)’

     
    强制left/right音频编码

    ‘auto’

     
    自动检测

  • optimize_mono

    设置是否允许对单声道优化。此选项只对非单声道流有效。 可能值:

    ‘on’

     
    允许

    ‘off’

     
    禁止

时间: 2024-09-17 04:36:25

音频编码器的相关文章

iOS 通过(lame)将录制音频转换成Mp3

转载请注明出处,保留原帖地址及作者署名. Url:http://blog.csdn.net/ysy441088327/article/details/7392842#reply Author:余书懿 为了达到 iPhone 与 Android 实现音频互通. 那么Mp3格式的音频文件再好不过了. 至于能够转换成Amr 是最好,10秒 的 一个Amr文件 只有5K左右的大小. 非常适合移动设备的数据传输 这里主要用到lame,一款非常棒的Mp3音频编码器.    那么在转换之前呢? 就需要先录制好

[总结]FFMPEG视音频编解码零基础学习方法--转

ffmpeg编解码学习   目录(?)[-] ffmpeg程序的使用ffmpegexeffplayexeffprobeexe 1 ffmpegexe 2 ffplayexe 3 ffprobeexe ffmpeg库的使用视频播放器 1 ffmpeg库的配置 2 最简单的视频播放器 3 相关结构体的研究 ffmpeg库的使用音频播放器 1 最简单的音频播放器 ffmpeg库的使用一个真正的播放器ffplay 1 真正的播放器 ffmpeg库的使用编码 1 编码 2 转码 ffmpeg源代码分析 F

FFMPEG视音频编解码零基础学习方法

在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的"大神",有的是刚开始学习的初学者.在和大家探讨的过程中,我忽然发现了一个问题:在"大神"和初学者之间好像有一个不可逾越的鸿沟."大神"们水平高超,探讨着深奥的问题:而初学者们还停留在入门阶段.究竟是什么原因造成的这种"两极分化"呢?最后,我发现了问题的关键:FFMPEG难度比较大,却没有一个循序渐进,由简单到复

最佳的开源网络视频会议音频编码库:Speex

在网络视频会议开发领域,我们有许多开源的音频编码库可以供选择,如G.7x系列.ACC.AC3.Speex等音频编码库,但由于网络视频会议可能会在无QOS保证的网络中传输数据,所以不仅要求音频编码器可以传输实时的高质量的音频数据,还需要保证带宽足够小,满足不同带宽的需求.因此一些宽带的编码器,如ACC.AC3等,其传输需要较大的带宽,就很难适应网络视频会议的低带宽传输要求.Speex是一个基于CELP算法的开源编码器,其可以支持从窄带(2kb)到宽带(44kbs)的音频传输,最少的音频传输带宽可以

流媒体技术学习笔记之(六)FFmpeg官方文档先进音频编码(AAC)

  先进音频编码(AAC)的后继格式到MP3,和以MPEG-4部分3(ISO / IEC 14496-3)被定义.它通常用于MP4容器格式; 对于音乐,通常使用.m4a扩展名.第二最常见的用途是在MKV(Matroska)文件内,因为它比MP4更好地支持嵌入式基于文本的软字幕.本指南中的示例将使用扩展MP4和M4A. FFmpeg的可支持两个AAC-LC编码器(AAC&libfdk_aac)和一个HE-AAC(V1 / 2)编码器(libfdk_aac).的许可证libfdk_aac不与GPL兼

我的Android进阶之旅------>Android中编解码学习笔记

编解码学习笔记(一):基本概念 媒体业务是网络的主要业务之间.尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析.应用开发.释放license收费等等.最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范 标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了.所以豆丁上看不出所以然,从 wiki上查.中文的wiki信息量有限,很短,而wiki的英文内容内多,

最简单的视频网站(JavaEE+FFmpeg)

http://blog.csdn.net/leixiaohua1020/article/details/15811977/   本文记录一个最简单的视频网站系统.此前做过一些基于JavaEE中的 SSH (Strut2 + Spring + Hibernate)的网站系统,但是一直没有做过一个视频网站系统,所以就打算做一个"精简"的视频网站系统,以方便以后测试以及学习使用.本视频网站支持直播(通过RTMP实现)和点播(通过HTTP实现).为了保持精简,这个视频网站系统仅制作了网络视频的

Silk codec的一些资料

Skype表示它最近将开始向第三方开发人员和硬件制造商提供免版税认证(RF)的Silk宽带音频编码器. Silk下载地址如下 http://developer.skype.com/silk/SILK_SDK_SRC_v1.0.7.zip Silk标准下载地址如下 http://tools.ietf.org/html/draft-vos-silk-01 Silk的一些文档 http://developer.skype.com/silk Silk简介 SILK最早在Windows版Skype的4.0

FFmpeg 维基百科

FFmpeg是一个自由软件,可以运行音频和视频多种格式的录影.转换.流功能[1],包含了libavcodec ─这是一个用于多个项目中音频和视频的解码器库,以及libavformat--一个音频与视频格式转换库. "FFmpeg"这个单词中的"FF"指的是"Fast Forward"[2].有些新手写信给"FFmpeg"的项目负责人,询问FF是不是代表"Fast Free"或者"Fast Four