1. 已开始编码得到的aac长度为什么是4
答:
第疑问:版nero aac确实使用MPEG-4 AAC所扩展名使用m4a
第二疑问:看哥曾编码MPEG-2 AACMPEG-4 AAC绝部比使用像霍夫曼编码、相关立体声、声道耦合、反向自适应预测、域噪声整形、修离散余弦变换(MDCT)、及混合滤波器组都极其相同所包含MPEG-2 AACAAC扩展名并编码
第三疑问:软件没该选项
第四疑问:使用千千静听转换先安装千千静听再安装neroaac组件(要用千千静听版本)配置文件勾选导ISO 13818-7 aac轨道转换
另外我额外说几句阁提问奇妙MPEG-4 AACMPEG- 2 AAC整合并且追加特性音质更看着aac缀名流口水用aac扩展名吧
并且m4a文件改名aac或者mp4播放
理解mp4封装高层m4amp4部aacm4a部
使用扩展名m4a才王道宗高品质aac音频
另外我51AAC高品质音乐论坛位版主欢迎论坛
2. 请问什么是脉冲,什么是音频
脉冲就是脉博的跳动冲击形成的波形,可以分为好多种,可以控制模拟电路和数字电路,大多常见的是汽车的里程脉冲和变频器的PAM控制。
我们自以为知道什么是音频,可是我们所知道的音频将要永远改变了。当然,很多变革宣布了,却从未到来(有的到来了却未曾宣布)。在音频国度中,MPEG-4音频也许只是一个偏远的小省。另一方面,通信技术正在以我们5年或10年前根本无法想象的方式,改变我们的生活。我们所知道的音频(包括MP3和其它数据压缩格式)最后也许成了一种少数人的消遣。
在探讨这个话题前,不妨先介绍一点有关MPEG-4的知识及其与视频的关系。首先,根本就不存在MPEG-3—MPEG-2已包括了原来准备用在MPEG-3上的一些特征。其次,MP3是MPEG-1与MPEG-2的一个声音分量,根本就不存在“MP4”。
各种各样MPEG系统的基本思想都是以节省带宽和满足数据存储要求的方式编码音、视频信号的。我还记得,当我第一次知道可以用相当于4比特编码准CD质量音频时,我最初的反应是表示怀疑。MP3现在用约1.6比特就达到了这一目标!MP3使因特网传送音频成为可能。若非如此,音频将是因特网的陌路人,唱片公司可能还在睡大觉。MPEG-2使奇妙的DVD视频获得了成功,并很快普及开来。但是还有一个潜在的要求,即要求传送更多的内容,尤其是下一代移动电话技术,它可使小小的手机能访问因特网,包括视频流,在未来的几年内,这项技术将会以不可思议的速度发展起来。虽然移动电话的带宽将增加,但还必须进一步压缩音视频数据,这就导致了对MPEG-4的要求。
最重要的是想提醒大家,MPEG-4不是MPEG-2的替代品。它有完全不同的功能。我之所以说“最重要”,是因为MPEG-4有可能被许多人误解成是MPEG-2的替代品,而且因为MPEG-2的流行,有人会说:“我们对MPEG-2现在这个样子很满意了”。MPEG-2有着一个长远和确信无疑的未来。MPEG-4将不会替代MPEG-2现有的任何功能。
自然音频
MPEG-4 巧妙地把音频分为两类:自然音频和结构性音频。自然音频是我们所知道的,包括MP3和其它数据压缩格式的音频。结构性音频是我们完全不熟悉的东西,甚至是吓唬人的东西。让我们先从原始概念着手吧。
过去10年中最时髦的一个词是“可缩放性”。如果一个系统不能够缩放,你就可能同时拥有好几个互不兼容的系统。在音频或视频术语中,可缩放系统意味着可将信号传送到一台便宜的接收机(也许主要是用纸板制作的一次性手机),该机将拾取信号的低带宽部分,或基本层。可是,传输包含了更多的层—增强层,这时可用较高级的接收机来提供更好的质量。我们将它与同步广播做个比较,同步广播是从电视还没有像样的立体声伴音开始的,有时广播活动要通过电视和立体声调频广播同时进行。假如带宽有守护神的话,他肯定会高兴地看到肆意挥霍带宽的日子结束了。(带宽是否用得合理或者被浪费主要取决于内容,但那又是另外的话题了)。
自然音频又被细分为一般性音频和语音。例如,一般性音频可能是音乐,它需要的带宽显然比语音高,因为往往主要传送的是其信息内容。对于最高质量信号来说,即从“超过AM”到“透明”(对音频专业人士和其它苛求的听众来说可能更像是半透明的),可通过某些附加物使用高级音频编解码器(MPEG-2 AAC)—它作为标准MP3的一种增强型,面世已有一段时间了。这里涵盖了每声道16kb/s至64kb/s以上的比特率。MP3和MPEG-2 AAC系统丢弃了人耳不能听到的信息,只保留人耳朵可以听到的信息。有些方面是容易理解的,值得在这里提一下,因为里面包含了更复杂的技术。
1.联合立体声编码用于双声道中立体声信号常包含基本相同数据的场合。例如,立体声像中最重要的信号将受益于MS编码,这里的S信号将传送很少的信息,因此可用很少的比特来描述。由此带来的一个有用的“副产品”是,双声道中的量化噪声是相关的,因此落在声像中心,而且大都被信号的M分量所屏蔽。
2.声强编码依赖人耳的相对不灵敏性定相2kHz以上信息。因此可按左、右求和和方向性信息对信号进行编码。声强编码是有损耗的,因此更适合于低比特率的应用。
3.时间噪声整形是AAC中的一个新特性,它影响那些可显著改变信息块中电平的语音等信号。再加上每个信息块中的量化噪声是恒定的,因此失真可被人听见。时间噪声整形随时间整形量化噪声,以减少这种影响。
4.支持知觉噪声置换技术的人认为,对人的听觉系统来说,一种噪声非常像另外一种噪声。因此,如果发现任何频带含有类似噪声的数据时(我差点要说“类似噪声的信息”,这二个词是完全矛盾的),则它能被本地产生的噪声替换。最近用这个办法把Limp Bizkit声轨数据压缩到千字节以下的说法完全是无稽之谈。
我们再来看看TwinVQ。它是一种适合普通音频信号(包括音乐在内)的编解码器,比特率非常低(每声道低于16kb/s)。TwinVQ提取AAC的比例因子和频谱数据,并应用了矢量量化(VQ)。到目前为止,还没有找到向我们作出合理解释的有效方法,所以我只能说编码效率比AAC高,它很好用,缺点是总是损耗一定量的主观音质。
语音编码原理比较好理解(我们现在把音乐排除在外,并脱离开一般性音频),虽然实用性和以前同样复杂。我们可以把人的发音声道比作是一个声源(喉)和一个滤波器(喉、嘴和唇等)。在HVXC (谐波矢量激励编码)和CELP (码激励线性预测编码)编解码器中,编码器和解码器中都有发音声道模型。先用编码器合成近似语音的信号。然后将其与原信号和产生的参数组进行比较。重复此程序优化合成器,并传输量化和压缩的参数。解码器将参数复原,并用它们操纵声道模型—这模型与从中提取它们的的模型类似。HVXC与CELP的比特率随信号要求而变。HVXC的比特率为2kb/s 或4kb/s,这个带宽肯定太小。CELP以低达200b/s的步长在3.85~23.8kb/s之间变化。HVXC与CELP具有可缩放性,因此他们在传输中是基本层,而TwinVQ或AAC则可能是增强层。
结构性音频
你可以视在网络空间里没有人能听见你的喊叫声。那么就继续发挥你的想象吧……
你可以把结构音频的起点设想成是从一家流行音乐预录伴音带专业公司买来的一个General MIDI文件。把这个文件装载到你的定序器中,接上你的GM模块,马上就能卡拉OK了。确实,预录伴音带不会与原版本一模一样,甚至不同的GM模块也有不同的声音,但它都是由同类乐器演奏的音乐(样版),至少音质没问题。想到这些容易,但大量的音频处理可能在几年内以极其相同的方式进行是相当不容易想到的。结构性音频对带宽问题采取完全不同的态度,它通过发送音频事件的描述,而不是音频事件本身的压缩数据型式,减少传送音频所需的数据量。
我们再回过头来看看相似的问题。声音可以通过熵编码器传送或压缩存储。这意味着冗余码的数量减少了或没有了,但有意义的数据完整无缺,重放时可以完全重新组合。DVD-Audio建议采用的Meridian Lossless Packing就是这样的一个例子。这个方法固然好,但我们多半生活在一个现实的环境中—难以获得充足的带宽。MPEG AAC是一个知觉编码器,它所依靠的人耳和大脑不能或根本不需要处理所有的音频信息,只要找到不必要的数据并将其弃之即可。前面提到的HVXC与CELP是基于模型的编解码器,它能分析和重新合成可能存在的各种声音类型的非常小的子集,也就是人语。所有这些系统的目的是去除冗余或重复的信息。但问题依然存在,怎样才能准确地确定哪些信息是多余的呢?以上举的General MIDI的例子采区的是不折衷的方法,这就是结构性音频的起点。在未受到数字化影响的传统声音中,可在钢琴上演奏“G”调。钢琴可以是Steinway, Bechstein, Bosendorfer或 Bluthner—甚至是 Yamaha的。钢琴演奏家可能是Askenazy, Brendel 或Bill Evans,音乐厅可在Royal Festival Hall, Wigmore Hall或 Camegie Hall。传声器可以用……,好了,我想你们明白我的意思了。但是MIDI型可将此压缩到三个字节的数据,然后用任意数量的GM模块的钢琴声学程序恢复这些数据。但丢失了好多内容。
General MIDI里面可能包含一个指向结构音频相关信息的指针,但它还远远不够。还是以钢琴为例子,例如结构音频可传送一种类属的“G”调,但然后编码描述能播放和记录音符的不同方式的各种参数。这事实上效率更高、更灵活了。简单的编解码器只能描述几种参数,如响度、踏板踩下去另一根琴弦是否发出共振声。较复杂一点的编解码器几乎包括了所有与音符有关的参数,可以对这些音符进行分析。结构音频可能的声调范围主要是编码器的职责,凭借有足够计算能力的解码器,任何人都可以欣赏到音质的提高。
结构音频出现已有相当一段时间,但似乎是有了MPEG-4,才开创了结构音频的时代。其工作方式是这样的:在MPEG-4 SA码流的开头有一个标题,其中包括一大段交响乐。这大段交响乐听起来就像是一顿新奇的早点麦片粥一样的一个好听名字,它以各种乐器的形态出现,但实际上是描述将演奏码流中包含的音乐的乐器的数据(实际上是乐器的算法表达)。这大段交响乐写成“SAOL”(结构化的音频交响乐语言)。例如,每种乐器包含一种发声器的物理模型,如钢琴的琴键。此外,乐器还可能包含取样数据及描述怎样演奏声音和变音的指令和参数。码流本身含有定时事件。它反过来与标题有关。比如,一个事件可能说明被拔琴弦的物理模式(在标题中被描述),现在开始稍加抑制地大声弹奏“A”调。或者可演奏管乐器的曲调,码流可能要求音调应该渐高,有些地方要奏出颤音。颤音的深度和频率也可被描述。这一点比General MIDI有所改进,在GM中,没有标出确切的声响,只是说“钢琴”或“长笛”。在结构音频中标出了确切的声响。SA长笛(当编程在SAOL中时) 有可能听起来不太逼真,但至少这是听众将感受的方式,是内容创作者想要的、至少是认可的方式。
这是需要考虑的一个重要概念。可是过去一直对General MIDI视而不见,认为它只是与音频领域里的一小部分有关的点缀,因此很难衡量出结构音频有多重要。但有两点我可以肯定。第一,带宽不会低得让人用不了。结构音频可在低至10b/s的带宽上传输内容,适用于气氛烘托或低音,并与自然音频开始替换处的至少10kb/s相应(不管怎样,10kb/s 以上的SA比特流可能开始超过了解码器硬件要求的处理能力)。第二,结构音频有可能成为一种全新的制作技术,与普通录音和MIDI定序完全不一样。不低估这个挑战是明智的。在极低比特率可达到高品质音频的可能性,以及对这种可能性产生的组合的艺术(不仅仅是技术)的理解,使结构音频本身就是一种新媒体。
新的音频媒体
我们现在可以做些思考,随着结构音频范围的扩大,要说的东西很多。但有些事实现在是可以确定的。
目前还不能把已有的唱片变为结构音频形式。想一想如果有一种工具能把双簧管从已混录成立体声的完整的交响乐唱片中抽出后是什么样子。也许将来能这么做,但目前还远远做不到。这就是说,结构音频制作必须从零开始。还是以管弦乐队为例,这就是说,可以把乐谱装载到一个理想化的SA编码器中,这个编码器已对所有常用管弦乐乐器编程,或许你可以买一个藏族的鼻笛,或其它罕见的乐器作为插件。然后编码器创作出与实际乐器相似的全部声音信息,并将其放入SA比特流的标题中,把音符和演奏时的表现力放入码流中。编码器的操作在技术上相当简单,在艺术上比较复杂。在码流被传送到解码器的预期过程中,听众听到的声音与创作者听到的一样,只是在收听链的最后模拟阶段才有了变化。请注意,不知是什么缘故,可能纯粹是为了节省带宽的缘故,管弦乐队和“真正的”音乐家多余了。获得合适的声音或声槽至关重要的流行音乐制作将发生彻底的改变。获得动听的声音并把它录制到磁带或硬盘上不再足够了。必须把声音当作SA乐器创作,然后将其编入比特流中。结构音频不会彻底消灭传统技术,传统技术还可以使用,这是勿庸置疑的。在可预见的将来,凡是未用结构音频录音的音频都不可能转换
3. 笑话征集
“爷爷这地方死人了!”“是吗,有吹喇叭的吗”“有。”“有唱歌的吗”“有。”“有哭的吗”“有,
好多人在哭。”“你哭了吗
”“没有,我们家也没有死人呀!
唐山安宝平新作
4. 如何判断硬件能否兼容
主板参数中有写着支持的CPU接口(LGA775支持大多数intel的cpu,AM2 940支持大多数的AMD的产品,还有其他一些接口,配合不同的CPU),主板要和接口相对应的CPU搭配。主板参数中还有支持的内存类型(DDR,DDRII667,533,800等),显卡类型(PCIE和VGA),硬盘接口(PATA和SATA)。确定主板支持的各类接口后就可以选择配置了。下面以实例讲解吧。
比如我想选AMD3600+x2这款CPU,其接口是AM2 940,所以要选相应的主板,于是选了块技嘉M55SLI-s4,其显卡插槽是PCIE的(大都是这种了),就选了块昂达7600GS 256M狂飚版。主板支持DDRII533,667,800,所以选了一条1G的金士顿DDRII667,在看看硬盘,SATA的,选希捷吧。就这样配好了一台兼容机。
楼上几位都说的有道理,可以参考大家的回答啦。打字很辛苦就给点分啦。
5. dsd光盘是什么意思它是不是5.1声道的意思
DSD光盘:
(Direct Stream Digital)数字音频技术:
由索尼和飞利浦公司共同合作开发。该技术是采用1bit(比特)A/D转换器及Sigma/delta调制器达成录音或编码。DSD制式的取样频率为2 .8224mhz,较传统式CD的44.lkhz取样频率高64倍。 这个频率表示量化是以每秒2.8224百万次速度处理,然后将1比特数据录在唱片上,虽然比特数目只是CD制式所用的1/16,但因取样频率高64倍,结果DSD的数据能力较CD大四倍,理论上,它可将频率范围扩展至1.4mhz左右。结果是整体的音效提升了。
同时因为DSD技术中又开发了所谓的"噪声整形电路"可进一步把可闻频带(0 ~ 20kHz)内的噪声进一步转移到20kHz以上的超音频范围中去,从而令DSD CD的信噪比高达120dB以上。
6. 谁有笑话给我来
今天在网吧玩CS,不远处有两个非主流在玩劲5,辟里啪啦的按键盘!我很不爽!
于是,我也开始按键盘!我使劲的按!用力的按!按得比他们还快!比他们还响!
他们不禁看了过来,我故意轻蔑地瞥了他们一眼!他们变了脸色,狠狠瞪了我一眼!我马上回瞪过去!
他们铁青着脸继续玩劲5,不过声响超过了我!
我岂会甘心?所以,我干脆直接用手掌拍键盘!使劲的拍!用力的拍!
那两个家伙一看也不打劲5了,开始拍键盘!声响又超过我了!
我又怎会罢休?马上用拳头击打键盘!使劲的打!用力的打!
那两人对视一眼也开始击打键盘!声响又超过了我!我不认输!一把扯下了键盘!直接扔在地上!我使劲的踩!用力的踩!
全网吧的人都向我报以最热烈的掌声!那两个非主流傻了,不知所措!
但是,在我挑衅的眼光打量下,他们也怒了!他们也一把扯下了键盘!扔在地上,踩了个稀巴烂!然后他们也挑衅的看着我!
这时候,网吧的网管们将他们团团围住!一个网管看了看被他们踩烂的键盘,一耳光就扇了过去!接着网管们一拥而上!将两个非主流一顿暴打!
最后,两个非主流躺在地上,其中一个非主流指着我虚弱的问:"你们怎么不打他?
一个网管一脚踢了过去:"人家是打CS的,自己带的键盘!"
一次·一架旅游飞机出故障,导致坠机,全机人都死了只剩下3个幸存者。。 有一个中国人 有一个日本人 有一个美国人, 他们出了 飞机的残骸后 发现他们正经过 一个荒漠 并且他们 一望无际 根本看不见沙漠的尽头,他们绝望了··不过还是一起走着·····因为这是唯一的希望。。。。。。他们走啊走啊走 忽然 带头的美国人 脚不小心踢到一个啤酒瓶,啤酒瓶中刷的飞出一个全身冒着白光的 俊男子··飘在空中,,当时3人以为出现幻觉 可是 男子却道:"我是一个神仙,被妖魔困在其中,谢谢你们救出我····我答应满足你们 每人3个愿望,,你们有什么愿望快说吧!"
日本人首先说道:我要10个海边别墅!!要在一起的!然后要100个美女 都钟爱于我!!!!!最后,让我回到我的别墅跟美女身边!!
说完,日本人刷的消失了~~~~
美国人见状,忙道:我要10亿美元 然后要成为一个有很高地位的人!!!!!最后让我回去!!!!
说完美国人 也瞬间消失了~~~~
中国人见此,乐呵呵的说道:我要30瓶二锅头30瓶白兰地30瓶茅台30瓶青岛啤酒!!!!
让后我在要30瓶二锅头30瓶白兰地30瓶茅台30瓶青岛啤酒··
最后嘛···························我让刚才回去的那两个人回来和我一起喝酒~~~~~~~~~~
神仙全身光芒一闪,各式各样酒刷刷掉落 到沙土之上···发出沙沙的声音······那两个人也瞬间回到了中国人旁边~~~~~~~~~
汗。。。。。。。
等两人回过神后··大哭~~~~
抱怨着中国人,诅骂着中国人。。。
痛恨自己为什么先回答。。。
3天后 酒喝完了。。
他们继续向前走,
忽然,远方的一个啤酒瓶引起了3人的注意。。美国人忙的 吧瓶子一踢 刷的出来一位美女神仙。。。
美国人日本人高兴的尖叫着,,眼泪不禁流了出来。。。
神仙又说满足每人3个愿望·····美日两人怕又出上次的差错排好顺序让中国人先说~
中国人毫不犹豫的道:首先,我要回到我的国家,
日本人美国人都暗喜。
然后我也要1亿美金,10座海边别墅。而且要一个美丽的,对我忠心的,贤惠的女孩子 和我共度终生。
美日两人听后更加欢喜了···暗骂:这中国人 真蠢竟然只要一个美女 要是我要1万个也没事啊~哈哈哈哈.......待他们坐着美梦时,
中国人道: 行了 你先走吧·这里没事了·····
········ 我的愿望也说完啦~!!!
望采纳,谢谢
7. 有关于数模的,怎么进行在线配置
数模转换就是将离散的数字量转换为连接变化的模拟量,实现该功能的电路或器件称为数模转换电路,
通常称为D/A转换器或DAC(Digital Analog Converter)。
我们知道数分可为有权数和无权数,所谓有权数就是其每一位的数码有一个系数,如十进制数的45中的4表示为4×10,
而5为 5×1,即4的系数为10,而5的系数为1, 数模转换从某种意义上讲就是把二进制的数转换为十进制的数。
最原始的DAC电路由以下几部分构成:参考电压源、求和运算放大器、权产生电路网络、寄存器和时钟基准产生电路,
寄存器的作用是将输入的数字信号寄存在其输出端,当其进行转换时输入的电压变化不会引其输出的不稳定。
时钟基准产生电路主要对应参考电压源,它保证输入数字信号的相位特性在转换过程中不会混乱,
时钟基准的抖晃(jitter)会制造高频噪音。
二进制数据其权系数的产生,依靠的是电阻,CD格式是16bit,即16位。所以采用16只电阻,对应16位中的每一位。
参考电压源依次经过每个电阻的电流和输入数据每位的电流进行加权求和即可得出模拟信号。
这就是多比特DAC。 多比特与1比特的区别之处就是,多比特是通过内部精密的电阻网络进行电位比较,并最终转换为模拟信号,
好处在于高的动态跟随能力和高的动态范围,但是电阻的精度决定了多比特转换器的精度,要达到24bits的转换精度,对电阻的要求高达0.000015,
即便是理想的电阻,其热噪音形成的阻值波动都会大于此值,多比特系统目前广泛采用的是R-2R梯形电阻网络,对电阻的精度要求可以降低,但即便如此,
理想状态的电阻达到的转换精度也不会达到 24bits,23bits已经是极限多比特系统的优点在于设计简单,但受制于电阻的精度,成本也高
单比特的原理:依靠数学运算的方法在CD的脉冲代码信号(PCM)中插入过取样点,插入7个取样点就是18倍过取样,
这些插入的取样点与原信号通过积分电路进行比较,数值大的就定为1,数值小的就定为0,原先的PCM信号就变成了只有1和0的数据流,
1代表数据流较密集,0代表数据流较稀疏,这就是脉冲密度调制信号(PDM),脉冲密度调制信号经过一个开关电容网络构成的低通滤波器,
1 就转换为高电压信号,0就转换为低电压信号,然后通过级联积分,最终转换为模拟信号。
插入取样信号会制造出许多高频噪音,所以还要经过一个噪音整形电路处理,将这些噪音推移到人耳听不到的频域。
1bit的优点在于转换精度不受制于电阻,转换精度可以超过24bits,成本也低,但是设计过取样和噪音整形的电路难度很大。
因为电阻在精密程度(光刻)和热噪音(材料)上对音质影响相对小些,而1比特的电容和积分电路对音质影响则相对大些对于CD的数据格式,
单从声音素质上应该说多比特优于1比特,多比特对16比特的CD信号直接进行转换,而单比特还要经过一个PCM信号转换为PDM信号的程序,还要经过开关电容的充放电过程,
虽然从理论上来说,最终得到模拟信号的速度和多比特相比不会慢到可以比较的程度,
但是实际听感上,单比特不如多比特听起来更有活力,单比特似乎要慢一点,中频厚一点,音色比较浓郁。
1bit始创于飞利浦,分为三派,
一派是以飞利浦为代表的比特流Bitsream,
一派是以松下为代表的MASH,但是MASH的创始者是NTT公司,
还有一派就是今天非常流行的Delta-Sigma.
Bitsream采用最传统的 三阶或四阶噪音整形,MASH (Multi Stage Noise Shaping)就是多级噪音整形,
它将最初的量化值与原信号的误差保留下来,下一次量化时先将上次量化值与误差从原信号中减去,这样重复数次,
可以将二进制信号变换为脉冲宽度调制(PWM)的信号(PWM和PDM几乎一样)还可以将量化制造的噪音推到甚高频段,从而减少可闻频段的噪音。
但是似乎只有松下公司大量采用这种技术。现在MASH已经很少见了,但从理论上来说它是很优秀的。
1987年,飞利浦公司首次推出采用数字比特流技术(Bitsream)的单比特DAC芯片,它为高性能低价格CD唱机的出现奠定了坚实的基础。
1991年9月推出的DAC-7将比特流技术发挥到淋漓尽致的地步,同时还保持了合理的价格。音响史上有众多采用DAC-7的名机。
如飞利浦的LHH-900R,800R,300R,951。
马兰士的CD-72,CD-17,CD-23。
麦景图的MCD- 7007。
先锋的早年旗舰PD-T07。
meridian的602/603,
还有几乎所有欧洲数字音源厂家如 Rotel,Altis,Deltec,Revox,Studer等都在其旗舰系统中采用DAC-7。
进入21世纪之后,TDA1547依然锋芒未减,目前世界上最高级的SACD唱机——马兰士的SA-1仍然采用DAC-7,令世人不得不对DAC-7再次侧目。
迄今为止,DAC-7仍然是飞利浦最高级的比特流DAC芯片。
在飞利浦的产品手册里,是这样评价DAC-7的;拥有顶级性能的双声道数字比特流DAC芯片,
1Bit数字模拟转换器专用,使用DAC-7可以轻而一举获得高保真的数字音频再生。
DAC-7非常适合用于要求高质量的CD和DAT播放器,或者用于数字放大器和数字信号处理系统之中。这样的评价非常中肯。
DAC-7包括TDA1547和SAA7350 ,因为过取样和噪音整形电路制造出的大量高频数字信号会对TDA1547中的模拟电路造成干扰和调制。
所以将配合TDA1547的三阶噪音整形和24倍过取样电路单独设计于SAA7350之中。这也是TDA1547成功的最关键之处。
现在飞利浦又对SAA7350加以全面改进,将数字滤波器也集成进来,新型号定为TDA1307,仍然是专门配合TDA1547的芯片。
不过TDA1547和TDA1307合起来叫DF7。
TDA1547采用了双极组合型金属氧化物半导体工艺。在数字逻辑电路方面,采用最佳的时钟频率,可以减少数字噪音的产生。
在模拟电路方面采用双极型晶体管,可以使运算放大器获得较高的性能。
在电源供应方面,TDA1547费尽心机,首先是模拟电路与数字电路分开供电,
在数字电路里面,高电平逻辑电路与低电平逻辑电路分开供电,并且都是左右声道独立供电。
内部总体结构方面,TDA1547采用双单声道设计,彻底分离,输出也是左右声道独立输出。
TDA1307可以接收16、18、20bits格式的信号,输出音频格式32bits。
内置接收界面,去加重滤波器,采用8倍过取样有限脉冲响应(FIR)滤波器,3阶或4阶可选型噪音整形电路。
标准型芯片信噪比达致当今最高的142dB,动态范围高达137dB。
马兰士的SA-1将DAC-7最完美的运用,它采用四片TDA1547和TDA1307构成全平衡电路。
模拟放大部分采用马兰士高级机型里大量使用的HDMA。
今天Delta-sigma 1bit非常流行,它包括两部分电路,一部分是Delta电路,它将量化后的信号与初始信号进行比较求差,这些插值信号接下来进入Sigma电路,
此电路将这些插值信号进行误差求和,然后与量化前的信号相迭加。然后再进行量化。
通常采用飞利浦开发的动态元素配对(DEM)量化技术,此种量化包含一个极高精度的电流源和多个1/2镜像电流源,由于集成电路最擅长镜像电流源电路,
所以对元器件精度的要求可以降低,提高了性价比。
量化以后的信号通过开关电容网络转换为模拟信号。
需要指出并非所有的Delta- sigma 转换都是单比特。Delta-sigma的优势在于它的高性价比,从而在中低档数字音源市场上非常流行。
即便是那些坚持采用多比特的厂家,中低价位也得采用Delta-sigma。
坚持使用Delta-sigma的恐怕非Crystal莫属,CRYSTAL的cs4390,4396在业界也有大量使用,
其中也不乏极品如mbl1611hr,
还有发烧天书A级的Meridian 506.20 、
Meridian 508.24、 Meridian 506.24
还有国内新德克的 DAC-1 。
CS4390于1998年6月发售,是CRYSTAL第一块Delta-sigma DAC芯片。
它是一块完整的立体声DAC解码芯片,信号先进入128倍内插值电路,然后经过128倍过取样Delta-sigma数模变化,
接着输出模拟信号和经过调制的基准电压, 最后进入一个超级线性的模拟低通滤波器。
其中Delta-sigma数模变换部分还没有采用飞利浦的DEM技术。
CS4390的信噪比为115dB,动态范围是106dB,总谐波失真加噪音为—98dB,转换精度为24bits,对时基抖晃敏感程度较低。
其后又在CS4390的基础上增加了音量控制,改名为CS4391。
一年以后的1999年7月,CRYSTAL推出CS4390的升级产品——CS4396,CS4396与CS4390最大区别之处就是采用了DEM技术,
CS4396也是一块完整的立体声DAC芯片,信号在经过内插值和Delta-sigma变换后,进入DEM程序块,然后通过开关电容网络,最后通过模拟低通滤波器,
输出级采用了高音质的差分电路。DEM的采用使CS4396的失真和噪音都有所降低,达到了—100dB,动态范围也提高到120dB,
转换精度还是24bits,最高取样频率升至192KHz,但是不在提供信噪比的参数。
同时推出的CS4397是在CS4396的基础上支持外接PCM(对应DVD-AUDIO)和DSD(对应SACD)内插式滤波器。
半年多以后,CRYSTAL公司又推出CS4396的升级产品——CS43122,
与CS4396不同之处一个是采用了第二代的DEM技术,
另一个是 Delta-sigma调制器不再采用1bit而采用了5bits三阶调制。
对于内插值电路也加以改进,达到了102dB的阻带衰减性能。CS43122与CS4396的性能参数基本一样,只有动态范围达到了122dB,这也是目前动态范围最高的DAC芯片。
2000年9月20日,CRYSTAL公司又推出CS4392,一款对应 DVD-AUDIO和SACD的DAC芯片,动态范围有114dB,总谐波失真加噪音为—100dB,
但是只OEM,暂不流通销售,每片售价仅2.8美元。
(注意CRYSTAL从头到尾都不在提信噪比,因为它的信噪比只有CS4390 达到了115dB)
日本的NPC公司同样以Sigma-Delta变换技术闻名于世,我们对NPC的高性能数字滤波器一定很熟,最出名的SM5842,乃是公认的极品。
同样 SM5865则是Sigma-Delta 极品解码芯片,虽然不为人知,但是在不久的将来,SM5865也会被公认为极品。
SM5865是今年2月份推出的,首先它是单声道芯片,内部是真真正正的全平衡电路,信号先经过插值电路,然后进入三阶多比特Sigma-Delta变换程序,
接着经过31级DEM量化,最后经过开关电容网络变为模拟信号,
SM5865的DEM量化级数极高且非常成功,从而使得量化导致的可闻频域噪音可以完全忽略,所以最后一级的模拟低通滤波可以省掉,从而得到理想状态的失真程度和噪音量。
SM5865是目前世界上失真最低噪音最小的DAC芯片,总谐波失真加噪音只有0.0003%,即— 110.5dB。
同时仍然做到了120dB的信噪比和117dB的动态范围,接受数据格式在20-24bits之间,最高取样频率也是192KHz,从而顺利登上今日DAC之王的宝座。
多比特DAC分为两大名家,一是UltraAnalog公司,另一个就是Burr-Brown公司。
大多数人对UltraAnalog可能会比较陌生,因为它在1998年12月被Wadia收购了,从此再也没有它的消息。但是它在DAC历史上的地位远非Burr-Brown可比,
使用 UltraAnalogDAC芯片有汇点(Conterpoint)的旗舰解码器 DA-10,
宝丽音Parasound的旗舰解码器 D/Ac-2000,
Mark Levinson的早年旗舰解码器 NO.30和 N0.30.5
还有日本静电耳机名厂Stax的起见解码器 DAC-x1,
KinergetICs 的高级解码器 kcd-55
而Manleylab、 Sonic Forntiers、Camelot、Entech、Aragon、Audio Synthesis 的旗舰解码器都采用UltraAnalog的芯片。
基本上采用UltraAnalog芯片的解码器都会是发烧天书的A级品。并且几乎1998年以前所有的美国顶级解码器都采用的是UltraAnalog的芯片。
虽然UltraAnalog的产品很好但是利润低,因为UltraAnalog只有这一种产品,对集成电路生产厂家来说这样根本无法维持下去,UltraAnalog 可以活到1998年就已经不错了,
Wadia将其收购以后,没有将UltraAnalog的技术资源吸收并转化。同时Wadia也认为 UltraAnalog是个包袱,渐渐地UltraAnalog香消玉陨了,
今天仍有UltraAnalog的死终派如 Manleylab、 Sonic Forntiers、Camelot、Entech、Aragon、Audio Synthesis仍坚持采用UltraAnalog的芯片,
可能库存还不少,Sonic Forntiers 还和UltraAnalog有合作关系。可能也生产UltraAnalog的芯片。
UltraAnalog公司是世界上第一家对时基抖晃加以仔细研究的厂家,同时UltraAnalog的产品时基抖晃也是世界最低,
UltraAnalog还提出一种可以大幅减少时基抖晃的数字音频信号接口界面。
1993年 UltraAnalog还发明了非常廉价的时基抖晃分析仪。
UltraAnalog的芯片主要是D20040,我们对其知之甚少,只知道是20bits的转换精度,内部是两个19bits的DAC并联而成。其他就不知道了。
相信再过10年,还有谁知道UltraAnalog?技术和商业绝对不是一会事。
Burr-Brown在今天的DAC芯片市场上份额甚大,声誉颇隆。Burr-Brown成立于1993年,和UltraAnalog一样是多比特的死终派,
建厂伊始推出PCM58,PCM63,也是好评如潮,但仍无法与UltraAnalog匹敌。
1995年推出PCM1702终于可以于 UltraAnalog一争高下,直到今天采用PCM1702的高级CD机也不在少数,
Linn在2000推出的Sondek CD机采用PCM1702售价高达20000美元,发烧天书评为A级。这之后沉寂4年,
1999年2月,推出多比特DAC的终极产品PCM1704。此时UltraAnalog已经被Wadia收购,渐渐式微。Burr- Brown也被TI(德州仪器)公司收购,
依托TI的强大实力,Burr-Brown得到了良好的发展,成为今日DAC芯片市场上的龙头老大。
PCM1702推出于1995年6月,当时市场上1bit声誉甚隆,Burr-Brown对1bit提出挑战,
Burr-Brown指出1bit插入取样点的做法会导致许多高频噪音的产生虽然这些噪音的频率比较高,但是仍有可能对可闻频域造成调制,
并且这些人为制造的噪音还需要噪音滤波器来消除,滤波器的加入对信噪比的衰减较大,低电平时响应也不够好而Burr-Brown认为信噪比这个特性几乎是最重要的特性。
多比特的唯一缺点就是过零失真,PCM1702采用了信号数值型(sign magnitude)结构完美解决了这一问题,
在1702内部互补并联了一对DAC,并联的好处一是提高了信噪比,二是提高了转换精度,1702内部并联了两个19bits的DAC,转换精度就是20bits。
这两个DAC共用一个参考电压,共用一个R-2R梯形电阻网络,梯形电阻网络的位电流源由双平衡电流级供应,确保位电流源具备完美的跟踪特性。
每个DAC内部都采用激光微调的钼铬电阻,确保高精度,两个DAC经过精确微调确保相位一致。最终两个 DAC的正负半周转换完美解决了过零失真。
而传统的R-2R形电阻数模转换则取得了高信噪比和低失真,还有近乎理想的低电平表现和高电流输出能力。
PCM1702的信噪比为120dB,这个数值直到现在也没有谁能打破,在当时更使人难以想象。1702的总谐波失真加噪音为—96dB,在当时也是非常好的特性。
PCM1704推出于1999年2月,是多比特DAC的终极产品,恐怕再也不会有多比特DAC超过它,
Burr-Brown用它最擅长的电阻制造工艺制造出了达致理想精度的电阻,从而得到了世界上最高精度的多比特DAC,高达23bits。两个并联之后达到24bits。
至于内部结构与PCM1702基本上没有差别。
1704的信噪比还是120dB,动态范围112dB(K级),总谐波失真加噪音为-101dB(K级)。
至1704后到现在,Burr-Brown再也没有推出比1704更高等级的多比特DAC,Burr-Brown也无法打破自己创造的记录,
2001年4 月30日,Burr-Brown推出新一代的顶级DAC—PCM1738,采用了先进层次结构型DAC,Burr-Brown也知道传统的多比特走到了尽头。
先进层次型结构先用一个24bits,八倍取样频率下工作的数字内插值滤波器对数字信号进行分流,分为上6bits信号,下18bits信号。
上6bits信号进行反向互补位移型二进制译码,转换为62级数字信号,下18bits信号则进行三阶15级Delta-sigma调制,
调制频率是取样频率的64倍,最终转换为4级数字信号,
然后两者相加为66级数字信号,再加上1级LSB信号,总共67级数字信号,
这67级数字信号然后通过数据加权平均(DWA)程序,以减少模拟元件不配对引起的噪音,
实际上DWA就是第二代的DEM。经过DWA处理后,最后进入电流型数模转换器,将二进制脉冲信号变为脉冲电流信号,
再由芯片外的运算放大器进行电流电压转换,并最终取得模拟信号。应该说这种DAC不是单比特也不是多比特,应该叫它电流脉冲型DAC。
PCM1738的信噪比和动态范围都是117dB,总谐波失真加噪音为-108dB,应该说胜过PCM1704,但它的价格远低于PCM1704(K级)的25美元,只要5美元。
Analog Device公司也非常擅长制作极品级的DAC芯片,象金嗓子从来都是只用Analog Device的芯片,
在DAC芯片的理论设计上,Analog Device拥有至高无上的地位,Analog Device早在1998年就发明了多比特Delta-sigma调制,
因为传统的单比特Delta-sigma调制,导致离散到连续的边界每步尺寸过大,从而对主时钟的稳定程度要求极高,
例如要想在可闻频域内达到100dB以上的信噪比,那么主时钟的时基抖晃不能大于10PS,可这是不可能的,所以高信噪比的取得必须放弃单比特Delta-sigma调制。
多比特Delta-sigma调制的缺点是不方便采用DWA程序,模拟元件引起的噪音无法避免,
如果采用DWA程序,那么要求输入信号的格式低于18bits,可是现在是24bits的天下。显然无法接受。
Analog Device另觅蹊径,采用了分段噪音整形技术解决了这一难题。而Burr-Brown则在一开始就将信号分流。
传统的单比特解码必须采用开关电容,并且大约每增加一比特的转换精度,电容就要增加四倍,
要知道每个电容都会制造噪音,并且大电容会对配合开关电容网络的运算放大器要求更高的转换速率,
所以采用开关电容网络的DAC芯片,高转换精度会造成一定限度的声音品质下降,如果设计不良,有可能越高的转换精度声音越差,听感上声音过于清丽以致声音单薄。
Analog Device采用电流脉冲型DAC,电流型DAC的脉冲电流输出上升与下降时间不平均,要采用一般的电压电流转换运算放大器会导致转换线性下降,对时基抖晃也很敏感,
Analog Device采用双回转零开关电路解决了。此技术是于SONY联合开发的,最早用于SONY的顶级ES系列。
因为电流脉冲型采用一个异常纯净的瞬间电流源,电流脉冲不会再有任何波纹,几乎可以等同于完美的方波。音质会非常纯净。
自1999年以后,Analog Device发现音响市场萎缩,于是转而对SHARC型通用DSP芯片的开发与研究,没有再对DAC作进一步的研究,
尽管如此,Analog Device在1998年推出的DAC芯片AD1853,仍旧是目前最高级的DAC芯片,丝毫不比PCM1738或SM5865差,虽然这些芯片都是 2001推出的,
但无论在性能还是技术上,AD1853都不差。
并且AD1853还是世界上第一块取样频率为192KHz的DAC芯片,它还是世界上对时基抖晃敏感程度最低的DAC芯片,
它的信噪比为120dB,动态范围是117dB,总谐波失真加噪音为—107dB,和SM5865相比应该说旗鼓相当,不分高下。
对于目前新兴的音频格式的DAC芯片也应该有所了解。
DVD-AUDIO格式仍然使用PCM编码,所以DVD-AUDIO的DAC解码芯片与CD的解码芯片原理相同,
只是要求更高的转换精度和取样频率以及输入格式宽度。
SACD就不同了,它在录制的时候,将输入的模拟信号经过Delta-sigma调制变为单比特取样频率为2822.4kHz的二进制数字信号,
并且这时的数字信号已经是脉冲密度调制信号(PDM),所以在进行单比特解码时不必再加取样点和噪音整形电路,
只要通过开关电容网络和模拟低通滤波器,就可以得到模拟信号。
所以电路非常简单,并且在数模转换级没有任何数字运算电路更没有时钟基准产生电路,也就不会有任何数字噪音的混入,声音的纯净度极高。
SONY的SACD机没有采用开关电容网络,而是采用了最高等级的电流脉冲型数模转换。
顺便提一下,CD信号也是先将输入的模拟信号经过Delta-sigma调制变为16比特取样频率为44.1kHz的二进制信号,然后还得经过一个数字抽选滤波器,
任何数字滤波器都会制造无法忽略的噪音,还有通频带内纹波和铃振的现象,降低了声音的纯度。
SACD无论是录制还是重放系统中都没有一个数字滤波器,而CD不仅在录制时还是在重放时都有,单比特系统还要再加一个内插取样点滤波器。
音质的纯度根本无法与SACD相比,SACD是现阶段声音纯度最高的记录媒体和重放系统,最接近与真实的声音。
目前世界上有三片SACD用的DAC芯片,
一是SONY的SACD机上用的DSD1700,由Burr-Brown公司制造。
二是NPC公司的 SM5866,
三是CRYSTAL的CS4392,但没有公开发售。
由于SACD考虑到要有现阶段最优秀的声音表现,所以一般都采用电流脉冲型数模转换电路,
这种电路一般都用分离元件构成,故DSD1700和SM5866 内部实际上主要就是模拟低通滤波器,
严格地说DSD1700和SM5866不是DAC芯片,而是模拟低通滤波器芯片。
DSD设计只能用于SACD系统,它的内部主要是四组模拟低通滤波器,分别是热端正向和反向滤波和冷端正向和反向滤波,
每组滤波器内部是8个三端无限脉冲响应滤波器。四组滤波器最终输出双差分电路。
DSD动态范围是110dB,信噪比是110dB,总谐波失真是—100dB,高频响应为100KHz(—3dB)。
NPC公司的SM5866推出于2000年9月22日,它可用于SACD和DVD-AUDIO系统。其内部资料没有公布。
它的信噪比为120dB,总谐波失真加噪音为—109dB,高频响应为100KHz(—1dB)。很明显要比DSD1700高一个级别。
8. 什么叫大小音频
什么是音频
我们自以为知道什么是音频,可是我们所知道的音频将要永远改变了。当然,很多变革宣布了,却从未到来(有的到来了却未曾宣布)。在音频国度中,MPEG-4音频也许只是一个偏远的小省。另一方面,通信技术正在以我们5年或10年前根本无法想象的方式,改变我们的生活。我们所知道的音频(包括MP3和其它数据压缩格式)最后也许成了一种少数人的消遣。
在探讨这个话题前,不妨先介绍一点有关MPEG-4的知识及其与视频的关系。首先,根本就不存在MPEG-3—MPEG-2已包括了原来准备用在MPEG-3上的一些特征。其次,MP3是MPEG-1与MPEG-2的一个声音分量,根本就不存在“MP4”。
各种各样MPEG系统的基本思想都是以节省带宽和满足数据存储要求的方式编码音、视频信号的。我还记得,当我第一次知道可以用相当于4比特编码准CD质量音频时,我最初的反应是表示怀疑。MP3现在用约1.6比特就达到了这一目标!MP3使因特网传送音频成为可能。若非如此,音频将是因特网的陌路人,唱片公司可能还在睡大觉。MPEG-2使奇妙的DVD视频获得了成功,并很快普及开来。但是还有一个潜在的要求,即要求传送更多的内容,尤其是下一代移动电话技术,它可使小小的手机能访问因特网,包括视频流,在未来的几年内,这项技术将会以不可思议的速度发展起来。虽然移动电话的带宽将增加,但还必须进一步压缩音视频数据,这就导致了对MPEG-4的要求。
最重要的是想提醒大家,MPEG-4不是MPEG-2的替代品。它有完全不同的功能。我之所以说“最重要”,是因为MPEG-4有可能被许多人误解成是MPEG-2的替代品,而且因为MPEG-2的流行,有人会说:“我们对MPEG-2现在这个样子很满意了”。MPEG-2有着一个长远和确信无疑的未来。MPEG-4将不会替代MPEG-2现有的任何功能。
自然音频
MPEG-4 巧妙地把音频分为两类:自然音频和结构性音频。自然音频是我们所知道的,包括MP3和其它数据压缩格式的音频。结构性音频是我们完全不熟悉的东西,甚至是吓唬人的东西。让我们先从原始概念着手吧。
过去10年中最时髦的一个词是“可缩放性”。如果一个系统不能够缩放,你就可能同时拥有好几个互不兼容的系统。在音频或视频术语中,可缩放系统意味着可将信号传送到一台便宜的接收机(也许主要是用纸板制作的一次性手机),该机将拾取信号的低带宽部分,或基本层。可是,传输包含了更多的层—增强层,这时可用较高级的接收机来提供更好的质量。我们将它与同步广播做个比较,同步广播是从电视还没有像样的立体声伴音开始的,有时广播活动要通过电视和立体声调频广播同时进行。假如带宽有守护神的话,他肯定会高兴地看到肆意挥霍带宽的日子结束了。(带宽是否用得合理或者被浪费主要取决于内容,但那又是另外的话题了)。
自然音频又被细分为一般性音频和语音。例如,一般性音频可能是音乐,它需要的带宽显然比语音高,因为往往主要传送的是其信息内容。对于最高质量信号来说,即从“超过AM”到“透明”(对音频专业人士和其它苛求的听众来说可能更像是半透明的),可通过某些附加物使用高级音频编解码器(MPEG-2 AAC)—它作为标准MP3的一种增强型,面世已有一段时间了。这里涵盖了每声道16kb/s至64kb/s以上的比特率。MP3和MPEG-2 AAC系统丢弃了人耳不能听到的信息,只保留人耳朵可以听到的信息。有些方面是容易理解的,值得在这里提一下,因为里面包含了更复杂的技术。
1.联合立体声编码用于双声道中立体声信号常包含基本相同数据的场合。例如,立体声像中最重要的信号将受益于MS编码,这里的S信号将传送很少的信息,因此可用很少的比特来描述。由此带来的一个有用的“副产品”是,双声道中的量化噪声是相关的,因此落在声像中心,而且大都被信号的M分量所屏蔽。
2.声强编码依赖人耳的相对不灵敏性定相2kHz以上信息。因此可按左、右求和和方向性信息对信号进行编码。声强编码是有损耗的,因此更适合于低比特率的应用。
3.时间噪声整形是AAC中的一个新特性,它影响那些可显著改变信息块中电平的语音等信号。再加上每个信息块中的量化噪声是恒定的,因此失真可被人听见。时间噪声整形随时间整形量化噪声,以减少这种影响。
4.支持知觉噪声置换技术的人认为,对人的听觉系统来说,一种噪声非常像另外一种噪声。因此,如果发现任何频带含有类似噪声的数据时(我差点要说“类似噪声的信息”,这二个词是完全矛盾的),则它能被本地产生的噪声替换。最近用这个办法把Limp Bizkit声轨数据压缩到千字节以下的说法完全是无稽之谈。
我们再来看看TwinVQ。它是一种适合普通音频信号(包括音乐在内)的编解码器,比特率非常低(每声道低于16kb/s)。TwinVQ提取AAC的比例因子和频谱数据,并应用了矢量量化(VQ)。到目前为止,还没有找到向我们作出合理解释的有效方法,所以我只能说编码效率比AAC高,它很好用,缺点是总是损耗一定量的主观音质。
语音编码原理比较好理解(我们现在把音乐排除在外,并脱离开一般性音频),虽然实用性和以前同样复杂。我们可以把人的发音声道比作是一个声源(喉)和一个滤波器(喉、嘴和唇等)。在HVXC (谐波矢量激励编码)和CELP (码激励线性预测编码)编解码器中,编码器和解码器中都有发音声道模型。先用编码器合成近似语音的信号。然后将其与原信号和产生的参数组进行比较。重复此程序优化合成器,并传输量化和压缩的参数。解码器将参数复原,并用它们操纵声道模型—这模型与从中提取它们的的模型类似。HVXC与CELP的比特率随信号要求而变。HVXC的比特率为2kb/s 或4kb/s,这个带宽肯定太小。CELP以低达200b/s的步长在3.85~23.8kb/s之间变化。HVXC与CELP具有可缩放性,因此他们在传输中是基本层,而TwinVQ或AAC则可能是增强层。
结构性音频
你可以视在网络空间里没有人能听见你的喊叫声。那么就继续发挥你的想象吧……
你可以把结构音频的起点设想成是从一家流行音乐预录伴音带专业公司买来的一个General MIDI文件。把这个文件装载到你的定序器中,接上你的GM模块,马上就能卡拉OK了。确实,预录伴音带不会与原版本一模一样,甚至不同的GM模块也有不同的声音,但它都是由同类乐器演奏的音乐(样版),至少音质没问题。想到这些容易,但大量的音频处理可能在几年内以极其相同的方式进行是相当不容易想到的。结构性音频对带宽问题采取完全不同的态度,它通过发送音频事件的描述,而不是音频事件本身的压缩数据型式,减少传送音频所需的数据量。
我们再回过头来看看相似的问题。声音可以通过熵编码器传送或压缩存储。这意味着冗余码的数量减少了或没有了,但有意义的数据完整无缺,重放时可以完全重新组合。DVD-Audio建议采用的Meridian Lossless Packing就是这样的一个例子。这个方法固然好,但我们多半生活在一个现实的环境中—难以获得充足的带宽。MPEG AAC是一个知觉编码器,它所依靠的人耳和大脑不能或根本不需要处理所有的音频信息,只要找到不必要的数据并将其弃之即可。前面提到的HVXC与CELP是基于模型的编解码器,它能分析和重新合成可能存在的各种声音类型的非常小的子集,也就是人语。所有这些系统的目的是去除冗余或重复的信息。但问题依然存在,怎样才能准确地确定哪些信息是多余的呢?以上举的General MIDI的例子采区的是不折衷的方法,这就是结构性音频的起点。在未受到数字化影响的传统声音中,可在钢琴上演奏“G”调。钢琴可以是Steinway, Bechstein, Bosendorfer或 Bluthner—甚至是 Yamaha的。钢琴演奏家可能是Askenazy, Brendel 或Bill Evans,音乐厅可在Royal Festival Hall, Wigmore Hall或 Camegie Hall。传声器可以用……,好了,我想你们明白我的意思了。但是MIDI型可将此压缩到三个字节的数据,然后用任意数量的GM模块的钢琴声学程序恢复这些数据。但丢失了好多内容。
General MIDI里面可能包含一个指向结构音频相关信息的指针,但它还远远不够。还是以钢琴为例子,例如结构音频可传送一种类属的“G”调,但然后编码描述能播放和记录音符的不同方式的各种参数。这事实上效率更高、更灵活了。简单的编解码器只能描述几种参数,如响度、踏板踩下去另一根琴弦是否发出共振声。较复杂一点的编解码器几乎包括了所有与音符有关的参数,可以对这些音符进行分析。结构音频可能的声调范围主要是编码器的职责,凭借有足够计算能力的解码器,任何人都可以欣赏到音质的提高。
结构音频出现已有相当一段时间,但似乎是有了MPEG-4,才开创了结构音频的时代。其工作方式是这样的:在MPEG-4 SA码流的开头有一个标题,其中包括一大段交响乐。这大段交响乐听起来就像是一顿新奇的早点麦片粥一样的一个好听名字,它以各种乐器的形态出现,但实际上是描述将演奏码流中包含的音乐的乐器的数据(实际上是乐器的算法表达)。这大段交响乐写成“SAOL”(结构化的音频交响乐语言)。例如,每种乐器包含一种发声器的物理模型,如钢琴的琴键。此外,乐器还可能包含取样数据及描述怎样演奏声音和变音的指令和参数。码流本身含有定时事件。它反过来与标题有关。比如,一个事件可能说明被拔琴弦的物理模式(在标题中被描述),现在开始稍加抑制地大声弹奏“A”调。或者可演奏管乐器的曲调,码流可能要求音调应该渐高,有些地方要奏出颤音。颤音的深度和频率也可被描述。这一点比General MIDI有所改进,在GM中,没有标出确切的声响,只是说“钢琴”或“长笛”。在结构音频中标出了确切的声响。SA长笛(当编程在SAOL中时) 有可能听起来不太逼真,但至少这是听众将感受的方式,是内容创作者想要的、至少是认可的方式。
这是需要考虑的一个重要概念。可是过去一直对General MIDI视而不见,认为它只是与音频领域里的一小部分有关的点缀,因此很难衡量出结构音频有多重要。但有两点我可以肯定。第一,带宽不会低得让人用不了。结构音频可在低至10b/s的带宽上传输内容,适用于气氛烘托或低音,并与自然音频开始替换处的至少10kb/s相应(不管怎样,10kb/s 以上的SA比特流可能开始超过了解码器硬件要求的处理能力)。第二,结构音频有可能成为一种全新的制作技术,与普通录音和MIDI定序完全不一样。不低估这个挑战是明智的。在极低比特率可达到高品质音频的可能性,以及对这种可能性产生的组合的艺术(不仅仅是技术)的理解,使结构音频本身就是一种新媒体。
新的音频媒体
我们现在可以做些思考,随着结构音频范围的扩大,要说的东西很多。但有些事实现在是可以确定的。
目前还不能把已有的唱片变为结构音频形式。想一想如果有一种工具能把双簧管从已混录成立体声的完整的交响乐唱片中抽出后是什么样子。也许将来能这么做,但目前还远远做不到。这就是说,结构音频制作必须从零开始。还是以管弦乐队为例,这就是说,可以把乐谱装载到一个理想化的SA编码器中,这个编码器已对所有常用管弦乐乐器编程,或许你可以买一个藏族的鼻笛,或其它罕见的乐器作为插件。然后编码器创作出与实际乐器相似的全部声音信息,并将其放入SA比特流的标题中,把音符和演奏时的表现力放入码流中。编码器的操作在技术上相当简单,在艺术上比较复杂。在码流被传送到解码器的预期过程中,听众听到的声音与创作者听到的一样,只是在收听链的最后模拟阶段才有了变化。请注意,不知是什么缘故,可能纯粹是为了节省带宽的缘故,管弦乐队和“真正的”音乐家多余了。获得合适的声音或声槽至关重要的流行音乐制作将发生彻底的改变。获得动听的声音并把它录制到磁带或硬盘上不再足够了。必须把声音当作SA乐器创作,然后将其编入比特流中。结构音频不会彻底消灭传统技术,传统技术还可以使用,这是勿庸置疑的。在可预见的将来,凡是未用结构音频录音的音频都不可能转换
9. 如果做小脸整形的话,要选择哪家整形医院比较好呢
刻变得忐忑不安起来,漂亮的眼睛看着她,低声道:“姐姐,你是觉得麻烦吗?