1. 已開始編碼得到的aac長度為什麼是4
答:
第疑問:版nero aac確實使用MPEG-4 AAC所擴展名使用m4a
第二疑問:看哥曾編碼MPEG-2 AACMPEG-4 AAC絕部比使用像霍夫曼編碼、相關立體聲、聲道耦合、反向自適應預測、域雜訊整形、修離散餘弦變換(MDCT)、及混合濾波器組都極其相同所包含MPEG-2 AACAAC擴展名並編碼
第三疑問:軟體沒該選項
第四疑問:使用千千靜聽轉換先安裝千千靜聽再安裝neroaac組件(要用千千靜聽版本)配置文件勾選導ISO 13818-7 aac軌道轉換
另外我額外說幾句閣提問奇妙MPEG-4 AACMPEG- 2 AAC整合並且追加特性音質更看著aac綴名流口水用aac擴展名吧
並且m4a文件改名aac或者mp4播放
理解mp4封裝高層m4amp4部aacm4a部
使用擴展名m4a才王道宗高品質aac音頻
另外我51AAC高品質音樂論壇位版主歡迎論壇
2. 請問什麼是脈沖,什麼是音頻
脈沖就是脈博的跳動沖擊形成的波形,可以分為好多種,可以控制模擬電路和數字電路,大多常見的是汽車的里程脈沖和變頻器的PAM控制。
我們自以為知道什麼是音頻,可是我們所知道的音頻將要永遠改變了。當然,很多變革宣布了,卻從未到來(有的到來了卻未曾宣布)。在音頻國度中,MPEG-4音頻也許只是一個偏遠的小省。另一方面,通信技術正在以我們5年或10年前根本無法想像的方式,改變我們的生活。我們所知道的音頻(包括MP3和其它數據壓縮格式)最後也許成了一種少數人的消遣。
在探討這個話題前,不妨先介紹一點有關MPEG-4的知識及其與視頻的關系。首先,根本就不存在MPEG-3—MPEG-2已包括了原來准備用在MPEG-3上的一些特徵。其次,MP3是MPEG-1與MPEG-2的一個聲音分量,根本就不存在「MP4」。
各種各樣MPEG系統的基本思想都是以節省帶寬和滿足數據存儲要求的方式編碼音、視頻信號的。我還記得,當我第一次知道可以用相當於4比特編碼准CD質量音頻時,我最初的反應是表示懷疑。MP3現在用約1.6比特就達到了這一目標!MP3使網際網路傳送音頻成為可能。若非如此,音頻將是網際網路的陌路人,唱片公司可能還在睡大覺。MPEG-2使奇妙的DVD視頻獲得了成功,並很快普及開來。但是還有一個潛在的要求,即要求傳送更多的內容,尤其是下一代行動電話技術,它可使小小的手機能訪問網際網路,包括視頻流,在未來的幾年內,這項技術將會以不可思議的速度發展起來。雖然行動電話的帶寬將增加,但還必須進一步壓縮音視頻數據,這就導致了對MPEG-4的要求。
最重要的是想提醒大家,MPEG-4不是MPEG-2的替代品。它有完全不同的功能。我之所以說「最重要」,是因為MPEG-4有可能被許多人誤解成是MPEG-2的替代品,而且因為MPEG-2的流行,有人會說:「我們對MPEG-2現在這個樣子很滿意了」。MPEG-2有著一個長遠和確信無疑的未來。MPEG-4將不會替代MPEG-2現有的任何功能。
自然音頻
MPEG-4 巧妙地把音頻分為兩類:自然音頻和結構性音頻。自然音頻是我們所知道的,包括MP3和其它數據壓縮格式的音頻。結構性音頻是我們完全不熟悉的東西,甚至是嚇唬人的東西。讓我們先從原始概念著手吧。
過去10年中最時髦的一個詞是「可縮放性」。如果一個系統不能夠縮放,你就可能同時擁有好幾個互不兼容的系統。在音頻或視頻術語中,可縮放系統意味著可將信號傳送到一台便宜的接收機(也許主要是用紙板製作的一次性手機),該機將拾取信號的低帶寬部分,或基本層。可是,傳輸包含了更多的層—增強層,這時可用較高級的接收機來提供更好的質量。我們將它與同步廣播做個比較,同步廣播是從電視還沒有像樣的立體聲伴音開始的,有時廣播活動要通過電視和立體聲調頻廣播同時進行。假如帶寬有守護神的話,他肯定會高興地看到肆意揮霍帶寬的日子結束了。(帶寬是否用得合理或者被浪費主要取決於內容,但那又是另外的話題了)。
自然音頻又被細分為一般性音頻和語音。例如,一般性音頻可能是音樂,它需要的帶寬顯然比語音高,因為往往主要傳送的是其信息內容。對於最高質量信號來說,即從「超過AM」到「透明」(對音頻專業人士和其它苛求的聽眾來說可能更像是半透明的),可通過某些附加物使用高級音頻編解碼器(MPEG-2 AAC)—它作為標准MP3的一種增強型,面世已有一段時間了。這里涵蓋了每聲道16kb/s至64kb/s以上的比特率。MP3和MPEG-2 AAC系統丟棄了人耳不能聽到的信息,只保留人耳朵可以聽到的信息。有些方面是容易理解的,值得在這里提一下,因為裡麵包含了更復雜的技術。
1.聯合立體聲編碼用於雙聲道中立體聲信號常包含基本相同數據的場合。例如,立體聲像中最重要的信號將受益於MS編碼,這里的S信號將傳送很少的信息,因此可用很少的比特來描述。由此帶來的一個有用的「副產品」是,雙聲道中的量化雜訊是相關的,因此落在聲像中心,而且大都被信號的M分量所屏蔽。
2.聲強編碼依賴人耳的相對不靈敏性定相2kHz以上信息。因此可按左、右求和和方向性信息對信號進行編碼。聲強編碼是有損耗的,因此更適合於低比特率的應用。
3.時間雜訊整形是AAC中的一個新特性,它影響那些可顯著改變信息塊中電平的語音等信號。再加上每個信息塊中的量化雜訊是恆定的,因此失真可被人聽見。時間雜訊整形隨時間整形量化雜訊,以減少這種影響。
4.支持知覺雜訊置換技術的人認為,對人的聽覺系統來說,一種雜訊非常像另外一種雜訊。因此,如果發現任何頻帶含有類似雜訊的數據時(我差點要說「類似雜訊的信息」,這二個詞是完全矛盾的),則它能被本地產生的雜訊替換。最近用這個辦法把Limp Bizkit聲軌數據壓縮到千位元組以下的說法完全是無稽之談。
我們再來看看TwinVQ。它是一種適合普通音頻信號(包括音樂在內)的編解碼器,比特率非常低(每聲道低於16kb/s)。TwinVQ提取AAC的比例因子和頻譜數據,並應用了矢量量化(VQ)。到目前為止,還沒有找到向我們作出合理解釋的有效方法,所以我只能說編碼效率比AAC高,它很好用,缺點是總是損耗一定量的主觀音質。
語音編碼原理比較好理解(我們現在把音樂排除在外,並脫離開一般性音頻),雖然實用性和以前同樣復雜。我們可以把人的發音聲道比作是一個聲源(喉)和一個濾波器(喉、嘴和唇等)。在HVXC (諧波矢量激勵編碼)和CELP (碼激勵線性預測編碼)編解碼器中,編碼器和解碼器中都有發音聲道模型。先用編碼器合成近似語音的信號。然後將其與原信號和產生的參數組進行比較。重復此程序優化合成器,並傳輸量化和壓縮的參數。解碼器將參數復原,並用它們操縱聲道模型—這模型與從中提取它們的的模型類似。HVXC與CELP的比特率隨信號要求而變。HVXC的比特率為2kb/s 或4kb/s,這個帶寬肯定太小。CELP以低達200b/s的步長在3.85~23.8kb/s之間變化。HVXC與CELP具有可縮放性,因此他們在傳輸中是基本層,而TwinVQ或AAC則可能是增強層。
結構性音頻
你可以視在網路空間里沒有人能聽見你的喊叫聲。那麼就繼續發揮你的想像吧……
你可以把結構音頻的起點設想成是從一家流行音樂預錄伴音帶專業公司買來的一個General MIDI文件。把這個文件裝載到你的定序器中,接上你的GM模塊,馬上就能卡拉OK了。確實,預錄伴音帶不會與原版本一模一樣,甚至不同的GM模塊也有不同的聲音,但它都是由同類樂器演奏的音樂(樣版),至少音質沒問題。想到這些容易,但大量的音頻處理可能在幾年內以極其相同的方式進行是相當不容易想到的。結構性音頻對帶寬問題採取完全不同的態度,它通過發送音頻事件的描述,而不是音頻事件本身的壓縮數據型式,減少傳送音頻所需的數據量。
我們再回過頭來看看相似的問題。聲音可以通過熵編碼器傳送或壓縮存儲。這意味著冗餘碼的數量減少了或沒有了,但有意義的數據完整無缺,重放時可以完全重新組合。DVD-Audio建議採用的Meridian Lossless Packing就是這樣的一個例子。這個方法固然好,但我們多半生活在一個現實的環境中—難以獲得充足的帶寬。MPEG AAC是一個知覺編碼器,它所依靠的人耳和大腦不能或根本不需要處理所有的音頻信息,只要找到不必要的數據並將其棄之即可。前面提到的HVXC與CELP是基於模型的編解碼器,它能分析和重新合成可能存在的各種聲音類型的非常小的子集,也就是人語。所有這些系統的目的是去除冗餘或重復的信息。但問題依然存在,怎樣才能准確地確定哪些信息是多餘的呢?以上舉的General MIDI的例子采區的是不折衷的方法,這就是結構性音頻的起點。在未受到數字化影響的傳統聲音中,可在鋼琴上演奏「G」調。鋼琴可以是Steinway, Bechstein, Bosendorfer或 Bluthner—甚至是 Yamaha的。鋼琴演奏家可能是Askenazy, Brendel 或Bill Evans,音樂廳可在Royal Festival Hall, Wigmore Hall或 Camegie Hall。傳聲器可以用……,好了,我想你們明白我的意思了。但是MIDI型可將此壓縮到三個位元組的數據,然後用任意數量的GM模塊的鋼琴聲學程序恢復這些數據。但丟失了好多內容。
General MIDI裡面可能包含一個指向結構音頻相關信息的指針,但它還遠遠不夠。還是以鋼琴為例子,例如結構音頻可傳送一種類屬的「G」調,但然後編碼描述能播放和記錄音符的不同方式的各種參數。這事實上效率更高、更靈活了。簡單的編解碼器只能描述幾種參數,如響度、踏板踩下去另一根琴弦是否發出共振聲。較復雜一點的編解碼器幾乎包括了所有與音符有關的參數,可以對這些音符進行分析。結構音頻可能的聲調范圍主要是編碼器的職責,憑借有足夠計算能力的解碼器,任何人都可以欣賞到音質的提高。
結構音頻出現已有相當一段時間,但似乎是有了MPEG-4,才開創了結構音頻的時代。其工作方式是這樣的:在MPEG-4 SA碼流的開頭有一個標題,其中包括一大段交響樂。這大段交響樂聽起來就像是一頓新奇的早點麥片粥一樣的一個好聽名字,它以各種樂器的形態出現,但實際上是描述將演奏碼流中包含的音樂的樂器的數據(實際上是樂器的演算法表達)。這大段交響樂寫成「SAOL」(結構化的音頻交響樂語言)。例如,每種樂器包含一種發聲器的物理模型,如鋼琴的琴鍵。此外,樂器還可能包含取樣數據及描述怎樣演奏聲音和變音的指令和參數。碼流本身含有定時事件。它反過來與標題有關。比如,一個事件可能說明被拔琴弦的物理模式(在標題中被描述),現在開始稍加抑制地大聲彈奏「A」調。或者可演奏管樂器的曲調,碼流可能要求音調應該漸高,有些地方要奏出顫音。顫音的深度和頻率也可被描述。這一點比General MIDI有所改進,在GM中,沒有標出確切的聲響,只是說「鋼琴」或「長笛」。在結構音頻中標出了確切的聲響。SA長笛(當編程在SAOL中時) 有可能聽起來不太逼真,但至少這是聽眾將感受的方式,是內容創作者想要的、至少是認可的方式。
這是需要考慮的一個重要概念。可是過去一直對General MIDI視而不見,認為它只是與音頻領域里的一小部分有關的點綴,因此很難衡量出結構音頻有多重要。但有兩點我可以肯定。第一,帶寬不會低得讓人用不了。結構音頻可在低至10b/s的帶寬上傳輸內容,適用於氣氛烘托或低音,並與自然音頻開始替換處的至少10kb/s相應(不管怎樣,10kb/s 以上的SA比特流可能開始超過了解碼器硬體要求的處理能力)。第二,結構音頻有可能成為一種全新的製作技術,與普通錄音和MIDI定序完全不一樣。不低估這個挑戰是明智的。在極低比特率可達到高品質音頻的可能性,以及對這種可能性產生的組合的藝術(不僅僅是技術)的理解,使結構音頻本身就是一種新媒體。
新的音頻媒體
我們現在可以做些思考,隨著結構音頻范圍的擴大,要說的東西很多。但有些事實現在是可以確定的。
目前還不能把已有的唱片變為結構音頻形式。想一想如果有一種工具能把雙簧管從已混錄成立體聲的完整的交響樂唱片中抽出後是什麼樣子。也許將來能這么做,但目前還遠遠做不到。這就是說,結構音頻製作必須從零開始。還是以管弦樂隊為例,這就是說,可以把樂譜裝載到一個理想化的SA編碼器中,這個編碼器已對所有常用管弦樂樂器編程,或許你可以買一個藏族的鼻笛,或其它罕見的樂器作為插件。然後編碼器創作出與實際樂器相似的全部聲音信息,並將其放入SA比特流的標題中,把音符和演奏時的表現力放入碼流中。編碼器的操作在技術上相當簡單,在藝術上比較復雜。在碼流被傳送到解碼器的預期過程中,聽眾聽到的聲音與創作者聽到的一樣,只是在收聽鏈的最後模擬階段才有了變化。請注意,不知是什麼緣故,可能純粹是為了節省帶寬的緣故,管弦樂隊和「真正的」音樂家多餘了。獲得合適的聲音或聲槽至關重要的流行音樂製作將發生徹底的改變。獲得動聽的聲音並把它錄制到磁帶或硬碟上不再足夠了。必須把聲音當作SA樂器創作,然後將其編入比特流中。結構音頻不會徹底消滅傳統技術,傳統技術還可以使用,這是勿庸置疑的。在可預見的將來,凡是未用結構音頻錄音的音頻都不可能轉換
3. 笑話徵集
「爺爺這地方死人了!」「是嗎,有吹喇叭的嗎」「有。」「有唱歌的嗎」「有。」「有哭的嗎」「有,
好多人在哭。」「你哭了嗎
」「沒有,我們家也沒有死人呀!
唐山安寶平新作
4. 如何判斷硬體能否兼容
主板參數中有寫著支持的CPU介面(LGA775支持大多數intel的cpu,AM2 940支持大多數的AMD的產品,還有其他一些介面,配合不同的CPU),主板要和介面相對應的CPU搭配。主板參數中還有支持的內存類型(DDR,DDRII667,533,800等),顯卡類型(PCIE和VGA),硬碟介面(PATA和SATA)。確定主板支持的各類介面後就可以選擇配置了。下面以實例講解吧。
比如我想選AMD3600+x2這款CPU,其介面是AM2 940,所以要選相應的主板,於是選了塊技嘉M55SLI-s4,其顯卡插槽是PCIE的(大都是這種了),就選了塊昂達7600GS 256M狂飈版。主板支持DDRII533,667,800,所以選了一條1G的金士頓DDRII667,在看看硬碟,SATA的,選希捷吧。就這樣配好了一台兼容機。
樓上幾位都說的有道理,可以參考大家的回答啦。打字很辛苦就給點分啦。
5. dsd光碟是什麼意思它是不是5.1聲道的意思
DSD光碟:
(Direct Stream Digital)數字音頻技術:
由索尼和飛利浦公司共同合作開發。該技術是採用1bit(比特)A/D轉換器及Sigma/delta調制器達成錄音或編碼。DSD制式的取樣頻率為2 .8224mhz,較傳統式CD的44.lkhz取樣頻率高64倍。 這個頻率表示量化是以每秒2.8224百萬次速度處理,然後將1比特數據錄在唱片上,雖然比特數目只是CD制式所用的1/16,但因取樣頻率高64倍,結果DSD的數據能力較CD大四倍,理論上,它可將頻率范圍擴展至1.4mhz左右。結果是整體的音效提升了。
同時因為DSD技術中又開發了所謂的"雜訊整形電路"可進一步把可聞頻帶(0 ~ 20kHz)內的雜訊進一步轉移到20kHz以上的超音頻范圍中去,從而令DSD CD的信噪比高達120dB以上。
6. 誰有笑話給我來
今天在網吧玩CS,不遠處有兩個非主流在玩勁5,辟里啪啦的按鍵盤!我很不爽!
於是,我也開始按鍵盤!我使勁的按!用力的按!按得比他們還快!比他們還響!
他們不禁看了過來,我故意輕蔑地瞥了他們一眼!他們變了臉色,狠狠瞪了我一眼!我馬上回瞪過去!
他們鐵青著臉繼續玩勁5,不過聲響超過了我!
我豈會甘心?所以,我乾脆直接用手掌拍鍵盤!使勁的拍!用力的拍!
那兩個傢伙一看也不打勁5了,開始拍鍵盤!聲響又超過我了!
我又怎會罷休?馬上用拳頭擊打鍵盤!使勁的打!用力的打!
那兩人對視一眼也開始擊打鍵盤!聲響又超過了我!我不認輸!一把扯下了鍵盤!直接扔在地上!我使勁的踩!用力的踩!
全網吧的人都向我報以最熱烈的掌聲!那兩個非主流傻了,不知所措!
但是,在我挑釁的眼光打量下,他們也怒了!他們也一把扯下了鍵盤!扔在地上,踩了個稀巴爛!然後他們也挑釁的看著我!
這時候,網吧的網管們將他們團團圍住!一個網管看了看被他們踩爛的鍵盤,一耳光就扇了過去!接著網管們一擁而上!將兩個非主流一頓暴打!
最後,兩個非主流躺在地上,其中一個非主流指著我虛弱的問:"你們怎麼不打他?
一個網管一腳踢了過去:"人家是打CS的,自己帶的鍵盤!"
一次·一架旅遊飛機出故障,導致墜機,全機人都死了只剩下3個倖存者。。 有一個中國人 有一個日本人 有一個美國人, 他們出了 飛機的殘骸後 發現他們正經過 一個荒漠 並且他們 一望無際 根本看不見沙漠的盡頭,他們絕望了··不過還是一起走著·····因為這是唯一的希望。。。。。。他們走啊走啊走 忽然 帶頭的美國人 腳不小心踢到一個啤酒瓶,啤酒瓶中刷的飛出一個全身冒著白光的 俊男子··飄在空中,,當時3人以為出現幻覺 可是 男子卻道:"我是一個神仙,被妖魔困在其中,謝謝你們救出我····我答應滿足你們 每人3個願望,,你們有什麼願望快說吧!"
日本人首先說道:我要10個海邊別墅!!要在一起的!然後要100個美女 都鍾愛於我!!!!!最後,讓我回到我的別墅跟美女身邊!!
說完,日本人刷的消失了~~~~
美國人見狀,忙道:我要10億美元 然後要成為一個有很高地位的人!!!!!最後讓我回去!!!!
說完美國人 也瞬間消失了~~~~
中國人見此,樂呵呵的說道:我要30瓶二鍋頭30瓶白蘭地30瓶茅台30瓶青島啤酒!!!!
讓後我在要30瓶二鍋頭30瓶白蘭地30瓶茅台30瓶青島啤酒··
最後嘛···························我讓剛才回去的那兩個人回來和我一起喝酒~~~~~~~~~~
神仙全身光芒一閃,各式各樣酒刷刷掉落 到沙土之上···發出沙沙的聲音······那兩個人也瞬間回到了中國人旁邊~~~~~~~~~
汗。。。。。。。
等兩人回過神後··大哭~~~~
抱怨著中國人,詛罵著中國人。。。
痛恨自己為什麼先回答。。。
3天後 酒喝完了。。
他們繼續向前走,
忽然,遠方的一個啤酒瓶引起了3人的注意。。美國人忙的 吧瓶子一踢 刷的出來一位美女神仙。。。
美國人日本人高興的尖叫著,,眼淚不禁流了出來。。。
神仙又說滿足每人3個願望·····美日兩人怕又出上次的差錯排好順序讓中國人先說~
中國人毫不猶豫的道:首先,我要回到我的國家,
日本人美國人都暗喜。
然後我也要1億美金,10座海邊別墅。而且要一個美麗的,對我忠心的,賢惠的女孩子 和我共度終生。
美日兩人聽後更加歡喜了···暗罵:這中國人 真蠢竟然只要一個美女 要是我要1萬個也沒事啊~哈哈哈哈.......待他們坐著美夢時,
中國人道: 行了 你先走吧·這里沒事了·····
········ 我的願望也說完啦~!!!
望採納,謝謝
7. 有關於數模的,怎麼進行在線配置
數模轉換就是將離散的數字量轉換為連接變化的模擬量,實現該功能的電路或器件稱為數模轉換電路,
通常稱為D/A轉換器或DAC(Digital Analog Converter)。
我們知道數分可為有權數和無權數,所謂有權數就是其每一位的數碼有一個系數,如十進制數的45中的4表示為4×10,
而5為 5×1,即4的系數為10,而5的系數為1, 數模轉換從某種意義上講就是把二進制的數轉換為十進制的數。
最原始的DAC電路由以下幾部分構成:參考電壓源、求和運算放大器、權產生電路網路、寄存器和時鍾基準產生電路,
寄存器的作用是將輸入的數字信號寄存在其輸出端,當其進行轉換時輸入的電壓變化不會引其輸出的不穩定。
時鍾基準產生電路主要對應參考電壓源,它保證輸入數字信號的相位特性在轉換過程中不會混亂,
時鍾基準的抖晃(jitter)會製造高頻噪音。
二進制數據其權系數的產生,依靠的是電阻,CD格式是16bit,即16位。所以採用16隻電阻,對應16位中的每一位。
參考電壓源依次經過每個電阻的電流和輸入數據每位的電流進行加權求和即可得出模擬信號。
這就是多比特DAC。 多比特與1比特的區別之處就是,多比特是通過內部精密的電阻網路進行電位比較,並最終轉換為模擬信號,
好處在於高的動態跟隨能力和高的動態范圍,但是電阻的精度決定了多比特轉換器的精度,要達到24bits的轉換精度,對電阻的要求高達0.000015,
即便是理想的電阻,其熱噪音形成的阻值波動都會大於此值,多比特系統目前廣泛採用的是R-2R梯形電阻網路,對電阻的精度要求可以降低,但即便如此,
理想狀態的電阻達到的轉換精度也不會達到 24bits,23bits已經是極限多比特系統的優點在於設計簡單,但受制於電阻的精度,成本也高
單比特的原理:依靠數學運算的方法在CD的脈沖代碼信號(PCM)中插入過取樣點,插入7個取樣點就是18倍過取樣,
這些插入的取樣點與原信號通過積分電路進行比較,數值大的就定為1,數值小的就定為0,原先的PCM信號就變成了只有1和0的數據流,
1代表數據流較密集,0代表數據流較稀疏,這就是脈沖密度調制信號(PDM),脈沖密度調制信號經過一個開關電容網路構成的低通濾波器,
1 就轉換為高電壓信號,0就轉換為低電壓信號,然後通過級聯積分,最終轉換為模擬信號。
插入取樣信號會製造出許多高頻噪音,所以還要經過一個噪音整形電路處理,將這些噪音推移到人耳聽不到的頻域。
1bit的優點在於轉換精度不受制於電阻,轉換精度可以超過24bits,成本也低,但是設計過取樣和噪音整形的電路難度很大。
因為電阻在精密程度(光刻)和熱噪音(材料)上對音質影響相對小些,而1比特的電容和積分電路對音質影響則相對大些對於CD的數據格式,
單從聲音素質上應該說多比特優於1比特,多比特對16比特的CD信號直接進行轉換,而單比特還要經過一個PCM信號轉換為PDM信號的程序,還要經過開關電容的充放電過程,
雖然從理論上來說,最終得到模擬信號的速度和多比特相比不會慢到可以比較的程度,
但是實際聽感上,單比特不如多比特聽起來更有活力,單比特似乎要慢一點,中頻厚一點,音色比較濃郁。
1bit始創於飛利浦,分為三派,
一派是以飛利浦為代表的比特流Bitsream,
一派是以松下為代表的MASH,但是MASH的創始者是NTT公司,
還有一派就是今天非常流行的Delta-Sigma.
Bitsream採用最傳統的 三階或四階噪音整形,MASH (Multi Stage Noise Shaping)就是多級噪音整形,
它將最初的量化值與原信號的誤差保留下來,下一次量化時先將上次量化值與誤差從原信號中減去,這樣重復數次,
可以將二進制信號變換為脈沖寬度調制(PWM)的信號(PWM和PDM幾乎一樣)還可以將量化製造的噪音推到甚高頻段,從而減少可聞頻段的噪音。
但是似乎只有松下公司大量採用這種技術。現在MASH已經很少見了,但從理論上來說它是很優秀的。
1987年,飛利浦公司首次推出採用數字比特流技術(Bitsream)的單比特DAC晶元,它為高性能低價格CD唱機的出現奠定了堅實的基礎。
1991年9月推出的DAC-7將比特流技術發揮到淋漓盡致的地步,同時還保持了合理的價格。音響史上有眾多採用DAC-7的名機。
如飛利浦的LHH-900R,800R,300R,951。
馬蘭士的CD-72,CD-17,CD-23。
麥景圖的MCD- 7007。
先鋒的早年旗艦PD-T07。
meridian的602/603,
還有幾乎所有歐洲數字音源廠家如 Rotel,Altis,Deltec,Revox,Studer等都在其旗艦系統中採用DAC-7。
進入21世紀之後,TDA1547依然鋒芒未減,目前世界上最高級的SACD唱機——馬蘭士的SA-1仍然採用DAC-7,令世人不得不對DAC-7再次側目。
迄今為止,DAC-7仍然是飛利浦最高級的比特流DAC晶元。
在飛利浦的產品手冊里,是這樣評價DAC-7的;擁有頂級性能的雙聲道數字比特流DAC晶元,
1Bit數字模擬轉換器專用,使用DAC-7可以輕而一舉獲得高保真的數字音頻再生。
DAC-7非常適合用於要求高質量的CD和DAT播放器,或者用於數字放大器和數字信號處理系統之中。這樣的評價非常中肯。
DAC-7包括TDA1547和SAA7350 ,因為過取樣和噪音整形電路製造出的大量高頻數字信號會對TDA1547中的模擬電路造成干擾和調制。
所以將配合TDA1547的三階噪音整形和24倍過取樣電路單獨設計於SAA7350之中。這也是TDA1547成功的最關鍵之處。
現在飛利浦又對SAA7350加以全面改進,將數字濾波器也集成進來,新型號定為TDA1307,仍然是專門配合TDA1547的晶元。
不過TDA1547和TDA1307合起來叫DF7。
TDA1547採用了雙極組合型金屬氧化物半導體工藝。在數字邏輯電路方面,採用最佳的時鍾頻率,可以減少數字噪音的產生。
在模擬電路方面採用雙極型晶體管,可以使運算放大器獲得較高的性能。
在電源供應方面,TDA1547費盡心機,首先是模擬電路與數字電路分開供電,
在數字電路裡面,高電平邏輯電路與低電平邏輯電路分開供電,並且都是左右聲道獨立供電。
內部總體結構方面,TDA1547採用雙單聲道設計,徹底分離,輸出也是左右聲道獨立輸出。
TDA1307可以接收16、18、20bits格式的信號,輸出音頻格式32bits。
內置接收界面,去加重濾波器,採用8倍過取樣有限脈沖響應(FIR)濾波器,3階或4階可選型噪音整形電路。
標准型晶元信噪比達致當今最高的142dB,動態范圍高達137dB。
馬蘭士的SA-1將DAC-7最完美的運用,它採用四片TDA1547和TDA1307構成全平衡電路。
模擬放大部分採用馬蘭士高級機型里大量使用的HDMA。
今天Delta-sigma 1bit非常流行,它包括兩部分電路,一部分是Delta電路,它將量化後的信號與初始信號進行比較求差,這些插值信號接下來進入Sigma電路,
此電路將這些插值信號進行誤差求和,然後與量化前的信號相迭加。然後再進行量化。
通常採用飛利浦開發的動態元素配對(DEM)量化技術,此種量化包含一個極高精度的電流源和多個1/2鏡像電流源,由於集成電路最擅長鏡像電流源電路,
所以對元器件精度的要求可以降低,提高了性價比。
量化以後的信號通過開關電容網路轉換為模擬信號。
需要指出並非所有的Delta- sigma 轉換都是單比特。Delta-sigma的優勢在於它的高性價比,從而在中低檔數字音源市場上非常流行。
即便是那些堅持採用多比特的廠家,中低價位也得採用Delta-sigma。
堅持使用Delta-sigma的恐怕非Crystal莫屬,CRYSTAL的cs4390,4396在業界也有大量使用,
其中也不乏極品如mbl1611hr,
還有發燒天書A級的Meridian 506.20 、
Meridian 508.24、 Meridian 506.24
還有國內新德克的 DAC-1 。
CS4390於1998年6月發售,是CRYSTAL第一塊Delta-sigma DAC晶元。
它是一塊完整的立體聲DAC解碼晶元,信號先進入128倍內插值電路,然後經過128倍過取樣Delta-sigma數模變化,
接著輸出模擬信號和經過調制的基準電壓, 最後進入一個超級線性的模擬低通濾波器。
其中Delta-sigma數模變換部分還沒有採用飛利浦的DEM技術。
CS4390的信噪比為115dB,動態范圍是106dB,總諧波失真加噪音為—98dB,轉換精度為24bits,對時基抖晃敏感程度較低。
其後又在CS4390的基礎上增加了音量控制,改名為CS4391。
一年以後的1999年7月,CRYSTAL推出CS4390的升級產品——CS4396,CS4396與CS4390最大區別之處就是採用了DEM技術,
CS4396也是一塊完整的立體聲DAC晶元,信號在經過內插值和Delta-sigma變換後,進入DEM程序塊,然後通過開關電容網路,最後通過模擬低通濾波器,
輸出級採用了高音質的差分電路。DEM的採用使CS4396的失真和噪音都有所降低,達到了—100dB,動態范圍也提高到120dB,
轉換精度還是24bits,最高取樣頻率升至192KHz,但是不在提供信噪比的參數。
同時推出的CS4397是在CS4396的基礎上支持外接PCM(對應DVD-AUDIO)和DSD(對應SACD)內插式濾波器。
半年多以後,CRYSTAL公司又推出CS4396的升級產品——CS43122,
與CS4396不同之處一個是採用了第二代的DEM技術,
另一個是 Delta-sigma調制器不再採用1bit而採用了5bits三階調制。
對於內插值電路也加以改進,達到了102dB的阻帶衰減性能。CS43122與CS4396的性能參數基本一樣,只有動態范圍達到了122dB,這也是目前動態范圍最高的DAC晶元。
2000年9月20日,CRYSTAL公司又推出CS4392,一款對應 DVD-AUDIO和SACD的DAC晶元,動態范圍有114dB,總諧波失真加噪音為—100dB,
但是只OEM,暫不流通銷售,每片售價僅2.8美元。
(注意CRYSTAL從頭到尾都不在提信噪比,因為它的信噪比只有CS4390 達到了115dB)
日本的NPC公司同樣以Sigma-Delta變換技術聞名於世,我們對NPC的高性能數字濾波器一定很熟,最出名的SM5842,乃是公認的極品。
同樣 SM5865則是Sigma-Delta 極品解碼晶元,雖然不為人知,但是在不久的將來,SM5865也會被公認為極品。
SM5865是今年2月份推出的,首先它是單聲道晶元,內部是真真正正的全平衡電路,信號先經過插值電路,然後進入三階多比特Sigma-Delta變換程序,
接著經過31級DEM量化,最後經過開關電容網路變為模擬信號,
SM5865的DEM量化級數極高且非常成功,從而使得量化導致的可聞頻域噪音可以完全忽略,所以最後一級的模擬低通濾波可以省掉,從而得到理想狀態的失真程度和噪音量。
SM5865是目前世界上失真最低噪音最小的DAC晶元,總諧波失真加噪音只有0.0003%,即— 110.5dB。
同時仍然做到了120dB的信噪比和117dB的動態范圍,接受數據格式在20-24bits之間,最高取樣頻率也是192KHz,從而順利登上今日DAC之王的寶座。
多比特DAC分為兩大名家,一是UltraAnalog公司,另一個就是Burr-Brown公司。
大多數人對UltraAnalog可能會比較陌生,因為它在1998年12月被Wadia收購了,從此再也沒有它的消息。但是它在DAC歷史上的地位遠非Burr-Brown可比,
使用 UltraAnalogDAC晶元有匯點(Conterpoint)的旗艦解碼器 DA-10,
寶麗音Parasound的旗艦解碼器 D/Ac-2000,
Mark Levinson的早年旗艦解碼器 NO.30和 N0.30.5
還有日本靜電耳機名廠Stax的起見解碼器 DAC-x1,
KinergetICs 的高級解碼器 kcd-55
而Manleylab、 Sonic Forntiers、Camelot、Entech、Aragon、Audio Synthesis 的旗艦解碼器都採用UltraAnalog的晶元。
基本上採用UltraAnalog晶元的解碼器都會是發燒天書的A級品。並且幾乎1998年以前所有的美國頂級解碼器都採用的是UltraAnalog的晶元。
雖然UltraAnalog的產品很好但是利潤低,因為UltraAnalog只有這一種產品,對集成電路生產廠家來說這樣根本無法維持下去,UltraAnalog 可以活到1998年就已經不錯了,
Wadia將其收購以後,沒有將UltraAnalog的技術資源吸收並轉化。同時Wadia也認為 UltraAnalog是個包袱,漸漸地UltraAnalog香消玉隕了,
今天仍有UltraAnalog的死終派如 Manleylab、 Sonic Forntiers、Camelot、Entech、Aragon、Audio Synthesis仍堅持採用UltraAnalog的晶元,
可能庫存還不少,Sonic Forntiers 還和UltraAnalog有合作關系。可能也生產UltraAnalog的晶元。
UltraAnalog公司是世界上第一家對時基抖晃加以仔細研究的廠家,同時UltraAnalog的產品時基抖晃也是世界最低,
UltraAnalog還提出一種可以大幅減少時基抖晃的數字音頻信號介面界面。
1993年 UltraAnalog還發明了非常廉價的時基抖晃分析儀。
UltraAnalog的晶元主要是D20040,我們對其知之甚少,只知道是20bits的轉換精度,內部是兩個19bits的DAC並聯而成。其他就不知道了。
相信再過10年,還有誰知道UltraAnalog?技術和商業絕對不是一會事。
Burr-Brown在今天的DAC晶元市場上份額甚大,聲譽頗隆。Burr-Brown成立於1993年,和UltraAnalog一樣是多比特的死終派,
建廠伊始推出PCM58,PCM63,也是好評如潮,但仍無法與UltraAnalog匹敵。
1995年推出PCM1702終於可以於 UltraAnalog一爭高下,直到今天採用PCM1702的高級CD機也不在少數,
Linn在2000推出的Sondek CD機採用PCM1702售價高達20000美元,發燒天書評為A級。這之後沉寂4年,
1999年2月,推出多比特DAC的終極產品PCM1704。此時UltraAnalog已經被Wadia收購,漸漸式微。Burr- Brown也被TI(德州儀器)公司收購,
依託TI的強大實力,Burr-Brown得到了良好的發展,成為今日DAC晶元市場上的龍頭老大。
PCM1702推出於1995年6月,當時市場上1bit聲譽甚隆,Burr-Brown對1bit提出挑戰,
Burr-Brown指出1bit插入取樣點的做法會導致許多高頻噪音的產生雖然這些噪音的頻率比較高,但是仍有可能對可聞頻域造成調制,
並且這些人為製造的噪音還需要噪音濾波器來消除,濾波器的加入對信噪比的衰減較大,低電平時響應也不夠好而Burr-Brown認為信噪比這個特性幾乎是最重要的特性。
多比特的唯一缺點就是過零失真,PCM1702採用了信號數值型(sign magnitude)結構完美解決了這一問題,
在1702內部互補並聯了一對DAC,並聯的好處一是提高了信噪比,二是提高了轉換精度,1702內部並聯了兩個19bits的DAC,轉換精度就是20bits。
這兩個DAC共用一個參考電壓,共用一個R-2R梯形電阻網路,梯形電阻網路的位電流源由雙平衡電流級供應,確保位電流源具備完美的跟蹤特性。
每個DAC內部都採用激光微調的鉬鉻電阻,確保高精度,兩個DAC經過精確微調確保相位一致。最終兩個 DAC的正負半周轉換完美解決了過零失真。
而傳統的R-2R形電阻數模轉換則取得了高信噪比和低失真,還有近乎理想的低電平表現和高電流輸出能力。
PCM1702的信噪比為120dB,這個數值直到現在也沒有誰能打破,在當時更使人難以想像。1702的總諧波失真加噪音為—96dB,在當時也是非常好的特性。
PCM1704推出於1999年2月,是多比特DAC的終極產品,恐怕再也不會有多比特DAC超過它,
Burr-Brown用它最擅長的電阻製造工藝製造出了達致理想精度的電阻,從而得到了世界上最高精度的多比特DAC,高達23bits。兩個並聯之後達到24bits。
至於內部結構與PCM1702基本上沒有差別。
1704的信噪比還是120dB,動態范圍112dB(K級),總諧波失真加噪音為-101dB(K級)。
至1704後到現在,Burr-Brown再也沒有推出比1704更高等級的多比特DAC,Burr-Brown也無法打破自己創造的記錄,
2001年4 月30日,Burr-Brown推出新一代的頂級DAC—PCM1738,採用了先進層次結構型DAC,Burr-Brown也知道傳統的多比特走到了盡頭。
先進層次型結構先用一個24bits,八倍取樣頻率下工作的數字內插值濾波器對數字信號進行分流,分為上6bits信號,下18bits信號。
上6bits信號進行反向互補位移型二進制解碼,轉換為62級數字信號,下18bits信號則進行三階15級Delta-sigma調制,
調制頻率是取樣頻率的64倍,最終轉換為4級數字信號,
然後兩者相加為66級數字信號,再加上1級LSB信號,總共67級數字信號,
這67級數字信號然後通過數據加權平均(DWA)程序,以減少模擬元件不配對引起的噪音,
實際上DWA就是第二代的DEM。經過DWA處理後,最後進入電流型數模轉換器,將二進制脈沖信號變為脈沖電流信號,
再由晶元外的運算放大器進行電流電壓轉換,並最終取得模擬信號。應該說這種DAC不是單比特也不是多比特,應該叫它電流脈沖型DAC。
PCM1738的信噪比和動態范圍都是117dB,總諧波失真加噪音為-108dB,應該說勝過PCM1704,但它的價格遠低於PCM1704(K級)的25美元,只要5美元。
Analog Device公司也非常擅長製作極品級的DAC晶元,象金嗓子從來都是只用Analog Device的晶元,
在DAC晶元的理論設計上,Analog Device擁有至高無上的地位,Analog Device早在1998年就發明了多比特Delta-sigma調制,
因為傳統的單比特Delta-sigma調制,導致離散到連續的邊界每步尺寸過大,從而對主時鍾的穩定程度要求極高,
例如要想在可聞頻域內達到100dB以上的信噪比,那麼主時鍾的時基抖晃不能大於10PS,可這是不可能的,所以高信噪比的取得必須放棄單比特Delta-sigma調制。
多比特Delta-sigma調制的缺點是不方便採用DWA程序,模擬元件引起的噪音無法避免,
如果採用DWA程序,那麼要求輸入信號的格式低於18bits,可是現在是24bits的天下。顯然無法接受。
Analog Device另覓蹊徑,採用了分段噪音整形技術解決了這一難題。而Burr-Brown則在一開始就將信號分流。
傳統的單比特解碼必須採用開關電容,並且大約每增加一比特的轉換精度,電容就要增加四倍,
要知道每個電容都會製造噪音,並且大電容會對配合開關電容網路的運算放大器要求更高的轉換速率,
所以採用開關電容網路的DAC晶元,高轉換精度會造成一定限度的聲音品質下降,如果設計不良,有可能越高的轉換精度聲音越差,聽感上聲音過於清麗以致聲音單薄。
Analog Device採用電流脈沖型DAC,電流型DAC的脈沖電流輸出上升與下降時間不平均,要採用一般的電壓電流轉換運算放大器會導致轉換線性下降,對時基抖晃也很敏感,
Analog Device採用雙回轉零開關電路解決了。此技術是於SONY聯合開發的,最早用於SONY的頂級ES系列。
因為電流脈沖型採用一個異常純凈的瞬間電流源,電流脈沖不會再有任何波紋,幾乎可以等同於完美的方波。音質會非常純凈。
自1999年以後,Analog Device發現音響市場萎縮,於是轉而對SHARC型通用DSP晶元的開發與研究,沒有再對DAC作進一步的研究,
盡管如此,Analog Device在1998年推出的DAC晶元AD1853,仍舊是目前最高級的DAC晶元,絲毫不比PCM1738或SM5865差,雖然這些晶元都是 2001推出的,
但無論在性能還是技術上,AD1853都不差。
並且AD1853還是世界上第一塊取樣頻率為192KHz的DAC晶元,它還是世界上對時基抖晃敏感程度最低的DAC晶元,
它的信噪比為120dB,動態范圍是117dB,總諧波失真加噪音為—107dB,和SM5865相比應該說旗鼓相當,不分高下。
對於目前新興的音頻格式的DAC晶元也應該有所了解。
DVD-AUDIO格式仍然使用PCM編碼,所以DVD-AUDIO的DAC解碼晶元與CD的解碼晶元原理相同,
只是要求更高的轉換精度和取樣頻率以及輸入格式寬度。
SACD就不同了,它在錄制的時候,將輸入的模擬信號經過Delta-sigma調制變為單比特取樣頻率為2822.4kHz的二進制數字信號,
並且這時的數字信號已經是脈沖密度調制信號(PDM),所以在進行單比特解碼時不必再加取樣點和噪音整形電路,
只要通過開關電容網路和模擬低通濾波器,就可以得到模擬信號。
所以電路非常簡單,並且在數模轉換級沒有任何數字運算電路更沒有時鍾基準產生電路,也就不會有任何數字噪音的混入,聲音的純凈度極高。
SONY的SACD機沒有採用開關電容網路,而是採用了最高等級的電流脈沖型數模轉換。
順便提一下,CD信號也是先將輸入的模擬信號經過Delta-sigma調制變為16比特取樣頻率為44.1kHz的二進制信號,然後還得經過一個數字抽選濾波器,
任何數字濾波器都會製造無法忽略的噪音,還有通頻帶內紋波和鈴振的現象,降低了聲音的純度。
SACD無論是錄制還是重放系統中都沒有一個數字濾波器,而CD不僅在錄制時還是在重放時都有,單比特系統還要再加一個內插取樣點濾波器。
音質的純度根本無法與SACD相比,SACD是現階段聲音純度最高的記錄媒體和重放系統,最接近與真實的聲音。
目前世界上有三片SACD用的DAC晶元,
一是SONY的SACD機上用的DSD1700,由Burr-Brown公司製造。
二是NPC公司的 SM5866,
三是CRYSTAL的CS4392,但沒有公開發售。
由於SACD考慮到要有現階段最優秀的聲音表現,所以一般都採用電流脈沖型數模轉換電路,
這種電路一般都用分離元件構成,故DSD1700和SM5866 內部實際上主要就是模擬低通濾波器,
嚴格地說DSD1700和SM5866不是DAC晶元,而是模擬低通濾波器晶元。
DSD設計只能用於SACD系統,它的內部主要是四組模擬低通濾波器,分別是熱端正向和反向濾波和冷端正向和反向濾波,
每組濾波器內部是8個三端無限脈沖響應濾波器。四組濾波器最終輸出雙差分電路。
DSD動態范圍是110dB,信噪比是110dB,總諧波失真是—100dB,高頻響應為100KHz(—3dB)。
NPC公司的SM5866推出於2000年9月22日,它可用於SACD和DVD-AUDIO系統。其內部資料沒有公布。
它的信噪比為120dB,總諧波失真加噪音為—109dB,高頻響應為100KHz(—1dB)。很明顯要比DSD1700高一個級別。
8. 什麼叫大小音頻
什麼是音頻
我們自以為知道什麼是音頻,可是我們所知道的音頻將要永遠改變了。當然,很多變革宣布了,卻從未到來(有的到來了卻未曾宣布)。在音頻國度中,MPEG-4音頻也許只是一個偏遠的小省。另一方面,通信技術正在以我們5年或10年前根本無法想像的方式,改變我們的生活。我們所知道的音頻(包括MP3和其它數據壓縮格式)最後也許成了一種少數人的消遣。
在探討這個話題前,不妨先介紹一點有關MPEG-4的知識及其與視頻的關系。首先,根本就不存在MPEG-3—MPEG-2已包括了原來准備用在MPEG-3上的一些特徵。其次,MP3是MPEG-1與MPEG-2的一個聲音分量,根本就不存在「MP4」。
各種各樣MPEG系統的基本思想都是以節省帶寬和滿足數據存儲要求的方式編碼音、視頻信號的。我還記得,當我第一次知道可以用相當於4比特編碼准CD質量音頻時,我最初的反應是表示懷疑。MP3現在用約1.6比特就達到了這一目標!MP3使網際網路傳送音頻成為可能。若非如此,音頻將是網際網路的陌路人,唱片公司可能還在睡大覺。MPEG-2使奇妙的DVD視頻獲得了成功,並很快普及開來。但是還有一個潛在的要求,即要求傳送更多的內容,尤其是下一代行動電話技術,它可使小小的手機能訪問網際網路,包括視頻流,在未來的幾年內,這項技術將會以不可思議的速度發展起來。雖然行動電話的帶寬將增加,但還必須進一步壓縮音視頻數據,這就導致了對MPEG-4的要求。
最重要的是想提醒大家,MPEG-4不是MPEG-2的替代品。它有完全不同的功能。我之所以說「最重要」,是因為MPEG-4有可能被許多人誤解成是MPEG-2的替代品,而且因為MPEG-2的流行,有人會說:「我們對MPEG-2現在這個樣子很滿意了」。MPEG-2有著一個長遠和確信無疑的未來。MPEG-4將不會替代MPEG-2現有的任何功能。
自然音頻
MPEG-4 巧妙地把音頻分為兩類:自然音頻和結構性音頻。自然音頻是我們所知道的,包括MP3和其它數據壓縮格式的音頻。結構性音頻是我們完全不熟悉的東西,甚至是嚇唬人的東西。讓我們先從原始概念著手吧。
過去10年中最時髦的一個詞是「可縮放性」。如果一個系統不能夠縮放,你就可能同時擁有好幾個互不兼容的系統。在音頻或視頻術語中,可縮放系統意味著可將信號傳送到一台便宜的接收機(也許主要是用紙板製作的一次性手機),該機將拾取信號的低帶寬部分,或基本層。可是,傳輸包含了更多的層—增強層,這時可用較高級的接收機來提供更好的質量。我們將它與同步廣播做個比較,同步廣播是從電視還沒有像樣的立體聲伴音開始的,有時廣播活動要通過電視和立體聲調頻廣播同時進行。假如帶寬有守護神的話,他肯定會高興地看到肆意揮霍帶寬的日子結束了。(帶寬是否用得合理或者被浪費主要取決於內容,但那又是另外的話題了)。
自然音頻又被細分為一般性音頻和語音。例如,一般性音頻可能是音樂,它需要的帶寬顯然比語音高,因為往往主要傳送的是其信息內容。對於最高質量信號來說,即從「超過AM」到「透明」(對音頻專業人士和其它苛求的聽眾來說可能更像是半透明的),可通過某些附加物使用高級音頻編解碼器(MPEG-2 AAC)—它作為標准MP3的一種增強型,面世已有一段時間了。這里涵蓋了每聲道16kb/s至64kb/s以上的比特率。MP3和MPEG-2 AAC系統丟棄了人耳不能聽到的信息,只保留人耳朵可以聽到的信息。有些方面是容易理解的,值得在這里提一下,因為裡麵包含了更復雜的技術。
1.聯合立體聲編碼用於雙聲道中立體聲信號常包含基本相同數據的場合。例如,立體聲像中最重要的信號將受益於MS編碼,這里的S信號將傳送很少的信息,因此可用很少的比特來描述。由此帶來的一個有用的「副產品」是,雙聲道中的量化雜訊是相關的,因此落在聲像中心,而且大都被信號的M分量所屏蔽。
2.聲強編碼依賴人耳的相對不靈敏性定相2kHz以上信息。因此可按左、右求和和方向性信息對信號進行編碼。聲強編碼是有損耗的,因此更適合於低比特率的應用。
3.時間雜訊整形是AAC中的一個新特性,它影響那些可顯著改變信息塊中電平的語音等信號。再加上每個信息塊中的量化雜訊是恆定的,因此失真可被人聽見。時間雜訊整形隨時間整形量化雜訊,以減少這種影響。
4.支持知覺雜訊置換技術的人認為,對人的聽覺系統來說,一種雜訊非常像另外一種雜訊。因此,如果發現任何頻帶含有類似雜訊的數據時(我差點要說「類似雜訊的信息」,這二個詞是完全矛盾的),則它能被本地產生的雜訊替換。最近用這個辦法把Limp Bizkit聲軌數據壓縮到千位元組以下的說法完全是無稽之談。
我們再來看看TwinVQ。它是一種適合普通音頻信號(包括音樂在內)的編解碼器,比特率非常低(每聲道低於16kb/s)。TwinVQ提取AAC的比例因子和頻譜數據,並應用了矢量量化(VQ)。到目前為止,還沒有找到向我們作出合理解釋的有效方法,所以我只能說編碼效率比AAC高,它很好用,缺點是總是損耗一定量的主觀音質。
語音編碼原理比較好理解(我們現在把音樂排除在外,並脫離開一般性音頻),雖然實用性和以前同樣復雜。我們可以把人的發音聲道比作是一個聲源(喉)和一個濾波器(喉、嘴和唇等)。在HVXC (諧波矢量激勵編碼)和CELP (碼激勵線性預測編碼)編解碼器中,編碼器和解碼器中都有發音聲道模型。先用編碼器合成近似語音的信號。然後將其與原信號和產生的參數組進行比較。重復此程序優化合成器,並傳輸量化和壓縮的參數。解碼器將參數復原,並用它們操縱聲道模型—這模型與從中提取它們的的模型類似。HVXC與CELP的比特率隨信號要求而變。HVXC的比特率為2kb/s 或4kb/s,這個帶寬肯定太小。CELP以低達200b/s的步長在3.85~23.8kb/s之間變化。HVXC與CELP具有可縮放性,因此他們在傳輸中是基本層,而TwinVQ或AAC則可能是增強層。
結構性音頻
你可以視在網路空間里沒有人能聽見你的喊叫聲。那麼就繼續發揮你的想像吧……
你可以把結構音頻的起點設想成是從一家流行音樂預錄伴音帶專業公司買來的一個General MIDI文件。把這個文件裝載到你的定序器中,接上你的GM模塊,馬上就能卡拉OK了。確實,預錄伴音帶不會與原版本一模一樣,甚至不同的GM模塊也有不同的聲音,但它都是由同類樂器演奏的音樂(樣版),至少音質沒問題。想到這些容易,但大量的音頻處理可能在幾年內以極其相同的方式進行是相當不容易想到的。結構性音頻對帶寬問題採取完全不同的態度,它通過發送音頻事件的描述,而不是音頻事件本身的壓縮數據型式,減少傳送音頻所需的數據量。
我們再回過頭來看看相似的問題。聲音可以通過熵編碼器傳送或壓縮存儲。這意味著冗餘碼的數量減少了或沒有了,但有意義的數據完整無缺,重放時可以完全重新組合。DVD-Audio建議採用的Meridian Lossless Packing就是這樣的一個例子。這個方法固然好,但我們多半生活在一個現實的環境中—難以獲得充足的帶寬。MPEG AAC是一個知覺編碼器,它所依靠的人耳和大腦不能或根本不需要處理所有的音頻信息,只要找到不必要的數據並將其棄之即可。前面提到的HVXC與CELP是基於模型的編解碼器,它能分析和重新合成可能存在的各種聲音類型的非常小的子集,也就是人語。所有這些系統的目的是去除冗餘或重復的信息。但問題依然存在,怎樣才能准確地確定哪些信息是多餘的呢?以上舉的General MIDI的例子采區的是不折衷的方法,這就是結構性音頻的起點。在未受到數字化影響的傳統聲音中,可在鋼琴上演奏「G」調。鋼琴可以是Steinway, Bechstein, Bosendorfer或 Bluthner—甚至是 Yamaha的。鋼琴演奏家可能是Askenazy, Brendel 或Bill Evans,音樂廳可在Royal Festival Hall, Wigmore Hall或 Camegie Hall。傳聲器可以用……,好了,我想你們明白我的意思了。但是MIDI型可將此壓縮到三個位元組的數據,然後用任意數量的GM模塊的鋼琴聲學程序恢復這些數據。但丟失了好多內容。
General MIDI裡面可能包含一個指向結構音頻相關信息的指針,但它還遠遠不夠。還是以鋼琴為例子,例如結構音頻可傳送一種類屬的「G」調,但然後編碼描述能播放和記錄音符的不同方式的各種參數。這事實上效率更高、更靈活了。簡單的編解碼器只能描述幾種參數,如響度、踏板踩下去另一根琴弦是否發出共振聲。較復雜一點的編解碼器幾乎包括了所有與音符有關的參數,可以對這些音符進行分析。結構音頻可能的聲調范圍主要是編碼器的職責,憑借有足夠計算能力的解碼器,任何人都可以欣賞到音質的提高。
結構音頻出現已有相當一段時間,但似乎是有了MPEG-4,才開創了結構音頻的時代。其工作方式是這樣的:在MPEG-4 SA碼流的開頭有一個標題,其中包括一大段交響樂。這大段交響樂聽起來就像是一頓新奇的早點麥片粥一樣的一個好聽名字,它以各種樂器的形態出現,但實際上是描述將演奏碼流中包含的音樂的樂器的數據(實際上是樂器的演算法表達)。這大段交響樂寫成「SAOL」(結構化的音頻交響樂語言)。例如,每種樂器包含一種發聲器的物理模型,如鋼琴的琴鍵。此外,樂器還可能包含取樣數據及描述怎樣演奏聲音和變音的指令和參數。碼流本身含有定時事件。它反過來與標題有關。比如,一個事件可能說明被拔琴弦的物理模式(在標題中被描述),現在開始稍加抑制地大聲彈奏「A」調。或者可演奏管樂器的曲調,碼流可能要求音調應該漸高,有些地方要奏出顫音。顫音的深度和頻率也可被描述。這一點比General MIDI有所改進,在GM中,沒有標出確切的聲響,只是說「鋼琴」或「長笛」。在結構音頻中標出了確切的聲響。SA長笛(當編程在SAOL中時) 有可能聽起來不太逼真,但至少這是聽眾將感受的方式,是內容創作者想要的、至少是認可的方式。
這是需要考慮的一個重要概念。可是過去一直對General MIDI視而不見,認為它只是與音頻領域里的一小部分有關的點綴,因此很難衡量出結構音頻有多重要。但有兩點我可以肯定。第一,帶寬不會低得讓人用不了。結構音頻可在低至10b/s的帶寬上傳輸內容,適用於氣氛烘托或低音,並與自然音頻開始替換處的至少10kb/s相應(不管怎樣,10kb/s 以上的SA比特流可能開始超過了解碼器硬體要求的處理能力)。第二,結構音頻有可能成為一種全新的製作技術,與普通錄音和MIDI定序完全不一樣。不低估這個挑戰是明智的。在極低比特率可達到高品質音頻的可能性,以及對這種可能性產生的組合的藝術(不僅僅是技術)的理解,使結構音頻本身就是一種新媒體。
新的音頻媒體
我們現在可以做些思考,隨著結構音頻范圍的擴大,要說的東西很多。但有些事實現在是可以確定的。
目前還不能把已有的唱片變為結構音頻形式。想一想如果有一種工具能把雙簧管從已混錄成立體聲的完整的交響樂唱片中抽出後是什麼樣子。也許將來能這么做,但目前還遠遠做不到。這就是說,結構音頻製作必須從零開始。還是以管弦樂隊為例,這就是說,可以把樂譜裝載到一個理想化的SA編碼器中,這個編碼器已對所有常用管弦樂樂器編程,或許你可以買一個藏族的鼻笛,或其它罕見的樂器作為插件。然後編碼器創作出與實際樂器相似的全部聲音信息,並將其放入SA比特流的標題中,把音符和演奏時的表現力放入碼流中。編碼器的操作在技術上相當簡單,在藝術上比較復雜。在碼流被傳送到解碼器的預期過程中,聽眾聽到的聲音與創作者聽到的一樣,只是在收聽鏈的最後模擬階段才有了變化。請注意,不知是什麼緣故,可能純粹是為了節省帶寬的緣故,管弦樂隊和「真正的」音樂家多餘了。獲得合適的聲音或聲槽至關重要的流行音樂製作將發生徹底的改變。獲得動聽的聲音並把它錄制到磁帶或硬碟上不再足夠了。必須把聲音當作SA樂器創作,然後將其編入比特流中。結構音頻不會徹底消滅傳統技術,傳統技術還可以使用,這是勿庸置疑的。在可預見的將來,凡是未用結構音頻錄音的音頻都不可能轉換
9. 如果做小臉整形的話,要選擇哪家整形醫院比較好呢
刻變得忐忑不安起來,漂亮的眼睛看著她,低聲道:「姐姐,你是覺得麻煩嗎?