目次へ戻る

CDの出力波形の修正

きっかけは、下のSACDの優位性についての質問でしたが内容の大部分はCDの出力波形の修正についての話です。

SACDについて教えてください
投稿者:CM 投稿日:2010年 1月 9日(土)01時57分45秒  
SACDの信号をユニバーサルプレイヤーのアナログ信号としてAVアンプにつないで聞いてみました。マルチチャンネルの音を聞きました。しかし、プレイヤーの操作性が遅く・設定が複雑でした。TVモニター接続必要。2CHの信号に限って、CDよりも優れる点が何処にあるのか分かれば将来考慮するかしないか参考になります。信号の扱い方式にもiLINKなど便利があるようです。CDよりも高周波数領域の再生が良いとのことですが、それだけなのでしょうか。いい音源であれば、SACDであっても聴こうと思うのでありますが。基本的に高周波数領域の再生がCDより優れているだけであれば使わないつもりです。

Re: SACDについて教えてください 投稿者:志賀 投稿日:2010年 1月 9日(土)22時21分48秒  
CMさん

一応ここに書いてあります。

http://www.ne.jp/asahi/shiga/home/MyRoom/highlimit.htm#SACD

このページの録音媒体の限界 2.SACD というところです。これを書いたのは2003年頃ですが、だいたい予想通りの推移をたどっていますね。

また、BBS過去録にもこの件に関しては何件か再録してあります。


http://shigaarch.web.fc2.com/audioBBS.html

確かにCDフォーマットはあまり余裕のない規格なので、高音質のCDを得るにはそれなりに丁寧に作る必要があり、音質の悪いCDはたくさんありますが、よくできたCDならSACDに比べほとんど差はないんではないでしょうか?

いずれにせよSACDはソースが少ないのが最大のネックですね。ただ5.1ch の音楽ソースとして評価する人もいるようです。


ところで、SACDはSACDプレーヤーで再生する限りTVモニターはいらないんではないでしょうか?

Re: SACDについて教えてください 投稿者:WT  投稿日:2010年 1月10日(日)01時01分49秒  
CMさん

SACDというとどうしても可聴帯域外まで周波数特性が伸びていることだけに目が行きがちですが、低レベルでの波形再現性においても非常に良い特性が得られます。例えば、stereophileでは16bit44,1kHzとSACDでの−90dBでの波形再現性を比較していますが、大きな差があります。
http://stereophile.com/hirezplayers/1007eso/index4.html
−90dBで比較しても無意味だという意見もありますが、個人的には−90dBそのものが問題なのではなく、そのレベルに至るまでの−50、−60、−70あたりでもCDフォーマットでは音のひずみが目立つことが問題ではないかと思います。

 SACDとCDとの波形再現性の直接比較はSACDのテストディスクが一般には入手できませんので無理ですが、ハイビット、ハイサンプリングでの波形再現性比較は個人でも可能です。下にお示しした波形は1kHzでのデータです。このような波形を実際に聞いてみると、16bit44,1kHzでは波形の見た目ではひずみがわかりませんが、聴感上では意深く聞くと−40でも歪が感じられ、−50dBあたりからははっきりと歪んでいるのがわかります。

このマルチビットでの正弦波の波形再現性と、ここには載せていない矩形波での波形再現性、そして先のステレオファイルのデータを比べると、SACDは少なくとも24bit96kHz程度の波形再現性は持っていると推測していいと思います。


Re: SACDについて教えてください 投稿者:志賀 投稿日:2010年 1月11日(月)08時47分28秒  
WT さん

>・・・・・このような波形を実際に聞いてみると、16bit44,1kHzでは波形の見た目ではひずみがわかりませんが、聴感上では意深く聞くと−40でも歪が感じられ、−50dBあたりからははっきりと歪んでいるのがわかります。
>
ということですが、これは具体的にはどのようにされたんでしょうか?

私の想像ですが、とりあえずサンプリング周波数は44.1kHzとして、例えば、GeneWaveのようなソフトで、分解能16bitで作った-50dB の正弦波と分解能24bitで作った-50dB の信号を普段聴く音量までアンプで増幅して聴き比べるということでしょうか?

もしそうだとすると、前者の波形は分解能16bitのデジタルシンセサイザーの下位9bitのみで作った正弦波で、後者は分解能24bitの下位17bit で作った正弦波となり、これを同じ音量で比較聴取することになりますね。これは9bitのA/D,D/A コンバータを使ったシステムと17bitのシステムの音を聴き比べるのと同じことになりませんか? それなら差が感じられても不思議ではありませんが?


(無題) 投稿者:WT  投稿日:2010年 1月11日(月)14時38分57秒  
志賀さん

>私の想像ですが、とりあえずサンプリング周波数は44.1kHzとして、例えば、GeneWaveのようなソフト・・・

はい、ほぼご想像の通りです。Wavegeneで各レベル及びフォーマットの正弦波を作成し、それをDVD-audioディスクに焼きこんで、DVDプレーヤー(パイオニアDV-S757A)で再生したアナログ出力を増幅して測定した物です。ですので、16bitよりも24bitの方が分解能が優れているという理論をデータ化したにすぎません。念のためにDVDプレーヤーのデジタルアウトをアキュフェーズのSACDプレーヤー、DP-77に入れて波形を観測しましたが、差は無いように見えました。

 -90dBの波形はカタログなどで時々見かけますが、そこに至るまでの過程でどのあたりから波形が崩れ始めるのか、どのあたりから聴感上波形のひずみが感じられるのかを知りたかったので実験してみたのです

Re: (無題) 投稿者:KZM 投稿日:2010年 1月11日(月)15時55分47秒  

WT さん

>ですので、16bitよりも24bitの方が分解能が優れているという理論をデータ化したにすぎません。

SACDは1bitで記録されているといっても、商用ソフトならば十中八九マスタリング段階でPCM24bitで編集したのち1bitに変換しなおしたものです。
ダイナミックレンジは1bitAD変換、1bit-PCM変換、マスタリング、PCM-1bit変換のそれぞれでどのような処置を行ったものかによりけりです。
SACDにするような音源ならばまず24bit相当の精度は持っている(そういう処理にしている)と考えてよいので、その意味ではCDフォーマットよりも優位であるとは言えるわけです。

16bitで十分なのはあくまでフルスケール付近まで使い切ったシーンのみです。信号のピークでフルスケールで規格化している以上、平均的には精々12bit程度しか使われていないということは往々にしてありますから、結果的にフルスケール24bit相当の精度が得られるSACDにはそれなりに意味はあると思われます。

SACDは普及のさせ方を間違えた感はあるものの、1bitでもブルーレイディスクに記録してHDMIで伝送できるように規格化されたので、普及は今後のやり方次第とも言えます

Re: (無題) 投稿者:志賀 投稿日:2010年 1月11日(月)22時03分38秒  
WT さん

>・・・ですので、16bitよりも24bitの方が分解能が優れているという理論をデータ化したにすぎません。

この件は了解しました。

>念のためにDVDプレーヤーのデジタルアウトをアキュフェーズのSACDプレーヤー、DP-77に入れて波形を観測しましたが、差は無いように見えました。
>
差は無いとは何と何を比較したときですか? DVDプレーヤーの出力波形と比べてですか? それとも、SACDプレーヤーで再生すると-90dBの波形も-60dBの波形も差が無いと言うことですか?

なぜこんなことを聞くかというと、以前話題になったことですが


http://shigaarch.web.fc2.com/OldBBS/89waveshape.html

このまとめの最後に挙げた

http://denon.jp/catalog/pdf/cdplayer_21.pdf
(大変重いファイルなのでご注意を!)

このプレーヤーではCDフォーマットの-90dBの正弦波でも補間によってほぼ元の正弦波を再現できることを示しており、最近の中高級のプレーヤーなら皆そういう処理を行なっているのかどうかを知りたかったからです。

実際の掲示板ではコメントしなかったのですが、低レベル信号の出力波形を比較して音質の優劣を論じるのは誤解を招きやすいので後出しですがコメントを付けておきます。

PCM出力の最低ビット付近の出力の波形は測定精度さえ上げてやれば必ず階段状になります。 上の図で仮に32bit384khzのDACと、さらに低レベル信号で比較すると24bit 192kHz といえども階段状の波形になり十分でないということになってしまいます。つまり、測定精度が許す限りいくらでもエスカレートしてしまうことになります。そこで、聴感によるテストをする必要があるわけですが、こちらも、例えば-60dB の音といえばLPレコードのノイズレベル程度の小ささです。また-40dBの音が通常の音量になるようなボリューム位置で市販のCDを聴くととんでもない大音量になるはずです。CDと比べSACDが本当に聴いてわかるような音質の差が有るのかはやはり、ハイブリッドSACDなどで同じ音楽ソースを使い通常聞く音量で厳密なダブルブラインドテストを行なわない限り軽々に結論は出せないと思います。私自身はかなり懐疑的です。

以下はもっぱら、CDの波形をビットレートを上げて修正する方法についての議論となります。


(無題) 投稿者:WT  投稿日:2010年 1月12日(火)01時27分56秒  
KZM さん

蛇足ですが、pyramixというDAWが近年(2004年あたり?から)DXDデータという32bit384khzのPCM録音(詳しいことは知りませんが、SACD制作用の方式のようです)を可能にしており、これですとミックス、編集ができるためにこのDXDを採用する場合もかなりあるようです。

SACDのフォーマットとしての器は非常に大きいので、マイク次第、録音次第でまだまだ音質が良くなる可能性を秘めている、というのが個人的な感想です。

志賀さん
>差は無いとは何と何を比較したときですか?

言葉足らずでした。DVDプレーヤーの-90dB(-70でも60でも)と、DVDプレーヤーのデジタルアウトを受けたSACDプレーヤーの-90dBの出力波形も見た目では違いを見出せない、という意味です。DVDプレーヤーには周波数延伸技術が使われていますが、DVD-Audioモードでは自動的にオフになります。(先の波形を観測したのはDVD-audioディスクです)。また、SACDプレーヤーには下記に示すような補間技術は採用されておりません。

補間技術(この場合はALPHAプロセッシング)によってCDプレーヤーでも微小レベルの正弦波を正確に再生する技術は、それ自身は確かにすごいとは思います。無線と実験2008年8月号にこの技術の仕組みが解説されておりました。かいつまんで申しますと、波形の変化の仕方(スルーレート)から、あらかじめプログラムされた補間カーブを適宜使い分けるのだそうです。補間カーブはいくつか用意されていて、どのように使い分けるかはマル秘だそうです。ですから正弦波のようなデータは簡単に再現できてしまうそうです。 これは結局のところ、類推補間であって占いのようにあまり当たってないとき(源波形に近づかない時)もあるだろうと考えられます。そうした物理データはありませんが、聴感上合わない、はずした方が自然に感じるという声も聞きます。しかしまったくダメ、というわけでもないようです。ですので、メーカーによってはこうした補間技術を採用しないところもあります。正確に数えたわけではありませんが、日本国内のメーカーでは半々ぐらいのように思います。

さらに蛇足で申しますと、周波数延伸技術もありますが、これも私の知る限りではうまくいかない場合もあります。お示ししたデータは、先のDVDプレーヤーに搭載されているレガートリンク(周波数延伸技術)をオンにしてSACDのCD層を再生したときのFFTグラフです。同じプレーヤーでSACDを再生したときはこのようなディップは現れませんでした(SACD再生時はレガートリンクは自動でオフになります)から、アルゴリズムが合わなかったのだろうと推測しています。他のいくつかのCDも再生してみてみましたがやはりこのようなディップは出来ませんでした。

 以上のような点から、私は補間技術に頼るのではなく、もともとの器の大きいフォーマットで録音、再生するのがベターであると考えます。


DSDの存在価値? 投稿者:BM 投稿日:2010年 1月12日(火)09時23分29秒  
LINNがパッケージソフトの再生機の生産を打ち切りましたが、録音段階ではPCMが主流でDSD録音でのSACDは数少ない現状でして、これからSACDが発展する要素は無いと思っています、配信ソフトに移行してもPCMですし。DSDの存在価値って、残る物なのでしょうか?

Re: (無題) 投稿者:志賀 投稿日:2010年 1月12日(火)18時44分24秒  
WT さん

> 蛇足ですが、pyramixというDAWが近年(2004年あたり?から)DXDデータという32bit384khzのPCM録音(詳しいことは知りませんが、SACD制作用の方式のようです)を可能にしており、これですとミックス、編集ができるためにこのDXDを採用する場合もかなりあるようです。

横からですが、この件に関して以前(2005年)この掲示板で議論しており、予想通りの展開のようです。

http://shigaarch.web.fc2.com/OldBBS/15nextformat.html#07242224

> 補間技術(この場合はALPHAプロセッシング)によってCDプレーヤーでも微小レベルの正弦波を正確に再生する技術は、それ自身は確かにすごいとは思います。無線と実験2008年8月号にこの技術の仕組みが解説されておりました。かいつまんで申しますと、波形の変化の仕方(スルーレート)から、あらかじめプログラムされた補間カーブを適宜使い分けるのだそうです。補間カーブはいくつか用意されていて、どのように使い分けるかはマル秘だそうです。ですから正弦波のようなデータは簡単に再現できてしまうそうです。
>  これは結局のところ、類推補間であって占いのようにあまり当たってないとき(源波形に近づかない時)もあるだろうと考えられます。

詳しい情報有難うございます。ALPHAプロセッシングに関しては,MJの記事は読んでいないんですが、手元にある初期の頃に書かれた資料集にかなり詳しい技術解説があり、ちょっと上の理解と違うようです。いずれにせよ、正弦波だけでなく、インパルス信号もかなり正確に再現されており,かなりまともな技術だと理解しています。

>そうした物理データはありませんが、聴感上合わない、はずした方が自然に感じるという声も聞きます。しかしまったくダメ、というわけでもないようです。

聴感は主観なのでいろいろあるでしょう。

> ですので、メーカーによってはこうした補間技術を採用しないところもあります。正確に数えたわけではありませんが、日本国内のメーカーでは半々ぐらいのように思います。

特許の問題もあるんでしょうね。

> さらに蛇足で申しますと、周波数延伸技術もありますが、これも私の知る限りではうまくいかない場合もあります。お示ししたデータは、先のDVDプレーヤーに搭載されているレガートリンク(周波数延伸技術)をオンにしてSACDのCD層を再生したときのFFTグラフです。

レガートリンクについてはその原理をよく知りません。周波数領域での外挿法のようですがどのような原理に基づき外挿されるのかご存じなら教えて下さい。ちなみに、ALPHAプロセッシングは時間領域での内挿法で結果的に周波数領域でも延伸されていると理解しています。
>
>  以上のような点から、私は補間技術に頼るのではなく、もともとの器の大きいフォーマットで録音、再生するのがベターであると考えます。

それはもちろんそうですが。

(無題) 投稿者:WT  投稿日:2010年 1月12日(火)20時39分19秒  
志賀さん

>インパルス信号もかなり正確に再現されており,かなりまともな技術だと理解しています・・・ALPHAプロセッシングは時間領域での内挿法で結果的に周波数領域でも延伸されていると理解しています

私はデノンのCDプレーヤーを持っていないので、実測した場合、周波数特性的にどのような振る舞いを見せるかについて知りません。手元にあれば試してみたいとは思いますが・・・。

で、ALPHAプロセッシングのインパルス応答波形ですが、やはり無線と実験2008年8月号に詳しい解説が載っています。それによると、音楽信号とインパルス応答波形のような測定用の信号を区別して、インパルス応答波形のような測定用信号が入った場合、リンギングマスキング回路に送ってリンギングを除去してしまうそうです。従ってあたかも音楽信号においてもリンギングのない優秀な特性を示すかのような回路に仕上がっているという訳です。

私の理解の仕方が間違っているかもしれませんから、もしご希望であればその記事をPDFファイルでメールお送りいたします。パイオニアのレガートリンクの技術についても別の号で詳しく解説されてます。そちらもお送りいたしましょうか?

Re: (無題)
投稿者:志賀 投稿日:2010年 1月12日(火)22時20分44秒  
WT さん

>私の理解の仕方が間違っているかもしれませんから、もしご希望であればその記事をPDFファイルでメールお送りいたします。パイオニアのレガートリンクの技術についても別の号で詳しく解説されてます。そちらもお送りいたしましょうか?

私の方もメーカーサイドの技術資料なので公平な判断は出来ないですね。

厚かましいですが、ぜひpdf ファイル送って下さい。もちろん急ぎません。また、レガートリンクの方も出来ればよろしくお願いします。

Re: (無題) 投稿者:KZM 投稿日:2010年 1月12日(火)23時58分20秒  
WT さん

> 蛇足ですが、pyramixというDAWが近年(2004年あたり?から)DXDデータという32bit384khzのPCM録音(詳しいことは知りませんが、SACD制作用の方式のようです)を可能にしており、これですとミックス、編集ができるためにこのDXDを採用する場合もかなりあるようです。

可聴域で24bit相当のダイナミックレンジを確保しつつ384kHzPCMに変換した場合、元が2.8MHzならば20kHz以上は掃き上げられた量子化ノイズが相当積み上がることになります。実用的には192kHzとほとんど変わらないように思われます。逆に広帯域を目指すと24bit相当の精度はとても取れません。また、bit深度の方は32bitといっても実際には24bitのLSB付近が改善される程度でしょう。それでも実24bitよりはましになるので、32bit化にはまだ意味があると思います。

また、CPU能力の限界があるために、このような大きいフォーマットで処理できるトラック数はかなり限られてきます。知人のスタジオミュージシャンによれば、ドラムだけで10トラックは最低必要なので自分は48kHzでやっているということでした。1bit録音機材がワンポイント録音主義者や2chアナログマスターの高精度デジタル記録以外では受けが悪いのは、結局PCMで編集が必要になるからという事情があります。PCMマスタリングを前提にDSDフォーマットでリリースしても、1bit録音の本来の思想とはかけ離れたものになります。CDよりは自由度が広いというメリットは残るとは言えます。

>音楽信号とインパルス応答波形のような測定用の信号を区別して、インパルス応答波形のような測定用信号が入った場合、リンギングマスキング回路に送ってリンギングを除去してしまうそうです。

信号に込められた意味量を捉える音声認識、文字認識はかなりの精度が得られるのに対し、信号波形そのものを再現するのはやはり難しいでしょう。sin波にしろインパルスにしろ、元の特性がわかっていれば予測変換はやはり比較的容易です。ハイビジョンをSD画質に落として超解像をかけても元通りにはならないように、映像、音楽などの未知入力信号を処理するのは、何もやらないよりはよくなることが多いでしょうが、あくまでチューニングと確率の問題になってきます。

pyramix 投稿者:WT  投稿日:2010年 1月13日(水)19時00分14秒  
KZM さん

pyramixの輸入販売元であるDSPジャパンの人にちょっと聞いてみたのですが、このDXDというファイル形式は非常に特殊で、32bit384khzと言いながら、DSDデータを「変換(レンダリング)」しているのではないのだそうです。理屈を少し教えていただいたのですが、私の頭では理解不能でありました(笑)

トラック数については、理論上は制限は無いそうです(DXD,DSD時でも)が、HDDの転送速度に依存するそうです。現実的にはどうなんでしょうかね、たぶん32トラックあたりが今のところの限界のように想像します。ポップスやジャズですとこれでは足りないですね。pyramixのDSDマスタリングソフトパッケージは非常に高価だそうで(pyramixを使っている某ミキサーさんのお話)こうしたこともSACD普及の足かせになっているようです。

Re: pyramix 投稿者:KZM 投稿日:2010年 1月13日(水)21時54分28秒  
WT さん

DSPジャパンの説明を再度読んでみたところ、「オーバーダビングの際に、編集された素材はリアルタイム・プレイバック中に8fsにトランスコードされる」とされています。察するに、1bitのトラックがベースにあり、オーバーダビング(ミキシング)中のみメモリ上で384KHzPCMに変換して、結果を再度1bitに変換して記録するという方式のように思われます。するとPCMデータはユーザーの目には見えてこず、あたかも1bitを直接ミックスしているような気になるというだけのように見えます。短い文章だけから判断したことですので誤解があるかもしれません。

DXD、SACD 投稿者:WT  投稿日:2010年 1月14日(木)10時38分9秒  
KZM さん

このDXDに関しては、今の所私には歯が立たないですね(笑)。INTER BEEや放送機器展にでも行ったときに、もう一度担当者に聞いてみたいと思います。

CMさん

だいぶCMさんのお話から脱線してしまいましたが、つまるところSACDは「周波数領域の拡大だけではない」という物理特性をもっていることは明らかです。他のメディアと同様、録音の良し悪しには大きく左右されますが、一度聞いてみることをお勧めします。

レガートリンクなど 投稿者:志賀 投稿日:2010年 1月26日(火)22時25分35秒
WT さん、 皆さん

少し前の記事で、送ってもらった資料を読んだ結果報告です。

レガートリンクの原理だいたい分かりました。CDに記録されている22kHz以下の成分の高調波を作りこれに1/fの重みをつけ元信号に混ぜる。ただし、HPF により22kHz 以下の成分はカットするというものです。予想通り周波数領域での外挿です。

高調波成分を混ぜるということは、当然元信号を歪ませるということですから、入力が純サイン波なら出力は歪んだ波形となります。

ちなみにアルファプロセッサーは時間領域のスムージング操作でサイン波やインパルス信号なら低レベルの信号でもかなりきれいに再現するようです。

といっても、もちろん失った情報が取り戻せるわけでないので、元信号と比較してもあまり意味がなく、結局どの方式が聴き易いかを比較するしかないんだと思います。

で、本当にブラインド条件で比較した結果があるんでしょうかね??

思うに、その人がもっとも合理的と思う技術で補正したプレーヤの音がもっともいい音に聴こえるというのが真相のような気がします。 いかがでしょう?


Reレガートリンクなど 投稿者:WT  投稿日:2010年 1月27日(水)01時22分16秒   志賀さん

>レガートリンクの原理だいたい分かりました。CDに記録されている22kHz以下の成分の高調波を作りこれに1/fの重みをつけ元信号に混ぜる・・・

レガートリンクの手法については私も志賀さんのおっしゃるとおりに理解しました。

>アルファプロセッサーは時間領域のスムージング操作でサイン波やインパルス信号なら低レベルの信号でもかなりきれいに再現するようです。

少し補足しますと、アルファプロセッサーはインパルス信号のようなテスト信号の場合は音楽信号とは別回路で処理され、実際の音楽信号の場合はいくつかの補間カーブから随時選択されて補間をしている、というもののようですね。

>といっても、もちろん失った情報が取り戻せるわけでないので、元信号と比較してもあまり意味がなく・・・

意味がないというのがなぜなのかは私にはちょっとわかりかねますが、純粋に技術としてみた時には元信号に忠実なほうがハイフィディリティーであり、オーディオ機器の基本的に目指す方向であると思います。

>結局どの方式が聴き易いかを比較するしかないんだと思います。

主観的評価を許容するならば、おっしゃるとおりだと思います。しかし、ここのサイトであの音がいい、この音が悪いといったような書き込みはあまり意味がないと思いましたのでそうした観点からの評価は私は意識的にやめております。

>で、本当にブラインド条件で比較した結果があるんでしょうかね??

そのような記事は見たこと無いですね(笑)

ま、事の発端から申し上げますとCMさんがSACDには周波数帯域の拡大以外のメリットはないのでしょうかという問いがありましたから、低レベルの波形再現性でもSACDが有利であることはまちがいないということをデータを基に書いた、ということです。

レガートリンクもアルファプロセッサーもそれぞれ独自のアルゴリズムを持っていますから、源波形に上手く近づく場合もあればソースによってはちょっと違ってしまう場合もあるだろう、それだったらもともとの物理特性がCDより優れているSACDのほうが技術的にベターである、というのが私の見解ですね。

某オーディオ店で、数年前にアルファプロセッサーを搭載したSACD機を聞いたんですが、何を聴いても感心しませんでした。しかし、ごく最近のデノンのSACD機(新しいアルファプロセッサーを搭載した物)は見違えるほど良い音を聞かせてくれました。勿論これがただの錯聴ではない、ということを証明することは出来ません。

Re: Reレガートリンクなど 投稿者:KZM 投稿日:2010年 1月27日(水)02時11分8秒 WT さん

>>で、本当にブラインド条件で比較した結果があるんでしょうかね??
>
ネガティブな結果が出たら自分の首を絞めるだけなのでメーカーも雑誌もまずやりません。大学などでは、他にやるべきことがたくさんありますからそんなことをやっている暇はありません。映像は同時に並べて比較できるので超解像などは当然比較評価します。

さて、同一CD音源に対してAL24 Processingを作用させたものと切ったものを改めて実24bitで録音したデータを作成し、foobarなどでABX testする方法には興味はありますか?
レガートリンクも同様です。

Re: Reレガートリンクなど
投稿者:WT  投稿日:2010年 1月27日(水)22時35分50秒 KZMさん

>さて、同一CD音源に対してAL24 Processingを作用させたものと切ったものを・・・

うーん、あまり興味はないんですよ。無線と実験誌の解説を読んで、手品のネタバラシを見てしまったような感じで。技術的手法には興味を惹かれましたが、自分にとって魅力ある技術かというとむしろ逆なんですね。そういう手法で音が変わっても変わらなくても別にいいじゃないか、という気分です。

Re: Reレガートリンクなど
投稿者:KZM 投稿日:2010年 1月27日(水)23時13分51秒 WT さん

つまり、忠実再生とは別モノでありHiFiに寄与しないということでしょう。インパルス応答に対して別のテーブルを引っ張り出してくるという話はなんともセコイと感じましたけど、元のCD音源が低bit故に聴くに耐えないようなときはそれなりに意味があると考える人がいてもよいと思います。なお、そういう音源にはほとんど出会ったことはありません。

それからAl24を簡単にオンオフできるプレーヤは見つかりませんでした。

Re: Reレガートリンクな
ど 投稿者:TK 投稿日:2010年 1月27日(水)23時25分38秒  

スレッドの流れから少し逸れますが、音楽のデジタルフォーマットの補間技術に興味があり少し調べてみました。NTT 研究所の橋本さんが昔やってたようです。1997年の情報処理学会の数理モデル化と問題解決研究会の論文に少し載っていました。

楽音の統計的性質を利用した音楽信号の高次bit推定方法

http://ci.nii.ac.jp/naid/110002936277

この論文では、ALPHA プロセッシングを従来の技術として引用していて、情報の復元としては意味が無いと書いてありました。
続報が無いようなので、うまくいかなかったのかもしれません。

圧縮音源の interpolation に関する研究はあるようですが、CD のような高品位なものを想定したものは、他に見付かりませんでした。
(調べ方が悪いのかもしれません)

オーディオ関連の論文は、日本だと、日本音響学会、電子情報通信学会などに多そうでした。
国際的な学会は Audio Engineering Society (AES) が有名なようです。
日本の場合は、大学等からアクセスすると読める論文が多かったですが、AES はお金を払わないと読めないようでした。

Re: Reレガートリンクなど 投稿者:志賀 投稿日:2010年 1月28日(木)14時49分49秒
TKさん

私も見てみましが、ちょっと違う印象を持ちました。確かにALPHAプロセッシングの文献が引用してありますがこれはただ参考のために挙げているだけで、この人達の考えていることは周波数領域の外挿法に関するものではないでしょうか? レガートリンクタイプです。

このとき、実際の音楽信号はいろんなタイプがあり、また楽器のたたきはじめと余韻では周波数スペクトルに差が有り、結論的にはどういう外挿法が最適かを結論するのは難しいといったところではないでしょうか?

> この論文では、「ALPHA プロセッシングを従来の技術として引用していて、情報の復元としては意味が無い」と書いてありました。

いずれにせよ、本文中にこのような記述は見あたらなかったのですが?ひょっとして別の論文?

ALPHAプロセッシング 投稿者:志賀 投稿日:2010年 1月28日(木)15時13分57秒
ワッツさん、 KZMさん、皆さん

私も、こちらの方の解説を少し丁寧に読んでみました。確かにインパルス信号や矩形波などは別扱いになってますね。

興味のあるのは何をもってインパルス信号と判断するかですが、16ビット44.1kHz 信号のスルーレートが判断の基準ですね。人工的なインパルス信号や矩形波は極端にスルーレートが高く(0からいきなり大きな有限値になる)ので、こういう入力があったときは補間をせずオーバーサンプリングによるリンキングを避ける処理をするということのようです。

従って通常の音楽信号のときは全く使っていないといっていいでしょう。これを宣伝文に使うのは確かにちょっと問題ですね。

音楽信号の場合は隣接するサンプルデータの変化率を解析し正弦波をベースにした数個の関数形から適当な補間関数を選ぶということのようです。入力信号がテスト用の純正弦波であっても特別扱いするわけでなく、通常の音楽信号補間用のアルゴリズムに従って処理しているだけのようですね

ご存じの方教えて下さい 投稿者:志賀 投稿日:2010年 1月28日(木)15時25分26秒  
皆さん

この所話題になっているCDのアップデータ処理は要するに量子化ノイズの軽減が目的といっていいと思いますが、もともとCDが発売された頃はいわゆるディザノイズを加えていわばごまかしていたわけですね。

最近のCDはどうなっているんでしょうか? もしまだディザノイズが入れてあるなら、細かい補間の話をしてもそれこそ無意味なような気がしますが?

Re: ご存じの方教えて下さい 投稿者:NS 投稿日:2010年 1月28日(木)22時28分58秒  
志賀さん

最近のCDでもディザやノイズシェイパーは入れてあります。その理由は、変換後にこれらの処理を入れていないと高調波歪が生じるからです

Re: ご存じの方教えて下さい 投稿者:WT  投稿日:2010年 1月28日(木)23時23分6秒NSさん

ハード(CDプレーヤー)側の話しかと思ったらソフト側の話なんですね。ソフト側ではディザをやっているのですか。知りませんでした。勉強になりました

志賀さん、KZMさん

CDプレーヤーでも一時期ディザを入れるのが流行りましたけど、今は何処もやってないですね。アルファプロセッサーやレガートリンクのような拡大、延伸技術もひと時盛り上がりましたが、積極的にやっているのは今はデノンとパイオニアだけになりました。

 デノンのホームページを見ましたら、インパルス信号と音楽信号を分けて処理してあることをちゃんと書いてありました。
「Advanced AL32 Processingでは適応性の高いフィルターアルゴリズムを採用。パルス性の信号や高い周波数の連続音等に対しても、最適なアルゴリズムによるフィルタリングを行います」
とても上手な表現なので感心してしまいました。

Re: ご存じの方教えて下さい 投稿者:志賀 投稿日:2010年 1月29日(金)06時30分45秒 NSさん

> 最近のCDでもディザやノイズシェイパーは入れてあります。 その理由は、変換後にこれらの処理を入れていないと高調波歪が生じるからです。

おっしゃる通りでした。量子化時にディザを入れるのは必須ですね。ちょっと考え違いをしていました。

Re: ご存じの方教えて下さい 投稿者:志賀 投稿日:2010年 1月29日(金)09時02分10秒 WT さん

> CDプレーヤーでも一時期ディザを入れるのが流行りましたけど、今は何処もやってないですね。アルファプロセッサーやレガートリンクのような拡大、延伸技術もひと時盛り上がりましたが、積極的にやっているのは今はデノンとパイオニアだけになりました。

ということはかなりの高級機でも補間によるスムージングはやらずに、低レベル信号は階段状のまま出力しているということでしょうか?

>
 デノンのホームページを見ましたら、インパルス信号と音楽信号を分けて処理してあることをちゃんと書いてありました。
> 「Advanced AL32 Processingでは適応性の高いフィルターアルゴリズムを採用。パルス性の信号や高い周波数の連続音等に対しても、最適なアルゴリズムによるフィルタリングを行います」
> とても上手な表現なので感心してしまいました。

http://denon.jp/products2/dcdsx.html

ここに書いてある宣伝文ですね。

その前段に「従来のALPHA Processingではパルスデータに対しては通過帯域を広げリンギングの発生を防ぐ適応型デジタルフィルターを採用していました。」という文章が入っています。つまり、インパルス信号などの超高スルーレートの信号だけを別回路で処理していたのは従来型でAdvanced方はハード的にはパルス信号だけを特別扱いせず、複数のアルゴリズムを用意し信号のパターンによって切り替えるようですね。

この文の下に書いてあるブロックダイヤグラムはわかりやすいです。

いずれにせよ、大変細かい話で、これで効果があるのかどうかは別にして、技術的な点はだいぶ理解できました。お付き合い有難うございます。

Re: ご存じの方教えて下さい 投稿者:WT  投稿日:2010年 1月29日(金)22時32分44秒  
志賀さん

>高級機でも補間によるスムージングはやらずに、低レベル信号は階段状のまま出力しているということでしょうか?

ディザを使った場合、低レベルの信号はホワイトノイズが重畳されたようなぼやけた波形になったかと記憶しています。しかしステレオファイルに載っている-90dBの波形はどこのメーカーものでも、くっきりした階段状の波形ですね。真っ先にディザを取り入れたティアックのCDPでもそうですね。今はティアック(エソテリック)もディザを使っているとは詠ってません。なぜやめてしまったのか理由はわかりませんが。

>Advanced方はハード的にはパルス信号だけを特別扱いせず、複数のアルゴリズムを用意し信号のパターンによって切り替えるようですね。

私も最初はリンギングマスキング回路を使うのはやめたのだな、と思いましたが、「パルス性の信号や高い周波数の連続音等に対しても、最適なアルゴリズムによる・・・」という文面をちょっと意地悪く?解釈すると、パルス性の信号(インパルス信号)に適応したフィルタリングがちゃんと用意されていてもウソにはならないな、と思った次第です。どこまでがホントかはわかりません。

Re: Reレガートリンクなど 投稿者:KZM 投稿日:2010年 1月29日(金)23時31分56秒
情報を整理しまして:

>> この論文では、「ALPHA プロセッシングを従来の技術として引用していて、情報の復元としては意味が無い」と書いてありました。
>
> いずれにせよ、本文中にこのような記述は見あたらなかったのですが?

補間処理についての内挿外挿という用語についてあまり馴染みがなかったので少々調べてみたところ、補間と内挿は同義であり、外挿は「補外」と同義であるとわかりました。つまり、この補間処理は内挿法だというのは同じことを言っているだけになります。引用論文の従来の技術の項で復元に意味がないというのはAL-processingそのものです。

今までの情報を総合するに、AL-processingではスルーレートに応じて補間カーブを数種類使い分けるのならば、予測の成功率とは確かに無関係になります。サンプリング点間を通る曲線は無限に存在し、元信号は基本的にランダムなので、それが補間カーブに近い確率は無限小になるからです。
微小なsin波はスルーレートが低いものに相当しますから、sin波を近似するのに都合のよいカーブを低スルーレート用に登録しておけば結果は見掛け上良好になります。インパルス応答も同様です。

論文で表現されているように、確かにこれは適応型LPFと思われます。言葉だけ見ると適応しているならいいではないかと思いがちですが、適応型フィルタとは既知の入力信号の特性に合わせて対応するフィルタのことで、特性が未知の音楽信号に対しては全然適応してくれません。

ということは、最も基本的であるゼロ補間で得られるカーブとAL-processingの結果は元信号推定の意味では確率的にほとんど同じであり、AL-processingは元信号に無関係な高周波を追加しているだけです。確率的に有効なのはスルーレートが極端になるsin波とインパルス応答だけになります。

>今はティアック(エソテリック)もディザを使っているとは詠ってません。なぜやめてしまったのか理由はわかりませんが。

実用的には、極端にボリュームを上げて聴く場合にはディザを入れた方が微小な高調波が目立たなくなり若干優位のように思います。しかし、LSBが見えてくるような使い方を考慮してわざわざノイズを混入しているという触れ込みの製品では、売り文句にならないからでは。

Re: Reレガートリンクなど 投稿者:HD 投稿日:2010年 1月30日(土)09時29分36秒 KZMさん:

最近のプレーヤに使われるDACはほとんどがΔーΣ型で LSIですね。 中・高級プレーヤにも使われていそうなLSIチップのブロックダイヤグラムを2,3見てみました。中にinterpolator(補間器)という機能が入っています。 この機能はどういう動作をするのでしょうか? ある種のフィルターでしょうか? 下に2種類例をあげます。

Re: Reレガートリンクなど
投稿者:KZM 投稿日:2010年 1月30日(土)09時57分53秒
HDさん

通常のDACに使われているinterpolatorはゼロ補間(単に元データの間を0で埋める)によるハイサンプリング化を行い、直接DA変換に伴う量子化誤差を広帯域に拡散して急峻なFIR-LPFで元データに含まれない高周波をノイズフロアまで落とす手法です。ゼロ補間に限ったことではないものの、ひとつの定式でやるなら元信号推定の成功率はゼロ補間と変わりません。このままでは2倍オーバーサンプリングで量子化誤差が1/2になるなど、数字に従う誤差低減しかできませんので、さらにΔΣ変調をかけて可聴域のS/Nを向上させます。ΔΣを詳しく論じ始めると話がずれすぎますのでまずはこれまでに。

村橋さん(現シャープ)の解説を参照ください。
http://www.okuma.nuee.nagoya-u.ac.jp/~murahasi/dsm/feature.html
http://27.pro.tok2.com/~KZM/

Re: Reレガートリンクなど 投稿者:toshi 投稿日:2010年 1月30日(土)10時13分34秒
HDさん
ΔΣ方式だとアップサンプリングで、ローパスフィルター自由度拡大&ノイズ低減が目的
 http://jaco.ec.t.kanazawa-u.ac.jp/edu/digi/pdf/54.pdf
 http://jaco.ec.t.kanazawa-u.ac.jp/edu/digi/pdf/51.pdf

ノイズ低減は、A−Dコンバーターの例ですが、
  http://ednjapan.rbi-j.com/issue/2008/4/10/2993
  http://ednjapan.rbi-j.com/issue/2008/5/12/1810
  http://ednjapan.rbi-j.com/issue/2008/6/13/4626
  http://ednjapan.rbi-j.com/issue/2008/7/14/3612
が、デジタル処理全体を含め比較的分かりやすく書かれています。

波形の修正 投稿者:志賀 投稿日:2010年 1月31日(日)07時03分12秒  
PCM録音の補間の問題が盛り上がっていますが、ちょっと難しい技術的議論になってきたので私なりの整理をさせてもらいます。

話題となっているのはbit数 N、サンプリング周波数 fs のPCM録音では、 fs/2 より十分低い周波数で、最下位ビット付近の信号の変化をD/A変換すると階段状の波形になります。そこで「これは自然界には存在しない波形なのでビットレートを上げ何か手を加えて修正した方がいいのでは?」という発想が出てくるのが自然の流れです。もちろんビットレートを上げたフォーマットを使って録音・再生すれば、聴感上問題にならないということで解決するわけですが、ここでは、録音側の規格をそのままで再生時に多ビット化やアップサンプリングで対応する場合のことに話題を限定します。また、比較する際はそれぞれの方法でのビットレートは等しいとして考えます。

方法としては、(1)元の波形を推定し人工的に合成する(レガートリンクなど)。これは周波数領域での外挿といっていいと思います(2)時間領域の波形をスムージング補間する(アルファプロセッシングなど)。(3) ノイズレベルを下げるものの波形はいじらない。といった所でしょうか。それぞれ一長一短あるわけですが、Nやfsが小さい場合は音として聴くと違って聴こえるはずで当然評価は分かれるはずです。

ところが、CD規格(16bit 44.1kHz)の場合、ワッツさんの言われるように、いろんな方式が考案されるもののはやりすたれがあり中々評価が定まらないようです。現在では(3)の方式が多数派だそうですが、理屈の上ではこれが最上だとは考えにくい。やはり不自然ですよね。といっもSACDなどの上位フォーマットが普及するわけではなくその気配もないというのが現状ではないでしょうか?

これが何を意味するか?

私の意見は、結局のところCD規格は人間の聴覚には十分で、どの方法をとってもブラインドでは有意差がでないような差しかないというものです。

いかがでしょう?


Re波形の修正 投稿者:WT  投稿日:2010年 1月31日(日)23時32分25秒
志賀さん

私自身はSACDが普及しない原因が音質的な有意差がないからだ、と結論付けることは出来ないと考えます。
それはオーディオ機器の歴史をみても、従来より明らかに優れたフォーマットが主流になることはあまりないからです。

 古くはエルカセットがそうでした。カセットテープよりもはるかに優れた音質を持つ物として期待されましたが、ほとんど普及せずに消えていきました。次に期待されたのがDATで、これも「夢のテープレコーダー」とまで言われ、その優秀性からプロのレコーディングにも使われ、DATで録音されたCDも数多く市販されました。しかしカセットテープに取って代わるほどの普及には至らず、どちらかといえば録音マニアのもの、というレベルで終わりました。

 一方、LPに取って代わったCDはそれこそ堰を切ったようにあっという間の交代劇を見せました。これはよく言われるようにその音質が認められたからではなく、その簡便性、利便性が受け入れられたからです。現在のデジタル音響機器、特にipodなどが急速にシェアを伸ばしているのも、ダウンロードミュージックの販売が伸びているのもその利便性によるところが大きいと解釈するのが妥当であると思います。

こうしたことはテレビでも同様で、従来のNTSCよりも明らかに画質の良いハイビジョンが世に現れたのは80年代だと思いましたが、一向に普及しませんでした。20年以上も経ったここにきてやっと普及し始めたのはアナログ放送が終了という、いわば強制終了という事態になったからであり、一般ユーザーが高画質を求めたからではないことは明らかです。
ですから上位フォーマットが普及しない原因が音質の優位性が感じられないからだ、と結論付けるのは無理があると私は考えます。

SACDの音質と普及
投稿者:志賀 投稿日:2010年 2月 1日(月)08時59分7秒  
WT さん

>・・・・ですから上位フォーマットが普及しない原因が音質の優位性が感じられないからだ、と結論付けるのは無理があると私は考えます。

元記事でいいたかったのはCDの波形修正技術の優劣についてで、SACDのことを付け加えたのは余計なことでした。(WT さんはそちらの方に興味があったのだとは思いますが)

SACDの音質が、人間の聴覚で聴き分けられるほどCDより優れているかどうかについてはかなり懐疑的ですが、否定しているわけではありません。いずれにせよ信頼出来る客観的なデータがない以上議論しても水掛け論になるだけでやめておきましょう。

ただ、普及しない理由についてはそれぞれに理由があり単純ではないと思います。まあどちらかというと技術論より経済学・社会学の問題ではないでしょうか?

要因としては、単に技術的な優位性でなく実際に使ったときの優位性の差、価格の差、絶対的な価格とその時の所得水準、利便性の差、同様の機能を持つがそれより優れた全く別の原理を使った製品の出現、それを必要とする人数、製品の寿命(買い変え期間)、政治的法律的理由 等々 いろいろ考えられ、元記事で挙げられた例もそれぞれ全く違った説明も可能だと思います。


しかしこれも見解の相違で終わりそうなので議論するのはやめておきましょう。

一般論としては実用上すぐれていることがはっきりしていても価格が高すぎる製品はすぐには普及しなくても、ある程度普及が進むと大量生産により価格が低下しある時点で爆発的に普及が進むことはよくあることですね。これは協力現象による相転移として自然界にもよく見られる現象です。

ReSACDの音質と普及 投稿者:WT  投稿日:2010年 2月 1日(月)16時58分35秒  
志賀さん

>元記事でいいたかったのはCDの波形修正技術の優劣についてで・・・

あ、そうでしたか。勘違いをしました。失礼しました。


>普及しない理由についてはそれぞれに理由があり単純ではないと思います。まあどちらかというと技術論より経済学・社会学の問題ではないでしょうか?

私もそう思います。私の挙げた理由は「そういうのも一つの理由」と思ってます。


>単に技術的な優位性でなく実際に使ったときの優位性の差・・・いろいろ考えられ、元記事で挙げられた例もそれぞれ全く違った説明も可能だと思います

はい、確かにそうだと思います。

SACD

comment

inserted by FC2 system