コンパクトリニア DNG ファイル：
DxO PureRAW ⁶ が、
画像品質を犠牲にすることなく、
DNG ファイルのサイズを
約 4分の 1に縮小する仕組み

概要

DxO PureRAW ⁶ は、DNG 形式に高忠実度圧縮オプションを新たに導入しました。現行のロスレス圧縮と比較して、ファイルサイズを約 4分の 1に削減しながら、知覚上の画像品質を完全に維持します。

本テクノロジーは、ダイナミックレンジ圧縮（DRC）と JPEG XL 画像コーデックという 2つの補完的な技術を組み合わせています。

主なメリット

1/4 のファイルサイズ：5,000万画素カメラのリニア DNG が、約 200MB から約 50MB に縮小。リニア DNG を、日常的な撮影や大量処理のワークフローで実用的に活用できます。ファイルが小さくなることで、インポートの高速化、クラウド同期の迅速化、ディスク使用量の削減が実現します。
高い忠実度：大胆な編集を加えた場合でも、圧縮による劣化は知覚できないレベルです。
互換性：出力されるファイルは、標準的な DNG ファイルのままです。DNG 対応のアプリケーション（Adobe Lightroom、Capture Oneなど）であれば、通常どおりにファイルを開いて編集できます。

なぜ、さらなる圧縮が必要なのか？

リニア DNGは、DxO PureRAW の推奨出力フォーマットです。最大限の編集余地を保ちながら、サードパーティ製 RAW 現像ソフトとの幅広い互換性を実現します。しかし、DNG 仕様に組み込まれたロスレス圧縮を適用しても、一般的なリニア DNG のファイルサイズは、1メガピクセルあたり約 4MB に達します。5,000万画素のカメラでは、1画像あたり 200MB にもなります。

このような大容量のファイルをさらに圧縮したいというニーズがあるのは、当然のことです。
では、品質を損なうことなく、どこまで圧縮できるのでしょうか？

ロスレスから、知覚的ロスレスへ

ロスレス圧縮は、展開後のファイルが元のデータとビット単位で数学的に同一であることを保証するため、開発者にとってもユーザーにとっても最も安心できるアプローチです。しかし、この種のアルゴリズムには、本質的な効率の限界があります。特に、圧縮対象の信号に、知覚的には無意味な情報が含まれている場合、その限界は顕著です。

DxO PureRAW 6 では、DxO の画像科学者チームが、この不要な情報を圧縮前に除去する圧縮方式を開発しました。圧縮前に、この情報を除去することで、はるかに高い圧縮率を実現しています。その成果が知覚的ロスレス圧縮と呼ばれる技術です。数学的な損失は存在しますが、通常の閲覧・編集条件下では、人間の目には知覚できないレベルに収まっています。

DxO は、リニア DNG ファイルにおいて、知覚的に無関係な情報を 2種類特定しました。

１．過剰なピクセル精度：デジタルカメラの RAW ファイルは通常、1ピクセルあたり、12ビットまたは 14ビットでエンコードされます。DxO の DeepPRIME パイプラインの出力は 16ビットです。ただし、画像には、常にわずかなノイズが意図的に残されています。これは、完全なノイズ除去によって生じる不自然な「プラスチック」のような見た目を防ぐためです。以下で説明するとおり、信号に含まれるノイズが多いほど、数値精度をフルに確保する意味は薄れます。この利用されない精度を除去するのが、ダイナミックレンジ圧縮（DRC）の役割です。

２．テクスチャやグレインの正確な形状：ノイズのグレインや、微細なテクスチャの形状にわずかな違いがあっても、人間の目には知覚できません。こうした微細なディテールを単純化するのは、画像・映像圧縮における古典的な原理であり、JPEG XL コーデックが担う領域です。

いずれの技術も、標準的な DNG メカニズムを使用しているため、対応ソフトウェアであれば、生成されたファイルを問題なく開くことができます。DRC は DNG Linearization Table タグによってエンコードされ、JPEG XL は DNG 仕様バージョン1.7で導入された圧縮モードです。どちらも、主要な RAW 現像アプリケーションでサポートされています。

ダイナミックレンジ圧縮

ダイナミックレンジ圧縮（DRC）は、オーディオ信号処理の分野で広く知られている技術です。コンプレッサーは、非線形の伝達関数を適用して信号のダイナミックレンジを圧縮します。オーディオの用語で言えば、大きな音は減衰させ、小さな音は増幅させることで、与えられたビット量の中に信号を効率的に収めるものです。この原理は、RAW デジタル画像にも極めて適していることが分かっています。

DRC が RAW 画像に有効な理由

デジタル画像は、光そのものの基本特性であるフォトン（ショット）ノイズの影響を受けます。このノイズの標準偏差は、信号強さの平方根に比例して増大します。

この特性は、リニア画像の圧縮に重大な影響を及ぼします。

暗部では、ノイズは非常に少なく、信号は精緻な構造を持っています。精度のあらゆるビットが真に有用な情報を含んでいる可能性があり、14ビット、あるいは 16ビットが必要になる場合もあります。
明部では、ノイズが相対的に大きくなります。有用な信号精度は、14ビットや 16ビットが表現できる範囲よりも、はるかに低くなります。余分なビットは、誰も必要とせず、目にすることもできないレベルでノイズをより精密にエンコードしているにすぎません。

ハイライト領域に存在する、知覚的に無意味な高精度サンプルこそが、ロスレス圧縮の効率を低下させる原因です。コンプレッサーは、意味のある情報を一切含まないビットまで、忠実にエンコードしなければならないからです。

DRC は、圧縮前にリニアピクセル値にコンパンディング関数（具体的には平方根に近い曲線）を適用することで、この問題に対処します。これは分散安定化変換と概念的に関連しています。平方根を適用した後は、ノイズの標準偏差がトーン全域にわたってほぼ一定になります。精度は本当に重要な部分に配分されます。つまり、シャドウには多くの階調を、ハイライトには少なめの階調を割り当てます。知覚的に意味のある情報は一切失われません。

展開時には、DNG 線状化テーブルに格納された逆関数により、DNG 仕様が意図するとおりの元のリニアエンコーディングが復元されます。この処理は、後段のどのアプリケーションでも特別な処理を必要とせず、そのまま扱うことができます。

量子化レベルの数は保守的に選定され、大幅な露出プッシュと極端なシャドウ回復を組み合わせたワーストケースの編集シナリオに対して検証済みです。あらゆる実用的な使用条件において、量子化アーティファクトが視認されないことが確認されています。

JPEG XL 圧縮

DRC 処理後のコンディショニング済み画像は、JPEG 委員会が標準化した次世代画像コーデックである JPEG XL で圧縮されます。

JPEG XL が従来の JPEG より優れている理由

従来の JPEG は 1992年に策定された規格で、固定の 8×8 ブロック変換と比較的単純なエントロピー符号化に依存しています。当時は画期的でしたが、今日の水準から見ると、このアプローチでは圧縮性能に大きな改善余地が残されています。 JPEG XL は、画像圧縮研究における20年以上の進歩を取り込んでいます。

可変サイズ変換：最小 2×2 から最大 256×256 まで対応し、エンコーダーは平滑な領域では大きく効率的なブロックを、エッジ付近では小さく精密なブロックを使用できます。それによって、画一的なグリッドではなく、画像の局所的な特性に適応します。

知覚最適化された色空間：JPEG XL の内部カラー表現は、人間の視覚システムをモデルとしており、知覚にとって最も重要な画像の側面にビットを、よりスマートに割り当てることが可能です。

高度なエントロピー符号化：最新の高効率な符号化技術により、従来の手法では不可能だったレベルまでデータの冗長性を抽出します。

高精度な予測とコンテキストモデリング：エンコーダーは、処理の進行に合わせて画像の統計モデルを構築し、きめ細かなローカル構造を捉えることで、実際に保存すべき予測不能な情報量を削減します。

ネイティブ高ビット深度サポート：従来の JPEG とは異なり、JPEG XL は高ビット深度コンテンツを前提にゼロから設計されており、RAW 画像処理パイプラインの圧縮レイヤーとして理想的です。

DxO では、JPEG XL を、ニアロスレスの品質設定で適用しています。つまり、コーデックが導入する数学的損失はごくわずかであり、実際の画像のノイズフロアをはるかに下回るレベルです。事前の DRC との組み合わせこそが、この圧縮を極めて効果的にしている鍵です。知覚的に無関係な精度を JPEG XL に渡す前に除去することで、コーデックには本質的に圧縮しやすい信号が供給されます。品質を損なう判断をコーデックに委ねる必要がなくなるのです。