世界を動かす技術を、日本語で。

AV2ビデオ標準がリリースされました(最終版v1.0仕様)

概要

  • AV2 はAlliance for Open Media(AOMedia)による次世代ビデオ符号化仕様
  • AV1 の基盤を活かし、より高効率な圧縮と低ビットレートでの高品質配信を実現
  • ストリーミング・放送・リアルタイム会議 など多様な用途に最適化
  • 技術仕様書は ビットストリーム構造・セマンティクス・デコード処理 を網羅
  • AR/VRやマルチプログラム分割画面 など新機能への対応強化

AV2とは

  • AV2 はAlliance for Open Media(AOMedia)が策定した次世代ビデオコーデック仕様
  • AV1 を基盤とし、さらに高い 圧縮効率低ビットレート での高画質配信を実現
  • ストリーミング配信・放送・リアルタイム会議 など、進化する映像配信ニーズに最適化
  • AR/VRアプリケーション への強化対応
  • マルチプログラム分割画面配信画面コンテンツ処理の改良
  • 広範な画質レンジ での動作が可能

技術仕様書の内容

  • AV2仕様書 は、実装者向けの 公式技術リファレンス
  • ビットストリーム構文・セマンティクス・デコード処理 の詳細を網羅
  • 完全な準拠性 を確保するための必須情報を提供
  • AOMedia Video Model(AVM) が公式リファレンスソフトウェアとして提供
  • AR/VRや複数番組同時配信 など新機能の技術的根拠を明記

バージョン情報

  • AV2 Bitstream & Decoding Process Specification v1.0.0 が現行最新版
  • AVMリファレンスソフトウェア もv1.0.0に対応
  • 開発途中のドラフト(v13)は v1.0.0以前の作業版 として参照用に保持
  • v13v1.0.0より新しいバージョンではない ことに注意

仕様書の利用方法

  • フル仕様書 は範囲・定義から付録まで全セクションを網羅
  • PDF版 はv1.0.0の全内容をオフライン参照用にダウンロード可能
  • Additional Tables はセクション9のルックアップテーブルを C言語ヘッダファイル として提供
  • Syntax Browser はセクション5(構文)・6(セマンティクス)を分割表示
    • 構文定義と意味を 並列表示
    • クリック可能な構文要素 で容易なナビゲーション
    • 全文検索機能
    • 構文構造のコピー機能
  • リファレンスソフトウェア(AVM)v1.0.0タグ に対応

Hackerたちの意見

いくつかのことがあるけど、これは長い道のりの一歩に過ぎないよ。AV2は今の状態じゃ使い物にならないし(エンコーダーは良いハードウェアでも大体1fpsくらい)、2028年頃に最初のAV2ハードウェアアクセラレーションチップが出るまでこのままだと思う。そうなっても、2030年まではAV2のストリームが一般的になるとは思えないな。個人的には、もし効率の向上だけが話題にされているなら(それはかなり大きいけど、AV1に対して約20-30%の改善)、AV2はあまり価値がないと思う。でも、AV2の一番の利点はマルチストリームサポートで、これはVRやライブスポーツにとって大きなメリットになるよ。あと、アルファチャンネルを別のストリームとして送れるのも面白いところで、そのファイルがちゃんと透明な動画をサポートするために合成してくれるんだ。

AV1の進展を考えると、ハードウェアエンコードは必須ではないね(あったら嬉しいけど)。今のエンコーダーはリファレンスエンコーダーだし、仕様が確定したから、製品エンコーダーからはかなりの速度改善が期待できるよ。ただ、リアルタイム処理はハードウェアが出るまで無理だと思うけど。

AV1に対する効率の向上についての情報はどこで見られるの?

それ自体は問題ないし、コーデックにとっては新しいことでもないよ。普及には時間がかかるからね。AV1を見てみて、すべてのハードウェアで本当に普及しているとは言えないし。初期の頃に比べればかなり進んでるけど、まだハードウェアアクセラレーションがないモバイルデバイスもあるんだ。

AV2で計算するのがそんなに高コストな理由、誰か知ってる?

この調子だと、PCでAV2のハードウェアエンコーダはすぐには期待できそうにないね。最新の最高のチップ容量は、完全にAppleやAI企業に独占されてるし。チップメーカーがAV2の設計を古い安いノードに移植しない限り、一般ユーザーには無理だと思う。中国のテレビチップメーカーがAV2デコーダを入れてチェックボックスを埋めることはあるかもしれないけど、実際のエンコーダとしては、すぐには期待できないかな。

HWアクセラレーションチップでは、通常どの計算部分を加速するの?古いハードウェアを再利用することはできるかな?

2030年には、480pを送って、向こうでAIでアップスケールする方が可能性高い気がする。

でも、一番大きなポイントはマルチストリームサポートだね。これがVRやライブスポーツにとっては大きな勝利になると思う。AV1もそれに対応してるのかな?

........AV2はあんまり価値ないと思うな。ハードウェアのエンコーダーとデコーダーの設計が並行して進められない限り、ハードウェアブロックの設計が完成するのは2028年だし、最初の製品が出るのは2030年になると思う。実際には2031年か2032年の方が現実的だと思うし、20-30%の世代間コーデック改善はあんまり意味がないってずっと言ってる。最初は50%を目指して、その後40%、30%に下がったんじゃないかな。

高品質のビデオ配信をかなり低いビットレートで実現することができる > 最初のAV2ハードウェアアクセラレートチップが出るのは2028年頃までそうだろうね。これってちょっとバカみたいに聞こえるかもしれないけど、遅いデバイス向けに作られてるのに、その遅いデバイス自体がまだ存在しないってどういうこと?

Dav2dって、あんまり響きが良くないね。誰か面白いリポ名のセンスを持った人が貢献してくれるといいな。avi2ude?av2go?

2av2quit?

少なくともD4vdじゃないね。

いいね!最初のほどダジャレっぽくはないけど、かなりストレートでわかりやすい。

av2のいい名前を見つけるのが難しかったよ :( フランス語だとd2vid(デウビッド)って感じかな。

e2ed

おめでとう!ドルビーの特許の問題はどうなってるの?AV1を使ったことでSnapchatを攻撃しようとしたみたいだけど。

最後の更新は「訴訟が提起された」ってだけで、それ以降は全く更新がないみたい。こういうのは進展が遅いことが多いよね。

こういうことはいつも起こるよね。家賃を求めずにはいられない存在ってのがいるんだよ。

俺が興味あるのは、これがAVIF画像フォーマットをどう改善するかだな。AVIFは低ビットレートの静止画像では競合を圧倒してるけど(クロマサブサンプリングを使ってる場合)、ロスレス画像ではあまり強くない。ロスレスJPEG XLやロスレスWEBPがあるから、ロスレスAVIFはちょっと笑い話みたいになってる。

正直、AVIF2は今のところ必要ないと思う。マイナーな画像フォーマットが多すぎるよ。

今のところ、AVIFが一番好きな画像フォーマットだね。他のフォーマットには、ロスレス、HDR、透明性、ブラウザサポートの四拍子が揃ってるのはないよ。あと、言った通り、すごく圧縮された画像でもめっちゃ綺麗に見える。AVIFファイルがこんなに小さいなんて驚きだよ。それに、HEICやUltra HDR JPEGとは違って、ファイルフォーマットの一部としてHDRをネイティブでサポートしてるから、ハッキーなサイドカーゲインマップのトリックを使わなくて済むんだ。みんなにとって重要じゃないかもしれないけど、私はHDRが大好きで、AVIFだけが本当にそれを真剣に受け止めてると感じるんだ。

ほとんど冗談みたいなもんだよ… AV1対応のApple TVをずっと待ってたから、今はAV2のサポートを待ってるって感じ。

Appleエコシステムの外では、AV1はほぼどこでもサポートされてるよ。

俺の10年前のiPhone 7でも、VLCで1080pのAV1動画を200分以上再生できるんだ。iPhone 7はAV1が出る1年半前に発売されたから、今のApple TVデバイスもソフトウェアでAV1動画を再生できると思うよ。Apple TV用のVLCもあるしね。: https://www.videolan.org/vlc/download-appletv.html https://apps.apple.com/us/app/vlc-media-player/id650377962?p...

どれくらいの時間がかかるかな、誰かがこの標準を実装して、AdobeやDolby、他の誰かに訴えられるまで。俺の知識は古いかもしれないけど、もしこれがAV1と同じくらい「オープン」なら、個々の企業が本当にそれを許可するとは思えない。欲にまみれてるからね。

AV1に対する最初の特許主張が裁判所に行くまでに7年かかったし、そのケースが解決するまでにはしばらく時間がかかるだろうね。面白いことに、それは何年もニュースになってたプールからではなかったんだ。つまり、試みが行われるまでにはかなり時間がかかることもあるってことさ。

特許トロールは厄介だよね。アメリカの司法の独立を揺るがして、自分の利益のために全力でサポートを得るのにどれくらいかかるんだろう?それまでに腐敗が止まることを願うよ。

新しい規格のハードウェアデコーディングをサポートするまで、ベンダーには数年かかるから、すぐに普及することはなさそうだね。

ちゃんとしたスピードのエンコーダが出てくるのを楽しみにしてる。AV1のリファレンスはあんまり良くないし、ここでも同じことが言える。でも、SVT-AV2とかが出たら、めっちゃ嬉しいな。

今、AV1は多くの企業によって積極的に特許訴訟されてるし、訴訟が来るのはほぼ確実だね。AV2でも同じ流れが始まってるけど、ほとんどのプレイヤーはAV1のケースが成熟するのを待ってる感じ。みんなAVファミリーのコーデックを「ロイヤリティフリー」って呼ぶけど、実際には法律や財政的なギャンブルに見えてきてる。

これに関しては何十年も言われてるよね。なんで一部の人が、企業が数学を所有することを地元のスポーツチームのように応援するのか、全然理解できない。しばらくの間、H.264エンコーダに多くの努力を注いだ人たちがいて、デジタルシェアクロッパーたちが、誰かがごちゃごちゃした自由を主張することに怒って嫉妬してるのかと思ってた。でも、どうやら一部の人は、企業が動画配信に税金をかけることを楽しんでるみたい。幸いなことに、そういう貪欲な企業は何度も自分の足を撃ってきたから、その影響力は弱まってきてるね。

AV1がリリースされてからどれくらい経ったんだろう?もう約8年だけど、まだ信頼できる特許保持者はいないんだよね。圧縮規格の周りには常にハゲタカがうろうろしてる。あんまり真剣に受け取らない方がいいよ。訴訟が起こされても、根拠のない主張から守るための法的防衛基金があるからさ。

実際には、ますます法的および財務的なギャンブルに見える それに対して、HEVCみたいなもの?3つの異なる特許プールにお金を払わないといけないから、確実にするためには(それぞれ条件が違うし)、さらに他の特許保持者もいて、いつでも好きな条件でロイヤリティの請求をしてくるんだよね?

AV1はすでに効率的でオープンな動画フォーマットへの大きな一歩だったよ。AV2をずっと待ってる。チップやハードウェアに実装されるから、効率的で速いハードウェアエンコーディング/デコーディングには時間がかかるだろうけど、約25%の効率向上は、ストレージ価格が上がってる今の時代にはすごく期待できるね。