AMDの発表を見て「性能の絶対的な指標としてTFLOPsに頼るのは危険」の答え合わせ

PS5

AMDの発表を見て、2020年3月にマーク・サーニー氏が語った「AMD技術のこの継続的な改善は、性能の絶対的な指標としてTFLOPsに頼るのは危険だということを意味しています。」と照らし合わせ。

Radeon RX 6900 XTとGeforce RTX 3090

AMDで一番高性能なGPUがRadeon RX 6900 XT($999)で、NVIDIAではGeforce RTX 3090($1499)。

Radeon RX 6900 XT Geforce RTX 3090
単精度性能 23.04TFLOPs 35.686TFLOPs
ブーストクロック 2250MHz 1700MHz
ピクセル・レート 288GP/s 162.72GP/s
テクスチャ・レート 720GT/s 555.96GT/s
メモリバス幅 256-bit 384-bit
メモリ帯域幅 512GB/s 935.8GB/s

この2つの製品が同等の性能であるとアピールされていました。
10本のゲームを同じ設定の4Kでプレイした時のフレームレートが互角。

AMD独自の機能である『RAGE MODE』と『SMART ACCESS MEMORY』が使用されている場合での比較ですので、AMDに有利ではあります。
しかし、この2つの機能による向上効果が2~13%(RX 6800 XT)なので、これらがなかったとしても大きな差があるわけではない。$999と$1499という価格差を考えると、Radeon RX 6900 XTは魅力的に見える。

AMDの発表なので、AMDがよく見えるようにいろいろ考えられているとも思いますが。

性能の絶対的な指標としてTFLOPsに頼るのは危険

この比較を最初に持ってきたのは、2020年3月にマーク・サーニー氏が語った、
「AMD技術のこの継続的な改善は、性能の絶対的な指標としてTFLOPsに頼るのは危険だということを意味しています。」
からの、2つ前の記事で私が書いた、
「AMDのグラフィックスカードが高い周波数で動作して、FLOPSの値のわりにベンチマークの結果が良ければ、マーク・サーニー氏の言ってた感じかなと思います。」
の答え合わせのためです。

単精度性能(FLOPS)の差が、
23.04TFLOPs35.686TFLOPs
という非常に大きな差があるのに、パフォーマンスが同等という事に驚く。これはまさにマーク・サーニー氏が言ってた事そのもの。
特に家庭用ゲーム機においては、GPU性能=FLOPS=ゲーム機の性能くらいの感覚で見られていましたので、2020年3月当時では「TFLOPsが性能の絶対的な指標じゃない」と言われても納得しにくかった。今回、23TFLOPsのGPUと36TFOPSのGPUが同等のパフォーマンスであると見せられて、ようやく納得できました。

高い周波数

マーク・サーニー氏は高い周波数での動作が重要だと語りました。

36CU@1GHzと48CU@0.75GHzのGPUを例に出して説明しており、これらはFLOPSは同じで4.6TFLOPsですが、パフォーマンは周波数が高い36CU@1GHzのほうが良くなると言う。

その理由は「GPUの周波数が33%高くなると、ラスタライズの処理が33%速くなり、コマンドバッファの処理が大幅に速くなり、L2やその他のキャッシュの帯域幅も大幅に向上するなど、より高速に動作します。」と。
The Road to PS5 「PS5への道程」 全文日本語訳 ~マーク・サーニー氏の技術解説講演~ – The Road to Next Gen Ludens

RDNA1よりも周波数が30%向上したRDNA2

今回のAMDの発表で、RDNA2はRDNA1と同じ7nmのNODEでありながら、30%も周波数を上げる事に成功したと語っていました。これがゲームのパフォーマンスにおいて重要だとも言う。マーク・サーニー氏もそう言っていました。

RDNA2のGPUは高い周波数であり、

  • Radeon RX 6900 XT – 2250MHz
  • Radeon RX 6800 XT – 2250MHz
  • Radeon RX 6800 – 2105MHz

RDNA1のGPUは低い周波数となっている。

  • Radeon VII – 1750MHz ※Vega20/GCNアーキテクチャ
  • Radeon RX 5700 XT – 1,905MHz
  • Radeon RX 5700 – 1,725MHz

このあたりの仕様は、2020年3月にマーク・サーニーが語っていた通り。当然ながらPS5のGPUも高い周波数で動作します。

  • PS5 – 2230MHz

PS5は10.28TFLOPsですが、従来の低い周波数のGPUよりもゲームのパフォーマンスが良くなる可能性は高い。期待していいんじゃないでしょうか。

INFINITY CACHE

家庭用ゲーム機には関係ないかもしれませんが、今回のAMDの発表で気になったのは『INFINITY CACHE』です。これは128MBのL3キャッシュです。

Radeon RX 6900 XTとGeforce RTX 3090の比較を見直すと、メモリバス幅に差があります。

  • Radeon RX 6900 XT – 256bit
  • Geforce RTX 3090 – 384bit

Radeon RX 6900 XTらRDNA2の弱い部分になるわけですが、256bitのGDDR6メモリとINFINITY CACHEを組み合わせると、384bit+GDDR6メモリに比べて2.17倍の性能を発揮するようです。

消費電力は少し上がりますが、それでも384bit+GDDR6メモリよりは少ない。性能差を考えると、めちゃくちゃ素晴らしいものに見える。

ただ、いろんな環境において「問題なく動作するのか?」という疑問は持たれているようですね。
INFINITY CACHE lang:ja – Twitter

PS5のCACHE SCRUBBERS

PS5もRDNA2製品と同じ256bit。
PS5にはGPUにCACHE SCRUBBERSが搭載されていると解説されていました。「すべてのGPUキャッシュをデータ削除するというのは魅力的なオプションではなく、GPUのパフォーマンスを著しく低下させる可能性があります。」「コヒーレンシーエンジンが上書きされたアドレス範囲をGPUに通知し、数十のGPUキャッシュ内のカスタムスクラバーがそのアドレス範囲をピンポイントで削除するという、より穏やかな方法を実装しました。」というものらしいです。

GPU自体のおおまかな解説でも「GPUを設計することで消費電力を削減し、GPUを最適化してパフォーマンスを向上させ、より高度な機能セットを新たに追加することで、必要な場所に近いところにデータを配置していました。」と語っており、「必要な場所に近いところ」というところでキャッシュの扱いにもこだわっているかもしれない。
The Road to PS5 「PS5への道程」 全文日本語訳 ~マーク・サーニー氏の技術解説講演~ – The Road to Next Gen Ludens

ただ私は『INFINITY CACHE』が具体的にどういう動作をするものかわかりませんので、マーク・サーニー氏の考え方に合うのかもわからない。

キャッシュに関してはよくわかりませんが、今回は「AMD技術のこの継続的な改善は、性能の絶対的な指標としてTFLOPsに頼るのは危険だということを意味しています。」の答え合わせとして、非常に面白い発表でした。23TFLOPsのGPUと36TFLOPSのGPUが同等のパフォーマンスだったというのは衝撃が大きい。

そろそろPCを買い替えたいタイミングなので、Radeon RX6000シリーズかGeForce RTX3000シリーズかというところも迷います。CPU+GPUのセット装備で特別なスキルが発動するという感覚で、AMDに魅力を感じているところ。急いではいないので、動作検証を待ちたい。

コメント

  1. A.P より:

    私もゲーミングPCを新調したいと思っていたのですが、技術的に大きく進歩しているようなので1年程度待って落ち着いてから買いたいと思ってます
    AMDが頑張っているのはプレイステーションにとっても良い事ですし、PS5proが出る場合は大きく進歩したこれらのGPUが搭載されるのでしょうね

  2. 匿名 より:

    そりゃあTFlopsで負けてるほうは「TFlopsでは判断できない!」と言うしかないわな
    サードの同発マルチで比較するとUBIのウォッチドッグスはXSX版のみがネイティブ4kレイトレ対応と発表されていてPS5はダイナミック4kでレイトレは部分的な対応になっている(UBI公式が発表済み)
    結局ブーストで多少底上げしたところで性能差がなくなるわけじゃないし、実行性能ではほとんどのタイトルでPS5はXSXに負ける事になると思われる
    それに高クロックで回せば当然発熱が凄い事になるから常にブーストできるわけじゃない
    高熱になればダウンクロックするので一気に性能が落ちる

    • 匿名 より:

      よくそんな捏造ができますね
      ウォッチドッグスのXSX版は検証動画で既に下限1440pのダイナミック4Kだとバレてます
      レイトレも一部使われてるとはされてますが、近景ですらSSRを使ってるぐらい限定的です

      あなたみたいな人がいるから、日本人は皆Xboxの印象が悪くなるんですよ

    • 匿名 より:

      性能が落ちるどころか電源が落ちたハードを某龍が如く7の実機デモ動画で見たことがあるのですがw

    • 匿名 より:

      記事のタイトルに噛みついているだけで、記事内容そのものに関しては触れていない辺り記事本文は読まずに脊髄反射でコメントしたんでしょうね。
      AMDが何故高クロックに拘り重要なのか、RDNA2の発表会で説明した事自体を否定したら、そもそもNVIDIAに対する優位性そのものが無くなるって事じゃないですか。

  3. k より:

    こんにちは。
    Radeon VIIは、Vega20でGCNアーキテクチャですね。
    13.8TFLOPSと浮動小数点演算性能値は高かったのですが、実行性能は10.1TFLOPSのRTX2080に負けるようなシーンがほとんどで、TFLOPS詐欺のようなGPUでした。
    そんなAMDがTFLOPSの呪縛から離れ、RTX3090に対抗出来るGPUを出したのは感慨深いですね。
    ひとえにサーニーとのコラボのお陰かと思います。

    • Hamasukei Hamasukei より:

      こんにちは、情報ありがとうございます。追記しました。

      なるほど、既にTFLOPSの数値だけでは判断できなかった布石があったんですね。そこから新たな方向性が生まれたのは面白い話です。

      マーク・サーニー氏がPCとは違うPS5向けにどんなカスタマイズをしたのかも気になりますし、いよいよ11月になり、もうすぐそれが確認できます。

タイトルとURLをコピーしました