top of page

CES2025でNVIDIAが最新GPU「RTX 50」を発表!…GPUってなんだ?

  • 執筆者の写真: NKimetenai
    NKimetenai
  • 1月21日
  • 読了時間: 6分

更新日:2月27日


毎年アメリカはラスベガスで開催されるテックの祭典「Consumer Electronics Show」

NVIDIA Geforce RTX 50を紹介するジェンセン・フアン氏
トレードマークの革ジャン姿のジェンセン・フアン氏とRTX 50。革ジャンは約135万円の高級品らしい

通称 CES

今年も様々な大企業やスタートアップが出展し、注目を集めました。


その中でもギーク達が待ち望んでいたのはNVIDIAの社長兼CEOであるジェンセン・フアン氏のプレゼン…!

ハードウェア界の巨頭であり億万長者の彼は、ついにGeForceの最新機種「RTX 50」を発表しました。


GeForce…GPU…なにそれ?

そんなあなたに!

今回は新発表されたNVIDIA製GPU「RTX 50」のスペックの概要、というかGPUとは何か、解説していきます。





Blackwell「RTX 50」の主なスペック


まずはスペックをザっと見てみましょう。

ジェンセン・フアン氏がRTX 50をプレゼンしている様子
RTX 50はモノリシックダイを採用。(すべて単一にまとまっている構造)全体的にAI性能に注力し、より効率的にデータを処理する能力に長ける

  • トランジスタ数: 920億個 (前世代比21%増加

  • メモリ: 最新規格のGDDR7

  • メモリ帯域幅: 1.8TB/s (前世代の約2倍

  • AI性能: 推論性能 4,000 AI TOPS

  • テンサーコア: AI計算に特化した 新世代設計

  • 冷却技術: 3D Vapor Chamber

  • 価格帯: $549~$1,999



各スペックをわかりやすく解説


トランジスタ数

RTX 50のトランジスタ数を説明する資料
「トランジスタ数は2年ごとに2倍になる」ゴードン・ムーアが提唱した説。似たもので、フアン氏が提唱した「フアンの法則」というものもある。

トランジスタとは、GPUの「頭脳」を構成する基本部品です。RTX 50では、このトランジスタが920億個も詰まっており、これが計算処理能力の向上に直結します。


Blackwell RTX 50のトランジスタ数は前世代比21%増加となっていますが、博識な方はムーアの法則と当てはめて「少ないのでは?」と思うかもしれません。

近年ではコンシューマ向けGPUのトランジスタ数が目に見えて減少している傾向があり、その代わりにAI処理技術(DLSSなど)により性能を底上げする戦略がとられています。トランジスタ数の上昇は性能だけでなく、消費電力や熱問題など、別のタスクが多くなってしまうんです。


事実、データセンター向けのBlackwellでは、トランジスタ数が2080億となっており、近年の大規模AIに対応するため超性能GPUに仕上がっています。これはデータセンターなら膨大な消費電力と発熱に対応できるためです。

コンシューマ向けモデルでは、本モデルのアーキテクチャ(設計)「Blackwell」によって、大幅な効率化が実現され、21%のトランジスタ数増加でも性能向上ができたのです。



GDDR7メモリ

メモリは、GPUがデータを一時的に保存する場所。最新規格のGDDR7は、データの読み書き速度が飛躍的に向上し、ゲームやAI処理の効率を大幅にアップさせます。よく言われる例えとして「メモリは机の大きさ、大きければ沢山の作業が一気にできる」と言われます。


デスクトップPCなどをいじっていると、DDRという言葉を聞くかもしれません。GDDRはGPUに特化したバージョンのメモリで、「Graphics DDR」というのが正規の呼び方です。

DDRは低遅延、GDDRは高速データ転送を得意としています。本棚から本を探す速さに特化しているのがDDR、大量の本をいかに早く運ぶかに特化しているのがGDDRです。




GDDRとDDRのイメージ DDRは汎用的なリクエストに対しての応答が早く、GDDRは推論やグラフィック処理など大量のデータを高速で運ぶ


GPUでは並列処理といって大量のデータを扱う処理を行うので、データ転送速度を重きに置いています。逆にDDRは一般的な処理(OSやアプリケーション)に使うので、素早く対応できる事のほうが重要というわけです。

GDDR7はそのGDDRの最新バージョンであり、スペックはお墨付きです。全体的に大幅な性能上昇ですが、その中でもメモリ帯域幅を見ていきましょう。



メモリ帯域幅

RTX 50のGDDR7の帯域幅のイメージ画像
1.8TBのデータを運ぶイメージ画像

前世代の倍となる1.8TB/sの帯域幅は、データ転送の高速化を実現。これにより、複雑な映像やAI処理もストレスなく実行できます。


帯域幅は「一気にどれぐらいのデータを転送できるか」という意味です。つまり一秒に1.8TBのデータを転送できるということ。これによりAI推論やグラフィック処理などの大量データにスムーズ対応できるスペックを手に入れました。





テンサーコア

この専用コアは、AI処理に特化した部分です。RTX 50では第5世代の設計が採用され、AI推論の効率がさらに向上しました。

GoogleのSoCで「Tensor」という同じ名前のものがありますが、別物ですのでご注意ください。


NVIDIAのDLSS技術を説明する資料
左下の「従来のレンダー」をDLSSでアップスケーリング、フレームを生成する図。クリックで参考動画を参照

現在、ほぼすべての処理においてAIによる最適化が行われています。

例えば、今まではゲームの処理を常に計算し、その分プロセッサー(CPUやGPUなどのチップ)に負担がかかっていました。

最近では、元となるデータからAIが推測計算し、画面上のほとんどの効果をいちいち処理しなくて済むようになってきています。こういった面で、AI処理に特化したテンサーコアが役に立つわけです。





注目すべき新機能として「FP4への対応」が挙げられます。FPというのはものすごく簡単に言うと「AIを動かすときの計算方法」です。FP32、FP16など種類が沢山あるのですが、その中でもFP4は精度が低く、代わりに飛躍的速度で計算ができます


AIの推論は、必ずしも完璧な精度で計算する必要はありません。例えば画像認識などもFP4で計算できます。

もともと学習したデータを基に推測できればいいので、「恐らく人が映っている」と判別できれば、あとは学習データに当てはめて「スーツを着た男性」と回答できるのです。また、計算速度も上がるので顔認識の判別など早い処理が求められるタスクに有効です。



AMP(AI Management Processor)の導入

BlackwellからAMPというプロセッサが導入されました。これは「AI処理の管理者」のようなもので、仕事の割り振りを行います。


RTX 50にはテンサーコア、CUDAコア、RTコアがありますが、それぞれ得意な計算が違うので、これらに対してタスクの割り振りを行います。

そして処理している間も監視し、最適化。出来上がったらそれを統合する。という流れです。


これにより演算効率の大幅向上が見込めるといいます。

AI処理は電力リソースとの闘いでもありますから、このように効率化が進んでいくことは非常に喜ばしいです。




RTX 50は一般家庭にも必要なのか?

AI処理を行うプロセッサとして一番身近なのはNPU(AI処理特化のプロセッサ)ですよね。最近ではIntelの「Core ultra」やAppleの「M・Aシリーズ」など、NPUが搭載されているSoCがラップトップやスマホを中心に注目されています。


「ゲームをやらないなら、GPUではなくNPUでいいのでは?」

となりますよね。事実です。現在流行している大規模言語モデル(GPTやGemini)はクラウドAIであり、プロセッサが行うのはFP4、FP8などを中心とした軽量な演算です。また、グラフィック処理においてもRTX 50レベルの演算能力が求められるのは、4K以上の高解像度や、レイトレーシングなどの高負荷の処理、最先端CG処理。現段階では一般ユーザーには必要性は低いです


また、高性能なプロセッサを搭載するということは、消費電力も増えるということ。

RTX 50の省電力性は前世代よりも高くなっているとはいえ、使わない物にリソースを割くことになってしまいます。


GPUではオーバースペックになってしまう場合も十分考えられるため、日常のタスクでAIを用いる程度ならNPU搭載AIPCが最適です。

今すぐGPU搭載PCを買う必要はないでしょう。


もし、グラフィック処理や、オフラインでの画像生成などクリエイティブな用途を予定している場合、今後のAI能力の向上に追いつくGPUは魅力的な選択肢です。RTX 50は少し高額ですが、ぜひこの機会に検討してみてください。





bottom of page