Nvidia RTX20シリーズが発表
アーキテクチャが一新
2016年のGTX10シリーズから採用された、「Pascal」アーキテクチャから、「Turing」アーキテクチャに一新されました。
リアルタイムレイトレーシングに対応
「Maxwell」世代のアーキテクスチャから「Pascal」世代のアーキテクチャに進化した際、性能が3倍になる、といった性能のパワーアップをうたっていたのに対し、「 Turing」は世界初のリアルタイムレイトレーシングに対応したGPUであることをうたっています。
新アーキテクチャ「Turing」とは
リアルタイムレイトレーシングに対応
レイトレーシングは、ハリウッドで制作される映画の映像などで利用されている、光源処理を計算する技術です。
通常は、手に入らないレベルの高性能のハードウェアで、時間をかけて計算する部分ですが、「 Turing」ではこの計算を劇的にはやめ、リアルタイムで行えるようにしたという部分が大きな特徴です。
通常のレンダリングは、カメラに入る範囲の要素をレンダリングして出力するのに対し、レイトレーシングではカメラの視点から「レイ」を画面内の要素に向けて飛ばし、オブジェクトに当たった際、素材や反射などを判定し画面に反映する仕組みです。つまり、「光がカメラに入る原理を、逆にたどっていき描写する仕組み」で、画面外の要素や、カメラの視点からみてオブジェクトの裏側にある要素も反映でき、よりフォトリアルな表現ができる技術です。
実際にレイトレーシングがある場合とない場合のデモを見ていただくと、車や地面など、特に光の反射を行う要素に大きな変化が感じられるとおもいます。
バトルフィールド5でのデモ
「RT Core」と「Tensor Core」を搭載
リアルタイムレイトレーシングに対応したことで、Turing世代のGPUは、通常のシェーダーコアと別に、「RT Core」と「Tensor Core」という2つのコアを搭載しています。
「RT Core」はレイトレーシングの計算を行うための専用コア、「Tensor Core」は機械学習に特化した専用コアです。
レイトレーシング専用の「RT Core」とは
Turingのリアルタイムレイトレーシングを実現するために、レイトレーシングの計算を専用で行うために作られたものが、「RT Core」です。リアルタイムでレイトレーシングの計算を行うためには、それなりの処理性能が必要で、「RT Core」を用意したことで、Pascal世代のGTX 1080tiでは1.21Giga/秒だったものが、Turing世代の RTX 2080tiでは10Giga/秒の処理を実現することができました。10Giga/秒は毎秒100億レイ投射できるということです。fpsや解像度にもよりますが、レイトレーシングにおいてPascal世代から段違いに性能が上がっています。
機械学習に最適なTensor Core(テンサーコア)とは
Tensor Coreは、行列計算を行うための演算機で、いわゆる機械学習(ディプラーニング)に特化したコアです。機械学習に特化したコアをわざわざ乗せた理由は、レイトレーシングで処理した映像からノイズを除去するために利用するためです。
レイトレーシングの処理を行った映像そのままでは、どんなにレイの本数をふやしてもノイズがのってしまいます。
そこでNvidiaは別軸のアプローチとして、レイで計算して出力した1フレームの画像を、時間をかけてレンダリングした数十点のフレーム画像との機械学習にかけあわせて、ノイズがないよりフォトリアルな映像として出力する「Nvidia DLAA」という技術を開発してします。
つまり、「Tensor Core」の機械学習は、「RT Core」のレイトレーシングを補い、より写実的にするために搭載されていると言えます。
Nvidia GTX10シリーズとの性能差は
ベンチーマークの発表はなし、ただしベンチでは測れない進化
今回、ベンチマークの発表はありませんでした。
公表されている性能についてGTX10シリーズと比較しました。
RTX 2080ti |
GTX 1080ti |
RTX 2080 |
GTX 1080 |
RTX 2070 |
GTX 1070 |
|
アーキテクチャ |
Turing |
Pascal |
Turing |
Pascal |
Turing |
Pascal |
CUDAコア数 |
4352 |
3584 |
2944 |
2560 |
2304 |
1920 |
ベースクロック (MHz) |
1350 |
1480 |
1515 |
1607 |
1410 |
1506 |
ブーストクロック (MHz) |
1545 |
1582 |
1700 |
1733 |
1620 |
1683 |
メモリ速度 |
14Gbps |
11Gbps |
14Gbps |
10Gbps |
14Gbps |
8Gbps |
搭載メモリ |
11GB GDDR6 |
11GB GDDR5X |
8GB GDDR6 |
8GB GDDR5X |
8GB GDDR6 |
8GB GDDR5 |
メモリ インターフェイス幅 |
352ビット |
352ビット |
256ビット |
256ビット |
256ビット |
256ビット |
メモリ帯域幅 |
616 GB/秒 |
484 GB/秒 |
448 GB/秒 |
320 GB/秒 |
448 GB/秒 |
256 GB/秒 |
正直なところ、2年という期間が空いた上での新製品であることを考えると、コア数の増加があまりないように感じると思います。これは、「RT Core」「Tensor Core」にコアを割いていることが理由と考えられます。
ただ、今回のシリーズから、単純な性能の進化とは別の軸、レイトレーシングという側面から、グラフィックのリアリティの向上を目指し始めたということでもあります。
グラフィックの進化は著しい一方で、シェーダーの性能を引き上げる事による進化は、人の目で見て変化を感じることが少なくなって来ていることは確かです。そのため、Nvidiaはこのタイミングで光源処理を帰るという新しいアプローチに映ったと言えます。型番が長く続くブランドである「GTX」から、「RTX」にかわったのもその意思表示と言えるでしょう。
シェーダーの進化を追い求めなくても、先のデモ動画でもわかるように、リアルタイムレイトレーシングによって、グラフィックのリアリティ、没入感は上がったと言えます。
VRへの恩恵は
VRケーブルの新基準「VirtualLink」に対応
Nvidiaは、GTX10シリーズから、VRへの対応を強く打ち出しており、当然ならが今回のRTX20シリーズでもVRへの対応強化を行なっています。その一つとして、映像出力、電源供給、センサーを1本のケーブルで担える「VirtualLink」に対応しています。
詳しくはこちらの記事を参照
Nvidia RTX20シリーズに搭載されたVirtualLinkとは?
リアルタイムレイトレーシングによる没入感の強化
リアルタイムレイトレーシングによって、表現がよりフォトリアルになり、没入感が向上することは間違い無いでしょう。
また、レイトレーシングはモーションブラーなどにも強く、VR酔いの改善にも寄与する可能性が考えられます。
懸念点があるとすれば、フレームレートです。レイトレーシングのコアを分けた事により、レイトレーシングの性能に、フレームレートが引っ張られることがあるのかどうか、実際の発売やレビューが出揃うまでわかりません。
Nvidiaはグラフィックボードの新しい潮流を起こそうとしている
RTX20シリーズによって、いままでのコア数や性能アップの競争から、「リアルタイムレイトレーシング」という新しい表現手法にゲームチェンジしました。
ゲームGPUを牽引するNvidiaがゲームチェンジしたことは大きく、これからのグラフィックボードのトレンドは、「リアルタイムレイトレーシング」になっていく可能性が高いでしょう。
今後製品の性能を評価するのは、コア数やクロック、メモリなどだけでなく、毎秒何レイ処理できるか、といった部分もチェックする必要があるかもしれません。