Nishiki-Hub

国内外のPC/PCパーツ/スマホ/Appleなどの最新情報を取り上げています

Intel Arcの詳細な話題が公式で出てきたのでまとめる。~ ゲームキャプチャやオーバークロックなどの競合のドライバと同等の機能を搭載

f:id:doskokimeil127-dosd:20210817174526p:plain

錦です。

Intelは、MediumにてIntelのゲーミングGPUIntel Arc」についての情報を共有しています。

ものの話自体は、Architecture Dayで発表された内容のニュースリリースにあたるようなものなので、大体の話自体はこちらのエントリでお話している内容です。今回はそれに加えて、このドキュメントでわかった内容も加えてお伝えしています。

各ユニットの説明

Intelはこれまで、CPU内蔵のGPUについて、実行ユニット(Excution Unit/EU)と言う単位で表現していましたが、Xe HPGやXe HPCの規模が大きくなるにつれて、マイクロアーキテクチャの構成可能性を適切に表現するためにはEUが適さないということから、これが変わっています。具体的には、Xe Coreというのが実質的にそれを受け継いでいるものです。ただ、単にEU = Xe-Coreという関係性はなく、全くの別物と見たほうがいいでしょう。

Xe-Core

f:id:doskokimeil127-dosd:20210825154836p:plain
Xe-Core

Xe-Coreの命令セットアーキテクチャ(ISA)は、様々なワークロードや製品に合わせてXe-Coreを柔軟に拡張することができるようにできています。一応、性能における最小単位ということになっているようです。詳細な情報はまだふせられているものの、Architecuture Dayで発表があったとおり、16基ずつ搭載されるベクトルエンジンと、マトリクスエンジンがXe-Coreには搭載されています。特に、マトリクスエンジンはXe Matrix eXtention(XMX)と呼ばれており、1024bit演算を行います。XeSSはこれをベースにしています。

Xe-Coreにはこれ以外にSaveとRestoreのおそらくAGUと、ローカルシェアドメモリ(LSM)、L1キャッシュが搭載されています。

Render Slice

f:id:doskokimeil127-dosd:20210825155506p:plain
Render Slice

Render Sliceは、Xe-Coreを4つ包括した上で、3Dグラフィックスを生成するために必要なレンダリングユニットが含まれています。

具体的には、4基のXe-Coreと、レイトレ用のアクセラレータ(Raytracing Unit)を4基、DirectX 12 Ultimateに対応するサンプラーピクセルバックエンド、ジオメトリ、ラスタライズパイプラインが搭載されています。レイトレーシングは、DirectX Raytracing(DXR)とVulkan Raytracingを完全にカバーしています。

実際のスケールでは、このRender Sliceの数を増減することによって、ラインナップを展開していくことになります。レンダースライス内のいくつかのXe-Coreを無効にするとか、そういうことをするのかどうかはまだわからず。もしもそれがないのであれば、最大8つのSKUでラインナップされることになります。

これらのRender Sliceは、広帯域のメモリファブリックに接続し、SoCあたり最大32基のXe-Coreで構成されます。

アーキテクチャとプロセス

Intelは、より高い性能と効率を実現するため、あらゆるレベルでアーキテクチャを改良し、論理設計・回路設計・ソフトウェアの改善、それとGPUに最適な特性を持つというTSMCの6nmプロセス「N6」プロセスで製造することにより、前世代より同じ電圧でのワットあたりの性能・クロックの両方で前世代(おそらくGen11 iGPU)と比べて50%も性能が向上したとのことです。

XeSS

Intelが、NVIDIAのDLSSや、AMDFSRに対抗する技術として新たに発表したのが「Xe Super Sampling」(XeSS)というものです。

これは、AIをベースにしており、ある種のAIアクセラレーションということになっています。一応、ゲーミング用途ではDLSSやFSRと同様にアップスケーリング技術ということになっています。

XeSSは、隣接するピクセルだけでなく、動きを補正した前のフレームからの情報に基づいてサブピクセルの詳細を再構築し、時間的な認識を加えています。この処理は、高い性能と忠実性を実現するために訓練されたニューラルネットワーク上で行われ、Xe-Core内のXMXによって高速化されています。XMXがTensorコアに相当すると行っていいのかはわかりませんが、似たような感じになることは間違いないみたいです。

それに加えて、DP4a命令をベースにした追加のバージョンがIntelより発表されました。DP4a命令は、8bit整数のベクトル積和算命令で、このXeSSの追加バージョンは、DP4a命令をサポートするGPUなら、ArcだけでなくIntelで先行して登場しているXe GPUIntel Iris Xe Max」GPUTiger Lake/Rocket LakeのiGPUであるXe-LPと、競合他社のGPUでも使えるとしています。そしてXeSSは、こんにちのゲームエンジンに統合できるように設計されています。

話をまとめると、XeSSには、XMXをベースにしたものと、DP4a命令をベースにしたものという2つのバージョンが有り、XMX版は専用のアクセラレータが必要なためIntel Arcのみ対応、DP4a版はDP4a命令の対応するGPUならNVIDIAAMD製品でも利用することができるということみたいです。

XMXをベースにしたバージョンのSDKは、今月からISV(開発者)に向けてリリースされ、DP4aのSDKは今年後半にリリースされる予定です。

DP4aをサポートするGPU

DP4a命令をサポートするGPUは、IntelはXeシリーズとNVIDIAPascal(GP102/104/106)世代以降。AMDは公式なドキュメントからDP4a命令について見つからなかったので、Redditの書き込みベースの情報ですが、Vega 20とRDNA以降としています。つまり以下のGPUが対応するものと見られます。

DP4a命令をサポートしたすべてのGPUがXeSSをサポートするかどうかはわかりませんが、とりあえず。

長くなったので、畳んだ状態で表示します。開いてくんろ。

DP4a命令に対応するGPU

Intel

NVIDIA

AMD

ドライバ

Intelは、MicrosoftDirectX 12 Ultimateの開発に参加しているとしています。Intel Arcは、DX 12 Ultimateをすべてカバーしていることを既に明らかにしているためドライバもかなり重要です。DXRのレイトレーシングの他、可変レートシェーディング、メッシュシェーディングにも対応しています。

最近のIntelのグラフィックドライバは、CPU負荷の高いタイトルのスループットを向上させたり、シェーダーのコンパイルを強化してロード時間を短縮したり、100以上のゲームに影響を与える大きな変更を実施したりと、大きな成果を上げており、このままドライバも改良を続けていくことになるでしょう。

機能

ドライバには、NVIDIAGeForce ExperienceにあたるGUI機能が十二分に用意されていて 強力なハードウェアエンコードを活用したキャプチャ機能や、AIのバーチャルカメラなどが搭載されています。また、AMDのソフトウェアのように、オーバークロック機能も統合されています。

今後の展開

Alchemist

今年の後半には、より詳しい情報が提供されるとのことです。

Alchemistの製品は来年初頭から登場する事になっており、おそらく一番初めにはハイエンドのものから登場するのでしょう。楽しみです。

Alchemist以降

f:id:doskokimeil127-dosd:20210825191308p:plain
ロードマップ

そして、Alchemist以降は、Battlemage、Celestial、Druidという順番で展開されていきます。

関連リンク