米インテル、データセンターのAI処理向け4製品

BP速報
2020/6/22 12:45
保存
共有
印刷
その他

「第3世代Xeon Scalable Processor」の概要

「第3世代Xeon Scalable Processor」の概要

日経クロステック

米インテルは、データセンターに向けた4つの新製品を18日に発表した。いずれも人工知能(AI)処理能力を高めた製品だという。具体的には(1)MPU(超小型演算処理装置)の「第3世代Xeon Scalable Processor」(2)演算回路を自由に書き換えられる「FPGA」と呼ばれる専用半導体の「Stratix 10 NX」(3)3次元NAND型フラッシュ・メモリー・ベースのソリッド・ステート・ドライブ(SSD)「D7-P5500/P5600」(4)相変化メモリーモジュールの「Optane Persistent Memory 200 Series」である。

第3世代Xeon Scalable Processorの開発コードは「Cooper Lake」である。同社は2019年8月にCooper Lakeについて先行発表している。その際、Cooper Lakeを第3世代Xeon Scalable Processorとして20年上期に市場投入すると宣言した。今回の発表によって、その約束が守られたことになる。

新製品の第3世代Xeon Scalable Processorは4/8ソケット向けのMPUで、深層学習(ディープラーニング)処理の高速化機能「Intel Deep Learning Boost」を強化したことが特徴である。具体的には、米グーグルが定義した深層学習向け16ビット浮動小数点演算形式「bfloat16」をサポートした。これにより、前世代製品の32ビット浮動小数点演算による処理に比べて、学習で1.93倍、推論で1.9倍の高性能化を図れたという。しかもソフトウエアの変更は最小限で済み、精度は32ビット浮動小数点演算に引けを取らないという。

第3世代Xeon Scalable Processorには11モデルが用意される。このうち、6モデルがXeon Platinum Processor。残り5モデルがXeon Gold Processorである。ハイエンドの「Xeon Platinum 8380HL Processor」は28コアを備えており、56スレッドの処理が可能。ベースクロック周波数は2.9ギガヘルツ、1コア動作時の最大動作周波数は4.3ギガヘルツ、熱設計電力(TDP)は250W、1ソケット当たり最大4.5テラバイトのDRAMを外付けできる。

一方、ローエンドの「Xeon Gold 5318H Processor」は18コアを備えており、36スレッドの処理が可能。ベースクロック周波数は2.5ギガヘルツ、1コア動作時の最大動作周波数は3.8ギガヘルツ、熱設計電力(TDP)は150ワット、1ソケット当たり最大1.12テラバイトのDRAMを外付けできる。

第3世代Xeon Scalable Processorは14ナノメートル(ナノは10億分の1、nm)プロセスで製造する。開発コード名が「Ice Lake」で10nmプロセスで製造するXeon Scalable Processorは20年後半に市場投入する予定。Ice Lakeは1/2ソケットに向けたMPUである。また、21年には開発コード名が「Sapphire Rapids」の次世代Xeon Scalable Processorを市場投入の予定。こちらは10nmプロセスで製造の予定で、1~8ソケットに向けたMPUとする。

■初のAI処理に最適化したFPGA

新製品のFPGAであるStratix 10 NXは「Intel初のAI処理に最適化したFPGA」だという。これまでのStratix 10製品と同じく14nmプロセスで製造する。既存のStratix 10 MXと同じく、新製品のStratix 10 NXは3次元実装DRAMの「HBM(High Bandwidth Memory)」を混載するが、Stratix 10 MXよりも推論処理向けの8ビット整数演算能力が15倍高いという。Stratix 10 NXでは「AI Tensor Block」と呼ぶニューラルネットワーク処理に特化した回路を備えることが効いている。既存のStratix 10 MXでは汎用的な回路のDSPブロックで対応していた。

新製品のSSDであるD7-P5500/P5600は、TLC(トリプル・レベル・セル)の3次元NANDフラッシュを使う。前世代品に比べてレイテンシー(遅延)が最大40%低減し、最大で性能が33%向上したという。新製品の相変化メモリーモジュールのOptane Persistent Memory 200 Seriesのソケット当たりのメモリー容量は最大4.5テラバイト。前世代品と比べて転送帯域幅が平均25%拡大した。また、競合製品と比較して225倍以上のアクセス速度を持つという。

(日経クロステック/日経エレクトロニクス 小島郁太郎)

[日経クロステック 2020年6月19日掲載]

保存
共有
印刷
その他

日経BPの関連記事

関連企業・業界 日経会社情報DIGITAL

電子版トップ



[PR]