IBM、最新メインフレームにAI革新: Telum IIとSpyre Acceleratorが未来を変える
- IBM、新しいTelum IIプロセッサーとSpyre AIアクセラレーターを発表
- 新技術はAIワークロードの効率化とセキュリティ向上を目指す
- ホットチップス2024で公表、IBM Zプラットフォームに導入予定
IBMはホットチップス2024イベントで新しいTelum IIプロセッサーとSpyre AIアクセラレーターの仕様を発表しました。
これらの技術は、最新のIBM ZメインフレームシステムでAIワークロードを駆動するために設計されています。
特に、効率的でセキュアなスケール可能なソリューションが求められる昨今のGenAIニーズに応える内容となっています。
Morgan Stanleyによる研究では、今後数年間でGenAIの電力需要は年間70%増加すると予測されています。
2027年にはGenAIが2022年のスペインの総電力消費量に匹敵する可能性があるとのことです。
新しいTelum IIプロセッサーは、前世代からさらに進化しています。
完全に新設計されたデータ処理ユニット(DPU)を搭載し、ネットワーキングとストレージの性能を向上させます。
DPUは周波数、メモリ容量、統合AIアクセラレーターコアの増加を実現し、大規模なデータセットの効率的処理を可能にします。
Spyre AIアクセラレーターは、追加のAI計算能力を提供し、複数のモデルを組み合わせる「アンサンブル法」をサポート。
これにより、予測の精度を向上させることが期待されます。
SpyreチップにはAIアプリケーション用の32個の計算コアが内蔵されており、レイテンシの低減とスループットの向上が図られています。
IBM ZおよびLinuxONEのVPであるティナ・タルキニオ氏は、「これらのイノベーションは次世代IBM Zプラットフォームで導入され、クライアントが大規模なLLMと生成AIを活用できるようになります」と述べています。
Telum IIプロセッサーは、8つの高性能コア(5.5GHz動作)を搭載し、コアあたり36MBのメモリを持ちます。
強力なAI推論機能を統合し、効率性とセキュリティを向上させます。
Telum IIプロセッサーは大規模AIワークロード、Spyreアクセラレーターは複雑なAIモデルと生成AIの処理に適しています。
これにより、外部GPU搭載サーバーへのデータ転送が不要となり、メインフレームの信頼性とセキュリティが強化されます。
両技術はIBMの長年の製造パートナーであるSamsung Foundryによって5nmプロセスで製造されます。
Telum IIプロセッサーとSpyreアクセラレーターは、2025年に利用可能になる予定です。
これって、Telum IIプロセッサーとSpyre AIアクセラレーターって何がすごいの?
どんなメリットがあるの?
IBMの新しいTelum IIプロセッサーは、高速で大規模なAIワークロードを効率的に処理します。Spyre AIアクセラレーターは予測精度を上げ、大規模なAIモデルを迅速に動かせます。
Telum IIプロセッサーとSpyre AIアクセラレーターは、IBMが最新のAIワークロードを効率的かつセキュアに処理するために開発した技術です。
Telum IIは8つの高性能コアと新設計のデータ処理ユニット(DPU)を備え、5.5GHz動作で大規模なAIワークロードの効率性とセキュリティを向上させます。
これにより、ユータ、ネットワーキングとストレージの性能も向上し、メインフレームの信頼性が高まるんだ。
アヤカの指摘通り、Spyre AIアクセラレーターは32個の計算コアを持ち、複数のAIモデルを組み合わせる「アンサンブル法」による予測精度の向上を目指します。
これでAIアプリケーションのレイテンシが低減し、スループットも向上するんだよ。
これらの技術は、IBM Zプラットフォームに導入され、クライアントが大規模なLLMと生成AIを活用できるようになるとのことです。
2025年に利用可能となる予定です。